为了降低运营成本,互联网企业将多种工作负载部署在同一集群中。虽然负载不同的资源需求使得部署混合负载部署成为可能,但是该方法使得负载面临资源竞争和性能干扰等问题,严重影响应用的服务质量。现有解决方案通过从批量作业中抢占资源来满足延迟敏感型任务的资源需求,进而保证敏感延迟服务的服务质量。但是直接抢占批处理任务资源的方式会导致批处理作业有很大的性能损失。此外,谷歌、阿里巴巴等企业开源的集群跟踪数据显...
实验室博士邹晓敏的论文“ROWE-tree: A Read-Optimized and Write-Efficient B+-tree for Persistent Memory”、博士雷梦雅的论文“A Dynamic and Recoverable BMT Scheme for SecureNon-Volatile Memory”、硕士王霖的论文“Exploiting Parallelism in Disk Failure Recovery via Partial Stripe Repair for an Erasure-Coded High-Density Storage Server”被International Conference on Parallel Processing(ICPP 2022)正...
实验室博士生亓文杰的论文“InDeF: An Advanced Defragmenter Supporting Migration Offloading on ZNS SSD”、博士生张健顺的论文“HaLSM: A Hotspot-aware LSM-tree based Key-Value Storage Engine”被The 40th IEEE International Conference on Computer Design(ICCD 2022)作为长文全文录用。分区命名空间(ZNS)作为一种新型的存储接口,具有低垃圾回收开销和低配置开销等优点。然而,由于其异地更新和应用程序的多线程写...
实验室博士生李鹏飞的论文“FINEdex: A Fine-grained Learned Index Scheme for Scalable and Concurrent Memory Systems”被The 48th International Conference on Very Large Data Bases (VLDB 2022)作为长文全文录用。高效的索引结构对于提升内存系统的性能非常重要,尤其是最近提出的学习索引结构获得了巨大的性能提升。但是现有的学习索引方案由于模型和数据结构的依赖性,在可扩展和并发的系统中引入了过多的资源竞争,使...
数据安全是非易失性存储器(NVM)系统设计中不可或缺的一部分。但是,在NVM上保障数据安全是非常具有挑战性的,因为系统必须保证用户数据和相关安全元数据的崩溃一致性,确保系统断电后数据能正确解密、验证和恢复。现有的一致性方案忽略了Intel SGX风格完整性树(SGX Integrity Tree,SIT)的可恢复性和元数据块之间的访问相关性,造成了不必要的NVM写流量和性能开销。实验室博士生雷梦雅,在王芳教授的指导下,针对安全NVM,设计...
随着数据量的剧增,大容量,高性能的NVM被认为是下一代的新型主存。但是NVM存在安全性问题。本工作考虑的攻击模型为总线监听攻击和内存窃取攻击。对于总线监听攻击方式,攻击者可以在内存总线上植入监听,以获取CPU和内存之间传输的明文数据。窃取攻击则是攻击者直接窃取DDR内存条,由于NVM的非易失性,窃取之后数据仍然保留,攻击者可流出相应的数据。为了防御这些攻击,NVM中的数据可采用计数器模式进行加密,即AES加密硬件...
近年来,基于开放通道固态盘(Open-Channel SSD, OCSSD)的研究持续火热。相比于传统SSD,OCSSD的最大特点是利用主机的计算和内存资源实现闪存转换层(Flash Translation Layer, FTL),因此主机对I/O的地址分配和并行性有更好的控制,具有很高的优化潜力。包括OCSSD在内的基于闪存的存储器为了实现高性能,需要尽量利用设备并行性,让I/O并行执行。然而,现有文件系统在发送I/O过程中,为了保障数据一致性,需要约束I/O持久化...
近年来,如何低成本且高可靠地存储全球爆炸增长的海量数据日益成为数据存储领域的重要挑战。纠删码(Erasure coding)技术通过将k个数据块线性编码生成r个校验块,并将k+r个数据和校验块放置到不同的存储节点上,构成编码条带,可以实现数据存储的高可靠和低成本。进一步,在FAST 2021(ECWide)和ICDCS 2021(StripeMerge)提出的大条带编码技术,通过构建远大于一般纠删码存储系统(k=20)的k个数据块实现极致的存储成本。在...
近日,实验室博士生周海的论文“Multi-level Forwarding and Scheduling Repair Technique inHeterogeneous Network for Erasure-coded Clusters”、周洋的论文“ASLDP: An Active Semi-supervised Learning method for Disk Failure Prediction”、于金玉的论文“CERES: Container-Based Elastic Resource Management System for Mixed Workloads”、胡静的论文“Parallel Multi-split Extendible Hashing for Persistent Me...
图嵌入作为一种有效的图分析技术近年来备受关注,其旨在将图数据映射为低维稠密向量,进而应用到机器学习任务中,如链接预测、节点分类、推荐系统、可视化等。然而,现有图嵌入技术中普遍存在计算开销大和有效性难以保证的问题,对大规模图则更为甚之。信息存储与光显示功能实验室博士生方鹏,在王芳教授、施展副教授的指导下,通过分析基于随机游走的图嵌入技术发现,现有方法采用的“一刀切”策略预先设定了随机游走的路径长...