新型的分离式内存架构(disaggregated memory)将内存和计算资源从传统整机(monolithic server)中分离出来,构建独立的、高速网络互联的计算池和内存池,以提高资源利用率和服务弹性。现有工作采用单版本设计思路以简化存储结构,但是存在写阻塞读和大量undo日志占用网络资源等限制。使用多版本设计可以避免单版本的限制,但是现有多版本分布式事务系统为传统整机架构设计,并不适用于新型分离式内存架构。实验室博士生张铭...
人工智能(AI)应用已被广泛运用于各种领域,如图像分类、自然语言处理和自动驾驶。分布式深度神经网络(DNN)训练对于人工智能应用十分重要。不幸的是,分布式训练涉及多个训练机器节点,使得DNN训练容易受到系统故障的影响。检查点技术(Checkpointing)可用于为DNN训练提供容错保证,但会带来较高的运行时开销。为了实现高性能和低延迟的高频次检查点,信息存储与光显示功能实验室博士生陈梦雷在华宇教授的指导下,提出了...
实验室博士生彭周旋的论文“AdaptHM:A Fully Adaptive Data Migration Strategy for Hybrid Memory Systems”于2023年11月8日被IEEE Transaction on Computer-Aided Design of Integrated Circuits and Systems (TCAD)录用。IEEE TCAD是中国计算机学会推荐的A类国际学术期刊。数据迁移策略被广泛应用于现有的各种混合异构内存系统中,其作用是将被频繁访问的数据迁移到好的快速内存设备,以提升系统的整体性能表现。然而,...
持久内存(Persistent Memory, PM)结合了传统易失性内存与磁盘存储器的特性,既具有较高的访问性能,又可以确保数据在断电后不会丢失,同时还具有TB级的超大容量。此外,持久内存可以绕过操作系统被应用程序直接访问,极大地提升了存储访问性能。然而,持久内存的动态分配需要考虑元数据的崩溃一致性,这使得传统的易失性内存分配器无法被应用于持久内存。为了解决持久内存的动态分配问题,信息存储与光显示功能实验室硕士生向...
新兴的分区命名空间(ZNS) SSD为主机提供细粒度的、性能可预测的存储管理。ZNS SSD将地址空间划分为多个Zone,每个Zone必须按顺序写入,且不能被覆盖。然而,写约束导致频繁地对文件元数据进行小的修改,以记录更新数据块的最新逻辑块地址,从而增加了fsync()系统调用的开销。通过综合分析了真实ZNS SSD上fsync的元数据开销,发现:(1)大多数元数据块的更新大小(如几十字节)远远小于区域的IO单元(如4 KiB),频繁的fsync会导致严...
随着现代计算机系统对存储和I/O需求的持续增长,具有数据去重(Deduplication)功能的SSDs(Solid State Drives)在云平台中得到了广泛部署以满足高性能存储需求。在多租户场景中,由于内存资源有限,来自不同租户的多个I/O流同时运行时,会出现指纹缓存的争用。然而,现有的全局和固定指纹管理方案难以适应不同租户的负载特性,在多租户环境中争用指纹缓存空间影响系统性能,指纹计算和指纹查找的开销导致的性能下降。为了解...
分布式文件系统在大规模数据处理场景中被广泛使用。在分布式文件系统中,元数据服务位于关键路径,往往成为性能瓶颈。现有的元数据服务方案采用扁平化的元数据管理和全路径索引来保证容量和带宽的高可扩展性。然而,这些方法无法提供可靠延迟。首先,为了保证安全,文件系统具有分层权限检测机制,这与全路径索引方式产生冲突,无法充分发挥后者的优势。其次,分布式文件系统中包含超大规模目录,对扁平化元数据管理方式提出...
混合存储系统利用多种存储设备,如新兴的非易失性存储器(NVM)、固态驱动器(SSD)和硬盘驱动器(HDD),来实现相比于单设备更大的容量和更高的性能。这些设备具有不同的特性,需要在延迟、吞吐量和成本之间进行权衡。混合存储架构因采用多层存储硬件来提高系统性能而广受业界和学术界的欢迎。由于不同存储介质的性能存在差异,混合存储系统必须采用合适的架构和数据调度策略来充分并行发挥多设备的物理特性及其性能优势。现...
在数据中心中,由于应用服务对内存资源和计算资源的需求不均衡,导致两种资源有大量相对的闲置,从而提高了数据中心的硬件成本。为了解决该问题,分离式内存架构被提出并受到学术界和工业界的广泛关注。它将计算资源和内存资源在物理上进行解耦,并且使用高速互联协议(RDMA、CXL等)进行连接、池化。从而使得数据中心可以动态调整两种资源的配置。B+-tree广泛应用于数据库、文件系统中,以提高数据的读写性能。传统的B+-tree通...
基于新兴非易失存储器件(Emerging nonvolatile memory, eNVM)的存内计算(Processing in memory, PIM)加速器,其计算受到eNVM单元本身编程波动性现象的影响以及ADC转换开销的限制。现有工作多采用以计算单元(Operation unit,OU)为粒度进行计算来解决这些问题。然而我们的测试表明,以OU为粒度计算受到互连线寄生电阻(Parasitic wire resistance)带来的严重的电压降(IR drop)影响。这个影响导致在基于eNVM加速器上进...