信息存储系统教育部重点实验室

【学术动态】

博士生干创的论文被会议FAST 2025录用

纠删码(Erasure Code)被广泛部署在分布式存储系统中来保证数据可靠性,同时降低存储成本。最小存储再生码(Minimum-storage regenerating codes, MSR码)是修复理论最优的纠删码,它能在保证最优存储效率的前提下,最小化修复带宽开销。当前对于编码理论和系统领域的研究,主要聚焦于系统(Systematic)MSR 码,系统MSR码存储的条带中会保留原始数据块以便系统直接访问。然而,现有系统MSR码会将数据块分成许多小的分片,在修...

2025-01-06 16:15:32 阅读
查看更多

博士生陈梦雷的论文被会议FAST 2025录用

如今GPU已被广泛运用于各种领域,如人工智能应用、数据库和科学计算。高效地管理海量数据对于GPU应用十分重要。然而,GPU应用需要借助CPU来管理数据,会导致高昂的数据传输开销。具有持久内存的GPU系统(GPM)允许GPU应用直接以字节粒度访问持久内存。哈希索引具有常数级的单点查询性能,因此被广泛用于实现高效的数据管理。然而,现有的哈希索引由于对线程束(warp)无感知、高开销的一致性保证以及GPU和持久内存巨大的带宽差...

2025-01-04 22:51:37 阅读
查看更多

博士生丁波的论文被会议DATE 2025录用

持久内存(Persistent Memory, PM)因其低延迟和数据持久性,成为下一代存储技术的理想选择。然而,传统的块设备 I/O 软件栈冗长,限制了 PM 的访问效率。现有的解决方案大多采用内存映射(MMIO)的方式来访问 PM,虽然能缩短 I/O 路径、提高性能,但在多进程环境下,现有基于 MMIO 的文件系统面临诸多挑战,如重复缺页中断(每个进程访问 PM 需单独映射,导致成倍的缺页中断开销,且页表内存占用大)和多进程不一致性(进程对 ...

2024-12-16 17:27:37 阅读
查看更多

博士生丁波的论文被期刊TC录用

持久内存(Persistent Memory, PM)因其低延迟和数据持久性,成为下一代存储技术的理想选择。然而,传统的块设备I/O软件栈冗长,限制了PM的访问效率。现有的解决方案大多采用内存映射的方式来访问PM,尽管这种方式能够显著缩短I/O路径、提高性能,但由于直接将文件映射到用户地址空间,数据易受程序错误或系统崩溃的影响,从而引发数据完整性和一致性问题,使得数据可靠性无法得到保障。通常,需要额外的保护措施来解决这些可靠...

2024-12-13 10:16:37 阅读
查看更多

博士生朱蔚霖的论文被会议ICPP 2024录用

实验室博士生朱蔚霖的论文“LpaqHP: A High Performance FPGA Accelerator for LPAQ Compression”被53rd International Conference on Parallel Processing (ICPP)录用。LPAQ算法具有极高的压缩率,可大幅减少数据的体量。然而LPAQ算法的压缩速率极低,无法投入实际的实用。LpaqHP总体架构博士生朱蔚霖在童薇副教授的指导下提出了LpaqHP——通过解除算法的比特级数据依赖性并使用FPGA对算法进行加速,实现一个字节内八个比特的...

2024-08-21 09:23:24 阅读
查看更多

博士生张津通的论文被会议ICCD 2024录用

​实验室博士生张津通的论文“SchInFS: A File System Integrating Functions of the Block I/O Scheduler for ZNS SSDs” 被42nd IEEE International Conference on Computer Design (ICCD 2024) 录用。新兴的分区命名空间(ZNS)SSD将地址空间划分为顺序写入的区域,并将垃圾回收(GC)转移到主机,从而提供更稳定的性能、更大的容量和更长的设备寿命。然而,顺序写入约束给ZNS设备上的文件系统设计带来了一些问题,特别是导...

2024-08-16 21:26:25 阅读
查看更多

博士生殷文的论文被会议ACM MM 2024录用

实验室博士生殷文的论文“Backdoor Attacks on Bimodal Salient Object Detection with RGB-Thermal Data”于2024年07月21日被ACM International Conference on Multimedia (ACM MM) 录用。ACM MM是中国计算机学会推荐的A类国际学术会议。在云边融合的安全存储系统中,边缘端的视频监控是常用的数据采集方式。其中,可见光—热显著目标检测可以充分利用可见光和热红外来有效采集车辆、行人等数据信息,将图像中最受注意的目标分...

2024-08-15 22:17:47 阅读
查看更多

博士生周恒的论文被会议MICRO 2024录用

存算一体(Computing-in-Memory,CIM)架构能通过原位计算有效加速矩阵向量乘法(Matrix-vector multiplication,MVM),减少数据搬运的开销,有望解决传统冯诺伊曼体系结构的“存储墙”瓶颈。现有软件层面的通信优化工作主要通过精心设计静态的数据布局来减少通信距离;硬件层面的磨损均衡和错误处理工作通过动态调度来提高系统寿命,但却导致数据布局随机化,增加通信距离。为了平衡通信性能和可靠性,同时让现有CIM编译器与...

2024-07-28 19:07:39 阅读
查看更多

博士生明章强的论文被会议HPDC 2024录用

跨节点部署的数据并行(Data Parallel)深度神经网络(DNN)训练系统已被广泛应用于各个领域,而系统性能往往受制于工作者之间同步梯度的通信开销。Top-k稀疏化压缩是缓解通信瓶颈的最有效的方法之一。然而,传统的Top-k仍然存在性能问题:1) DNN每一层的梯度通常表示为多个维度的张量,而传统Top-k所选择的最大k个元素仅集中在所有维度中的部分维度,因此训练可能会丢失很多维度信息(称之为维度缺失),从而导致收敛性能降低...

2024-06-11 17:23:36 阅读
查看更多

博士生王霖的论文被会议Euro-Par 2024录用

随着人工智能服务的迅速发展,预测服务系统(PSSes)已被广泛应用。然而,PSSes在多节点上运行时容易出现掉队节点(如节点减速或故障),这会导致预测延迟增加。为了解决这个问题,传统的方法是使用复制技术,将相同的预测任务分配给多个节点,但这会导致资源开销显著增加。近年来,编码分布式计算(CDC)因其资源效率更高而受到关注,它将预测任务编码为奇偶校验单元,通过解码进行预测重建。然而,现有的CDC方法在准确性和延...

2024-05-28 11:50:55 阅读
查看更多

分享文章

Share

最新发布

Latest