博士生王霖的论文被会议CLUSTER 2025录用 随着数据量爆炸式增长,重复数据删除技术在集群主存储系统中引入新碎片化问题,现有重写与超级块方案效果不佳。华中科技大学信息存储及应用实验室硕士生王霖(第一作者)、硕士生毛世龙、博士生李茗畦、硕士生段梓羚等同学,在胡燏翀教授、秦磊华教授、冯丹教授的联合指导下,与华为合作提出ReoDedup:1)利用余弦相似度算法(CSR)将高共享度块重定位;2)基于邻接表启发式算法(ATR)降低复杂度;3)设计索引重映射更新(IRU...
硕士生童傲洋的论文被会议ICS 2025录用 持久化学习型索引利用机器学习模型拟合数据分布模式,能够显著提高索引的搜索性能。然而,在动态场景下,持久化学习型索引需要频繁进行重训练以维持模型精度,从而严重阻塞索引操作并显著降低系统性能。此外,为了保证崩溃一致性,现有的持久化学习型索引将模型结构保存在NVM中,从而在索引操作的关键路径上产生大量的模型读写开销,并迅速消耗NVM带宽。为了降低持久化学习型索引的重训练和持久化开销,信息存储与光显示功能实...
博士生董根的论文被会议ATC 2025录用 如今各种软件离不开云的支持,保证云的可靠性是重要的研究课题。云上的容错机制保证了故障发生时云的可靠性,但是目前的容错机制都是针对粗粒度的故障所设计的。新的故障类型Fail-slow硬件表现出的细粒度特征在云上造成了严重的系统错误。为了减少Fail-slow硬件导致的云系统错误,信息存储与光显示功能实验室博士生董根在华宇教授的指导下,总结了Fail-slow硬件导致的云系统错误的特征并深入地分析了这类错误发生的根本原因。在...
本科生姚晨炫和博士生刘飞帆的论文被会议SC 2025录用 大型深度学习模型的分布式训练常常会出现故障,因此 checkpointing(检查点机制)被广泛用于故障恢复。当前关于快速恢复的前沿研究主要集中在频繁检查点机制上,但这种方式会生成大量检查点,导致成本显著增加,进而降低训练性能。最近,差分检查点机制被提出以降低成本,但其应用仅限于推荐系统,在通用分布式训练系统中的应用尚未得到探索。实验室即将入学攻读博士的本科生姚晨炫和博士生刘飞帆在胡燏翀老师的指导下,共同提...
博士生万天宇的论文被会议Euro-Par 2025录用 分解内存将计算和存储节点分成两个独立的内存池,通过RDMA或CXL链路连接。分解内存提高了资源利用率,节省了成本开销,并确保了内存和计算资源的弹性可扩展性。树索引是数据库或KV存储等存储系统的重要保证。现有的分解内存系统存在写入性能差的问题,主要是由于并发冲突、频繁的结构修改操作(SMO)和树索引上的高锁开销。信息存储系统教育部重点实验室博士生万天宇,以及硕士生龚世佳,胡杨扬,在导师陈俭喜副教授的指导下,...
硕士生郑欣觉的论文被会议Euro-Par 2025录用 随着深度神经网络(DNN)的快速发展和数据集规模的持续增长,分布式深度神经网络训练系统在梯度同步过程中面临通信瓶颈。梯度压缩技术能够极大程度上减少通信开销,但是由于只传输压缩的梯度,会造成模型准确率的损失。为了确保模型准确率和收敛性能,通常将原始梯度与压缩梯度的差值(残差)存储在GPU内存中以补偿损失。然而,残差通常会在训练过程中产生显著的GPU内存开销,限制了集群可训练模型的大小。为了解决这个问题,信...
博士生明章强的论文被会议HPDC 2025录用 跨节点(Worker)部署的分布式深度神经网络(DNN)训练系统已广泛应用于各个领域,而Worker之间同步梯度张量的通信开销往往成为性能瓶颈。为了优化通信效率,最先进的研究通常采用两种优化技术:i)梯度稀疏化压缩,即将梯度截断为最大的元素,以减少通信流量;ii)张量融合,将多个梯度张量合并在一个融合缓冲区内一起传输,以减少通信启动开销。然而,进过测量发现现有的研究往往在张量融合后才进行梯度稀疏化(称之为“张量...
博士生姜聪的论文被会议DAC 2025录用 实验室博士生姜聪的论文“Generalizable Lithographic Hotspot Detection Using Asynchronous Meta-Learning with Only One Shot”被IEEE/ACM Design Automation Conference (DAC’25)录用。随着制造工艺的发展,芯片设计版图的规模越来越大,且特征尺寸急剧缩小,导致传统EDA在版图优化方面面临挑战。基于深度学习的光刻热点检测成为先进制程中对超大规模芯片版图实现快速、准确光刻热点检测的关键技术。然而, 现有光刻热点检...
博士生姜聪的论文被期刊TODAES录用 实验室博士生姜聪的论文“LithoExp: Explainable Two-stage CNN-based Lithographic Hotspot Detection with Layout Defect Localization”被IEEE/ACM Transactions on Design Automation of Electronic Systems(TODAES)录用。在芯片设计制造流程中,光刻热点检测是保证芯片制造版图与设计版图内容一致的关键技术。当前光刻热点检测模型普遍沿用原始深度学习的训练范式,自动探索芯片版图布局关键特征的提取方法并用于热点检测...
博士生亓文杰的论文被期刊TACO录用 新兴的分区命名空间(Zoned Namespace,ZNS)为主机提供细粒度的、性能可预测的存储管理。ZNS将地址空间组织成由固定大小、顺序写入、不可覆盖的块组成的Zone,使其适用于日志结构文件系统。然而,实验分析表明,ZNS的写约束带来了文件同步开销。首先,数据块的异地更新需要对文件元数据块进行频繁的小修改,以记录最新的逻辑块地址。其次,一些文件(如数据库的WAL文件)经常执行小的同步写操作,其I/O大小通常小于逻辑块。这...
分享文章
最新发布
友情链接