信息存储系统教育部重点实验室

【学术动态】

博士生陈梦雷和硕士生王一枭的论文被国际学术会议DAC 2026录...

在线事务处理(OLTP)系统广泛支撑着电子商务等关键应用,尽管现代事务处理系统将数据全量存储在内存中以消除磁盘I/O瓶颈,其性能仍然受制于内存带宽,大量细粒度的随机读写操作导致内存访问成为主要性能瓶颈。存内处理(PIM)架构虽能提供高聚合带宽,但在实际事务处理中面临负载不均衡和DPU间数据传输开销高等挑战。为了克服上述问题,实验室博士生陈梦雷、硕士生王一枭(共同一作),在华宇教授的指导下,提出了一种面向真实...

2026-05-24 20:21:48 阅读
查看更多

硕士生魏攀悦的论文被会议DCC 2026录用

数据压缩是降低存储成本、提升数据传输效率的重要基础技术。上下文混合压缩算法(Context Mixing, CM)能够通过精细的预测建模获得极高压缩比,但其在CPU平台上的吞吐率较低。以LPAQ为代表的CM压缩算法需要逐bit完成预测、混合和编码,且依赖离散的哈希状态访问,导致难以持续发挥SIMD并行能力,也难以随着线程数增加获得接近线性的吞吐扩展。针对上述问题,华中科技大学信息存储及应用实验室硕士生魏攀悦(第一作者)及朱蔚霖...

2026-05-12 11:28:15 阅读
查看更多

博士生刘飞帆的论文被会议DAC 2026录用

大型语言模型的分布式推理服务常常会出现负载不均衡问题,因此前缀 KV 缓存被广泛用于提升推理效率。当前关于负载均衡的前沿研究主要集中在热点缓存副本机制上,但这种方式会导致缓存副本数量有限,依然引发严重的节点负载不均,进而拉高推理延迟。实验室博士生刘飞帆在胡燏翀老师的指导下,共同提出了一种基于纠删码的前缀 KV 缓存框架ECPrefix。该框架通过将热点前缀缓存编码为分块并分散存储到多个节点,替代传统副本策略以...

2026-04-12 13:15:58 阅读
查看更多

博士生郭柯磊的论文被会议SIGMOD 2026录用

​随着Transformer架构发展,大规模推荐模型(LRM)已广泛应用于实际业务。这类系统既要处理海量用户行为序列,又会产生大量KV缓存,给底层存储带来点读、范围扫描、低延迟读取和高效写入等混合负载挑战。现有存储系统难以同时满足性能、成本与在线服务稳定性要求,已成为制约相关应用发展的关键瓶颈。实验室博士生郭柯磊在方鹏博士后、王芳教授、冯丹教授指导下,联合字节跳动公司提出面向大规模推荐模型全生命周期的统一存储...

2026-03-20 20:04:45 阅读
查看更多

硕士生丁峥尧的论文被会议DAC 2026录用

随着闪存固态硬盘的存储单元密度和层数的增加,数据读取面临原始误码率不断攀升的问题。现有的基于低密度奇偶校验码(Low-Density Parity-Check Code,LPDC)的纠错码采用低码率或码率调整方案,面临高昂校验数据开销和跨页访问成本,难以兼顾冗余开销、读取性能和数据可靠性。华中科技大学信息存储及应用实验室硕士生丁峥尧(第一作者)、硕士生王鼎鑫等,在李晓露讲师等的指导下,提出COLA框架:(1)基于码字故障感知的重读...

2026-03-16 21:19:58 阅读
查看更多

博士生张望的论文被期刊ACM TACO录用

异构对象存储(HOS)系统作为人工智能、大数据应用的核心存储支撑,通过整合NVMe SSD、HDD等不同性能等级存储设备实现成本与性能的平衡,已成为云存储领域主流架构。然而,设备间巨大性能差距与请求动态访问模式,导致传统副本选择与请求调度策略难以应对。现有方案多忽视设备异构特性与跨设备空间依赖(如性能耦合、干扰效应),易造成局部拥堵扩散为系统性瓶颈,引发服务级目标(SLO)违例,严重影响上层应用可靠性。图1 STGr...

2026-03-11 22:46:42 阅读
查看更多

博士生张望的论文被期刊IEEE TPDS录用

分布式存储系统作为人工智能、大数据技术的核心支撑,其性能直接影响上层应用效率。随着存储集群规模扩大、架构日趋复杂,系统可调参数迅猛增长且交互复杂。加之工作负载动态多变,传统调优方案面临三大难题:参数空间探索不充分、调优速度与稳定性难以平衡、跨集群知识无法复用,严重制约系统扩展性与响应速度。图1 KGQW架构图针对这一问题,信息存储系统教育部重点实验室博士生张望在施展副教授的指导下,提出了一个框架KGQW...

2026-03-11 22:43:08 阅读
查看更多

博士生张望的论文被期刊IEEE TPDS录用

服务无感知计算凭借“按需调用、免运维”的特性,已成为云原生应用开发的核心技术之一。然而,该技术面临冷启动问题这一关键痛点。即:函数,尤其是稀疏函数,在首次调用或闲置后需重新初始化其执行环境,导致其启动延迟远超实际执行时间。因这些函数调用数据稀疏、有效样本少,使得传统预测模型难以捕捉规律,继而既影响系统资源调度策略的正常运行,导致用户体验受损。图1 SPFaaS架构图针对这一问题,信息存储系统教育部重点...

2026-03-11 22:38:14 阅读
查看更多

毕业生张健顺和博士生邓迅的论文被会议VLDB 2026录用

随着大规模数据密集型应用的快速发展,基于日志结构合并树(LSM-tree)的键值存储系统凭借其接口简单、写入吞吐高等特性,已在现代存储系统中被广泛采用。但是,LSM-Tree存在显著的写放大问题,键值分离(Key-Value Separation)能够缓解这一问题,代价是引入更高的空间开销。为提升成本效率与资源弹性,现代存储系统逐渐开始向存算分离架构演进,通过将计算节点与存储节点解耦并独立部署,实现资源弹性调度与独立扩展。然而,...

2026-03-11 22:27:04 阅读
查看更多

博士生明章强的论文被会议DAC 2026录用

大型语言模型(LLM)通常在分布式系统上进行训练,是众多不同领域应用不可或缺的一部分。然而,LLM训练系统的分布式特性(通常涉及多个节点和较长的训练周期)导致故障频发,因此需要强大的故障恢复机制。传统的检查点机制会定期将模型状态保存到持久存储(例如磁盘)中,但这可能会造成显著的延迟,从而减慢训练进度。目前最先进的方法采用基于分区的流水线式检查点机制,将检查点分割成多个分区,并在训练过程中以流水线方式...

2026-02-24 20:47:44 阅读
查看更多

分享文章

Share