博士生刘飞帆的论文被会议DAC 2026录用 大型语言模型的分布式推理服务常常会出现负载不均衡问题,因此前缀 KV 缓存被广泛用于提升推理效率。当前关于负载均衡的前沿研究主要集中在热点缓存副本机制上,但这种方式会导致缓存副本数量有限,依然引发严重的节点负载不均,进而拉高推理延迟。实验室博士生刘飞帆在胡燏翀老师的指导下,共同提出了一种基于纠删码的前缀 KV 缓存框架ECPrefix。该框架通过将热点前缀缓存编码为分块并分散存储到多个节点,替代传统副本策略以...
博士生郭柯磊的论文被会议SIGMOD 2026录用 随着Transformer架构发展,大规模推荐模型(LRM)已广泛应用于实际业务。这类系统既要处理海量用户行为序列,又会产生大量KV缓存,给底层存储带来点读、范围扫描、低延迟读取和高效写入等混合负载挑战。现有存储系统难以同时满足性能、成本与在线服务稳定性要求,已成为制约相关应用发展的关键瓶颈。实验室博士生郭柯磊在方鹏博士后、王芳教授、冯丹教授指导下,联合字节跳动公司提出面向大规模推荐模型全生命周期的统一存储...
硕士生丁峥尧的论文被会议DAC 2026录用 随着闪存固态硬盘的存储单元密度和层数的增加,数据读取面临原始误码率不断攀升的问题。现有的基于低密度奇偶校验码(Low-Density Parity-Check Code,LPDC)的纠错码采用低码率或码率调整方案,面临高昂校验数据开销和跨页访问成本,难以兼顾冗余开销、读取性能和数据可靠性。华中科技大学信息存储及应用实验室硕士生丁峥尧(第一作者)、硕士生王鼎鑫等,在李晓露讲师等的指导下,提出COLA框架:(1)基于码字故障感知的重读...
博士生张望的论文被期刊ACM TACO录用 异构对象存储(HOS)系统作为人工智能、大数据应用的核心存储支撑,通过整合NVMe SSD、HDD等不同性能等级存储设备实现成本与性能的平衡,已成为云存储领域主流架构。然而,设备间巨大性能差距与请求动态访问模式,导致传统副本选择与请求调度策略难以应对。现有方案多忽视设备异构特性与跨设备空间依赖(如性能耦合、干扰效应),易造成局部拥堵扩散为系统性瓶颈,引发服务级目标(SLO)违例,严重影响上层应用可靠性。图1 STGr...
博士生张望的论文被期刊IEEE TPDS录用 分布式存储系统作为人工智能、大数据技术的核心支撑,其性能直接影响上层应用效率。随着存储集群规模扩大、架构日趋复杂,系统可调参数迅猛增长且交互复杂。加之工作负载动态多变,传统调优方案面临三大难题:参数空间探索不充分、调优速度与稳定性难以平衡、跨集群知识无法复用,严重制约系统扩展性与响应速度。图1 KGQW架构图针对这一问题,信息存储系统教育部重点实验室博士生张望在施展副教授的指导下,提出了一个框架KGQW...
博士生张望的论文被期刊IEEE TPDS录用 服务无感知计算凭借“按需调用、免运维”的特性,已成为云原生应用开发的核心技术之一。然而,该技术面临冷启动问题这一关键痛点。即:函数,尤其是稀疏函数,在首次调用或闲置后需重新初始化其执行环境,导致其启动延迟远超实际执行时间。因这些函数调用数据稀疏、有效样本少,使得传统预测模型难以捕捉规律,继而既影响系统资源调度策略的正常运行,导致用户体验受损。图1 SPFaaS架构图针对这一问题,信息存储系统教育部重点...
毕业生张健顺和博士生邓迅的论文被会议VLDB 2026录用 随着大规模数据密集型应用的快速发展,基于日志结构合并树(LSM-tree)的键值存储系统凭借其接口简单、写入吞吐高等特性,已在现代存储系统中被广泛采用。但是,LSM-Tree存在显著的写放大问题,键值分离(Key-Value Separation)能够缓解这一问题,代价是引入更高的空间开销。为提升成本效率与资源弹性,现代存储系统逐渐开始向存算分离架构演进,通过将计算节点与存储节点解耦并独立部署,实现资源弹性调度与独立扩展。然而,...
博士生明章强的论文被会议DAC 2026录用 大型语言模型(LLM)通常在分布式系统上进行训练,是众多不同领域应用不可或缺的一部分。然而,LLM训练系统的分布式特性(通常涉及多个节点和较长的训练周期)导致故障频发,因此需要强大的故障恢复机制。传统的检查点机制会定期将模型状态保存到持久存储(例如磁盘)中,但这可能会造成显著的延迟,从而减慢训练进度。目前最先进的方法采用基于分区的流水线式检查点机制,将检查点分割成多个分区,并在训练过程中以流水线方式...
硕士生马海舰的论文被会议NIPS 2025录用 在多模态大语言模型(MLLMs)广泛应用于图像理解、视觉问答等领域的当下,其安全漏洞问题愈发突出。现有对抗攻击方法多针对特定图像 - 提示对优化,存在泛化能力弱、迁移性差等缺陷,难以应对真实场景中多样化的输入组合。近日,一项受国家自然科学基金(No.62476107)支持的创新性研究,提出基于分布逼近理论的跨图像 / 提示对抗攻击方法,成功实现对主流多模态大模型的高效通用攻击,为大模型安全防护体系建设提供了重要参考...
硕士生马海舰的论文被会议EMNLP 2025录用 在网络威胁日益复杂多变的当下,入侵检测系统(IDS)作为网络安全的核心防线,却长期面临高质量标注恶意样本稀缺的行业痛点。现有样本来源受隐私保护、法律约束及威胁滞后性等因素限制,导致检测模型泛化能力不足,难以应对新型攻击。近日,华中科技大学与北京大学联合研究团队提出创新半监督框架 GANGRL-LLM,成功实现少样本场景下高质量恶意代码生成与检测能力的双重提升,为自适应防御系统研发提供了全新解决方案。该研究由...
分享文章
最新发布
友情链接