首 页 最新通知 图片新闻 项目快讯 项目简报 项目概况 国际会议 信息交流 联系方式

博士生付忞的论文被TPDS录用

点击次数:发布时间:2015-06-17 15:09作者:admin

        实验室博士生付忞的论文《Reducing Fragmentation for In-line Deduplication Backup Storage via Exploiting Backup History and Cache Knowledge》被 IEEE Transactions on Parallel and Distributed Systems (TPDS) 录用。

        数据去重作为一种非常有效的数据缩减技术,已经被广泛应用于备份和归档系统中。然而,数据去重的机制(重复数据块被指针取代)使得后续备份的数据流在物理上离散地分布,并最终碎片化。碎片问题会严重降低系统的读性能(即数据恢复性能)。我们发现碎片来自两种不同的容器:稀疏容器和乱序容器。稀疏容器会降低系统的恢复性能和垃圾回收效率,而乱序容器会在内存不足的情况下严重降低恢复性能。

        付忞等博士生在冯丹教授的指导下,设计了一个新的数据去重系统解决碎片带来的挑战。(1)为了减少稀疏容器,我们提出了基于历史感知的重写算法(HAR),HAR 比现有算法更准确地识别碎片,因此存储开销更小且恢复性能更好;(2)为了减少乱序容器的影响,我们提出了缓存感知过滤器(CAF)并实现了最有缓存替换算法(OPT),它们的观察是用户恢复文件的顺序可以和备份文件的顺序相同;(3)为了减少垃圾回收的元数据开销,我们提出一种容器标记算法(CMA),CMA 可以将元数据开销降低2个数量级。

       这项研究成果发表在中国计算机学会推荐的 A 类期刊 IEEE TPDS 上。本工作受国家973计划(2011CB302301)、国家自然科学基金(61025008,61173043,61232004)和国家863计划(2013AA013203)等项目的资助。

 

图1 去重率比较

图2 恢复性能比较

下一条:博士生付忞的论文被FAST 2015录用

项目简介及成果展示


    本项目针对存储服务模式转变对存储系统带来的影响,对面向复杂应用环境的数据存储系统理论与技术中的关键科学问题进行研究。围绕“面向服务的异构融合存储体系和复杂应用环境下泛在存储服务支撑架构”,研究内容包括:面向服务的融合存储体系结构理论;存储服务架构和效用评价方法;存储需求表达与按需服务模型;存储智能化方法;自组织的动态数据对象管理、存储虚拟化和资源共享方法;混合云存储服务及关键技术;高效能存储系统构建方法;存储高安全高可靠方法。 本项目由华中科技大学主持,参加单位有武汉大学测绘遥感信息工程国家重点实验室,清华大学计算机系,北京大学计算机系,中科院计算所高性能计算国家工程中心,中国人民解放军通信指挥学院等。
相关链接

华中科技大学 信息存储与应用实验室
地址: 湖北省武汉市洪山区珞喻路1037号 光电国家实验室(筹)F307 邮编:430074
Tel:(027)87792450(027)87792302 FAX:87792450