首 页 最新通知 图片新闻 项目快讯 项目简报 项目概况 国际会议 信息交流 联系我们

博士生付忞的论文被TPDS录用

点击次数:发布时间:2015-06-17 15:09作者:admin

        实验室博士生付忞的论文《Reducing Fragmentation for In-line Deduplication Backup Storage via Exploiting Backup History and Cache Knowledge》被 IEEE Transactions on Parallel and Distributed Systems (TPDS) 录用。

        数据去重作为一种非常有效的数据缩减技术,已经被广泛应用于备份和归档系统中。然而,数据去重的机制(重复数据块被指针取代)使得后续备份的数据流在物理上离散地分布,并最终碎片化。碎片问题会严重降低系统的读性能(即数据恢复性能)。我们发现碎片来自两种不同的容器:稀疏容器和乱序容器。稀疏容器会降低系统的恢复性能和垃圾回收效率,而乱序容器会在内存不足的情况下严重降低恢复性能。

        付忞等博士生在冯丹教授的指导下,设计了一个新的数据去重系统解决碎片带来的挑战。(1)为了减少稀疏容器,我们提出了基于历史感知的重写算法(HAR),HAR 比现有算法更准确地识别碎片,因此存储开销更小且恢复性能更好;(2)为了减少乱序容器的影响,我们提出了缓存感知过滤器(CAF)并实现了最有缓存替换算法(OPT),它们的观察是用户恢复文件的顺序可以和备份文件的顺序相同;(3)为了减少垃圾回收的元数据开销,我们提出一种容器标记算法(CMA),CMA 可以将元数据开销降低2个数量级。

       这项研究成果发表在中国计算机学会推荐的 A 类期刊 IEEE TPDS 上。本工作受国家973计划(2011CB302301)、国家自然科学基金(61025008,61173043,61232004)和国家863计划(2013AA013203)等项目的资助。

 

图1 去重率比较

图2 恢复性能比较

项目简介及成果展示



    本项目针对下一代互联网的高效性、可扩展性、安全性和高服务,提出建立一种新的存储模式,即“多层次、可扩展的存储对象”模式,并研究相关的核心技术,达到统一和更新网络存储,组建PB级的基于存储对象的存储系统。项目重点研究内容包括:基于存储对象的分布体系结构;高速通道;海量数据存储网络;数据组织与共享机制;存储按需部署与服务质量;GIS分布存储示范应用系统。预期在存储系统理论和核心技术方面获得突破,形成有自主知识产权的信息存储技术。本项目由华中科技大学主持,参加单位有武汉大学测绘遥感信息工程国家重点实验室,清华大学计算机系,北京大学计算机系,中科院计算所,解放军通信指挥学院等。
相关链接

华中科技大学 信息存储与应用实验室
地址: 湖北省武汉市珞喻路1037号 华中科技大学南一楼中501室 邮编:430074
Tel:(027)87542463 (027)87557649 Fax:(027)87545004