首 页 最新通知 图片新闻 项目快讯 项目简报 项目概况 国际会议 信息交流 联系方式

博士生付忞的论文被ATC 2014录用

点击次数:发布时间:2014-06-04 09:46作者:admin

       实验室博士生付忞的论文“Accelerating Restore and Garbage Collection in Deduplication-based Backup Systems via Exploiting Historical Information”被2014年USENIX年度技术会议(2014 USENIX Annual Technical Conference,ATC 2014)录用。

       论文旨在解决数据去重备份系统中的恢复和垃圾回收操作效率低下的问题。数据去重系统中的数据块会被多次备份共享,导致一次备份的数据在在磁盘上不是连续分布,降低了读性能;被用户删除的失效数据也离散地分布在磁盘,导致垃圾回收的效率很低,垃圾回收的开销与数据块的数量成正比,同时与定时的备份操作和紧急的恢复操作竞争存储带宽。我们的观察发现碎片分为两类,即稀疏容器和乱序容器。乱序容器可以通过增加恢复缓存解决,稀疏容器直接放大了读操作,因此更为严重。现有的解决方案在备份的过程中识别出碎片化的数据块,并将碎片数据块重新写到新的物理地址。这种方法使用一个重写缓冲区,将连续到来的重复数据块暂时放在缓冲区中,然后在缓冲区的范围内分析重复数据块的物理地址,找出物理地址不连续的数据块,将它们重写。这种方法牺牲一定的存储效率换取读性能。然而由于缓冲区的大小有限,现有方法不能准确地识别稀疏容器,因而损失了太多存储效率,同时获得的恢复性能提升有限。我们提出了一种准确识别稀疏容器的方法,称为历史感知的重写算法(HAR)。HAR的观察是,在备份应用中,稀疏容器有继承的特点,即一个数据块在当前备份是属于稀疏容器的,则在下一次备份也是属于稀疏容器。因此HAR在备份时记录下稀疏容器信息,用于下一次备份的重写。HAR的存储效率和恢复性能都优于现有重写算法。此外论文还实现了Belady的最优缓存替换算法,可以减少乱序容器对恢复性能的影响。为了简化垃圾回收的引用管理操作,论文还提出了容器标记算法,将引用管理的粒度从块级提升到容器级,将元数据开销减少了2个数据级。

        ATC是计算机系统领域的旗舰会议,由于ATC注重计算机系统领域的前沿技术以及侧重系统和实践性的工作,所以竞争非常激烈。本届会议收到241篇投稿,仅录用44篇论文,录用率为18%。

上一条:博士生吴运翔的论文被ICPP-2015录用 下一条:博士生黄赛的论文被MSST2013录用

项目简介及成果展示


    本项目针对存储服务模式转变对存储系统带来的影响,对面向复杂应用环境的数据存储系统理论与技术中的关键科学问题进行研究。围绕“面向服务的异构融合存储体系和复杂应用环境下泛在存储服务支撑架构”,研究内容包括:面向服务的融合存储体系结构理论;存储服务架构和效用评价方法;存储需求表达与按需服务模型;存储智能化方法;自组织的动态数据对象管理、存储虚拟化和资源共享方法;混合云存储服务及关键技术;高效能存储系统构建方法;存储高安全高可靠方法。 本项目由华中科技大学主持,参加单位有武汉大学测绘遥感信息工程国家重点实验室,清华大学计算机系,北京大学计算机系,中科院计算所高性能计算国家工程中心,中国人民解放军通信指挥学院等。
相关链接

华中科技大学 信息存储与应用实验室
地址: 湖北省武汉市洪山区珞喻路1037号 光电国家实验室(筹)F307 邮编:430074
Tel:(027)87792450(027)87792302 FAX:87792450