首 页 最新通知 图片新闻 项目快讯 项目简报 项目概况 国际会议 信息交流 联系方式

博士生张宇成论文在INFOCOM2015上发表

点击次数:发布时间:2015-06-17 15:04作者:admin

        实验室博士生张宇成的论文《AE: An Asymmetric Extremum Content Defined Chunking Algorithm for Fast and Bandwidth-Efficient Data Deduplication》被第34届IEEE计算机通信国际会议(34th IEEE International Conference on Computer Communications (INFOCOM 2015))作为长文全文录用。

        大数据时代,海量的数据给存储和传输带来了巨大的挑战。近期的研究表明,存储系统和网络流量中都存在大量的重复数据,因此重复数据删除技术受到企业和学术界越来越多的关注。重复数据删除包括数据分块、指纹计算、索引、存储(或传输)四个环节,其中数据分块负责将输入数据流分成多个数据块。但是目前的分块算法过于耗时,导致数据分块环节成为重复数据删除流程中的性能瓶颈。

        张宇成等博士生在冯丹教授的指导下,提出一种基于非对称极值的分块算法(Asymmetric Extremum Chunking Algorithm,简称AE算法),打破了数据去重系统中的数据分块环节的性能瓶颈。AE算法查找非对称区域内的局部极值,并利用局部极值不容易被替换掉这一原理避免边界偏移问题。与现有分块算法相比,AE算法的计算开销更小,块长方差更小,同时可检测到更多的低熵字符串。实验结果表明,AE可获得与现有分块算法相当或更高的去重率,同时达到现有算法3倍多的分块吞吐量。

       这项研究成果“数据重删系统中的基于内容的非对称极值分块算法”(AE:An Asymmetric Extremum Content Defined Chunking Algorithm for Fast and Bandwidth-Efficient Data Deduplication)发表在中国计算机学会A类国际会议INFOCOM 2015上,INFOCOM是IEEE组织在通信网络领域的旗舰型会议,同时也是中国计算机学会规定的A类会议。本届会议收到1640篇投稿,录用316篇论文,录用率为19%。相关研究工作得到国家973计划(2011CB302301)、国家自然科学基金(61025008,61173043,61232004,6140050892)和国家863计划(2013AA013203)等项目的支持。

实验结果:分块吞吐量

上一条:博士生付忞的论文被FAST 2015录用 下一条:博士生周玉坤的论文被MSST2015录用

项目简介及成果展示


    本项目针对存储服务模式转变对存储系统带来的影响,对面向复杂应用环境的数据存储系统理论与技术中的关键科学问题进行研究。围绕“面向服务的异构融合存储体系和复杂应用环境下泛在存储服务支撑架构”,研究内容包括:面向服务的融合存储体系结构理论;存储服务架构和效用评价方法;存储需求表达与按需服务模型;存储智能化方法;自组织的动态数据对象管理、存储虚拟化和资源共享方法;混合云存储服务及关键技术;高效能存储系统构建方法;存储高安全高可靠方法。 本项目由华中科技大学主持,参加单位有武汉大学测绘遥感信息工程国家重点实验室,清华大学计算机系,北京大学计算机系,中科院计算所高性能计算国家工程中心,中国人民解放军通信指挥学院等。
相关链接

华中科技大学 信息存储与应用实验室
地址: 湖北省武汉市洪山区珞喻路1037号 光电国家实验室(筹)F307 邮编:430074
Tel:(027)87792450(027)87792302 FAX:87792450