2011年Usenix ATC 2011(USENIX Annual Technical Conference)文章录用结果揭晓,华中科技大学计算机学院信息存储及应用实验室博士生夏文的论文《SiLo: A Similarity-Locality based Near-Exact Deduplication Scheme with Low RAM Overhead and High Throughput 》被收录为大会宣读论文,这也是该实验室被此系列会议录用的第一篇论文。
Usenix ATC是计算机体系结构领域的旗舰会议。Usenix ATC是Usenix组织开办的年度技术大会简称为USENIX。USENIX的会议宗旨是“将世界领导性的研究者和实践者带到一起进行6天的前沿技术探讨”,由于Usenix注重计算机系统领域的前沿技术以及侧重系统和实践性的工作,所以竞争非常激烈,通常每届会议录用30篇左右论文,录取率在15%左右。Usenix ATC的议题主要包括计算机系统结构、云计算、分布式与并行系统、嵌入式系统、能耗管理、文件存储系统、网络及网络服务、操作系统、计算虚拟化等。
《SiLo: A Similarity-Locality based Near-Exact Deduplication Scheme with Low RAM Overhead and High Throughput》一文提出了一种全新的思路优化重复数据删除性能。由于传统的重复数据删除需要一个庞大的索引表来维持重复数据索引,而这种索引表往往占用了巨大的内存开销。SiLo通过量化分析了存储系统中的数据流的相似性和局部性特征,提出了一种局部性和相似性的有机结合的方法。SiLo通过结合重复数据删除的局部性与相似性特征可以互补的应用到重复数据删除设计的设计中。通过局部性可以提高相似性的重删吞吐率和重复数据删除率,而通过相似性可以减少局部性的内存开销和进一步提高重删吞吐率。这样达到99%的重复数据删除率的前提下,大幅度削减重复数据删除的内存开销,而且达到很高的重复数据删除吞吐率。