首 页 最新通知 图片新闻 项目快讯 项目简报 项目概况 国际会议 信息交流 联系方式

博士生夏鹏论文获得HPDC08会议录用

点击次数:发布时间:2008-04-08 21:55作者:admin

      2008年高性能分布式计算会议HPDC'08文章录用结果揭晓,华中科技大学计算机学院计算机外存储系统国家重点专业实验室博士生夏鹏的论文《FARMER: A Novel Approach to File Access Correlation Mining and Evaluation Reference Model for Optimizing Peta-Scale File System Performance》被收录为大会宣读论文。
      High-Performance Distributed Computing (HPDC) 是高性能计算领域顶级会议之一,平均录取率大约在17%左右,该会议所关注议题包括:高速网络,软件,高性能分布式计算和并行处理,大规模、高效计算以及存储通信。

        文章介绍了一种新颖的挖掘和评价文件相关性的模型— FARMER。该模型借鉴了信息检索领域中向量空间模型的知识将文件访问次序和文件语义属性结合起来评价文件相关度。

      FARMER模型由以下几个阶段组成:1将原始数据从trace文件中提取(Extracting)出来,并有一定的清理(cleaning)操作;2构建访问关系图;3挖掘(Mining)和评价(Evaluating)文件相关性(具体过程下段介绍);4整理结果,排序(Sorting)。FARMER模型的文件相关性挖掘和评价方法主要有两个部分组成:文件语义属性挖掘和文件访问频率挖掘。前者把文件看作成一个由各个语义属性表示的一维向量空间,那么两个文件之间的语义距离(用来描述两个文件语义关系程度),就可以利用信息检索领域中的相似度计算公式来得到。文件访问频率的计算就是通过统计两两文件之间的相对访问概率(访问文件A后访问其后继B的计数比上文件A总的访问计数)。在得到上述的两个方面的评价结果后通过统一的方程将他们结合起来所计算出的结果就是两个文件之间的相关度。

      在已有的方法中,由于没有找到一种比较合适的方法将访问频率挖掘和语义属性挖掘结合,所以并不能完全的反映文件相关性。FARMER通过一种合适的方式同时考虑这两种因素对文件相关性进行评价。通过在HUSt系统上的测试发现,不论是考虑何种应用(高性能计算,普通用户和服务器),FARMER都能够很好的挖掘和评价文件的相关性,在已经实现的应用中(利用相关性进行预取),FARMER预取算法能够显著的提高元数据的缓存命中率(最高可达30%)并且降低元数据服务器响应时间(最高可达35%)。

上一条:博士生吴素贞论文被FAST09会议录用 下一条:华宇博士的论文获得ICDCS08大会的录用

项目简介及成果展示


    本项目针对存储服务模式转变对存储系统带来的影响,对面向复杂应用环境的数据存储系统理论与技术中的关键科学问题进行研究。围绕“面向服务的异构融合存储体系和复杂应用环境下泛在存储服务支撑架构”,研究内容包括:面向服务的融合存储体系结构理论;存储服务架构和效用评价方法;存储需求表达与按需服务模型;存储智能化方法;自组织的动态数据对象管理、存储虚拟化和资源共享方法;混合云存储服务及关键技术;高效能存储系统构建方法;存储高安全高可靠方法。 本项目由华中科技大学主持,参加单位有武汉大学测绘遥感信息工程国家重点实验室,清华大学计算机系,北京大学计算机系,中科院计算所高性能计算国家工程中心,中国人民解放军通信指挥学院等。
相关链接

华中科技大学 信息存储与应用实验室
地址: 湖北省武汉市洪山区珞喻路1037号 光电国家实验室(筹)F307 邮编:430074
Tel:(027)87792450(027)87792302 FAX:87792450