中国学术期刊网络出版总库
  关闭
一种变长编码压缩倒排索引算法  
   推荐 CAJ下载 PDF下载
【英文篇名】 An variable length code algorithm compression inverted index
【下载频次】 ★★★
【作者】 毛福林; 瞿有利;
【英文作者】 MAO Fu-lin; QU You-li; School of Computer and Information Technology; Beijing Jiaotong University;
【作者单位】 北京交通大学计算机与信息技术学院;
【文献出处】 山东大学学报(理学版) , Journal of Shandong University(Natural Science), 编辑部邮箱 2014年 12期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  CJFD收录刊
【中文关键词】 倒排索引; 整数压缩; 索引压缩;
【英文关键词】 inverted index; integer compression; index compression;
【摘要】 全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。
【英文摘要】 The efficiency of text search engines relies on data structure: inverted index. And the more large space is need to storage the inverted index. A newcompression algorithm was proposed. For the given document collections. Terrier,the information retrival tool,was used to build inverted index,and the state-of-the-art compression techniques was used to compress inverted file. Then the compress ratio was confirmed by comparing the file size. Experiments showthat the newcompression techniques can get much better...
【基金】 中央高校基本科研业务费专项资金项目(2011JBM231)
【更新日期】 2015-01-05
【分类号】 TP391.3
【正文快照】 0引言信息检索系统在搜索引擎、数字图书馆和电子商务等领域中广泛使用[]。信息检索系统对文档集合构建倒排索引,响应成千上万的用户查询请求,并且向用户提供准确的查询结果。存储倒排索引需要很大的存储空间[2],如果不使用任何技术存储倒排索引,则需要的存储空间可为原文档集?

xxx
【读者推荐文章】中国期刊全文数据库 中国优秀硕士学位论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      检索机
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号