节点文献

基于一种文档表示模型的站内搜索引擎设计与实现

Website Search Engine Design and Implementation Based on a Document Representation Model

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 蒋辉阳小华刘志明闫仕宇马家宇李晓昀李萌周座

【Author】 JIANG Hui;YANG Xiao-hua;LIU Zhi-ming;YAN Shi-yu;MA Jia-yu;LI Xiao-yun;LI Meng;ZHOU Zuo;School of Computer Science and Technology,University of South China;

【机构】 南华大学计算机科学与技术学院

【摘要】 根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体,在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.

【Abstract】 According to the comprehensive information theory,epistemology information is the trinity of syntactic information,semantic information and pragmatic information.Making better use of pragmatic information in information retrieval can promote the quality of information retrieval.A document representation model based on query and content can make better use of pragmatic information,and it is good to promote the precision of the website search engine.Lucene is a open source full text search engine architecture which is developed using java language.We use lucene to design and implement a website engine based on document representation model using query and content.The experiment results show that this model can effectively improve precision rate in information retrieval.

【基金】 湖南省自然科学基金资助项目(11JJ6047);衡阳市科技计划基金资助项目(2011KJ14;2013KG67);湖南省科技计划基金资助项目(2011FJ3087);南华大学计算机科学与技术校级重点学科基金资助项目
  • 【文献出处】 南华大学学报(自然科学版) ,Journal of University of South China(Science and Technology) , 编辑部邮箱 ,2013年04期
  • 【分类号】TP391.3
  • 【被引频次】2
  • 【下载频次】50
节点文献中: 

本文链接的文献网络图示:

本文的引文网络