节点文献

基于Lucene的站内搜索引擎研究

THE STUDY OF INTRANET SEARCH ENGINE BASED ON LUCENE

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 马志强刘利民苏依拉马瑞明

【Author】 MA Zhi-qiang1,LIU Li-min1,SU Yi-la1,MA Rui-ming2 (1.School of Information Engineering,Inner Mongolia University of Technology,Hohhot 010051,China;2.Inner Mongolia Research Institute of Electric Power Engineering,Hohhot 010020,China)

【机构】 内蒙古工业大学信息工程学院内蒙古电力工程技术研究院

【摘要】 网站提供的站内查询系统存在着系统不能自动采集网络信息,以及模糊查询结果准确率低等缺点.因此,应用搜索引擎的工作原理,设计了一种基于Lucene的站内搜索引擎系统,实现了站内信息的增量采集、自动分词和建立倒排索引功能.该系统的建立,提高了用户站内搜索的准确率和查全率,使站内信息资源能得到充分利用.

【Abstract】 The service of intranet query is provided on web site.However,it still has some disadvantages.First,the service system can’t collect information automatically.Second,the accuracy of fuzzy query response is very low.With a view to surmounting these disadvantages,on the working principle of search engine,the intranet search engine based on Lucene is designed.The increment collection of information,automatic segmentation of Chinese words and creation function of inverted index have all become available.Consequently,the accuracy of query and response is improved and full use is made of the information of intranet.

【关键词】 搜索引擎Lucene中文分词
【Key words】 search engineLuceneChinese word segmentation
【基金】 国家自然科学基金资助项目(60673015);内蒙古工业大学科学研究项目(X200806)
  • 【文献出处】 内蒙古工业大学学报(自然科学版) ,Journal of Inner Mongolia University of Technology(Natural Science) , 编辑部邮箱 ,2009年01期
  • 【分类号】TP391.3
  • 【被引频次】19
  • 【下载频次】275
节点文献中: 

本文链接的文献网络图示:

本文的引文网络