节点文献

蒙古文信息检索系统的设计与实现

Design and Implementation of Mongolian Information Retrieval System

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 温子潇包飞龙高光来王勇和苏向东

【Author】 WEN Zixiao;BAO Feilong;GAO Guanglai;WANG Yonghe;SU Xiangdong;College of Computer Science,Inner Mongolia University;

【通讯作者】 包飞龙;

【机构】 内蒙古大学计算机学院

【摘要】 该文针对传统蒙古文与西里尔蒙古文设计开发了一个功能完备的信息检索系统。在网页抓取方面,采用MD5算法对爬虫进行了改进,提升了爬虫的速度。在预处理阶段,对蒙古文文档进行了编码转换、词缀切分转换等操作。在检索方面,使用向量空间模型实现了对蒙古文文档的检索。在该文系统中加入了西里尔蒙古文到传统蒙古文转换和更新统计等模块,最终搭建了一个可以达到应用要求的蒙古文信息检索系统。

【Abstract】 This paper presents a well-functioned information retrieval system for both traditional Mongolian and Cyrillic Mongolian.In the network crawling,MD5 algorithm is applied to improve the crawler performance.In the preprocessing,Mongolian documents are porcessed for code conversion,affix analysis and proofreading.The retrieval module is built upon the Vector Space Model.In addition,the Cyrillic Mongolian to the traditional Mongolian conversion module is developed to meet the application requirements.

【基金】 国家自然科学基金(61563040);内蒙古自然科学基金重大项目(2016ZD06);内蒙古自然科学基金(2017BS0601)
  • 【文献出处】 中文信息学报 ,Journal of Chinese Information Processing , 编辑部邮箱 ,2018年07期
  • 【分类号】TP391.3
  • 【被引频次】11
  • 【下载频次】197
节点文献中: 

本文链接的文献网络图示:

本文的引文网络