节点文献

高效FTP搜索引擎的设计与实现

Design and Implementation of High-Performance FTP Search Engine

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 郭立力赵春江

【Author】 Guo Li-li1 Zhao Chun-jiang2(1.College of Engineering,China Agricultural University,Beijing 100083,China;2.National Engineering Research Center for Information Technology in Agriculture,Beijing 100037,China)

【机构】 中国农业大学工学院国家农业信息化工程技术研究中心

【摘要】 为了解决传统FTP搜索引擎对检索结果优化程度不够而造成的检索质量低的问题,在对FTP用户查询日志进行统计分析的基础上,采用双字节倒排索引、检索结果自动分类以及查询自动纠错等技术设计了一种高性能的智能化FTP搜索引擎.双字节倒排是对文件名中每两个字节建立倒排索引表,自动分类是对检索结果按主题划分为层次结构,查询自动纠错是以用户查询日志中的高频查询词为数据源构建拼写错误词典.试验结果表明,该方案能够有效地提高FTP搜索引擎的文件检索效率与质量.

【Abstract】 In order to improve the query quality of the traditional FTP search engines possessing low optimization performance for query results,a high-performance intelligent FTP search engine is designed based on the statistical analysis of FTP user query logs.In this engine,the double-byte inverted index is employed to build an inverted index table with every double bytes of the file name,the automatic classification of query results is used to establish a tree structure of query results based on the search topic,and the automatic error correction is adopted to construct a spelling mistake dictionary with the high-frequency search keywords in user query logs.Query results in a real system indicate that the proposed scheme greatly improves the query efficiency and quality of a FTP search engine.

【基金】 国家“863”计划项目(2006AA10Z239);国家科技支撑计划项目(2006BAH02A16)
  • 【文献出处】 华南理工大学学报(自然科学版) ,Journal of South China University of Technology(Natural Science Edition) , 编辑部邮箱 ,2009年01期
  • 【分类号】TP391.3
  • 【被引频次】14
  • 【下载频次】339
节点文献中: 

本文链接的文献网络图示:

本文的引文网络