节点文献

Peer-to-Peer环境下基于内容的智能搜索

Intelligent Search Based on Content of Documents in Peer-to-Peer Network

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 何盈捷冯月利王珊

【Author】 HE Ying-Jie,FENG Yue-Li,and WANG Shan (School of Information,Renmin University of China,Beijing 100872)

【机构】 中国人民大学信息学院

【摘要】 目前大多数P2P系统只支持基于文件标识的搜索,大大限制了P2P的应用范围.纯P2P网络所采用的广播式搜索盲目低效,浪费网络带宽.提出了P2P环境下基于内容的智能搜索算法.利用向量空间模型进行基于相似度的查询.结点对以往的查询进行查询聚类,对当前的查询,根据查询类选择最有可能包含查询结果的结点发送查询,提高了搜索的效率.随着查询的进行,查询类可以自动凋整,维护代价不大,具有自适应的特点.实验证明,基于内容的智能搜索在保证查询效果的前提下大大提高搜索的效率.

【Abstract】 Most existing peer-to-peer(P2P) systems only support simple title-based search,which is limited in functionality.Broadcast search is widely used in pure P2P network,which is not efficient and costs a lot of bandwidth.An intelligent search algorithm based on content of document is proposed.Vector space model(VSM) is used to do similarity search.Each peer does query clustering with the past queries. For a new arriving query,the most possible peers that have the query answers are selected according to the query cluster to send the query,which improves the search efficiency.With queries done,query clusters can be adjusted automatically with a little cost.It is proved by experiments that the intelligent search algorithm can greatly improve the search efficiency,and meanwhile guarantee the query effectiveness.

【关键词】 P2P相似度聚类智能搜索
【Key words】 P2Psimilarityclusteringintelligent search
【基金】 国家自然科学基金重大项目(604963205);国家“八六三”高技术研究发展计划专项基金项目(2002AA4Z3130);北京市科技计划基金重大项目(H030130040011);国家“九七三”重点基础研究发展规划重大项目前期研究专项基金项目(2001CCA03000)
  • 【会议录名称】 第二十一届中国数据库学术会议论文集(研究报告篇)
  • 【会议名称】第二十一届中国数据库学术会议
  • 【会议时间】2004-10-14
  • 【会议地点】中国福建厦门
  • 【分类号】TP391.3
  • 【主办单位】中国计算机学会数据库专业委员会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络