节点文献

一种改进的页面相似性度量方法

Improvement of similarity measure method

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 张霞王建东顾海花

【Author】 ZHANG Xia1,WANG Jian-dong2,GU Hai-hua1 1.Software College,Nanjing College of Information Technology,Nanjing 210046,China 2.College of Information Science and Technology,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China

【机构】 南京信息职业技术学院软件学院南京航空航天大学信息科学与技术学院

【摘要】 Web信息检索是指从大量Web文档集合中找到与给定的查询请求相关的、恰当数目的文档子集。为了更准确地找到相似文档,借助于两个页面的单词覆盖程度,提出一种改进的Web页面检索度量方法,并在KNN分类实验中得到验证。

【Abstract】 Web information retrieval is focus on how to search out the documents subset from a large collection of documents,which is relevant to the users’query.In order to find the similar documents,this paper presents an improved method on measure methods of web information retrieval,and it is verified in KNN classifiers.

【关键词】 Web页面检索相似性文本分类
【Key words】 web page retrievalsimilaritytext classification
【基金】 江苏省高校自然科学基金资助项目(No.05KJD510128)
  • 【文献出处】 计算机工程与应用 ,Computer Engineering and Applications , 编辑部邮箱 ,2010年19期
  • 【分类号】TP391.3
  • 【被引频次】7
  • 【下载频次】76
节点文献中: 

本文链接的文献网络图示:

本文的引文网络