节点文献

基于目的分析的作弊页面分类

Web Spam Taxonomy via Spam Intention Analysis

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 余慧佳刘奕群张敏马少平茹立云

【Author】 YU Hui-jia,LIU Yi-qun,ZHANG Min,MA Shao-ping,RU Li-yun(State Key Lab of Intelligent Technology & Systems,Tsinghua National Laboratory for Information Science and Technology(To Be Established),CS&T Department,Tsinghua University,Beijing,100084,China)

【机构】 智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机系

【摘要】 随着互联网的飞速发展,因网络作弊而产生的垃圾页面越来越多,严重影响了搜索引擎的检索效率和用户体验。反作弊已经成为搜索引擎所面临的最重要挑战之一。但目前的反作弊研究大都是基于页面内容或链接特征的,没有一个通用可行的识别方法。本文主要基于作弊目的的分析,给出作弊页面另一种体系的分类,为基于目的的作弊页面识别起到良好的导向作用。

【Abstract】 Along with the rapid development of the Internet,the spam pages which produced by web spam are prevailing and seriously impacts the retrieval efficiency of the search engine and the user experience.Anti-spam has become one of the most important challenges for the search engines.State-of-the-art anti-spam techniques usually make use of Web page features,either content-based or hyper-link structure based,to construct Web spam classifiers,which can’t deal with different spam techniques simultaneously.This paper proposes another kind of web spam taxonomy via spam intention analysis,so as to give some useful information for intent-based detection of spam pages.

【基金】 国家973重点基础研究资助项目(2004CB318108);国家自然科学基金资助项目(60621062,60503064,60736044);国家863高科技资助项目(2006AA01Z141)
  • 【文献出处】 中文信息学报 ,Journal of Chinese Information Processing , 编辑部邮箱 ,2009年02期
  • 【分类号】TP393.092
  • 【被引频次】18
  • 【下载频次】281
节点文献中: 

本文链接的文献网络图示:

本文的引文网络