中国重要会议论文全文数据库
  关闭
基于短语匹配的中文Web文档聚类算法  
   CAJ下载 PDF下载
【会议录名称】 第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集 , 2005 年
【作者】 汪洋; 张磊; 章毅;
【英文论文作者】 Wang Yang Zhang Lei Zhang Yi Computational Intelligence Laboratory; School of Computer Science and Engineering; University of Electronic Science and Technology of China; Chengdu 610054;
【作者单位】 成都电子科技大学计算机科学与工程学院计算智能实验室;
【会议名称】 第二届全国信息检索与内容安全学术会议(NCIRCS-2005)
【会议地点】 中国北京
【主办单位】 中国中文信息学会信息检索与内容安全专业委员会
【学会名称】 中国中文信息学会
【主编】 程学旗、王斌
【关键词】 Web挖掘; 文档相似度; 短语匹配; 文挡聚类; 搜索引擎;
【英文论文关键词】 Web Mining; Document Similarity; Phrase-based Matching; Document Clustering; Search Engine;
【论文摘要】 本文在一种采用图结构、基于短语的文档索引模型的基础上,提出了一种基于短语匹配的、在线的、无需进行中文分词的增量聚类算法来对中文搜索结果进行聚类。结合文档索引模型和该聚类算法,可以有效地完成对搜索引擎所产生结果的增量式自动分类。
【英文论文摘要】 An incremental clustering algorithm that is phrase-based, online and avoiding Chinese word segmentation has been proposed based on phrase-based document index model that is incremental constructed using graph technique for Chinese searching result. The auto-incremental classification of searching results can perform effectively and efficiently by combine the model and the algorithm.
【基金】 教育部春晖计划资助项目(Z2004-2-51009)
【更新日期】 2006-02-15

xxx
【读者推荐文章】中国期刊全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号