中国学术期刊网络出版总库
  关闭
一种高效的用于话题检测的关键词元聚类方法  
   推荐 CAJ下载 PDF下载
【英文篇名】 Efficient Key words Clustering Method for Topic Detection
【下载频次】 ★★★★★
【作者】 杨攀; 桂小林; 田丰; 王刚;
【英文作者】 YANG Pan1; 2; GUI Xiaolin1; TIAN Feng1; WANG Gang1; 3(1.School of Electronics and Information Engineering; Xi'an Jiaotong University; Xi'an 710049; China; 2.Shaanxi Province Key Laboratory of Computer Network; 3.School of Information; Xi'an University of Finance and Economics; Xi'an 710100; China);
【作者单位】 西安交通大学电子与信息工程学院; 陕西省计算机网络重点实验室; 西安财经学院信息学院;
【文献出处】 西安交通大学学报 , Journal of Xi'an Jiaotong University, 编辑部邮箱 2012年 10期  
期刊荣誉:中文核心期刊要目总览  ASPT来源刊  中国期刊方阵  CJFD收录刊
【中文关键词】 话题检测; 关键词元; 舆情监控;
【英文关键词】 topic detection; term-committee; public opinion monitor;
【摘要】 针对基于关键词元的话题内事件检测算法运行效率不高、不适合进行大规模文本话题检测的问题,提出了一种高效的关键词元聚类算法.该算法在进行词元簇选择时,为簇间相似度分配权值,并借鉴正态分布函数评估词元簇的个数,提高词元簇的选择精度,从而减少所需的词元聚类次数.实验结果表明,将改进的方法应用到舆情监控的话题检测中,能在不影响检测精度的前提下有效地提高算法的运行效率.
【英文摘要】 An improved term-committee-based event identification algorithm is presented to meet the requirements of efficiency and accuracy in public opinion monitor system,where the original event identification algorithm can not be applied due to its lower efficiency.While the similarity between the clusters is calculated,the weight is taken into consideration simultaneously.Referencing the examples from normal curve,an evaluation algorithm is proposed to help choosing cluster with a proper term number,thus the impr...
【基金】 国家自然科学基金资助项目(61172090); 国家科技重大专项课题(2012ZX03002001-004)
【更新日期】 2012-10-31
【分类号】 TP311.13
【正文快照】 网络舆情分析的任务是将Internet庞杂的新闻按照不同的话题聚类到一起,形成热点话题,为人们提供舆论导向,并将这一过程称为话题检测,也是文本聚类中的重要技术.常用的聚类算法包括单遍聚类算法、k均值算法、层次聚类算法,以及基于密度的聚类算法,但在文本聚类中,文本向量的高维

xxx
【读者推荐文章】中国期刊全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机软件
     程序设计、软件工程
      程序设计
       数据库理论与系统
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号