中国重要会议论文全文数据库
  关闭
面向汉语短文的话题识别系统研究  
   CAJ下载 PDF下载
【会议录名称】 第二十一届中国数据库学术会议论文集(技术报告篇) , 2004 年
【作者】 王永恒; 贾焰; 杨树强;
【作者单位】 国防科技大学计算机学院网络研究所;
【会议名称】 第二十一届中国数据库学术会议
【会议地点】 中国福建厦门
【主办单位】 中国计算机学会数据库专业委员会
【学会名称】 中国计算机学会数据库专业委员会
【主编】 彭丹
【英文论文关键词】 Text mining; Short Chinese passages; Topic detection; TF*PDF; Cosine similarity measure; Word semantic similarity measure;
【论文摘要】 <正>1引言近年来,随着信息传播手段的飞速发展,我们已经由信息贫乏的时代进入了信息极度丰富的时代。对于大型的企业或新闻机构,每天可能会积累几百MB甚至TB级的数据。这些数据中有一大部分是
【英文论文摘要】 Text mining is the key technology of detecting implicit useful knowledge from large text database.A system of detecting topic from short Chinese passages is discussed in this paper.Based on TF * PDF algorithm,the topic detection system calculates weight for each term from all data sources and get terms with high weight.The system then calculates passages weight base on terms weight and get passages with high weight.The passages with high weight are clustered in the end to detect topics.A combination of the ...
【基金】 国家自然科学基金(60003001); 国家“八六三”高技术研究发展计划基金项目(863-306-ZD02-01-2)、(2003AA115410)资助
【更新日期】 2010-07-13

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号