中国博士学位论文全文数据库
  关闭
文本内容分类和主题追踪关键技术研究     在线阅读 整本下载 分章下载 分页下载 本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Study on Key Techniques of Text Content Classification and Topic Tracking
【作者】 王会珍;
【导师】 张斌; 朱靖波;
【学位授予单位】 东北大学;
【学科专业名称】 计算机应用
【学位年度】 2008
【论文级别】 博士
【网络出版投稿人】 东北大学
【网络出版投稿时间】 2010-11-30
【关键词】 文本内容分类; 主题追踪; 垃圾邮件过滤; 特征选取; 混淆类判别; 多向量模型; 主题漂移;
【英文关键词】 text content classification; topic tracking; spam filtering; feature selection; confusion class recognition; multi-vector model; topoc drift;
【中文摘要】 互联网成为人们快速获取信息以及交换信息工具的同时,也给人们带来了更多新的挑战。人们迫切需要一种高效快速准确的技术来帮助自己处理浩瀚的信息。各种信息检索、信息过滤、分类、主题检测与追踪等文本信息处理技术应运而生,并且得到了越来越多的关注。目前,文本内容分类和主题追踪技术的研究逐渐成为了自然语言处理领域的研究热点。根据具体应用和需求通常需要对文本进行深入分析和处理。因此,本文分析和研究了文本内容分类和主题追踪任务的关键问题,提出了相应的解决方案,并通过大量的实验证明了这些方案的有效性。主要工作包括以下几点: (1)研究特征对不同类别之间的判别能力来提高文本分类的性能。采用合理的评价方式选择出对类别具有较强判别能力的特征来参与文本分类过程。以此来增强分类器对类别的判别能力。本文提出了基于判别能力的特征选取方法,该方法采用overall-divergence评价方式直接度量每个特征对不同类别之间的判别能力。实验结果显示,本文提出的特征选取方法在混淆数据集中很好地提高了文本分类的性能。在通用数据集中,基于判别能力的特征选取方法与最好的特征选取方法性能稍高或者相当。 (2)针对文本分类中存...
【英文摘要】 Nowadays the Internet has become an important tool for people to quickly acquire and exchange information, however it also brings more challenges. People are in great need of an efficient and accurate technique to help them process the vast information. Therefore text information processing technologies such as information retrieval, information filtering and classification, topic detection and tracking emerged and received more and more attention. Currently the research on text content classificatio...
【更新日期】 2011-03-17

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号