中国重要会议论文全文数据库
  关闭
一种基于认知情景框架的文本分类方法  
   CAJ下载 PDF下载
【会议录名称】 第五届全国青年计算语言学研讨会论文集 , 2010 年
【作者】 李月伦; 李湘; 常宝宝; 袁毓林;
【英文论文作者】 Li Yuelun; Li Xiang; Chang Baobao; Yuan Yulin Institute of Computational Linguistics; Peking University; Beijing; 100871;
【作者单位】 北京大学计算语言学研究所; 北京大学中文系; 教育部计算语言学重点实验室;
【会议名称】 第五届全国青年计算语言学研讨会
【会议地点】 中国湖北武汉
【主办单位】 中国中文信息学会
【学会名称】 中国中文信息学会
【关键词】 认知情境; 语义框架; 最大熵; 文本分类;
【英文论文关键词】 cognitive situations; semantic frame; maximum entropy; text categorization;
【论文摘要】 在文本分类领域,常用的特征选择方法(如文档频率)是基于概率统计信息的。本文从一个全新的角度,即基于认知情境的语义框架的角度进行特征选择,这种方法可以较准确地抓住文本类别的特征,对提高分类精度与分类效率起到促进作用。由于基于机器学习的文本分类方法近年来得到了广泛的关注与快速的发展,本文运用最大熵分类器,以罢餐类文本为例进行文本分类实验,召回率可达96.8%。
【英文论文摘要】 In the field of Text Categorization,the common used feature selection methods such as the document frequency are based on probability and statistics.In this paper,from a brand new perspective,we select features base on cognitive and semantic framework.This method can grasp the characteristics of the classification accurately,which can improve the classification accuracy and efficiency.Because the classification method using machine learning have gained widely attention and usage,we use maximum entropy class...
【基金】 自然科学基金(60975054); 社会科学基金(06BYY048)的支持
【更新日期】 2010-12-24

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号