节点文献

一种主题句发现的中文自动文摘研究

Chinese Automatic Summarization Based on Thematic Sentence Discovery

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王萌李春贵唐培和王晓荣

【Author】 WANG Meng1,LI Chungui1,TANG Peihe1,WANG Xiaorong2(1.Department of Computer Engineering,Guangxi University of Technology,Liuzhou 545006;2.Department of Computer Science,Central China Normal University,Wuhan 430079)

【机构】 广西工学院计算机工程系华中师范大学计算机科学系 柳州545006柳州545006武汉430079

【摘要】 提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。

【Abstract】 Automatic summarization is one of main research fields in natural language processing.This paper proposes a special Chinese automatic summarization method based on discovering thematic sentences,which uses terms as minimal semantic unit rather than word,and employs term length term frequency(TLTF) to compute weight of term to obtain feature.It uses an improved k-means method to cluster sentences,and discovers thematic sentences according to clustering results.Experimental results indicate a clear superiority of the proposed method over the traditional method under the proposed evaluation scheme.

【基金】 广西科学基金资助项目(桂科自0481016);2006年度广西教育厅科研资助项目(149);广西工学院博士基金资助项目
  • 【文献出处】 计算机工程 ,Computer Engineering , 编辑部邮箱 ,2007年08期
  • 【分类号】TP391.1
  • 【被引频次】21
  • 【下载频次】321
节点文献中: 

本文链接的文献网络图示:

本文的引文网络