节点文献

基于细粒度特征的话题句识别方法

Topic clause identification method based on specific features

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 蒋玉茹宋柔

【Author】 JIANG Yuru;SONG Rou;College of Computer Science,Beijing University of Technology;Computer School,Beijing Information Science and Technology University;College of Information Science,Beijing Language and Culture University;

【机构】 北京工业大学计算机学院北京信息科技大学计算机学院北京语言大学信息科学学院

【摘要】 话题句(TC)识别中采用穷举方法生成标点句的候选话题句(CTC)影响系统的执行效率和话题句识别的准确率。提出一种新的候选话题句生成方法,利用标点句在篇章中的位置特征、话题的语法特征以及话题串与说明的邻接性特征,指导候选话题句的生成过程。实验结果表明,该方法减少了候选话题句的个数,提高了系统效率。而且,通过与基于穷举式候选话题句生成策略的话题句识别工作进行对比,该方法使单个标点句话题句识别的准确率提高了0.96个百分点,使标点句序列话题句识别的准确率提高了1.31个百分点。

【Abstract】 When identifying the Topic Clause(TC) of Punctuation Clause(PClause),the brute-force method to generate Candidate Topic Clause(CTC) causes high time consumption and low accuracy of the identification system.A new CTC generating method was proposed,which used specific features such as the PClause location in the text,the grammatical features of the topic and the adjacent features of topic and its comment.The experimental result shows that the improved method can not only improve the efficiency of the system by reducing the number of CTCs,but also make the accuracy of TC identification for single PClause and PClause sequence increase by 0.96 percentage points and 1.31 percentage points respectively over the current state.

【基金】 国家自然科学基金资助项目(60872121,61171129);北京市教委科研计划面上项目(KM201411232014)
  • 【文献出处】 计算机应用 ,Journal of Computer Applications , 编辑部邮箱 ,2014年05期
  • 【分类号】TP391.1
  • 【被引频次】5
  • 【下载频次】145
节点文献中: 

本文链接的文献网络图示:

本文的引文网络