节点文献

基于CRF和转换错误驱动学习的浅层句法分析

Shallow Parsing Based on CRF and Transformation-based Error-driven Learning

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 张芬曲维光赵红艳周俊生

【Author】 ZHANG Fen1,2,QU Wei-guang1,2,ZHAO Hong-yan1,2,ZHOU Jun-sheng1,2(1.School of Computer Science and Technology,Nanjing Normal University,Nanjing Jiangsu 210046,China;2.The Research Center of Information Security and Confidentiality Technology of Jiangsu Province,Nanjing Jiangsu 210097,China)

【机构】 南京师范大学计算机科学与技术学院江苏省信息安全保密技术研究中心南京师范大学语言信息科技研究中心

【摘要】 本文提出一种CRF和基于转换错误驱动相结合的中文浅层句法分析方法。该方法应用于宾州大学中文树库,取得不错的组块识别效果。在CRF识别的基础上,对初始识别结果中的组块标注信息进行统计分析,获得候选转换规则集合;再根据定义的规则评价函数对候选集进行筛选,得到最终的转换规则集合;最后应用转换规则集对CRF标注的结果进行校正。实验结果表明,与单独使用CRF结果相比,组块识别的精确率、召回率以及F值均得到了提高。

【Abstract】 This paper proposes a method for shallow parsing on the basis of CRF and transformation-based error-driven learning.The method is applied to Penn Chinese Treebank and gets a good performance of chunking identification.First,CRF model is used to identify chunks to acquire candidate transformation rules by error-driven learning.Then,an evaluation function is used to filter candidate transformation rules.And last,transformation rules are used to revise the chunking results of CRF.The experimental results show that this approach is effective,and outperforms the single CRF-based approach in shallow parsing.Precision,recall and F-values are improved respectively.

【基金】 国家自然科学基金资助项目(60773173,61073119);国家哲学社科基金资助项目(10CYY021);江苏省自然科学基金资助项目(BK2010547);江苏省教育厅自然科学基金资助项目(10KJB520009);江苏省高校社科基金资助项目(06SJB71007)
  • 【文献出处】 广西师范大学学报(自然科学版) ,Journal of Guangxi Normal University(Natural Science Edition) , 编辑部邮箱 ,2011年03期
  • 【分类号】TP391.1
  • 【被引频次】7
  • 【下载频次】113
节点文献中: 

本文链接的文献网络图示:

本文的引文网络