节点文献

基于SVM的组块识别及其错误驱动学习方法

Chunk Parsing Based on SVM and Error-Driven Learning Methods

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 黄德根王莹莹

【Author】 HUANG De-gen,WANG Ying-ying(Department of Computer Science and Engineering,Dalian University of Technology,Dalian,Liaoning 116024,China)

【机构】 大连理工大学计算机科学与工程系大连理工大学计算机科学与工程系 辽宁大连116024辽宁大连116024

【摘要】 给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法。该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正。实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高。

【Abstract】 Chunk parsing of Chinese texts can decrease the difficulty of syntactic parsing.This paper proposes a chunking approach that combines support vector machine with error-driven learning.First,the SVM model is used to chunk the training data.Then by error-driven learning,we automatically acquire the tuning rules from the chunking results of SVM.After filtration the rules are used to revise the chunk parsing results of SVM.The experimental results show that this approach is effective in Chinese chunk parsing.Compared with the pure SVM-based chunking,the performance is improved.

【基金】 国家自然科学基金资助项目(60373095,60373096)
  • 【文献出处】 中文信息学报 ,Journal of Chinese Information Processing , 编辑部邮箱 ,2006年06期
  • 【分类号】TP391.4
  • 【被引频次】21
  • 【下载频次】263
节点文献中: 

本文链接的文献网络图示:

本文的引文网络