节点文献

针对SVM中文分词特性的个性化后处理设计

Specified Multiple PostProcess for Support Vector Machines Chinese Word Segmenter

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 王屹林朱慕华朱靖波

【Author】 Wang Yilin, Zhu Muhua, Zhu Jingbo (Natural Language Processing Lab of Northeastern University, Shenyang 110004, China)

【机构】 东北大学自然语言处理实验室

【摘要】 支持向量机是当前经常被使用的分类模型。本文使用支持向量机处理中文分词任务,并且在支持向量机的初步结果上, 根据其分词特性设计实现了个性化后处理规则。实验结果表明,支持向量机与后处理规则结合而实现的分词系统,在Sighan评测的数据上达到了良好的效果。

【Abstract】 Support vector machine is a state-of-art model in most classification task. We present a Chinese word segmentation system based on support vector machine that provides a frmawork to use a large number of linguistic features . Our system performs well especially followed with specified multiple postprocess rules.

【基金】 国家自然科学基金(NO.60473140)国家教育部新世纪优秀人才计划项目资助
  • 【会议录名称】 第三届学生计算语言学研讨会论文集
  • 【会议名称】第三届学生计算语言学研讨会
  • 【会议时间】2006-08
  • 【会议地点】中国辽宁沈阳
  • 【分类号】TP391.1
  • 【主办单位】中国中文信息学会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络