节点文献
针对SVM中文分词特性的个性化后处理设计
Specified Multiple PostProcess for Support Vector Machines Chinese Word Segmenter
【Author】 Wang Yilin, Zhu Muhua, Zhu Jingbo (Natural Language Processing Lab of Northeastern University, Shenyang 110004, China)
【机构】 东北大学自然语言处理实验室;
【摘要】 支持向量机是当前经常被使用的分类模型。本文使用支持向量机处理中文分词任务,并且在支持向量机的初步结果上, 根据其分词特性设计实现了个性化后处理规则。实验结果表明,支持向量机与后处理规则结合而实现的分词系统,在Sighan评测的数据上达到了良好的效果。
【Abstract】 Support vector machine is a state-of-art model in most classification task. We present a Chinese word segmentation system based on support vector machine that provides a frmawork to use a large number of linguistic features . Our system performs well especially followed with specified multiple postprocess rules.
【关键词】 中文分词;
支持向量机;
后处理规则;
【Key words】 Chinese word segmentation; support vector machines; postprocess rule;
【Key words】 Chinese word segmentation; support vector machines; postprocess rule;
【基金】 国家自然科学基金(NO.60473140)国家教育部新世纪优秀人才计划项目资助
- 【会议录名称】 第三届学生计算语言学研讨会论文集
- 【会议名称】第三届学生计算语言学研讨会
- 【会议时间】2006-08
- 【会议地点】中国辽宁沈阳
- 【分类号】TP391.1
- 【主办单位】中国中文信息学会