节点文献

越汉双语句子自动对齐研究初步

Preliminary Study on Vietnamese-Chinese Bilingual Sentence Alignment

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 陈坚忠李鹏孙茂松

【Author】 Kien Trung Tran,Li Peng,Sun Maosong State Key Laboratory of Intelligent Technology and Systems Tsinghua National Laboratory for Information Science and Technology Department of Computer Science and Technology,Tsinghua University,Beijing 100084

【机构】 智能技术与系统国家重点实验室清华信息科学与技术国家实验室(筹)清华大学计算机系

【摘要】 句子级对齐双语语料是自然语言处理的重要资源之一,对于机器翻译、跨语言检索、双语词典编纂等研究有很大应用价值。关于自动句子对齐的研究主要针对于英语、法语、汉语等语言,据我们所知,尚未见到针对越南语-汉语的相关研究。本文考查了使用不同参数时,基于长度的句子对齐算法、Champollion算法在越南语-汉语双语文本上的效果,并根据汉字与越南语音节间的独特对应关系对Champollion算法进行了改进,获得了更好的对齐效果。

【Abstract】 Sentence-level aligned parallel corpora are very important resources for a number of natural language processing tasks,including machine translation,cross language information retrieval and lexicography.In this paper,we investigate the performance of length-based sentence alignment algorithm and Champollion algorithm for Vietnamese-Chinese sentence alignment And we propose a method to improving the Champollion algorithm by adopting the correspondence between Vietnamese syllables and Chinese characters.Preliminary experiments show the effectiveness of this method.

【基金】 国家自然科学基金(60873174)资助
  • 【会议录名称】 中国计算语言学研究前沿进展(2009-2011)
  • 【会议名称】第十一届全国计算语言学学术会议
  • 【会议时间】2011-08-20
  • 【会议地点】中国河南洛阳
  • 【分类号】TP391.1
  • 【主办单位】中国中文信息学会
节点文献中: 

本文链接的文献网络图示:

本文的引文网络