节点文献

电子文本的繁简转换问题分析

Analysis on Simplified and Complex Chinese Characters Conversion of Electronic Text

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 卜师霞李智

【Author】 BU Shi-xia LI Zhi (Center for Chinese Folklore and Ancient Writing,Beijing Normal University,Beijing 100875,China)

【机构】 北京师范大学民俗典籍文字研究中心北京师范大学民俗典籍文字研究中心 北京100875北京100875

【摘要】 电子文本的繁简转换是信息时代处理文本时不得不面对的问题,目前已经有了很多繁简转换的电子工具和软件系统,但繁简转换的错误率仍然很高。本文封闭了170万字的新闻语料,150万字的文学语料。选取现代汉语常用字中的117组繁简一对多的字(简=繁1、繁2……)组进行统计,运用微软Word2003繁简转换功能进行转换,从中测查简繁转换的错误,并对其中出现的问题进行分析和总结,以期对繁简转换提出一些可供参考的建议。

【Abstract】 Simplified and complex chinese characters conversion of electronic text is the inevitable problems to handle electronic text in information age.At present,many electronic tools and softwares has been contrived about simplified and complex Chinese characters conversion,but the error rate is still too high.This paper has made a simulating study on 117 groups characters of one simplified Chinese characters to many complex Chinese Characters 1700 thousand literature characters and 1500thousand characters vocabulary.We transformate these vocabulary using convertion software of Word 2003 and find convertion errors.Moreover,we hope that these ana- lytical data will give some useful advice to simplified and complex chinese characters conversion of electronic text.

  • 【文献出处】 南阳师范学院学报(社会科学版) ,Journal of Nanyang Teachers’ College , 编辑部邮箱 ,2006年10期
  • 【分类号】H124
  • 【被引频次】3
  • 【下载频次】265
节点文献中: