节点文献

一种改进的基于PATRICIA树的汉语自动分词词典机制

An Improved PATRICIA-tree-based Dictionary Mechanism for Automatic Chinese Word Segmentation

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 马哲姚敏

【Author】 Ma Zhe Yao Min (College of Computer Science, Zhejiang Univ. , Hangzhou 310037, Zhejiang, China)

【机构】 浙江大学计算机系浙江大学计算机系 浙江 杭州 310027浙江 杭州 310027

【摘要】 分词词典机制是影响自动分词的重要因素,而查找速度是衡量一个词典好坏的重要标准.文中分析比较了现有的几种典型的词典机制,并在此基础上提出了一种新的词典机制,即在PATRICIAtree的基础上加入Hash机制,从而在明显提高查找速度的同时,降低了构造和维护词典的复杂度.

【Abstract】 The dictionary mechanism is an important factor affecting automatic word segmentation systems and the finding speed is an important criterion to determine the performance of a dictionary. In this paper, the existing typical dictionary mechanisms are analyzed and compared, on the basis of which a new dictionary mechanism is presented. This mechanism is based on the PATRICIA tree with the addition of Hash mechanism. It can greatly improve the finding speed and decrease the difficulty in dictionary construction and maintenance.

【基金】 国家自然科学基金资助项目(79970037)
  • 【文献出处】 华南理工大学学报(自然科学版) ,Journal of South China University of Technology(Natural Science) , 编辑部邮箱 ,2004年S1期
  • 【分类号】TP391.1
  • 【被引频次】26
  • 【下载频次】283
节点文献中: 

本文链接的文献网络图示:

本文的引文网络