节点文献

结合句法组成模板识别汉语基本名词短语的概率模型

A PROBABILISTIC CHINESE BASENP RECOGNITION MODEL COMBINED WITH SYNTACTIC COMPOSITION TEMPLATES

  • 推荐 CAJ下载
  • PDF下载
  • 不支持迅雷等下载工具,请取消加速工具后下载。

【作者】 赵军黄昌宁

【Author】 ZHAO Jun and HUANG Chang\|Ning (Department of Computer Science & Technology, Tsinghua University, Beijing 100084) (State Key Laboratory of Intelligent Technology & Management, Tsinghua University, Beijing 100084)

【机构】 清华大学计算机科学与技术系!北京100084清华大学智能技术与系统国家实验室!北京100084

【摘要】 文中首先给出了汉语基本名词短语(baseNP)的形式化定义,并通过抽取baseNP句法组成模板,显示了这个定义的可操作性.文中指出,句法组成模板只是识别baseNP的必要条件,而非充要条件,仅靠句法组成模板并不能解决baseNP识别中的边界模糊歧义和短语类型歧义问题.据此,把体现baseNP内部组成的句法组成模板与体现上下文约束条件的N 元模型结合起来,形成了汉语baseNP识别的新模型.实验证明,该模型的性能优于单纯基于词性标记的N 元模型

【Abstract】 A formal definition of Chinese baseNP is proposed in the present paper. The manipulatability of the definition is shown through the formulation of the Chinese baseNP annotation specification oriented for information processing and the extraction of the syntactic composition templates. It is pointed out that the syntactic composition templates are only necessary but not the sufficient condition for baseNP recognition, so the boundary ambiguity and phrase\|type ambiguity could not be solved depending merely on the syntactic composition templates. On the ground of this view, the basic templates embodying the baseNP composition and the N\|grams modeling the contextual constraints are organically incorporated into a new probabilistic model for Chinese baseNP recognition. The experiment shows that the model is superior to the N\|gram model based on part\|of\|speech information.

【关键词】 自然语言处理语料库基本名词短语
【Key words】 natural language processingcorpusbaseNP
【基金】 国家自然科学基金
  • 【文献出处】 计算机研究与发展 ,JOURNAL OF COMPUTER RESEARCH AND DEVELOPMENT , 编辑部邮箱 ,1999年11期
  • 【分类号】H085
  • 【被引频次】51
  • 【下载频次】361
节点文献中: 

本文链接的文献网络图示:

本文的引文网络