中国优秀硕士学位论文全文数据库
  关闭
中文自动分词及人名识别技术研究  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Research of Automatic Chinese Segmentation and Name Recognition
【作者】 蒋才智;
【导师】 王浩;
【学位授予单位】 合肥工业大学;
【学科专业名称】 计算机软件与理论
【学位年度】 2011
【论文级别】 硕士
【网络出版投稿人】 合肥工业大学
【网络出版投稿时间】 2011-08-11
【关键词】 自然语言理解; 中文自动分词; 四字词典; 中文人名识别; 朴素贝叶斯;
【英文关键词】 natural language understanding; Automatic Chinese segmentation; four-character dictionary; Chinese name recognition; Bayesian classifier;
【中文摘要】 在Internet日益普及的今天,语言文字作为信息的载体越来越多的出现在人们的视野中,因此自然语言理解成为了一个热门的研究领域。中文自动分词作为自然语言理解的第一步,分词技术的优劣将直接影响到中文信息的后续处理。它是自然语言理解的一个前沿课题,在基础研究和应用研究领域都起着举足轻重的作用。 中文人名是未登录词的最主要组成部分,它的存在成为影响分词精度的主要因素之一。中文人名识别是中文自动分词中的一项关键技术,但目前在处理结果上还不尽如人意,还需进一步提高其识别质量。 文本将针对中文自动分词模型和中文人名识别问题进行研究,主要工作集中在: (1)提出一种动态四字双向词典机制。该机制针对四字以内词出现频率高的特点,为每一个四字以内的词添加了相应的前后缀信息,达到减少词汇平均访问词典数的目的,提高词的查询效率。 (2)提出了基于知网的贝叶斯中文人名识别算法。在对文章初分词的基础上,进行朴素贝叶斯人名识别,完成对人名的粗略识别和定位,最后利用语义相关度知识对人名修正。该方法无需规则的大量的使用,同时在人名仅一次出现的情况下能够进行准确的识别,有效的提高了中文人名自动识别的质量。
【英文摘要】 With the continuous development of national information technology and the popularization of Internet, natural language understanding becomes a hot research field. As the first step in natural language understanding, automatic Chinese segmentation is more sophisticated and it determines the follow-up processes. Chinese name is the most important component of unknown words, its existence is one of the most important factors which are influence the segmentation accuracy. Therefore, Chinese name recogniti...
【更新日期】 2011-09-05

【相同导师文献】

导师:王浩    导师单位:合肥工业大学    学位授予单位:合肥工业大学
[1] 卢德玖.动态环境下基于物体分割的视觉SLAM算法研究[D]. 合肥工业大学,2022
[2] 金志军.稀疏场景下基于内在动机的多智能体强化学习研究[D]. 合肥工业大学,2022
[3] 汪京.基于内在情感动机的多智能体强化学习研究[D]. 合肥工业大学,2022
[4] 王乐.动态环境下基于实例级语义信息的同时定位与建图研究[D]. 合肥工业大学,2021
[5] 厉子凡.基于多智能体值分解深度强化学习的多智能体协作算法研究[D]. 合肥工业大学,2021
[6] 汪崟灿.动态环境下基于语义信息的视觉SLAM算法研究[D]. 合肥工业大学,2021
[7] 单文静.基于深度神经网络的上下文信息目标检测算法研究[D]. 合肥工业大学,2020
[8] 韩健英.基于RGB-D相机的组合优化同时定位与与地图构建算法研究[D]. 合肥工业大学,2020
[9] 栗永泽.基于多区域特征的面部表情识别研究[D]. 合肥工业大学,2020
[10] 周中凯.多能互补式区域能源系统供冷性能分析及运行优化[D]. 合肥工业大学,2020

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      文字信息处理
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号