中国优秀硕士学位论文全文数据库
  关闭
印刷体文档中的数学公式识别技术研究  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Research on the Mathematical Formula Recognition Technology for Printed Document
【作者】 陈峰;
【导师】 陈德运;
【学位授予单位】 哈尔滨理工大学;
【学科专业名称】 计算机应用技术
【学位年度】 2009
【论文级别】 硕士
【网络出版投稿人】 哈尔滨理工大学
【网络出版投稿时间】 2009-11-09
【关键词】 数学公式识别; 公式提取; 模糊C-均值算法; 基准线;
【英文关键词】 mathematical formula recognition; formula extraction; fuzzy c-means algorithm; baseline;
【中文摘要】 伴随着计算机技术的不断发展,信息资源的电子化成为至关重要的问题。数学公式是许多科技文献的重要组成部分,由于手工输入困难,自动输入技术的研究尤为重要。现有的OCR(Optical Character Recognition)技术虽然对中英文字符和数字等符号都能获得较好的识别效果,但是无法正确处理数学公式。其原因在于数学公式具有复杂的二维嵌套结构,并且公式符号含义具有多样性,这使得数学公式在识别和结构分析方面存在很多困难。因此,数学公式识别已经成为OCR领域的一个研究热点。 本课题研究的是印刷体文档中的数学公式识别问题。印刷体文档中数学公式识别系统主要包括三个组成部分:公式提取,公式识别和公式结构分析重构。由于字符识别技术相对成熟,本文的主要工作是数学公式的提取和公式的分析与重构。 本文对公式提取和公式的分析与重构做了较深入的研究,主要从以下的两个方面进行了改进。 首先在公式提取阶段结合数学公式自身的特征,提出了一种基于模糊C-均值算法的印刷体数学公式提取方法。模糊C-均值算法利用数学公式行与一般的文本文字行的行间距、宽高比、行密度的不同,将数学公式行提取出来。通...
【英文摘要】 With the development of computer technology, information source electrification is becoming a very important issue. Mathematical formula has played an important part in many Scientific and technical literatures. Owing to the difficulty of Manual input, the research of techniques of automatic input seems to be more important. The current OCR(Optical Character Recognition) technology doesn’t correctly deal with mathematical formulas though the result of recognition is satisfied with the Chinese ,Engli...
【更新日期】 2009-11-18

【相同导师文献】

导师:陈德运    导师单位:哈尔滨理工大学    学位授予单位:哈尔滨理工大学
[1] 孙昕.基于P2P的流媒体缓存管理机制的研究[D]. 哈尔滨理工大学,2011
[2] 赵海针.基于软场特性的ERT图像重建算法的研究[D]. 哈尔滨理工大学,2011
[3] 王珏.基于SOA的办公自动化系统的研究与实现[D]. 哈尔滨理工大学,2011
[4] 刘中昌.基于软场特性的ECT图像成像算法研究[D]. 哈尔滨理工大学,2011
[5] 王桂权.基于ECT技术的中药提取过程成像研究[D]. 哈尔滨理工大学,2011
[6] 于冬梅.两相流电容层析成像系统数学模型建立及特征提取[D]. 哈尔滨理工大学,2011
[7] 石文臣.基于DSP的电容层析成像数据采集系统的设计及实现[D]. 哈尔滨理工大学,2008
[8] 申超群.基于神经网络的电阻层析成像系统流型辨识的研究[D]. 哈尔滨理工大学,2008
[9] 孙玲.面向业务中间件的研究与设计[D]. 哈尔滨理工大学,2008
[10] 卫怀玉.电容层析成像系统图像重建算法研究及其软件设计[D]. 哈尔滨理工大学,2008

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      模式识别与装置
       图像识别及其装置
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号