中国优秀硕士学位论文全文数据库
  关闭
印刷体数学公式识别的研究与实现  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Research and Implementation on Printed Mathematical Formula Recognition
【作者】 喻志强;
【导师】 田艳丰; 牛连强; 张胜男;
【学位授予单位】 沈阳工业大学;
【学科专业名称】 计算机软件与理论
【学位年度】 2012
【论文级别】 硕士
【网络出版投稿人】 沈阳工业大学
【网络出版投稿时间】 2012-05-21
【关键词】 公式识别; 粘连字符; 分割编码; 分叉树;
【英文关键词】 formula recognition; adhesion character; segmentation coding; bifurcation tree;
【中文摘要】 目前,OCR技术逐步发展成熟,可以快速、准确地使大部分书籍资料电子化。虽然OCR技术对文字和数字的识别效果很好,但对数学公式的识别效果并不理想,原因在于数学公式有复杂的二维结构,字符之间的逻辑关系种类多样。正确的识别数学公式不仅对单个数学符号进行正确的分割和识别,同时还要求对公式结构进行准确的分析。 本文设计了一个数学公式识别系统,实现了对印刷体数学公式的识别功能。系统以图片形式输入,经过图像预处理、字符分割、字符识别和结构分析等处理操作后,将其转化为以Txt格式的文本形式输出。字符分割部分使用了循环的投影分割法与连通域分割法相结合的方法,先利用垂直与水平投影法循环投影将公式切分为子字符块,再利用连通域法把投影法无法分割开的字符块分割开,这种混合分割的方法比起使用单一的方法效果要好。对字符粘连部分提出了基于矩形框的分割方法,利用字符库中字符的宽和高对粘连字符进行切分,切分后有验证步骤,进而降低了分割错误的概率。在结构分析部分提出了字符块编码与构建分叉树相结合的分析方法,该方法在公式分割时就将字符块按垂直和水平分割法分开时进行了有序的编码,为结构分析奠定了基础。在结构分析阶段利用编码与分叉树对公式的各个...
【英文摘要】 At present, OCR technology is rapidly developing, accurately, which can make electronic books. Although the effect of OCR technology to distinguish digital and word and the recognition is very good, but the mathematical formula’s recognition effect is not ideal, the reason is that the mathematical formula has a complex structure, the logical relationship between the various characters is also complex. The correct identification of mathematical formula needs not only the recognition of a single mathematical ...
【更新日期】 2012-05-31

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      模式识别与装置
       图像识别及其装置
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号