中国优秀硕士学位论文全文数据库
  关闭
视频文字提取技术研究与应用  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【作者】 李方翔;
【导师】 雷航; 杨健;
【学位授予单位】 电子科技大学;
【学科专业名称】 软件工程
【学位年度】 2010
【论文级别】 硕士
【网络出版投稿人】 电子科技大学
【网络出版投稿时间】 2011-04-19
【关键词】 文字定位; 字符图像二值化; 字符切分; 字符识别; 集成型字符切分与识别;
【英文关键词】 Text localization; text image binarization; character segmentation; character recognition; integrated segmentation and recognition;
【中文摘要】 视频文字直接承载了高层语义信息,因此,如果能够有效地提取视频中的文字信息,对高速增长的视频内容的高效检索、理解和复用将具有重要的作用。传统的OCR技术不能完全解决视频中的文字信息提取问题,特别是复杂背景中的文字。因此,需要从理论和技术上提供有效的解决方案。 视频文字信息抽取的技术难点主要来源于5个方面:(1)复杂背景中的文字定位以及退化文字的定位问题;(2)种类繁多的字符图像二值化问题;(3)复杂背景中的字符切分问题;(4)粘连字符的切分问题;(5)退化字符的识别问题。 本文围绕着视频文字信息抽取这一领域,针对其中的若干问题展开了研究工作。本文的主要工作包括: 1.为解决各种类型的字符图像二值化问题,提出了一种多二值图像融合的字符图像二值化算法。算法首先从不同的角度提取图像的信息,得到不同的二值图像,然后把这些二值图像融合,得到最终的二值图像。对比其他字符图像二值化算法,该多二值图像融合的算法能大大地提高字符识别系统的性能。 2.为解决字符的切分问题,分析了字符图像的特点及字符切分的难点,提出了一种基于启发和识别的字符切分算法。算法能同时对粘连字符及复杂背景中的字符进行较准确的...
【英文摘要】 Text in videos is one powerful source of high-level semantics. If the text could be detected, segmented, and recognized automatically, they would be a valuable source of high-level semantics for indexing and retrieving the explosively increasing digital videos. The traditional character extraction methods were specially developed for the scanned images and they cannot effectively extract the text in videos, especially the text with complex backgrounds. Therefore, it is necessary to develop new methods. Ther...
【更新日期】 2011-06-29

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      模式识别与装置
       图像识别及其装置
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号