中国优秀硕士学位论文全文数据库
  关闭
视频文本提取技术研究及在虚拟卡拉OK中的应用  
   在线阅读 整本下载 分章下载 分页下载本系统暂不支持迅雷或FlashGet等下载工具
【英文题名】 Research on Video Text Extraction and the Application in Virtual Karaoke
【作者】 王琦;
【导师】 陈临强;
【学位授予单位】 杭州电子科技大学;
【学科专业名称】 计算机软件与理论
【学位年度】 2011
【论文级别】 硕士
【网络出版投稿人】 杭州电子科技大学
【网络出版投稿时间】 2011-08-15
【关键词】 视频检索; 文字检测; 视频文本定位; 文本分割; 文字识别; 背景建模;
【英文关键词】 video retrieval; text detection; video text location; text segmentation; text recognition; background modeling;
【中文摘要】 视频中的文字包含了丰富的语义信息,文字提取对于基于视频内容的分析、检索等研究领域具有重要作用。如果能自动地将视频文字检测、分割、识别出来,则对视频高层语义的自动理解、检索是非常有价值的。视频文本不同于普通扫描文档可以直接使用OCR识别提取,视频文本在大小、形状、颜色等属性上存在很大的差异,多数情况下文字还处于复杂背景之中,这些都成为文字提取过程很大中的阻碍。如何利用视频文本的特性,在已有研究的基础上更好地将文本提取出来,成为了本文研究的重点。 对于视频中可能存在几种颜色字幕的情况,本文提出了一种综合利用文字颜色、边缘、几何特征的方法。首先采用梯度法检测连续多帧文字位置,然后将位置映射到原始视频帧中,这样可以获取大量准确可靠的文字颜色信息,根据这些颜色信息,采用GMM (Gaussian Mixture Model)对颜色建模,在后续帧中利用模型提取文字颜色层,同时更新模型。根据视频具有的时间冗余性,提出了“与”掩码图的方法判断有无新的文本对象产生。该方法综合利用了文字的多种特性,在视频中背景与文字颜色差距较大时能有效提取文字。 针对视频中的静止文字时间和空间上的冗余特性,本文提出了一种检测...
【英文摘要】 Caption in video provides rich information for video content, therefore the technology of caption extraction is very important for image understanding and content-based information retrieval systems. If these text occurrences could be detected, segmented, and recognized automatically, they would be a valuable source of high-level semantics for indexing and retrieval. Text in video is different from ordinary document, which can be recognized by OCR directly. The size, shape and color of text in video various...
【更新日期】 2011-10-14

【相同导师文献】

导师:陈临强    导师单位:杭州电子科技大学    学位授予单位:杭州电子科技大学
[1] 张竹溪.基于深度学习的图像修复检测算法研究[D]. 杭州电子科技大学,2023
[2] 高旭东.基于深度学习的深度视频修复检测方法研究[D]. 杭州电子科技大学,2023
[3] 刘书辉.基于字符扰动变形及可控生成的中文文本信息隐藏[D]. 杭州电子科技大学,2023
[4] 黄望康.Gamut Fitting and Compensation Methods for Color Vision Deficiency[D]. 杭州电子科技大学,2022
[5] 郝苗.扩展词典与规则结合的微博情感分类研究[D]. 杭州电子科技大学,2020
[6] 程珉.基于单目视觉SLAM的无标识增强现实系统[D]. 杭州电子科技大学,2020
[7] 苏宁.基于视频监控下的行人属性分析[D]. 杭州电子科技大学,2019
[8] 李元媛.基于数码管识别的产品界面识别系统[D]. 杭州电子科技大学,2018
[9] 董杰.基于IPSAN的磁盘漂移技术的研究与实现[D]. 杭州电子科技大学,2017
[10] 方正涛.基于视频的孤寡老人室内异常行为检测研究[D]. 杭州电子科技大学,2017

xxx
【读者推荐文章】中国期刊全文数据库 中国重要报纸全文数据库 中国博士学位论文全文数据库 中国优秀硕士学位论文全文数据库 中国重要会议论文全文数据库
【相似文献】
中国期刊全文数据库
中国优秀硕士学位论文全文数据库
中国博士学位论文全文数据库
中国重要会议论文全文数据库
中国重要报纸全文数据库
中国学术期刊网络出版总库
点击下列相关研究机构和相关文献作者,可以直接查到这些机构和作者被《中国知识资源总库》收录的其它文献,使您全面了解该机构和该作者的研究动态和历史。
【文献分类导航】从导航的最底层可以看到与本文研究领域相同的文献,从上层导航可以浏览更多相关领域的文献。

工业技术
  自动化技术、计算机技术
   计算技术、计算机技术
    计算机的应用
     信息处理(信息加工)
      模式识别与装置
       图像识别及其装置
  
 
  CNKI系列数据库编辑出版及版权所有:中国学术期刊(光盘版)电子杂志社
中国知网技术服务及网站系统软件版权所有:清华同方知网(北京)技术有限公司
其它数据库版权所有:各数据库编辑出版单位(见各库版权信息)
京ICP证040431号    互联网出版许可证 新出网证(京)字008号