视频中的文本信息对于视频内容的检索具有非常重要的价值。由于受到背景复杂度、字符与背景的对比度、字符分辨率、字符排列方向和字体大小等因素的影响,对视频文本提取的处理难度比较大。虽然国内外众多学者在这一方面进行了研究,但效果并不是很令人满意。本文主要围绕国内外涉及比较少的视频文本提取的关键技术——视频文本的定位、跟踪和分割等三个方面进行了深入研究,并系统的提出了视频中文本提取的相关算法。
本文主要做了以下工作:
(1)为了准确定位文本区域,滤除虚假区域,提出了基于小波模极大值的算法对视频图像帧进行预处理,并引入两阶段分类验证来定位视频中的文本区域。两阶段分类验证包括一个级联分类器和一个一类支持向量机(1-SVM,one class support vector machine)分类器。级联分类器首先对文本和非文本区域进行粗分类,而1-SVM分类器则关注级联分类器输出的文本区域,根据统计特征进行更细致的验证判决,从而大大提高了定位的准确性,降低了漏检率。
(2)为避免对每一帧图像都进行文本定位,同时为了提高文本定位的准确率,提出了一种基于稳健模板匹配准则的文本跟踪技...
【英文摘要】
Text presented in videos provides important supplemental information for video indexing technology. In this paper, the key problems in the text extraction in digital video such as the text localization, text tracking and text segmentation are discussed. Because of the complex background, low contrast between the text area and background, the low resolution, the variety in the orientation and the different size of the text, it is challenge to deal with the text in video. Although many efforts have be...