一种数字视频中的文本提取方法

论文发布时间：[2009-12-29] 范文大全编辑：Voive.net

所有作者：张赫

作者单位：北京邮电大学计算机科学与技术学院

论文摘要：视频中的文本信息是帮助我们理解其内容的重要线索，有效的提取这些文本信息对视频的内容理解无疑是一项关键的技术。目前，商业化的OCR对扫描产生的普通二值图像的识别达到了相对成熟的水平，但是对于背景复杂、干扰强烈、表现效果多变的视频中的文本的识别还不能有效的应对。在此背景下，本文提出了一种用于数字视频中的文本提取方法。即在文本检测和定位的基础上，通过图像增强预处理、颜色聚类、噪声去除等步骤，综合利用文本的颜色分量信息及连通域信息，尽可能多的提取文本信息，同时最大限度的去除干扰，得到能够被OCR准确识别的清晰的二值图像。实验结果表明，本文提出的文本提取方法是鲁棒的和有效的。

关键词：图像增强颜色聚类模式识别连通域分析文本提取

免费下载《一种数字视频中的文本提取方法》PDF全文（已停止下载）
　　本站“论文下载”文章收集整理于“中国科技论文在线”，由于各种原因，本站已暂停论文下载！请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载！

〖返回计算机科学论文列表〗

下一篇：协同规则引擎的设计