所有作者:张赫
作者单位:北京邮电大学计算机科学与技术学院
论文摘要:视频中的文本信息是帮助我们理解其内容的重要线索,有效的提取这些文本信息对视频的内容理解无疑是一项关键的技术。目前,商业化的OCR对扫描产生的普通二值图像的识别达到了相对成熟的水平,但是对于背景复杂、干扰强烈、表现效果多变的视频中的文本的识别还不能有效的应对。 在此背景下,本文提出了一种用于数字视频中的文本提取方法。即在文本检测和定位的基础上,通过图像增强预处理、颜色聚类、噪声去除等步骤,综合利用文本的颜色分量信息及连通域信息,尽可能多的提取文本信息,同时最大限度的去除干扰,得到能够被OCR准确识别的清晰的二值图像。实验结果表明,本文提出的文本提取方法是鲁棒的和有效的。
关键词: 图像增强 颜色聚类 模式识别 连通域分析 文本提取
免费下载《一种数字视频中的文本提取方法》PDF全文(已停止下载)
本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!
下一篇:协同规则引擎的设计