数学论文 | 力学论文 | 化学论文 | 信息科学论文 | 物理学论文 | 农学论文 | 林学论文 | 药学论文 | 天文学论文 | 生物学论文 | 水产学论文 | 核科学论文 | 中医中药学论文
管理学论文 | 经济学论文 | 教育学论文 | 地球科学论文 | 畜牧兽医论文 | 基础医学论文 | 临床医学论文 | 医学卫生论文 | 工程学科论文 | 测绘科学论文 | 军事特种医学论文
材料学论文 | 矿山工程论文 | 化学工程论文 | 纺织科学论文 | 食品科学论文 | 体育科学论文 | 水利工程论文 | 环境科学论文 | 安全科学论文 | 能源科学论文 | 机械工程论文
电子通信自动控制论文 | 计算机科学论文 | 冶金工程技术论文 | 动力电气工程论文 | 土木建筑工程论文 | 交通运输工程论文 | 航空航天科学论文 | 图书馆情报文献学论文
  当前位置:免费论文首页 >> 计算机科学论文 >> 正文

PDF文件文本内容提取的设计与实现

论文发布时间:[2009-10-15]    范文大全    编辑:Voive.net

所有作者:孟美华 王宏伟

作者单位:大连理工大学电信学院自动化系

论文摘要:PDF文件格式是面向显示的,本身缺乏语义信息,如果不将其内容提取出来,就不能实现基于语义的查询。本文设计并实现了一款PDF内容提取的工具,首先对PDF文件进行了文本解析,将正文内容字符串流从源码中提取出,并对提取后的字符串流利用解密算法进行解密,然后利用Filter解码算法进行解码,最后将PDF的文本内容从解码后的字符串流中提取出。结果表明本文提出的方法不但能够非常准确的实现PDF文件格式的转换,而且可以非常方便的嵌入到搜索引擎中。

关键词: PDF文件 文件解析 解密 解码 文本提取

免费下载《PDF文件文本内容提取的设计与实现》PDF全文(已停止下载)
  本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!

〖返回计算机科学论文列表〗

下一篇:基于J2EE的终端管理系统的设计