所有作者:韩雪冬
作者单位:北京邮电大学计算机学院
论文摘要:在中文分词系统中,分词速度是系统性能的一个重要指标。分词过程中需要频繁查询字典,所以词典的数据结构对分词速度的提高起着关键作用。而双数组是一个用于字符串查询的数据结构,它最多查找字符串长度次数即可完成一次查询操作,查询效率很高,在分词系统中常被用来构造词典。目前常用的双数组算法是基于单字节查询,本文提出了一种基于双字节查询的双数组算法,速度上较单字节查询方法提高了20%,是一个有着实用价值的算法。
关键词: 双数组 Double-Array 中文分词 分词词典
免费下载《双数组算法改进与实现》PDF全文(已停止下载)
本站“论文下载”文章收集整理于“中国科技论文在线”,由于各种原因,本站已暂停论文下载!请前往“中国科技论文在线http://www.paper.edu.cn/”免费下载!
下一篇:计算机网络入侵检测系统研究