[发明专利]一种快速分词的实现方法无效
申请号: | 200910107961.1 | 申请日: | 2009-06-16 |
公开(公告)号: | CN101576877A | 公开(公告)日: | 2009-11-11 |
发明(设计)人: | 程治永 | 申请(专利权)人: | 程治永 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518059广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于词条查找树的快速分词方法,词条查找树由一级索引表和HASH多叉树构成。一级索引表是数组,通过下标直接访问,可快速缩小搜索范围,时间复杂度为常数。HASH多叉树是基于HASH的多叉树,即每个节点的子节点列表通过HASH散列,查找的时候平均时间复杂度为常数。通过本发明的词条查找树能利用相对较少的内存资源,获得近乎常数时间复杂度的分词功能,可支持大型词典,满足海量文本信息的分析需求。 | ||
搜索关键词: | 一种 快速 分词 实现 方法 | ||
【主权项】:
1.本发明是这样实现的:一种快速分词的实现方法,其特征在于,该方法包括以下步骤:基于词条查找树的快速分词方法,词条查找树由一级索引表和HASH多叉树构成。一级索引表是数组,通过下标直接访问,可快速缩小搜索范围,时间复杂度为常数。HASH多叉树是基于HASH的多叉树,即每个节点的子节点列表通过HASH散列,查找的时候平均时间复杂度为常数。通过词条添加操作构建词条查找树,利用词条查找树进行快速分词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于程治永,未经程治永许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910107961.1/,转载请声明来源钻瓜专利网。
- 上一篇:铁水罐车快速脱卸式高温视窗
- 下一篇:开槽推入旋转式辊轴与辊架