[发明专利]数据库术语检索的方法、装置及终端在审
申请号: | 201710423090.9 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107239549A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 冯泽康 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张宇峰 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 术语 检索 方法 装置 终端 | ||
1.一种数据库术语检索的方法,其特征在于,包括:
获取待检索术语的检索信息;
根据所述数据库的双数组字典树索引,检索与所述检索信息对应的术语信息;
其中,所述数据库的双数组字典树索引的构建过程包括:
从所述数据库中获取术语集合,并根据字典序,将所述术语集合中的术语进行排序,获得排序后的第一术语集合;
调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引,其中,所述双数组字典树包括两个整数数组,分别为基础数组(base[])和校验数组(check[])。
2.如权利要求1所述的方法,其特征在于,所述调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引包括:
步骤一:初始化双数组字典树根节点,并将所述根节点确定为当前节点,其中,base[0]=1;check[0]=0;
步骤二:对于所述当前节点的一群兄弟节点,确定对应的插入位置,其中,所述插入位置为begin值,且check[begin+a1…an]==0,a1…an是所述兄弟节点中的n个节点对应的字符编码值;
步骤三:将所述兄弟节点的check确定为check[begin+a1…an]=begin;
步骤四:若所述兄弟节点中的当前节点没有子节点,确定所述当前节点的base为负值;若所述兄弟节点中的当前节点有子节点,确定所述当前节点的兄弟节点,并迭代跳转到步骤二中;
步骤五:在所述插入位置插入第一术语集合中对应的术语,形所述双数组字典树索引。
3.如权利要求2所述的方法,其特征在于,所述调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引还包括:
生成索引辅助树,所述索引辅助树的每个节点包括:字符编码值、字符在字符串中的深度、字符的最左子节点的位置值,字符的最右子节点的位置值,字符串路径的结束标识信息。
4.如权利要求3所述的方法,其特征在于,所述检索与所述检索信息对应的术语信息之前,还包括:
将所述索引辅助树加载到内存中。
5.如权利要求1-4所述的任一方法,其特征在于,所述根据检索与所述检索信息对应的术语信息包括:
根据公式(1),在所述数据库的双数组字典树索引中,查找与所述检索信息对应的术语;
确定所述查找到的术语在所述双数组字典树的位置值;
在预设的与所述数据库对应的哈希对应关系中,确定与所述位置值对应的所述术语的辅助信息,其中,所述辅助信息包括:术语的原文、术语的译文、术语的属性信息等中的至少一种;
其中,公式(1)为:
base[s]+c=t
check[t]=s(1)
s代表原状态,t代表目标状态,c代表状态间转移的变化值,即字符编码值。
6.一种数据库术语检索的装置,其特征在于,包括:
获取单元,用于获取待检索术语的检索信息;
检索单元,用于根据所述数据库的双数组字典树索引,检索与所述检索信息对应的术语信息;
构建单元,用于从所述数据库中获取术语集合,并根据字典序,将所述术语集合中的术语进行排序,获得排序后的第一术语集合;并调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引,其中,所述双数组字典树包括两个整数数组,分别为基础数组(base[])和校验数组(check[])。
7.如权利要求6所述的装置,其特征在于,
所述构建单元,还用于初始化双数组字典树根节点,并将所述根节点确定为当前节点,其中,base[0]=1;check[0]=0;对于所述当前节点的一群兄弟节点,确定对应的插入位置,其中,所述插入位置为begin值,且check[begin+a1…an]==0,a1…an是所述兄弟节点中的n个节点对应的字符编码值;将所述兄弟节点的check确定为check[begin+a1…an]=begin;若所述兄弟节点中的当前节点没有子节点,确定所述当前节点的base为负值;若所述兄弟节点中的当前节点有子节点,确定所述当前节点的兄弟节点,并继续确定所述兄弟节点对应的插入位置;在所述插入位置插入第一术语集合中对应的术语,形所述双数组字典树索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710423090.9/1.html,转载请声明来源钻瓜专利网。