[发明专利]数据库术语检索的方法、装置及终端在审
申请号: | 201710423090.9 | 申请日: | 2017-06-07 |
公开(公告)号: | CN107239549A | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 冯泽康 | 申请(专利权)人: | 传神语联网网络科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京康盛知识产权代理有限公司11331 | 代理人: | 张宇峰 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 术语 检索 方法 装置 终端 | ||
技术领域
本发明涉及计算机信息技术领域,特别涉及数据库术语检索的方法、装置及终端。
背景技术
当前计算机辅助翻译是提高翻译一致性和效率的重要手段,它要求软件能够不断地记忆最新的术语及语料,并在后续的翻译流程中能够及时地调出满足相应条件的术语及语料以供选择。
随着术语和语料规模的不断扩大,数据库也原来越大,遍历数据库进行术语的检索,获得对应的术语信息所需花费的时间就会越来越多,可见,目前术语检索的效率比较低。
发明内容
本发明实施例提供了一种数据库术语检索的方法、装置及终端。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
根据本发明实施例的第一方面,提供了一种数据库术语检索的方法,包括:
获取待检索术语的检索信息;
根据所述数据库的双数组字典树索引,检索与所述检索信息对应的术语信息;
其中,所述数据库的双数组字典树索引的构建过程包括:
从所述数据库中获取术语集合,并根据字典序,将所述术语集合中的术语进行排序,获得排序后的第一术语集合;
调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引,其中,所述双数组字典树包括两个整数数组,分别为基础数组base[]和校验数值check[]。
本发明一实施例中,所述调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引包括:
步骤一:初始化双数组字典树根节点,并将所述根节点确定为当前节点,其中,base[0]=1;check[0]=0;
步骤二:对于所述当前节点的一群兄弟节点,确定对应的插入位置,其中,所述插入位置为begin值,且check[begin+a1…an]==0,a1…an是所述兄弟节点中的n个节点对应的字符编码值;
步骤三:将所述兄弟节点的check确定为check[begin+a1…an]=begin;
步骤四:若所述兄弟节点中的当前节点没有子节点,确定所述当前节点的base为负值;若所述兄弟节点中的当前节点有子节点,确定所述当前节点的兄弟节点,并迭代跳转到步骤二中;
步骤五:在所述插入位置插入第一术语集合中对应的术语,形所述双数组字典树索引。
本发明一实施例中,所述调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引还包括:
生成索引辅助树,所述索引辅助树的每个节点包括:字符编码值、字符在字符串中的深度、字符的最左子节点的位置值,字符的最右子节点的位置值,字符串路径的结束标识信息。
本发明一实施例中,所述检索与所述检索信息对应的术语信息之前,还包括:
将所述索引辅助树加载到内存中。
本发明一实施例中,所述检索与所述检索信息对应的术语信息包括:
根据公式(1),在所述数据库的双数组字典树索引中,查找与所述检索信息对应的术语;
确定所述查找到的术语在所述双数组字典树的位置值;
在预设的与所述数据库对应的哈希对应关系中,确定与所述位置值对应的所述术语的辅助信息,其中,所述辅助信息包括:术语的原文、术语的译文、术语的属性信息等中的至少一种;
其中,公式(1)为:
base[s]+c=t
check[t]=s (1)
s代表原状态,t代表目标状态,c代表状态间转移的变化值,即字符编码值。
根据本发明实施例的第二方面,提供一种数据库术语检索的装置,包括:
获取单元,用于获取待检索术语的检索信息;
检索单元,用于根据所述数据库的双数组字典树索引,检索与所述检索信息对应的术语信息;
构建单元,用于从所述数据库中获取术语集合,并根据字典序,将所述术语集合中的术语进行排序,获得排序后的第一术语集合;并调用双数组字典树插入所述第一术语集合中的术语,形成所述双数组字典树索引,其中,所述双数组字典树包括两个整数数组,分别为基础数组base[]和校验数组check[]。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于传神语联网网络科技股份有限公司,未经传神语联网网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710423090.9/2.html,转载请声明来源钻瓜专利网。