[发明专利]一种注释信息确定、前缀树构建方法及装置在审
申请号: | 201810500276.4 | 申请日: | 2018-05-23 |
公开(公告)号: | CN110597800A | 公开(公告)日: | 2019-12-20 |
发明(设计)人: | 邱星 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2457;G06F16/903 |
代理公司: | 11413 北京柏杉松知识产权代理事务所(普通合伙) | 代理人: | 马敬;项京 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 候选节点 全拼音 全字符 注释信息 前缀树 查询效率 人工成本 构建 预设 申请 匹配 应用 | ||
本申请实施例提供了一种注释信息确定、前缀树构建方法及装置,方法包括:获取待补全拼音缩写;将待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将预设前缀树中第一级别的所有节点作为待补全候选节点;从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;判断待补全拼音缩写中的所有字符是否匹配完成;如果否,则将下一级别的字符作为当前级别的待补全字符,将当前待补全节点对应的下一级别的所有节点作为待补全候选节点。应用本申请实施例,在确定注释信息时,能够提高查询效率,降低人工成本。
技术领域
本申请涉及计算机技术技术领域,特别是涉及一种注释信息确定、前缀树构建方法及装置。
背景技术
为满足便于记忆、书写方便等需求,人们常常采用拼音缩写来表达一个词组。例如,身份证号采用SFZH来表达,审批时间采用SPHJ来表达等。这使得拼音缩写随处可见。而为了便于人们理解拼音缩写的含义,需要对拼音缩写进行描述。这里,拼音缩写的描述信息即为上述拼音缩写所要表达的词组,也可以称为拼音缩写的注释信息。
目前,拼音缩写的注释信息主要是靠人工查找数据库来的确定的。其中数据库中存储有大量的拼音缩写与注释信息的对应关系。人工需要逐条查找数据库中包括的对应关系,以确定需要的拼音缩写的注释信息。这使得查询人工成本较高,查询效率较低。
发明内容
本申请实施例的目的在于提供一种注释信息确定、前缀树构建方法及装置,以在注释信息确定时,降低人工成本,提高查询效率。具体技术方案如下:
为实现上述目的,本申请实施例提供了一种注释信息确定方法,所述方法包括:
获取待补全拼音缩写;其中,所述待补全拼音缩写中的各个字符与预设前缀树中的各个级别一一对应,所述预设前缀树中每一分支的最后一级别的节点的值为注释信息,所述预设前缀树中除每一分支的最后一级别的节点外的节点的值为字符;
将所述待补全拼音缩写中第一级别的字符作为当前级别的待补全字符,将所述预设前缀树中第一级别的所有节点作为待补全候选节点;
从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点;
判断所述待补全拼音缩写中的所有字符是否匹配完成;
如果否,则将所述待补全拼音缩写中下一级别的字符作为当前级别的待补全字符,将所述预设前缀树中当前待补全节点对应的下一级别的所有节点作为待补全候选节点,返回执行所述从各个待补全候选节点中,选择值为当前级别的待补全字符的待补全候选节点,作为当前待补全节点的步骤。
可选的,所述获取待补全拼音缩写的步骤,包括:
获取用户输入的拼音缩写;
对所述用户输入的拼音缩写进行标准化处理,得到待补全拼音缩写。
可选的,所述对所述用户输入的拼音缩写进行标准化处理的步骤,包括:
去除所述用户输入的拼音缩写的前缀;和/或
对所述用户输入的拼音缩写进行归一化处理。
可选的,所述方法还包括:
若判定所述待补全拼音缩写中的所有字符匹配完成,则将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息。
可选的,所述将所述预设前缀树中当前待补全节点对应的最后一级别的节点的值,确定为所述待补全拼音缩写的注释信息的步骤,包括:
判断所述预设前缀树中当前待补全节点对应的下一级别的节点中是否存在结束字符节点;所述结束字符节点的值为表示字符串结束的字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810500276.4/2.html,转载请声明来源钻瓜专利网。