[发明专利]关键词校正方法、装置、计算机设备和存储介质在审
申请号: | 202110919541.4 | 申请日: | 2021-08-11 |
公开(公告)号: | CN113723081A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 贾亚龙;杨洋;李锋;张琛;万化 | 申请(专利权)人: | 上海浦东发展银行股份有限公司 |
主分类号: | G06F40/232 | 分类号: | G06F40/232;G06F40/284 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄晓庆 |
地址: | 200001*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 校正 方法 装置 计算机 设备 存储 介质 | ||
1.一种关键词校正方法,其特征在于,所述方法包括:
根据多个参考文本确定所述待处理文本中的待校正关键词,所述多个参考文本为与所述待处理文本相关的文本;
通过所述待校正关键词与所述多个参考文本的第一相似度从所述多个参考文本中确定候选参考文本;
根据所述待校正关键词与所述候选参考文本的音素相似度确定目标参考文本;
基于所述目标参考文本对所述待校正关键词进行校正。
2.根据权利要求1所述的方法,其特征在于,所述通过所述待校正关键词与所述多个参考文本的第一相似度从所述多个参考文本中确定候选参考文本,包括:
将所述待校正关键词分别与所述多个参考文本进行比较,得到多个比较结果,基于所述比较结果确定所述待校正关键词与所述多个参考文本的第一相似度;
将所述多个参考文本中与所述待校正关键词的所述第一相似度大于等于预设第一阈值的参考文本确定为所述候选参考文本。
3.根据权利要求2所述的方法,其特征在于,所述第一相似度为字符相似度,所述将所述待校正关键词分别与所述多个参考文本进行比较,得到多个比较结果,基于所述比较结果确定所述待校正关键词与所述多个参考文本的第一相似度,包括:
以字符为比较单位将所述待校正关键词中的字符分别与所述多个参考文本中的字符进行按照字符的排列顺序比较,得到多个编辑距离,所述编辑距离为所述待校正关键词中的字符调整为参考文本中的字符所需的次数;
根据所述待校正关键词与所述参考文本的编辑距离确定所述待校正关键词与所述多个参考文本的字符相似度。
4.根据权利要求2所述的方法,其特征在于,所述第一相似度为音节相似度,所述将所述待校正关键词分别与所述多个参考文本进行比较,得到多个比较结果,基于所述比较结果确定所述待校正关键词与所述多个参考文本的第一相似度,包括:
以音节为比较单位将所述待校正关键词中的各个音节分别与所述多个参考文本中的各个音节按照音节的排列顺序进行比较,得到多个编辑距离,所述编辑距离为所述待校正关键词中的各个音节调整为参考文本中的各个音节所需的次数;
根据所述待校正关键词与所述参考文本的编辑距离确定所述待校正关键词与所述多个参考文本的音节相似度。
5.根据权利要求1所述的方法,其特征在于,所述根据所述待校正关键词与所述候选参考文本的音素相似度确定目标参考文本,包括:
分别将所述待校正关键词音节中的各个音素和所述候选参考文本音节中的各个音素输入到预设的语言模型中进行向量化处理,得到所述待校正关键词的多个第一词向量以及所述候选参考文本的多个第二词向量;
根据超参数、所述第一词向量和与所述第一词向量对应的所述第二词向量之间的欧氏距离以及最大欧式距离确定所述待校正关键词与所述候选参考文本的音素相似度;
将所述候选文本中与所述待校正关键词的所述第二相似度大于等于预设第二阈值的候选文本确定为目标参考文本。
6.根据权利要求5所述的方法,其特征在于,所述根据超参数、所述第一词向量和与所述第一词向量对应的所述第二词向量之间的欧氏距离以及最大欧式距离确定所述待校正关键词与所述候选参考文本的音素相似度,包括:
根据包含的关系式确定所述待校正关键词与所述候选参考文本的编辑距离,其中,α为超参数,S为最大欧式距离,n为向量的维度,xi为第一词向量,yi为第二词向量;
根据所述待校正关键词与所述候选参考文本的编辑距离确定所述待校正关键词与所述候选参考文本的音素相似度。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
根据所述待校正关键词与所述候选参考文本的编辑距离和所述待校正关键词的音节长度对所述待校正关键词与所述候选参考文本的编辑距离进行处理;
根据处理后的所述待校正关键词与所述目标参考文本的编辑距离确定所述待校正关键词与所述候选参考文本的音素相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海浦东发展银行股份有限公司,未经上海浦东发展银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110919541.4/1.html,转载请声明来源钻瓜专利网。