[发明专利]问答匹配方法、文本匹配模型的训练方法和相关设备有效
申请号: | 202110753707.X | 申请日: | 2021-07-02 |
公开(公告)号: | CN113342958B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 罗通;吴海英;蒋宁;王洪斌 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F18/22;G06F18/2415;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 匹配 方法 文本 模型 训练 相关 设备 | ||
1.一种问答匹配方法,其特征在于,包括:
在问答知识库中,确定与待回答问题匹配的N个候选问题,所述N为大于1的整数;
分别将N组数据输入文本匹配模型,以使所述文本匹配模型输出N个语义相似度,每组数据均包括所述待回答问题和一个所述候选问题,所述语义相似度用于表示所述待回答问题与所述候选问题之间的语义相似度;
分别确定每个所述候选问题与所述待回答问题之间的文本相似度特征,得到N个文本相似度特征,其中,文本相似度特征包括编辑距离和字相似度,所述字相似度表示一个文本与另一个文本包含相同字符的程度;所述字相似度确定方式如下:分别遍历待回答问题和每个候选问题中的每个字符,确定待回答问题和候选问题中相同字符的数量,将相同字符的数量与待回答问题中包含字符数量的比值,确定为待回答问题与候选问题之间的字相似度;
根据所述N个语义相似度和文本相似度特征,确定所述N个候选问题中的目标问题,所述目标问题与所述待回答问题的接近度大于或等于第一阈值;
根据所述目标问题确定所述待回答问题的答案;
所述根据所述N个语义相似度和文本相似度特征,确定所述N个候选问题中的目标问题,包括:
根据所述N个语义相似度和所述N个文本相似度特征,确定N个接近度,所述接近度用于表示所述待回答问题与所述候选问题的接近程度;
将目标候选问题确定为所述目标问题,得到M个目标问题,所述目标候选问题对应的接近度大于或等于所述第一阈值;
其中,所述根据所述N个语义相似度和所述N个文本相似度特征,确定N个接近度,包括:
根据每个所述候选问题与所述待回答问题之间的语义相似度、编辑距离、字相似度以及第一公式,确定每个所述候选问题与所述待回答问题的最大接近度,所述第一公式为:
根据每个所述候选问题与所述待回答问题之间的语义相似度、编辑距离、字相似度和第二公式,确定每个所述候选问题与所述待回答问题的最小接近度,所述第二公式为:
根据所述N个最小接近度、所述N个最大接近度和第三公式,确定每个所述候选问题与所述待回答问题之间的接近度,得到所述N个接近度,第三公式为:
其中,Djbest表示第j条候选问题与所述待回答问题之间的最大接近度,Djworst表示第j条候选问题与所述待回答问题之间的最小接近度,Dj表示第j条候选问题与所述待回答问题之间的接近度,j的取值为1到N之间的整数;当i取值分别为1、2和3时,Xij、Wi、Ximax和Ximin分别表示不同的参数;具体的,X1j表示第j条候选问题与所述待回答问题之间的语义相似度,X2j表示第j条候选问题与所述待回答问题之间的编辑距离,X3j表示第j条候选问题与所述待回答问题之间的字相似度;W1表示所述语义相似度所占权重,W2表示编辑距离所占权重,W3表示字相似度所占权重;X1max表示N个语义相似度中的最大语义相似度,X2max表示N个编辑距离中的最大编辑距离,X3max表示N个字相似度中的最大字相似度;X1min表示N个语义相似度中的最小语义相似度,X2min表示N个编辑距离中的最小编辑距离,X3min表示N个字相似度中的最小字相似度。
2.根据权利要求1所述的方法,其特征在于,在所述问答知识库中,每个问题对应至少一个答案;所述根据所述目标问题确定所述待回答问题的答案,包括:
若所述M个目标问题对应的M个接近度中的最大接近度大于或等于第二阈值,则将第一目标问题对应的答案确定为所述待回答问题的答案,所述第一目标问题与所述最大接近度对应;
若所述最大接近度小于所述第二阈值,则将K个第二目标问题对应的答案作为所述待回答问题的答案,所述M个目标问题包括所述K个第二目标问题,所述K小于或等于所述M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753707.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息提取方法、模型训练方法及相关设备
- 下一篇:一种具有加湿功能的空气净化器