[发明专利]检索式问答方法、模型训练方法、服务器及存储介质有效
申请号: | 202010059894.7 | 申请日: | 2020-01-19 |
公开(公告)号: | CN111309878B | 公开(公告)日: | 2023-08-22 |
发明(设计)人: | 陈晓军;崔恒斌 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 郭曼 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 问答 方法 模型 训练 服务器 存储 介质 | ||
1.一种检索式问答方法,包括:
对接收的第一文本进行分词,得到至少一个第一词语;
确定所述至少一个第一词语的词权重;
根据所述至少一个第一词语从知识库召回预定数量的候选问题-答案对;
针对每个候选问题-答案对,分别将所述候选问题-答案对中的问题作为第二文本,确定所述第二文本包含的至少一个第二词语及其词权重;并根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定所述第一文本和所述第二文本的匹配度;
根据确定的所述第一文本和所述候选问题-答案对中每个第二文本的匹配度返回至少一个候选问题-答案对中的答案;
其中,所述根据所述至少一个第一词语、所述至少一个第二词语及其词权重确定所述第一文本和所述候选问题-答案对中每个问题的匹配度包括:
根据所述至少一个第一词语的词权重和所述至少一个第二词语的词权重确定所述第一文本和第二文本的词权重相关矩阵,其中,所述词权重相关矩阵中的每个元素Bij代表所述第一文本中第i个词语和所述第二文本中第j个词语的词权重相关系数;
确定所述第一文本和第二文本的注意力权值矩阵,其中,所述注意力权值矩阵中的每个元素Aij代表所述第一文本中第i个词语对所述第二文本中第j个词语的匹配度;
使用所述词权重相关矩阵对所述注意力权值矩阵进行更新;以及
将所述更新后的注意力权值矩阵、第一文本以及第二文本输入基于注意力机制的相似度匹配模型,确定所述第一文本和所述第二文本的匹配度。
2.根据权利要求1所述的方法,其中,所述确定所述至少一个第一词语的词权重包括:分别将所述至少一个第一词语输入经过训练的词权重模型,得到所述至少一个第一词语的词权重。
3.根据权利要求1所述的方法,其中,所述确定所述第二文本包含的至少一个第二词语及其词权重包括:
从所述知识库获取所述第二文本包含的至少一个第二词语及其词权重;
或,
对所述第二文本进行分词,得到所述至少一个第二词语,并分别将所述至少一个第二词语输入经过训练的词权重模型,得到所述至少一个第二词语的词权重。
4.根据权利要求1所述的方法,其中,所述第一文本中第i个词语和所述第二文本中第j个词语的词权重相关系数为所述第一文本中第i个词语和所述第二文本中第j个词语的词权重的乘积。
5.根据权利要求1所述的方法,其中,所述使用所述词权重相关矩阵对所述注意力权值矩阵进行更新包括:
针对所述注意力权值矩阵中的每个元素,将所述元素与所述词权重相关矩阵中的对应元素进行相乘,并使用得到的乘积替换所述元素;或,
针对上述注意力权值矩阵中的每个元素,求所述元素与所述词权重相关矩阵中的对应元素的平均值,并使用得到的平均值替换所述元素;或,
针对上述注意力权值矩阵中的每个元素,求所述元素与所述词权重相关矩阵中的对应元素的加权平均值,并使用得到的加权平均值替换所述元素。
6.根据权利要求1所述的方法,其中,所述根据确定的所述第一文本和所述候选问题-答案对中每个第二文本的匹配度返回至少一个候选问题-答案对中的答案包括:将所述第一文本和每个候选问题-答案对中问题的匹配度、所述第一文本和所述候选问题-答案对输入排序模型,接收所述排序模型输出的排序值,根据所述排序值返回排序在前的至少一个候选问题-答案对中的答案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010059894.7/1.html,转载请声明来源钻瓜专利网。