[发明专利]智能问答方法、装置、设备及存储介质在审
申请号: | 202210078742.0 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114416927A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 雷婷睿;唐海峰;李运松;张澍 | 申请(专利权)人: | 招商银行股份有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/35;G06F40/30;G06K9/62;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 黄廷山 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 问答 方法 装置 设备 存储 介质 | ||
1.一种智能问答方法,其特征在于,所述智能问答方法包括:
获取目标用户输入的查询文本信息;
将所述查询文本信息输入语义分类模型,获得目标问句语义向量,并基于所述查询文本信息以及所述目标问句语义向量,在预设问答知识数据库进行字词检索和语义向量检索,获得召回相似结果集,其中,所述语义分类模型为基于预先收集的领域无标注语料信息对BERT语言模型进行预训练,并结合AM-softmax损失函数对预训练得到的模型进行迭代训练获得;
基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型,构建目标特征矩阵,其中,所述语义相似度模型为基于所述语义分类模型输出问句语义向量构建的训练三元组样本进行迭代训练获得;
基于所述目标特征矩阵,通过语义排序模型进行排序,获得排序评分结果,并基于所述排序评分结果,确定最终目标返回结果,其中,所述语义排序模型为基于不同类别问句语义向量构建的训练三元组样本进行迭代训练获得。
2.如权利要求1所述的智能问答方法,其特征在于,所述基于所述查询文本信息以及所述目标问句语义向量,在预设问答知识数据库进行字词检索和语义向量检索,获得召回相似结果集的步骤包括:
根据所述查询文本信息,查询所述预设问答知识数据库,获得字词召回结果;
根据所述目标问句语义向量,查询所述预设问答知识数据库,获得语义召回结果;
将所述字词召回结果和所述语义召回结果进行合并去重处理,获得所述召回相似结果集。
3.如权利要求1所述的智能问答方法,其特征在于,所述基于所述查询文本信息、所述目标问句语义向量、所述召回相似结果集以及语义相似度模型,构建目标特征矩阵的步骤包括:
计算所述查询文本信息与所述召回相似结果集中各个召回数据的相似度,获得字词相似度特征;
基于所述目标问句语义向量以及所述语义相似度模型,确定语义相似度特征;
基于所述字词相似度特征以及所述语义相似度特征,构建所述目标特征矩阵。
4.如权利要求1所述的智能问答方法,其特征在于,在所述获取目标用户输入的查询文本信息的步骤之前,所述智能问答方法还包括:
获取领域无标注语料信息,并基于所述领域无标注语料信息,对待训练初始模型进行预训练,获得预训练语言模型;
获取待训练语料信息,其中,所述待训练语料信息包括不同类别的标准问集和相似问集;
基于预设损失函数以及所述相似问集,对所述预训练语言模型进行迭代训练,获得所述语义分类模型,并输出训练分类结果,其中,所述预设损失函数包括AM-softmax损失函数,所述训练分类结果包括问句语义向量以及分类概率信息;
将所述相似问集的每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合,并将组成结果存储至所述预设知识检索库中。
5.如权利要求4所述的智能问答方法,其特征在于,在所述将所述相似问集的每一相似问、各所述相似问对应的问句语义向量以及各所述相似问关联的标准问进行关联组合,并将组成结果存储至所述预设知识检索库中的步骤之后,所述智能问答方法还包括:
计算各所述相似问对应问句语义向量之间的相似度;
将所述相似度与预设相似度阈值进行比较,并基于所述相似度比较结果以及各所述相似问的真实类别标签,构建第一待训练三元组样本;
基于所述第一待训练三元组样本,对待训练相似度模型进行迭代训练,获得所述语义相似度模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商银行股份有限公司,未经招商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210078742.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高温氯化反应器
- 下一篇:基于频移干涉的激光雷达测距测速装置