[发明专利]问答匹配方法、文本匹配模型的训练方法和相关设备有效
申请号: | 202110753707.X | 申请日: | 2021-07-02 |
公开(公告)号: | CN113342958B | 公开(公告)日: | 2023-06-16 |
发明(设计)人: | 罗通;吴海英;蒋宁;王洪斌 | 申请(专利权)人: | 马上消费金融股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/30;G06F18/22;G06F18/2415;G06N3/04;G06N3/08 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张娜;刘芳 |
地址: | 401120 重庆市渝北区*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 匹配 方法 文本 模型 训练 相关 设备 | ||
本申请实施例提供一种问答匹配方法、文本匹配模型的训练方法和相关设备,该方法包括:在问答知识库中确定与待回答问题匹配的N个候选问题,所述N为大于1的整数;分别将N组数据输入文本匹配模型,输出N个语义相似度,每组数据均包括所述待回答问题和一个所述候选问题,所述语义相似度用于表示所述待回答问题与所述候选问题之间的语义相似度;根据所述N个语义相似度,确定所述N个候选问题中的目标问题,所述目标问题与所述待回答问题的接近度大于或等于第一阈值;根据所述目标问题确定所述待回答问题的答案。采用本申请实施例提供的方法能够待回答问题的答案的准确性。
技术领域
本申请实施例涉及自然语言处理技术领域,尤其涉及一种问答匹配方法、文本匹配模型的训练方法和相关设备。
背景技术
随着计算机科学与人工智能技术的快速发展,越来越多的人工智能产品应用到日常生活中,为人们提供各种便利服务。其中,基于常见问题(Frequently Asked Questions,FAQ)的智能问答系统就是一项典型的应用产品,且在实际生活中应用非常广泛。比如,它能够应用到智能客服、网络搜索等各种领域,当用户找客服咨询问题或使用搜索引擎搜索问题时,智能问答系统能够在大量资源中找到与用户问题相匹配的答案。
相关技术中,基于FAQ的智能问答系统中的常见问题和答案通常都是预先搜集整理出来的,一个问题对应一个答案,当为用户问题匹配答案时,先计算用户问题与智能问答系统中每个常见问题之间的句子相似度,将句子相似度最大的常见问题对应的答案作为用户问题匹配的答案。其中,句子相似度的计算方式通常采用词嵌入方式,即对用户问题和常见问题中的每一个词计算一个静态的词向量,通过余弦相似度计算用户问题与常见问题之间的词相似度,然后通过词相似度计算得到用户问题与每个常见问题之间的句子相似度,或者,将一句话中所有词向量采用累加等方法形成一个句子向量,分别得到用户问题对应的句子向量和每个常见问题对应的句子向量,再分别计算用户问题对应的句子向量与和每个常见问题对应的句子向量之间的余弦相似度。
但是,由于同一个问题可能有多种不同的文字表达,而基于词嵌入的方式计算句子相似度无法准确理解句子之间的语义关联性,可能会使得语义相同的两句话因表达文字不同而造成文字对应的词向量完全不同,进而导致两句话之间的句子相似度非常低,最终导致为用户问题匹配的答案准确率低。
发明内容
本申请实施例提供一种问答匹配方法、文本匹配模型的训练方法和相关设备,用于提高待回答问题的答案的准确性。
第一方面,本申请实施例提供一种问答匹配方法,包括:
在问答知识库中,确定与待回答问题匹配的N个候选问题,所述N为大于1的整数;
分别将N组数据输入文本匹配模型,输出N个语义相似度,每组数据均包括所述待回答问题和一个所述候选问题,所述语义相似度用于表示所述待回答问题与所述候选问题之间的语义相似度;
根据所述N个语义相似度,确定所述N个候选问题中的目标问题,所述目标问题与所述待回答问题的接近度大于或等于第一阈值;
根据所述目标问题确定所述待回答问题的答案。
可以看出,本申请实施例中,通过文本匹配模型能在深度语义方面更加准确的理解待回答问题和候选答案之间的语义相似度,进而提高根据N个语义相似度确定得到的目标问题的准确性,最终提高根据目标问题确定待回答问题的答案的准确性。
第二方面,本申请实施例提供一种文本匹配模型的训练方法,包括:
在自然语言语料库中获取第一目标数据集和第二目标数据集;
根据所述第一目标数据集和第二目标数据集,确定文本匹配训练集,所述文本匹配训练集包括至少一个训练样本,所述训练样本包括两个问题以及两个问题之间的语义相似度;
将所述文本匹配训练集输入至预先建立的深度神经网络中进行训练,得到文本匹配模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于马上消费金融股份有限公司,未经马上消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110753707.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信息提取方法、模型训练方法及相关设备
- 下一篇:一种具有加湿功能的空气净化器