[发明专利]一种面向答案选择的多角度注意力特征匹配方法及系统有效
申请号: | 202110361238.7 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113239678B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 徐小龙;刘聪;肖甫 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/284;G06F18/241;G06N3/0442;G06N3/0464;G06N3/047;G06N3/048;G06N3/09 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 田凌涛 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 答案 选择 角度 注意力 特征 匹配 方法 系统 | ||
本发明涉及一种面向答案选择的多角度注意力特征匹配方法及系统,使用混合编码层,通过使用混合编码层丰富文本特征,结合双向LSTM提取序列化信息,以及TextCNN的不同高度卷积核,获取更为广泛的短文本信息,进而达到互补效果;同时使用多层次相似度计算,通过注意力机制,提取两个句子之间的局部交互信息和整体相似度特征,然后将提取的特征进行组合,兼顾句子局部与整体进行相似度评分,整个技术方案,由候选答案中,能够高效、准确的实现目标答案的自动获得。
技术领域
本发明涉及一种面向答案选择的多角度注意力特征匹配方法及系统,属于自然语言处理技术领域。
背景技术
在问答系统中,经过信息检索后,问答系统内容需要对候选答案进行排序,从而选择最佳答案。在社区问答、智能客服等场景中,相对于生成需要答案,在已有的候选答案中选择合适的答案更加便捷高效。答案选择是自然语言处理中十分重要的任务,也是问答系统不可缺少的重要组件。答案选择任务可以看做是一个答案匹配任务。答案选择任务也被认为是文本匹配的一种应用。但是检索式问答系统同时也面临着以下的问题:(1)问句信息匮乏。用户提问一般不会非常详细,通常由短文本构成,其中蕴含的信息量本就不多,在去除无意义的词语后就更加稀少;(2)问题和答案的长度不匹配。通常问题内容较短,一般有5-15字短文本内容构成。而答案常常20-50字构成。答案中与问题不是十分相关的冗余特征,会对答案的表示造成影响,进而影响最后的排序;(3)候选答案相似度高。候选答案通常由相似领域的不同答案构成,这对基于关键词匹配或词袋模型的方法很难解决这类问题。
目前已经有很多学者研究问答系统中的答案选择,主要可以基于特征扩展的方法和基于深度学习的方法。前者通常基于词语匹配或者语法特征。后者通过对答案抽象总结,转化为对称的特征编码,减少冗余信息影响。答案选择任务实质上就是一种文本匹配任务,深度学习在答案选择中的应用通常由几个类别,首先是基于表示的文本匹配模型,这类模型通常使用孪生网络。通常是对问句和答案分别进行编码,然后根据二者的向量表示,设定相似度计算函数或结构,最终获得两句的相似度评分。另一种是基于交互的匹配模型,这类模型通常结合注意力机制构建。一般通过注意力结构对问题和答案进行不同粒度的交互,然后将交互结果组合起来,形成最终的匹配关系表示。这类模型通常由复杂的结构组成,注重提取句子特征和句子交互关系方面的内容。
目前的答案选择技术主要存在以下问题:
(1)基于特征工程的方法需要人为的进行特征工程,这类方法往往有着复杂的特征工程,并且模型只能适应特定数据集,并不具有普遍性。而且,模型的效果依赖特征工程的设计,人的作用过于重要。
(2)基于深度学习的方法中,基于表示的方法通常对两个句子进行相对独立的特征提取,即使加入交互信息,也是单一层级的交互,交互信息利用不充分;基于交互的方法通常难以考虑全面的交互信息,不能通篇考虑局部和全局相似度并加以有效结合。
发明内容
本发明所要解决的技术问题是提供一种面向答案选择的多角度注意力特征匹配方法,采用全新设计逻辑,能够由高效、准确的实现目标答案的自动获得。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种面向答案选择的多角度注意力特征匹配方法,执行如下步骤i至步骤viii,获得问题答案分类模型,以及应用问题答案分类模型,执行步骤A至步骤C,获得目标问题基于其各候选答案中所对应的目标答案;
步骤i.基于预设数量的各样本问题、各样本问题分别所对应的各样本候选答案,以及各样本问题分别基于其各样本候选答案中所对应的目标样本答案,构建样本数据集,然后进入步骤ii;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110361238.7/2.html,转载请声明来源钻瓜专利网。