[发明专利]一种非事实类问答答案选择方法及系统有效
申请号: | 201810427636.2 | 申请日: | 2018-05-07 |
公开(公告)号: | CN108829719B | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 马荣强;张健;李淼;陈雷;高会议 | 申请(专利权)人: | 中国科学院合肥物质科学研究院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/36;G06F40/211;G06F40/30 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 奚华保 |
地址: | 230031 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事实 问答 答案 选择 方法 系统 | ||
本发明公开了一种非事实类问答答案选择方法,属于智能检索技术领域,包括采用基于注意力机制的卷积神经网络分别对问句、待选择答案语句进行处理,得到第一语义向量、第二语义向量,其中,第一语义向量表示问句的语义向量,第二语义向量表示待选择的答案语句的语义向量;将第一语义向量与所述第二语义向量进行匹配,并将匹配度最高的第二语义向量所对应的待选择答案语句作为正确答案返回。本发明利用基于注意力机制的卷积神经网络生成句子的语义向量表示,在语义表示过程中的重要程度对输入赋予权重,减小与答案主题无关内容的影响,自动生成高质量的语义表示,提高了问句与答案语句的语义匹配度,进而提高了答案选择的正确率。
技术领域
本发明涉及智能检索技术领域,特别涉及一种非事实类问答答案选择方法及系统。
背景技术
非事实类问答系统回答问题的流程为:问题分析、问句检索和答案选择。首先通过问题分析来确定问题类型和预期的答案类型,有时还需要对问题的关键词进行扩展;然后利用问题的类型及关键词信息从知识库中检索出与问题相关的候选答案集;最后利用语义特征匹配选择出正确答案。答案选择任务的做法就是通过语义分析找到问句与答案之间的语义关联性,从而选出正确答案。非事实类领域非事实类问答的特点是答案文本的长度一般比问句要长的多,并且其数据来源主要是网络社区问答,答案中会包含一些口语化表达和冗余信息。因此,如何有效建立问题与答案之间的语义关联是非事实类领域问答系统中的主要任务之一。
随着以深度学习为代表的表示学习技术在多个领域的成功应用,许多研究者开始着手研究基于深度学习学习的答案选择技术。深度学习的优点在于通过将语义映射为低维空间向量,自动学习并提取语义特征,增强了语义的可计算性,消除了语义鸿沟。其基本假设是把答案选择任务看做语义匹配过程,通过表示学习知识,将自然语言问句和答案转换为低维语义空间中的数值向量,再次基础上,利用数值计算直接匹配与用户问句语义最相似的答案。
基于深度学习技术的答案选择模型可以分为两种情况,一种是使用通用神经网络模型,例如卷积神经网络(Convolutional Neural Network,CNN)和循环神经网络(Recurrent Neural Networks,RNN)等,生成文本的语义向量,然后利用语义匹配进行答案选择。例如利用卷积神经网络可以捕捉到单词的位置信息,可以在不用考虑单词的位置而提取n-gram模型特征,不用使用任何工具可以学习句子的语法结构特征捕捉句子的长距离依赖问题进而将将句子编码成定长向量。还可以将问题和候选答案看作一个整体,利用循环神经网络可以处理序列数据的特性,对每条问题-答案对进行编码,然后将编码后的句子向量输入到长短期记忆模型(long-short term memory,LSTM)中,每个时刻的输出作为答案最终的类别。这种操作方法可以捕捉到候选答案中的对话信息。
另一种利用深度学习技术来进行答案选择的情况是分析现有深度学习模型的缺点,结合模型的结构特性,从模型结构或中间的处理过程对模型进行改进。相关工作有:通过分析融合注意力(Attention)机制,利用三种对融合注意力机制的长短期记忆网络模型进行改进的措施,目的是改于单项LSTM网络越靠近后期的时间点保存的信息量越多,导致的注意力机制出现权重偏置的问题;为了更好地消除歧义,利用一种潜在的随机Attention机制,主要是在融合注意力机制的长短期记忆模型的权重相乘阶段,用一个潜在的向量表示得到的问题向量,然后利用这个潜在向量对答案文本中长短期记忆网络的没事时间点的输出计算一个权值。
基于深度学习的答案选择方法也有相应的弊端,比如:基于神经网络的语义表示模型往往对输入文本进行统一处理,并不能识别出答案文本中的噪声信息,并且单一的网络结构只能挖掘文本相同的语义特征,这都使得最后生成的语义向量不能高效表达语义信息。另外,神经网络训练过程计算量大,模型训练时间较长,最终要的是网络结构难以解释,只能通过模型最终的结果来验证不能网络结构及其组合形式的性能。
发明内容
本发明的目的在于提供一种非事实类问答答案选择方法及系统,以提高答案选择的准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院合肥物质科学研究院,未经中国科学院合肥物质科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810427636.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理的方法和装置
- 下一篇:数据处理方法及装置