[发明专利]一种用于问答系统的答案选择方法有效
申请号: | 201910332100.7 | 申请日: | 2019-04-24 |
公开(公告)号: | CN110046244B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 陈洪辉;邵太华;蔡飞;蒋丹阳;刘俊先;罗爱民;陈涛;舒振 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06K9/62;G06N3/04 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 410003*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于问答系统的答案选择方法,采用层次长度自适应神经网络结构来生成问题与答案的句子分布式表示,目的是根据输入句子的长度采用不同的神经特征抽取器来提取高质量的句子特征,首先通过连接一个固定的单词嵌入和一个微调的单词嵌入为输入语句中的每个单词生成一个单词分布式表示,然后,分别对短句子使用基于BiLSTM的特征抽取器和对长句子使用基于Transformer的特征抽取器,最后,使用一个考虑问答句之间交互作用的注意力池化层来生成用于衡量问题与候选答案之间相关性的句子向量表示,实验结果表明,本发明提出的基于长度自适应神经网络的答案选择模型在MAP和MRR方面可以比最先进的基线上取得较大的提升。 | ||
搜索关键词: | 一种 用于 问答 系统 答案 选择 方法 | ||
【主权项】:
1.一种用于问答系统的答案选择方法,其特征在于,包括以下步骤:A.接收用户输入的问题句子和答案句子,利用预训练得到的词嵌入模型得出各句子中每个单词的词向量,并结合网络训练过程中对词嵌入模型进行微调后得出的词向量,计算得出组合后的单词向量;B.从连接的单词向量中选取有效的特征,得到句子中每个单词的最终向量;C.根据预设的句子长度阈值,在句子长度高于和低于阈值时,采用不同的特征提取器对句子进行处理,生成拟合后的包含上下文信息的句子矩阵表示;D.注意力池化层根据步骤C中得到的包含上下文信息的句子矩阵,得出问题句子和答案句子的注意力相似度,通过分别在相似度矩阵的行和列的每一维度提取最大特征,对问题句子和答案句子进行长度自适应分布式表示,为问题句子和答案句子分别生成分布式向量表示;E.测量问题句子和答案句子的分布式向量表示之间的余弦相似性,得到各答案句子相对于问题句子的相关性,根据相关性对答案句子进行排序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910332100.7/,转载请声明来源钻瓜专利网。