[发明专利]一种面向机器阅读理解的答案推荐方法有效

专利信息
申请号: 202010775911.7 申请日: 2020-08-05
公开(公告)号: CN111782961B 公开(公告)日: 2022-04-22
发明(设计)人: 赵翔;霍立军;徐浩;谭真;葛斌;肖卫东;黄魁华;李硕豪 申请(专利权)人: 中国人民解放军国防科技大学
主分类号: G06F16/9535 分类号: G06F16/9535;G06F16/33;G06F40/126;G06F40/289;G06F40/30;G06N3/04;G06N5/04
代理公司: 长沙大珂知识产权代理事务所(普通合伙) 43236 代理人: 伍志祥
地址: 410003 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 机器 阅读 理解 答案 推荐 方法
【权利要求书】:

1.一种面向机器阅读理解的答案推荐方法,其特征在于,包括以下步骤:

步骤1,接受问题q和支持文档集T',问题q以元组(le,r,?)的形式提供,其中le是左实体,?表示未知右实体,r表示le与未知右实体也就是答案之间的关系;

步骤2,进行句子分割和语义编码,包括文本预处理、词编码和句子编码;

步骤3,根据编码的语义进行推断以构建多跳推理链,包括选择节点和建立跳边;

步骤4,通过挖掘多跳推理链的信息以对候选集进行排序,包括推理链信息的集成和答案概率分布的计算;

步骤5,根据答案概率分布结果,从候选集中预测未知右实体即答案;

步骤2中所述的预处理包括:使用TF-IDF算法来计算问题和每个支持文档之间的余弦相似度并对其进行排名,截取前N个支持文档以获得新的支持文档集

所述的词编码,将字符嵌入和预训练的Glove词嵌入结合起来作为初始词嵌入,并将它们输入到一层高速路神经网络中以获得最终的词表示,使用L',R'和X'分别表示le,r和T的词嵌入,对于语义编码,把L',R'和X'经过一层带有v个隐藏单元的双向LSTM网络并连接其双向输出,使用分别作为le,r和T的语义编码,其中Ql,Qr,J分别为le,r和T的词级长度;每个候选都在支持文档集T中找到,在X中取出与c'η相对应的词编码,并在词级别对其求平均,然后获得cη∈Rv作为c'η的语义编码;

所述的句子编码,包括:首先将文档t切成多个句子,以获得单个句子集其中,I是包含在t中的单个句子的数量,K是构成一个句子的单词数量,是在X中相应单词的编码;然后,将文档中所有两个相邻的单个句子级联起来,以获得级联句子集定义为:

其中||用于表示级联;接下来,联合Do和Db以完成t的句子划分并获得句子集D,也就是:

D=Do∪Db,

其中∪指取并集;对所有支持文档采用相同的操作,并获得T的词级句子编码S,即:

S=D1∪D2∪…∪DN={s1,…,sI'},

其中I'是T的单个句子和级联句子的总数,然后应用自我注意机制来实现句子的向量表示,并获得T的句子级编码E,用来将句子si转换成向量的公式如下,K为句子的长度:

aik=tanh(W2 tanh(W1sik+b1)+b2)

其中W1和W2为权重参数,b1和b2为偏移参数;

在步骤3中,使用分层记忆网络模型来构建句子的推理链,在选择节点阶段,模型抽取一个与网络记忆状态m最相关的句子作为当前跳的起始节点,在建立跳边阶段,模型更新m以准备跳到下一个节点,将这一阶段看做生成一个连接相邻节点的边;

在选择节点的过程中,在每跳h,模型会计算E中每个句子编码ei和当前网络记忆状态m的双线性相似度,并获得节点选择分布Psent,然后,选择句子si∈S作为当前跳的起始节点,其中i满足:

Psent(i)=max(Psent)

在建立跳边的过程中,选择了h跳的起始节点后,模型会计算mh和si中每个单词sik的双线性相似度并将其归一化以获得权重μ,使用μ来计算si中所有单词的加权平均值然后将其输入到一个GRU单元中以更新mh,之后,将这两个阶段合并为一个循环单元U,U通过更新m来连续选择节点,循环UH次,获得一条有H个节点的推理链Schain={s1,s2,...,sH},其中每个句子sh都由U从S中迭代选择,为了减少推理链生成的偶然性,重复句子选择器M次以生成的M条可能的推理链。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010775911.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top