[发明专利]一种面向机器阅读理解的答案推荐方法有效
| 申请号: | 202010775911.7 | 申请日: | 2020-08-05 |
| 公开(公告)号: | CN111782961B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 赵翔;霍立军;徐浩;谭真;葛斌;肖卫东;黄魁华;李硕豪 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/33;G06F40/126;G06F40/289;G06F40/30;G06N3/04;G06N5/04 |
| 代理公司: | 长沙大珂知识产权代理事务所(普通合伙) 43236 | 代理人: | 伍志祥 |
| 地址: | 410003 湖*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 机器 阅读 理解 答案 推荐 方法 | ||
1.一种面向机器阅读理解的答案推荐方法,其特征在于,包括以下步骤:
步骤1,接受问题q和支持文档集T',问题q以元组(le,r,?)的形式提供,其中le是左实体,?表示未知右实体,r表示le与未知右实体也就是答案之间的关系;
步骤2,进行句子分割和语义编码,包括文本预处理、词编码和句子编码;
步骤3,根据编码的语义进行推断以构建多跳推理链,包括选择节点和建立跳边;
步骤4,通过挖掘多跳推理链的信息以对候选集进行排序,包括推理链信息的集成和答案概率分布的计算;
步骤5,根据答案概率分布结果,从候选集中预测未知右实体即答案;
步骤2中所述的预处理包括:使用TF-IDF算法来计算问题和每个支持文档之间的余弦相似度并对其进行排名,截取前N个支持文档以获得新的支持文档集
所述的词编码,将字符嵌入和预训练的Glove词嵌入结合起来作为初始词嵌入,并将它们输入到一层高速路神经网络中以获得最终的词表示,使用L',R'和X'分别表示le,r和T的词嵌入,对于语义编码,把L',R'和X'经过一层带有v个隐藏单元的双向LSTM网络并连接其双向输出,使用分别作为le,r和T的语义编码,其中Ql,Qr,J分别为le,r和T的词级长度;每个候选都在支持文档集T中找到,在X中取出与c'η相对应的词编码,并在词级别对其求平均,然后获得cη∈Rv作为c'η的语义编码;
所述的句子编码,包括:首先将文档t切成多个句子,以获得单个句子集其中,I是包含在t中的单个句子的数量,K是构成一个句子的单词数量,是在X中相应单词的编码;然后,将文档中所有两个相邻的单个句子级联起来,以获得级联句子集定义为:
其中||用于表示级联;接下来,联合Do和Db以完成t的句子划分并获得句子集D,也就是:
D=Do∪Db,
其中∪指取并集;对所有支持文档采用相同的操作,并获得T的词级句子编码S,即:
S=D1∪D2∪…∪DN={s1,…,sI'},
其中I'是T的单个句子和级联句子的总数,然后应用自我注意机制来实现句子的向量表示,并获得T的句子级编码E,用来将句子si转换成向量的公式如下,K为句子的长度:
aik=tanh(W2 tanh(W1sik+b1)+b2)
其中W1和W2为权重参数,b1和b2为偏移参数;
在步骤3中,使用分层记忆网络模型来构建句子的推理链,在选择节点阶段,模型抽取一个与网络记忆状态m最相关的句子作为当前跳的起始节点,在建立跳边阶段,模型更新m以准备跳到下一个节点,将这一阶段看做生成一个连接相邻节点的边;
在选择节点的过程中,在每跳h,模型会计算E中每个句子编码ei和当前网络记忆状态m的双线性相似度,并获得节点选择分布Psent,然后,选择句子si∈S作为当前跳的起始节点,其中i满足:
Psent(i)=max(Psent)
在建立跳边的过程中,选择了h跳的起始节点后,模型会计算mh和si中每个单词sik的双线性相似度并将其归一化以获得权重μ,使用μ来计算si中所有单词的加权平均值然后将其输入到一个GRU单元中以更新mh,之后,将这两个阶段合并为一个循环单元U,U通过更新m来连续选择节点,循环UH次,获得一条有H个节点的推理链Schain={s1,s2,...,sH},其中每个句子sh都由U从S中迭代选择,为了减少推理链生成的偶然性,重复句子选择器M次以生成的M条可能的推理链。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010775911.7/1.html,转载请声明来源钻瓜专利网。





