[发明专利]问答处理方法、装置、计算机设备和可读存储介质在审
申请号: | 202010879758.2 | 申请日: | 2020-08-27 |
公开(公告)号: | CN114116990A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 汤良;吕考考;商清华;付子曦;张卓;黄传明 | 申请(专利权)人: | 奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/151;G06F40/216;G06F40/284;G06F40/289;G06N20/00 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 处理 方法 装置 计算机 设备 可读 存储 介质 | ||
1.一种问答处理方法,其特征在于,包括:
获取目标文档的问题部分和内容部分,其中,所述内容部分包括至少两个文本块;
根据所述问题部分和所述内容部分构建初始输入向量;
将所述初始输入向量输入至预设的问答机器模型,其中,所述问答机器模型包括预训练模型层、注意力模型层和最终输出层,所述预训练模型层用于对输入的所述初始输入向量处理后得到第一词向量,并输出至所述注意力模型层和所述最终输出层,所述注意力模型层用于对输入的所述第一词向量处理后得到第二词向量,并输出至所述最终输出层,所述第二词向量用于表征第一词语对所述第一词语所在文本块中其他词语的注意力大小,所述第一词语为所述内容部分的一个词语,所述最终输出层用于根据所述第一词向量和所述第二词向量输出问答结果信息;以及
根据所述问答结果信息确定所述内容部分是否包括所述问题部分对应的答案和所述答案在所述内容部分中的位置。
2.根据权利要求1所述的问答处理方法,其特征在于,所述文本块为一个段落或一个句子。
3.根据权利要求1所述的问答处理方法,其特征在于,所述第二词向量还用于表征所述第一词语对所述问题部分中词语的注意力大小。
4.根据权利要求3所述的问答处理方法,其特征在于,所述注意力模型层采用以下步骤根据所述第一词向量计算所述第二词向量:
将所述第一词向量输入第一全连接函数得到第一向量;
将所述第一词向量输入第二全连接函数得到第二向量;
将所述第一词向量输入第三全连接函数得到第三向量,其中,所述第一全连接函数、所述第二全连接函数和所述第三全连接函数分别为所述注意力模型层中不同的全连接函数;
根据所述问题部分和所述文本块构建注意力矩阵;
根据所述第一向量、所述第二向量、所述第三向量和所述注意力矩阵计算所述第二词向量。
5.根据权利要求4所述的问答处理方法,其特征在于,采用以下公式计算所述第二词向量:
H′=[h′1,h′2,...,h′n]=L(C(W1,W2,...,Wn))
Wi=AiVi
V=[V1,V2,...,Vn]=L1(H)
Q=[Q1,Q2,...,Qn]=L2(H)
K=[K1,K2,...,Kn]=L3(H)
H=[h1,h2,...,hn],
采用以下公式计算所述最终输出层的输入:
其中,H′为所述第二词向量,n为所述初始输入向量的处理阈值,C为拼接函数,L为全连接函数,V为所述第一向量,L1为所述第一全连接函数,H为所述第一词向量,S为归一化函数,M为所述注意力矩阵,Q为所述第二向量,L2为所述第二全连接函数,K为所述第三向量,L3为所述第三全连接函数,dk为归一化常量,i=1,2,...n,为所述最终输出层的输入,α为预设权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司,未经奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010879758.2/1.html,转载请声明来源钻瓜专利网。