[发明专利]问答处理方法、装置、计算机设备和可读存储介质在审
申请号: | 202010879758.2 | 申请日: | 2020-08-27 |
公开(公告)号: | CN114116990A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 汤良;吕考考;商清华;付子曦;张卓;黄传明 | 申请(专利权)人: | 奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/151;G06F40/216;G06F40/284;G06F40/289;G06N20/00 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 程超 |
地址: | 100088 北京市西城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 问答 处理 方法 装置 计算机 设备 可读 存储 介质 | ||
本发明提供了一种问答处理方法、装置、计算机设备和可读存储介质。该问答处理方法包括:获取目标文档的问题部分和内容部分,其中,内容部分包括至少两个文本块;根据问题部分和内容部分构建初始输入向量;将初始输入向量输入至预设的问答机器模型,其中,问答机器模型包括预训练模型层、注意力模型层和最终输出层;以及根据问答结果信息确定内容部分是否包括问题部分对应的答案和答案在内容部分中的位置。通过本发明,能够提升问答处理的准确性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种问答处理方法、装置、计算机设备和可读存储介质。
背景技术
基于文档的问答(Machine Reading Comprehension Question Answering,MRCQA)是指给定文档库,通过理解用户的问题,从文档中找到能够回答用户问题的答案的过程。这里进行MRCQA处理的前提是答案在文档中可以明确找到,且最好是一个连续的片段,基于文档的问答处理方法通常用来解决能从大量无结构化文本中寻找到问题的答案。
目前,针对问答处理方法,通常采用机器学习模型进行处理,其中,机器学习模型是一个由简单函数组成的复杂的函数,建立在问答处理方法中使用的机器学习模型时,通常先设计一个机器学习模型的架构,然后用计算机从给定的问答训练数据中训练得到架构的参数,这些参数保证训练得到的机器学习模型能够在实际问答处理过程中达到设计预期的效果,并且具有泛化能力。发明人对此研究发现,由于问答处理方法中使用的机器学习模型的参数数量非常庞大,在训练过程中容易出现过拟合的现象,进而使得得到的机器学习模型并不能准确的进行问答处理,从而造成问答处理方法准确率低的技术问题。
因此,如何提升问答处理方法准确率,成为本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种问答处理方法、装置、计算机设备和可读存储介质,用于解决现有技术中的上述技术问题。
一方面,为实现上述目的,本发明提供了一种问答处理方法。
该问答处理方法包括:获取目标文档的问题部分和内容部分,其中,所述内容部分包括至少两个文本块;根据所述问题部分和所述内容部分构建初始输入向量;将所述初始输入向量输入至预设的问答机器模型,其中,所述问答机器模型包括预训练模型层、注意力模型层和最终输出层,所述预训练模型层用于对输入的所述初始输入向量处理后得到第一词向量,并输出至所述注意力模型层和所述最终输出层,所述注意力模型层用于对输入的所述第一词向量处理后得到第二词向量,并输出至所述最终输出层,所述第二词向量用于表征第一词语对所述第一词语所在文本块中其他词语的注意力大小,所述第一词语为所述内容部分的一个词语,所述最终输出层用于根据所述第一词向量和所述第二词向量输出问答结果信息;以及根据所述问答结果信息确定所述内容部分是否包括所述问题部分对应的答案和所述答案在所述内容部分中的位置。
进一步地,所述文本块为一个段落或一个句子。
进一步地,所述第二词向量还用于表征所述第一词语对所述问题部分中词语的注意力大小。
进一步地,所述注意力模型层采用以下步骤根据所述第一词向量计算所述第二词向量:将所述第一词向量输入第一全连接函数得到第一向量;将所述第一词向量输入第二全连接函数得到第二向量;将所述第一词向量输入第三全连接函数得到第三向量,其中,所述第一全连接函数、所述第二全连接函数和所述第三全连接函数分别为所述注意力模型层中不同的全连接函数;根据所述问题部分和所述文本块构建注意力矩阵;根据所述第一向量、所述第二向量、所述第三向量和所述注意力矩阵计算所述第二词向量。
进一步地,采用以下公式计算所述第二词向量:
H′=[h′1,h′2,...,h′A]=L(C(W1,W2,...,Wn))
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司,未经奇安信科技集团股份有限公司;网神信息技术(北京)股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010879758.2/2.html,转载请声明来源钻瓜专利网。