[发明专利]基于生成式对抗网络的自然语言处理文本建模有效

专利信息
申请号: 201910623780.8 申请日: 2019-07-11
公开(公告)号: CN110781666B 公开(公告)日: 2023-09-05
发明(设计)人: D.杜阿;C.N.D.桑托斯;周伯文 申请(专利权)人: 国际商业机器公司
主分类号: G06F40/253 分类号: G06F40/253;G06F40/30;G06N3/0475;G06N3/094
代理公司: 北京市柳沈律师事务所 11105 代理人: 邸万奎
地址: 美国纽*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 生成 对抗 网络 自然语言 处理 文本 建模
【说明书】:

提供了用于实施用于自然语言处理的生成式对抗网络(GAN)的机制。利用这些机制,GAN的生成器神经网络被配置为基于噪声向量输入生成n元语法袋输出,以及GAN的鉴别器神经网络被配置为接收BoN输入,其中BoN输入是来自生成器神经网络的BoN输出,或者是与自然语言文本的实际部分相关联的BoN输入。这些机制进一步配置GAN的鉴别器神经网络,以输出关于输入的BoN是来自自然语言文本的实际部分还是是生成器神经网络的BoN输出的概率的指示。此外,该机制基于反馈机制训练生成器神经网络和鉴别器神经网络,该反馈机制将来自鉴别器神经网络的输出指示与输入的BoN是来自自然语言文本的实际部分还是是生成器神经网络的BoN输出的指示进行比较。

技术领域

本申请总体上涉及一种改进的数据处理装置和方法,并且更具体地涉及提供用于在执行自然语言处理中使用的基于生成式对抗网络的文本模型以及用于使用基于经训练的生成式对抗网络的文本模型来提供问答能力的机制。

背景技术

自然语言处理是计算机科学、人工智能、以及计算语言学的领域,其涉及计算机和人类(自然)语言之间的交互,并且特别地涉及对计算机进行编程以有效地处理大型自然语言语料库。自然语言处理中的挑战通常涉及自然语言理解、自然语言生成(通常来自形式、机器可读的逻辑形式)、连接语言和机器感知、对话系统、或它们的一些组合。

通常用于自然语言处理的一种模型是词袋(bag-of-words,BOW)模型或连续词袋(continuous bag-of-words,CBOW)模型。词袋模型是用于自然语言处理和信息检索(information retrieval,IR)的简化表示,其中诸如句子或文档的文本被表示为其单词袋(多重集),而忽略语法甚至忽略单词顺序,但保持多样性。词袋模型通常用于文档分类方法,其中每个单词的出现频率被用作用于训练分类器的特征。CBOW模型通过预测在给定上下文的情况下(例如,在上下文可以是单个单词或单词组的情况下)的单词概率来工作,例如,给在定单个上下文单词的情况下,CBOW预测单个目标单词。

生成式模型(generative model)学习输入变量x(所观测的数据值)和输出变量y(所确定的值)的联合概率分布p(x,y)。大多数无监督的生成式模型(诸如玻尔兹曼机(Boltzmann Machine)、深度信任网络(Deep Belief Network)等)需要复杂的采样器来训练生成式模型。然而,最近提出的生成式对抗网络(Generative Adversarial Network,GAN)技术重新利用来自博弈论中的最小/最大范式,以无监督的方式生成图像。GAN框架包括生成器和鉴别器,其中生成器充当对手并试图通过基于噪声输入产生合成图像来欺骗鉴别器,并且鉴别器试图将合成图像与真实图像区分开。

发明内容

提供本发明内容是为了以简化的形式介绍本文中在具体实施方式中进一步描述的构思选择。本发明内容不旨在标识所要求保护的主题的关键因素或基本特征,也不旨在用于限制所要求保护的主题的范围。

在一个说明性实施例中,提供了一种方法,在包括至少一个处理器和至少一个存储器的数据处理系统中,该至少一个存储器包括由至少一个处理器执行以配置处理器来实施用于自然语言处理的生成式对抗网络(GAN)的指令。该方法包括:配置GAN的生成器神经网络,以基于噪声向量输入生成n元语法袋(bag-of-ngrams,BoN)输出,以及配置GAN的鉴别器神经网络以接收BoN输入,其中BoN输入是来自生成器神经网络的BoN输出,或者是与自然语言文本的实际部分相关联的BoN输入。该方法进一步包括配置GAN的鉴别器神经网络,以输出关于输入的BoN是来自自然语言文本的实际部分还是是生成器神经网络的BoN输出的概率的指示。而且,该方法包括基于反馈机制训练生成器神经网络和鉴别器神经网络,该反馈机制将来自鉴别器神经网络的输出指示与输入的BoN是来自自然语言文本的实际部分还是是生成器神经网络的BoN输出的指示进行比较。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910623780.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top