[发明专利]机器学习任务的隐式桥接在审

专利信息
申请号: 201780068195.5 申请日: 2017-11-02
公开(公告)号: CN110140133A 公开(公告)日: 2019-08-16
发明(设计)人: 陈智峰;迈克尔·舒斯特;梅尔文·乔斯·约翰逊普雷姆库马尔;吴永辉;国·V·勒;马克西姆·克里昆;托尔斯滕·布兰奇 申请(专利权)人: 谷歌有限责任公司
主分类号: G06N3/04 分类号: G06N3/04;G06F17/28;G06N3/063
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 李宝泉;周亚荣
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 机器学习 模型输入 扩增 桥接 隐式 计算机存储介质 机器学习模型 标识符 计算机程序 任务应用 使用机器 系统训练 训练数据 显式 输出 学习
【说明书】:

用于执行机器学习任务的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。一种方法包括:接收(i)模型输入以及(ii)识别要对所述模型输入执行以针对所述模型输入生成第一类型的模型输出的第一机器学习任务的数据;用所述第一机器学习任务的标识符扩增所述模型输入以生成扩增模型输入;以及使用机器学习模型来处理所述扩增模型输入。如本说明书中所描述的对于机器学习任务应用隐式桥接的示例性系统训练机器学习模型以执行某些类型的机器学习任务,而不要求在训练期间使用针对所述某些类型的机器学习任务的显式训练数据。

背景技术

机器翻译系统要求大量并行训练数据来实现高水平的准确性。一般地,与许多人所说的语言相比,难以针对少数人所说的语言获得大量并行数据。例如,在互联网上找到的大多数文本是英语,然而在诸如日语或韩语的语言中找到的文本量较少。这使对于较小语言获得并行数据变得有挑战性。

传统的机器翻译系统通过经由第三语言桥接较小语言之间的翻译即将第一语言的文本的一部分翻译成第三语言然后从第三语言翻译成第二语言来克服此问题。这种桥接过程遭受许多问题,包括误差的传播、增加的等待时间和增加的系统复杂性。

发明内容

可在特定实施例中实现本说明书中描述的主题以便实现以下优点中的一个或多个:

如本说明书中所描述的对于机器学习任务应用隐式桥接的系统训练机器学习模型以执行某些类型的机器学习任务,而不要求在训练期间使用针对某些类型的机器学习任务的显式训练数据。例如,即使在训练期间未使用针对这种类型的任务的训练数据,系统也可以执行零样本(zero-shot)翻译以训练机器学习模型来将日语文本分段翻译成对应的韩语文本分段。因此,避免了针对翻译的显式桥接,从而避免误差的传播,减小机器学习任务的等待时间并且降低系统复杂性。例如,解码速度可以快两倍,因为当从日语翻译为韩语时通过第三语言的显式桥接是不必要的。

此外,一旦机器学习模型已被训练,如本说明书中所描述的执行零样本翻译的系统就可以实现高水平的准确性,其可比得上(若不好于)对于翻译应用显式桥接的系统。

如本说明书中所描述的执行零样本翻译的系统可以使用单个机器学习模型来执行N种语言之间的机器翻译,而不是具有N^2个单独的模型,从而减少模型参数调谐的所需时间和复杂性,以及减少由机器学习模型所消耗的计算资源。此外,模型的数量的减少可以使得能够在单个设备内使用更多的语言对,因为服务机器通常具有有限的存储器。此外,模型的数量的减少可以极大地简化系统架构,从而改进与系统相关联的生产/设置时间。

如本说明书中所描述的执行零样本翻译的系统可以允许缩放到附加语言。例如,可以将新的数据添加到现有模型,可能具有过采样或欠采样,使得所有语言都被适当地表示,并且在目标语言改变的情况下与新的前置令牌一起使用。不需要改变现有模型的架构。

如本说明书中所描述的执行零样本翻译的系统可以允许低资源语言改进。系统的所有参数都被建模的所有语言对隐式地共享。这迫使系统在训练期间跨越语言边界推广。当具有很少的可用数据的语言对和具有丰富的数据的语言对被混合到单个系统中时,可以改进低资源语言对上的翻译准确性。

本文中描述的各种示例实施方式涉及神经网络。神经网络是采用非线性单元的一个或多个层来针对接收到的输入预测输出的机器学习模型。一些神经网络除了包括输出层之外还包括一个或多个隐藏层。每个隐藏层的输出被用作网络中的下一个层即下一个隐藏层或输出层的输入。网络的每个层依照一组相应的参数的当前值来从接收到的输入生成输出。可以使用训练数据来在机器学习任务上训练神经网络以确定层参数的训练值,并且可以使用神经网络来对神经网络输入执行机器学习任务。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201780068195.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top