[发明专利]具有任务特定路径的多任务神经网络在审
申请号: | 201880005904.X | 申请日: | 2018-01-30 |
公开(公告)号: | CN110168578A | 公开(公告)日: | 2019-08-23 |
发明(设计)人: | 丹尼尔·彼得·维尔斯特拉;克里桑塔·托马斯·费尔南多;亚历山大·普里策尔;迪伦·苏尼尔·巴纳尔斯;查尔斯·布伦代尔;安德烈-亚历山德鲁·鲁苏;约里·茨沃尔斯;戴维·哈 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李宝泉;任庆威 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 机器学习 模块化 指派 计算机存储介质 计算机程序 网络 输出层 真子集 集合 | ||
1.一种系统,包括一个或多个计算机以及存储指令的一个或多个存储设备,所述指令在由所述一个或多个计算机执行时使得所述一个或多个计算机实现:
超神经网络,包括:
一个接一个地布置在堆栈中的多个层,其中,每一层包括相应的多个模块化神经网络,并且其中,每一层中的所述模块化神经网络均被配置为接收用于该层的层输入并且生成相应的模块化输出;以及
一个或多个输出层的多个集合,其中,输出层的每个集合对应于来自多个机器学习任务的不同机器学习任务,并且其中,一个或多个输出层的每个集合被配置为接收堆栈输出并且生成特定于对应的机器学习任务的神经网络输出;以及
子系统,所述子系统被配置为执行操作,所述操作包括:
接收第一网络输入以及从所述多个机器学习任务识别要在所述第一网络输入上执行的第一机器学习任务的数据;
选择特定于所述第一机器学习任务的通过所述多个层的路径,所述路径针对所述层中的每一个指定该层中的在执行所述第一机器学习任务时被指派为活动的所述模块化神经网络的真子集;以及
使所述超神经网络使用(i)对每一层,该层中的被所选择的路径指派为活动的所述模块化神经网络,以及(ii)对应于所识别的第一机器学习任务的一个或多个输出层的集合,来处理所述第一网络输入。
2.根据权利要求1所述的系统,
其中,所述超神经网络进一步包括:
在所述堆栈中所述多个层中的每一个之后的相应组合层,其中每一个组合层被配置为:
接收由该组合层之前的层中的当前活动的模块化神经网络生成的所述模块化输出;以及
组合由当前活动的模块化神经网络生成的所述模块化输出以生成组合输出,以及
其中,除了在所述堆栈中的最后一层之后的组合层之外的每一个组合层的组合输出是用于在该组合层之后的层的所述层输入,并且其中,在所述堆栈中的所述最后一层之后的所述组合层的所述组合输出是所述堆栈输出。
3.根据权利要求1或权利要求2中的任一项所述的系统,其中,每一个模块化神经网络包括被传递函数层跟随的一个或多个神经网络层,所述传递函数层将传递函数应用于所述神经网络层的输出。
4.根据权利要求3所述的系统,其中,所述传递函数是逐元素激活函数。
5.根据权利要求4所述的系统,其中,所述传递函数是整流线性单元函数。
6.根据权利要求1-5中的任一项所述的系统,其中,所述模块化神经网络中的至少一个包括一个或多个循环神经网络层。
7.根据权利要求6所述的系统,其中,所述循环神经网络层中的一些或全部是长短期记忆(LSTM)层。
8.根据权利要求1-7中的任一项所述的系统,其中,所述模块化神经网络中的至少一个包括卷积神经网络层。
9.根据权利要求1-8中的任一项所述的系统,其中,所述模块化神经网络中的至少一个包括完全连接的神经网络层。
10.根据权利要求1-9中的任一项所述的系统,其中,至少两个层在所述真子集中具有不同数量的活动的模块化神经网络。
11.根据权利要求1-10中的任一项所述的系统,其中,每一层在所述真子集中具有至少一个并且不超过预定数量的活动的模块化神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880005904.X/1.html,转载请声明来源钻瓜专利网。