[发明专利]用于二元神经网络的概率性训练在审
申请号: | 201910589028.6 | 申请日: | 2019-07-02 |
公开(公告)号: | CN110674920A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | J.彼得斯;M.韦林;T.格内魏因 | 申请(专利权)人: | 罗伯特·博世有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 72001 中国专利代理(香港)有限公司 | 代理人: | 毕铮;杨美灵 |
地址: | 德国斯*** | 国省代码: | 德国;DE |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工神经网络 神经网络 损失函数 权重 输出 神经元 终止标准 概率性 阈值化 应用 使用权 激活 评定 更新 配置 | ||
1.一种用于训练被至少部分地实现为二元神经网络(2)的人工神经网络(1)的方法(100),其中与至少一层(21-23)相关联的权重和至少一层(21-23)的输出两者只能具有两个可能值中的一个,所述方法(100)包括
● 接收(110)针对人工神经网络(1)或其一部分的输入xi的训练输入值(11),
● 根据由人工神经网络(1)或其一部分定义的处理链来处理(120)训练输入值(11),其中权重由训练权重wlj替代,从而获得输出值(12),
● 将损失函数(13)应用(130)于所获得的输出值(12),所述损失函数(13)被配置成在由训练输入值(11)标示的情形中对输出值(12)在人工神经网络(1)的意图应用的上下文中有多好进行评定;
● 更新(140)训练权重wlj,并且往回分支(150)到处理(120),直到损失函数(13)进行的评定(13a)满足预定的终止标准(160);以及
● 根据最终获得的训练权重wlj来配置(170)实际人工神经网络(1,2),
其中处理(120)包括在处理链的至少一层中:
● 针对层(21-23)中的每个神经元l确定(121)预激活al的分布Al,其中分布A1是对该神经元1的全部输入xj的加权总和,并且其中每个输入xj利用权重wlj的分布Wlj进行加权,使得分布Wlj取代训练权重wlj;以及
● 通过将具有两个可能输出值的预定阈值化函数g应用于分布A1,针对层(21-23)中的每个神经元1确定(122)输出值hl的分布Hl。
2.根据权利要求1所述的方法(100),其中至少一个分布Wlj被挑选成是集合{-1,+1}中的值的伯努利式分布。
3.根据权利要求1所述的方法(100),其中分布A1被建模为泊松二项分布,或者建模为具有均值μl和方差σl²的高斯分布。
4.根据权利要求3所述的方法(100),进一步包括:作为在Al的加权总和计算(121)中求和的分布的均值和方差的总和而获得(121a)均值μl和方差σl²。
5.根据权利要求3至4中任一项所述的方法(100),其中输出值的分布Hl被挑选为是集合{-1,+1}中的值的伯努利式分布,其具有期望ξl,所述期望ξl由高斯分布的累积密度函数在值0处的值给出。
6.根据权利要求1至5中任一项所述的方法(100),进一步包括:针对层(21-23)中的至少一个神经元1从分布Hl对至少一个输出值hl进行采样(123)。
7.根据权利要求1至6中任一项所述的方法(100),其中处理(120)进一步包括:在处理链的下一层(21-23)中的输入xi的位置中使用(124)来自处理链的至少一层的输出hl的至少一个分布Hl。
8.根据权利要求1至8中任一项所述的方法(100),其中配置(170)实际人工神经网络(1,2)包括:对于权重wlj的每个最终获得的分布Wlj,采样(171)至少一个值wlj,并且将其存储(172)在实际人工神经网络(1,2)的非易失性存储器中以用作对应的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910589028.6/1.html,转载请声明来源钻瓜专利网。