[发明专利]用于创建深度神经网络的方法、设备和计算机程序在审
| 申请号: | 201880068733.5 | 申请日: | 2018-10-15 |
| 公开(公告)号: | CN111226234A | 公开(公告)日: | 2020-06-02 |
| 发明(设计)人: | J.M.克勒;T.格内魏因;J.阿克特霍尔德 | 申请(专利权)人: | 罗伯特·博世有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 胡莉莉;刘春元 |
| 地址: | 德国斯*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 创建 深度 神经网络 方法 设备 计算机 程序 | ||
1.一种用于创建深度神经网络(10)的方法(30),
其中所述深度神经网络(10)具有多个层(12)和带有权重的连接(13),并且在所创建的深度神经网络中的所述权重能只取来自离散值的可预先给定的列表的可预先给定的离散值,所述方法包括步骤:
- 针对所述深度神经网络(10)提供至少一个训练输入变量;
- 测定表征成本函数的变量,其中所述表征成本函数的变量包括第一变量,所述第一变量表征所述深度神经网络的根据所提供的训练输入变量来测定的输出变量距可预先给定的标称输出变量的偏差,
并且其中所述表征成本函数的变量此外还包括至少一个惩罚变量,所述至少一个惩罚变量表征所述权重之一的值与所述可预先给定的离散值中的至少两个可预先给定的离散值中的至少一个的偏差;
- 训练所述深度神经网络(10),使得所述深度神经网络(10)根据所述深度神经网络(10)的所述训练输入变量来探测对象,
其中在训练所述深度神经网络时,所述权重之一的至少一个值根据所述表征成本函数的变量来适配;以及
- 将所述权重的值分别映射到包含在所述可预先给定的列表中的离散值。
2.根据权利要求1所述的方法,其中,所述惩罚变量表征所述权重之一的后验分布函数(24)与该权重的所述可预先给定的离散值的先验分布函数(20)的偏差。
3.根据权利要求2所述的方法,其中,针对所述神经网络(10)的所述权重的可预先给定的子集,根据所述深度神经网络(10)的部分的拓扑来选择所述先验分布函数(24),所述深度神经网络(10)的部分与所述可预先给定的子集相关联。
4.根据权利要求2或者3所述的方法,其中,所述惩罚函数表征所测定的偏差的经加权的合计,其中分别在分别分配给所述可预先给定的离散值之一的位置处,分别测定所述权重之一的所述后验分布函数(24)距所述先验分布函数(20)的偏差,并且依据加权函数来给所述所测定的偏差加权,所述加权函数分配给相应的可预先给定的离散值。
5.根据权利要求4所述的方法,其中,所述所测定的偏差分别是所述后验分布函数距对数均匀分布函数的所测定的偏差,其中所述所测定的偏差分别向所述至少两个可预先给定的离散值之一的位置中的一个位置移位,并且依据分配给所述相应的可预先给定的离散值的所述加权函数来加权。
6.根据权利要求4或者5所述的方法,其中,所述所测定的偏差之一依据从可预先给定的值中扣除相应的所述加权函数的和来加权。
7.根据权利要求2至6中任一项所述的方法,其中,所述后验分布函数与所述先验分布函数的所述偏差依据在所述后验分布函数与所述先验分布函数之间的库尔贝克-莱布勒散度的近似来测定。
8.根据权利要求2至7中任一项所述的方法,其中,在训练所述深度神经网络时,根据所述成本函数来适配所述后验分布函数之一,其中根据经过适配的后验分布函数来适配通过所述经过适配的后验分布函数表征的所述权重。
9.根据上述权利要求中任一项所述的方法,其中,所述可预先给定的离散值中的所述至少两个可预先给定的离散值之一是值“0”。
10.根据上述权利要求中任一项所述的方法,其中,在训练所述深度神经网络(10)之后,测定所述深度神经网络(10)的输入变量;借助经过训练的深度神经网络(10),根据所测定的输入变量来探测对象。
11.根据权利要求10所述的方法,其中,根据所探测到的对象来操控至少半自主的机器。
12.一种计算机程序,其包括指令,所述指令在计算机上实施时引起,实施根据权利要求1至11中任一项所述的方法的每个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于罗伯特·博世有限公司,未经罗伯特·博世有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880068733.5/1.html,转载请声明来源钻瓜专利网。





