[发明专利]产生输入图像的分类的卷积神经网络及计算机实现方法在审
| 申请号: | 201711090079.1 | 申请日: | 2017-11-08 |
| 公开(公告)号: | CN108734269A | 公开(公告)日: | 2018-11-02 |
| 发明(设计)人: | 穆斯塔法·艾尔可哈米;李正元;崔柳真 | 申请(专利权)人: | 三星电子株式会社 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/06;G06N3/08 |
| 代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 姜长星;胡江海 |
| 地址: | 韩国京畿*** | 国省代码: | 韩国;KR |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 输入图像 卷积神经网络 特征图 卷积 分类 计算机实现 循环移位 内核 输出 神经网络 预定间隔 穿孔 配置 | ||
1.一种卷积神经网络系统,所述卷积神经网络系统包括:
一系列的神经网络层,被配置为:
至少基于输入图像获得特征图;
通过根据模式将特征图和内核中的至少一个选择的多个行中的一行的一个或多个元素的值设置为零,并且将所述模式每行循环移位预定间隔以根据循环移位的模式将所述至少一个选择的所述多个行中的剩余的行的一个或多个元素的值设置为零,来对所述至少一个选择进行穿孔;
对特征图与内核进行卷积,以产生第一卷积输出;
至少基于第一卷积输出,产生输入图像的分类。
2.根据权利要求1所述的卷积神经网络系统,其中,对特征图和内核中的所述至少一个选择进行穿孔的步骤包括:当((w+h)modulo d)-s=0时,将在所述至少一个选择的在索引(w,h)的元素的值设置为零,其中,s为整数的移位值,d为整数的大于1的穿孔间隔值,w和h为元素的索引值,modulo表示取模运算。
3.根据权利要求1所述的卷积神经网络系统,其中,对特征图和内核中的所述至少一个选择进行穿孔的步骤包括:执行所述至少一个选择与遮蔽矩阵的点积,
其中,当((w+h)modulo d)-s=0时,在遮蔽矩阵的索引(w,h)的元素的值为零,
其中,当((w+h)modulo d)-s≠0时,在遮蔽矩阵的索引(w,h)的元素的值为一,
其中,s为整数的移位值,d为整数的大于1的穿孔间隔值,w和h为元素的索引值,modulo表示取模运算。
4.根据权利要求2所述的卷积神经网络系统,其中,所述卷积神经网络系统还被配置为通过以下步骤微调所述一系列的神经网络层:
对未穿孔的特征图与未穿孔的内核进行卷积,以产生第二卷积输出,
根据将第一卷积输出与第二卷积输出进行比较的误差成本函数来评价第一卷积输出的准确性。
5.根据权利要求4所述的卷积神经网络系统,其中,所述卷积神经网络系统还被配置为:通过根据移位值s的变化对所述至少一个选择进行穿孔来微调所述一系列的神经网络层,以确定最小化误差成本函数的最优移位值。
6.根据权利要求4所述的卷积神经网络系统,其中,所述卷积神经网络系统还被配置为:通过根据穿孔间隔值d的变化对所述至少一个选择进行穿孔来微调所述一系列的神经网络层,以确定最小化误差成本函数的最优穿孔间隔值。
7.根据权利要求4所述的卷积神经网络系统,其中,所述卷积神经网络系统还被配置为:通过经由针对内核的元素计算误差成本函数的梯度并最小化误差成本函数来执行反向传播以调节内核的元素的值,来微调所述一系列的神经网络层。
8.根据权利要求7所述的卷积神经网络系统,其中,所述至少一个选择包括内核,并且执行反向传播的步骤仅调节通过穿孔而未被设置为零的内核的元素的值。
9.根据权利要求1所述的卷积神经网络系统,其中,所述一系列的神经网络层还被配置为:
使用所述至少一个选择计算最大值以及与最大值对应的最大位置,
使用所述至少一个选择的未穿孔的形式计算在最大位置的值。
10.根据权利要求1所述的卷积神经网络系统,其中,循环移位的模式在第三维度中进行移位,使得对特征图和内核中的所述至少一个选择进行穿孔的步骤包括:当((w+h+c)modulo d)-s=0时,将在所述至少一个选择的索引(w,h,c)的元素的值设置为零,
其中,s为整数的移位值,d为整数的大于1的穿孔间隔值,w、h和c为元素的索引值,modulo表示取模运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711090079.1/1.html,转载请声明来源钻瓜专利网。





