[发明专利]一种神经网络结构确定方法及其装置在审
| 申请号: | 202011268949.1 | 申请日: | 2020-11-13 |
| 公开(公告)号: | CN114565092A | 公开(公告)日: | 2022-05-31 |
| 发明(设计)人: | 肖一凡;张健;钟钊 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06N3/063;G06K9/62 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 陈松浩 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 神经网络 结构 确定 方法 及其 装置 | ||
1.一种神经网络结构确定方法,其特征在于,所述方法包括:
获取待训练的初始神经网络,所述初始神经网络包括M个第一结构块block和第二block,所述第二block与每个第一block连接,且所述每个第一block对应一个目标权重,所述第二block用于根据M个第一输出,进行所述第二block对应的运算;其中,所述M个第一输出由所述每个第一block的输出分别与对应的目标权重进行乘积运算得到,所述目标权重为可训练的权重,所述M为大于1的整数;
对所述初始神经网络进行模型训练,以获取更新后的M个目标权重;
根据所述更新后的M个目标权重,更新所述初始神经网络中所述第二block与所述M个第一block的连接关系,以获取第一神经网络;其中,所述第一神经网络中的第二block用于根据所述更新后的M个目标权重中最大的N个目标权重对应的N个第一block的输出,进行所述第二block对应的运算,所述N小于所述M。
2.根据权利要求1所述的方法,其特征在于,所述初始神经网络中的所述M个第一block以及第二block依次形成串行连接,且所述第二block为所述串行连接的终点,所述初始神经网络中的所述M个第一block包括目标block,所述目标block在所述串行连接上与所述第二block连接,在所述目标block对应的更新后的目标权重不属于所述更新后的M个目标权重中最大的N个目标权重的情况下,所述第一神经网络中的第二block还用于根据所述目标block的输出,进行所述第二block对应的运算。
3.根据权利要求2所述的方法,其特征在于,所述N为1。
4.根据权利要求1至3任一所述的方法,其特征在于,所述对所述初始神经网络进行模型训练,以获取更新后的M个目标权重,包括:
对所述初始神经网络进行第一预设迭代次数的模型训练,以获取更新后的M个目标权重。
5.根据权利要求1至4任一所述的方法,其特征在于,所述方法还包括:
对所述第一神经网络进行模型训练,直至所述第一神经网络的数据处理精度满足预设条件或模型训练的迭代次数达到第二预设迭代次数,以得到第二神经网络。
6.根据权利要求1至5任一所述的方法,其特征在于,所述M个第一block的每个第一block的输入和输出的通道数与所述第二block的输入和输出的通道数相同。
7.根据权利要求1至6任一所述的方法,其特征在于,所述初始神经网络中的所述第二block用于根据所述M个第一输出的加和结果,进行所述第二block对应的运算;
所述第一神经网络中的第二block用于根据所述更新后的M个目标权重中最大的N个目标权重对应的第一block的输出的加和结果,进行所述第二block对应的运算。
8.根据权利要求1至7任一所述的方法,其特征在于,所述方法还包括:
获取待训练的数据,所述待训练的数据包括如下的至少一种:图像数据、文字数据以及语音数据;相应的,所述对所述初始神经网络进行模型训练,包括:
根据所述待训练的数据,对所述初始神经网络进行模型训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011268949.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:显示驱动方法及装置和LED显示系统
- 下一篇:四目车下全景图像采集装置





