[发明专利]一种光学神经网络训练方法、装置、设备及介质有效
申请号: | 202210292442.2 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114399038B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 陈静静;吴睿振;王凛;黄萍 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/067 | 分类号: | G06N3/067;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 柳虹 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 光学 神经网络 训练 方法 装置 设备 介质 | ||
本申请公开了一种光学神经网络训练方法、装置、设备及介质,涉及人工智能领域,该方法包括:获取包含图像样本和相应标签的训练集,并确定初始光学神经网络;从初始光学神经网络中筛选出包含目标分光器的目标光学运算模块;目标分光器为由于自身制造误差而引起分光比偏差的分光器;分别为初始光学神经网络中的每个目标光学运算模块均配置能够进行移相操作的误差补偿器得到优化后光学神经网络;利用训练集对优化后光学神经网络进行训练,并在训练过程中利用误差补偿器对目标光学运算模块中的目标分光器进行误差补偿。通过上述方案,能够降低光学神经网络中由于分光器制造误差所引起的不良影响,有利于提升光学神经网络的训练准确率和推断准确率。
技术领域
本发明涉及人工智能技术领域,特别涉及一种光学神经网络训练方法、装置、设备及介质。
背景技术
目前,人工神经网络(ANN,即Artificial Neural Network)是人工智能领域十分热门的研究方向,并得到了非常广泛的应用。
然而,人工神经网络在使用过程中由于存在矩阵乘法运算、卷积运算等许多复杂的运算,导致需要消耗大量的时间和能耗。为此,人们将光计算技术与神经网络进行了结合形成了光学神经网络(即ONN,Optical Neural Network),以利用光学神经网络中的光学运算模块的快速计算特性,极大地提升了运算速度并降低了功耗。不过由于光学神经网络的光学运算模块中所使用到的分光器在制造过程中容易出现误差,致使实际制造出来的分光器的分光比与理论上所需的50:50之间可能会出现偏差。这种由于分光器制造误差所引入的分光器噪声会严重影响光学神经网络的整体性能,降低了光学神经网络的训练准确率和推断准确率。
发明内容
有鉴于此,本发明的目的在于提供一种光学神经网络训练方法、装置、设备及介质,能够降低光学神经网络中由于分光器制造误差所引起的不良影响,有利于提升光学神经网络的训练准确率和推断准确率,从而提高了光学神经网络在分光器噪声下的鲁棒性和可用性。其具体方案如下:
第一方面,本申请公开了一种光学神经网络训练方法,包括:
获取包含图像样本和相应标签的训练集,并确定初始光学神经网络;
从所述初始光学神经网络中筛选出包含目标分光器的目标光学运算模块;所述目标分光器为由于自身制造误差而引起分光比偏差的分光器;
分别为所述初始光学神经网络中的每个所述目标光学运算模块均配置相应的能够进行移相操作的误差补偿器,以得到优化后光学神经网络;
利用所述训练集对所述优化后光学神经网络进行训练,并在训练过程中利用所述误差补偿器对相应的所述目标光学运算模块中的所述目标分光器进行误差补偿,以得到训练后光学神经网络模型。
可选的,所述确定初始光学神经网络,包括:
选取基于GridNet拓扑结构或FFTNet拓扑结构的并采用两层全连接层的光学神经网络,以得到初始光学神经网络。
可选的,所述从所述初始光学神经网络中筛选出包含目标分光器的目标光学运算模块,分别为所述初始光学神经网络中的每个所述目标光学运算模块均配置相应的能够进行移相操作的误差补偿器,以得到优化后光学神经网络,包括:
从所述初始光学神经网络中筛选出包含目标分光器的所有的马赫曾德尔干涉仪,以得到各目标光学运算模块,并分别为所述初始光学神经网络中的每个所述马赫曾德尔干涉仪均配置相应的能够进行移相操作的误差补偿器,得到优化后光学神经网络。
可选的,所述分别为所述初始光学神经网络中的每个所述目标光学运算模块均配置相应的能够进行移相操作的误差补偿器之前,还包括:
将马赫曾德尔干涉仪作为用于对所述目标光学运算模块中的所述目标分光器进行误差补偿的器件,以得到所述误差补偿器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210292442.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于超算的多源异构图数据融合方法及系统
- 下一篇:一种弹簧回火炉用输送装置