[发明专利]训练用于图像识别的神经网络的方法和设备在审
申请号: | 202210061402.7 | 申请日: | 2022-01-19 |
公开(公告)号: | CN114819050A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 崔熙旼;姜晓娥 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62;G06V10/82;G06V10/762 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 黄晓燕;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 用于 图像 识别 神经网络 方法 设备 | ||
公开了训练用于图像识别的神经网络的方法和设备。所述方法包括:通过将作为相同场景的图像的两组或更多组输入数据分别应用于第一神经网络模型,确定与每个输入数据对应的第一主干特征数据;通过将两组或更多组输入数据分别应用于第二神经网络模型,确定与每个输入数据对应的第二主干特征数据;从第一主干特征数据确定基于投影的第一嵌入数据和基于丢弃的第一视图数据;从第二主干特征数据确定基于投影的第二嵌入数据和基于丢弃的第二视图数据;以及基于损失来训练第一神经网络模型和第二神经网络模型中的任一者或两者,所述损失基于第一嵌入数据、第一视图数据、第二嵌入数据、第二视图数据和嵌入数据聚类结果中的任何两个或更多个的组合来确定。
本申请要求于2021年1月22日在韩国知识产权局提交的第10-2021-0009670号韩国专利申请以及于2021年5月13日在韩国知识产权局提交的第10-2021-0061877号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
下面的描述涉及具有神经网络训练的方法和设备。
背景技术
诸如识别(例如,模式识别)的处理的技术自动化可通过处理器实现的神经网络模型来实现,作为专门的计算架构的神经网络模型在大量训练之后可提供输入模式与输出模式之间的计算上直观的映射。生成这样的映射的训练能力可被称为神经网络的学习能力。此外,由于专门训练,因此这样的专门训练的神经网络由此可具有针对例如神经网络尚未被训练的输入模式生成相对准确的输出的泛化能力。
在构思本公开的过程中,发明人已经拥有或获得了上述描述,并且上述描述不一定是在提交本申请之前公知的技术。
发明内容
提供本发明内容以简要的形式介绍在以下具体实施方式中进一步描述的构思的选择。本发明内容不意在确定要求保护的主题的关键特征或必要特征,也不意在用于帮助确定要求保护的主题的范围。
在一个总体方面,一种处理器实现的训练用于图像识别的神经网络的方法包括:通过将两组或更多组输入数据分别应用于第一神经网络模型,确定与每个输入数据对应的第一主干特征数据,其中,所述两组或更多组输入数据是关于相同场景的图像数据;通过将所述两组或更多组输入数据分别应用于第二神经网络模型,确定与每个输入数据对应的第二主干特征数据;从第一主干特征数据确定基于投影的第一嵌入数据和基于丢弃的第一视图数据;从第二主干特征数据确定基于投影的第二嵌入数据和基于丢弃的第二视图数据;以及基于损失来训练第一神经网络模型和第二神经网络模型中的任一者或两者,所述损失基于第一嵌入数据、第一视图数据、第二嵌入数据、第二视图数据和嵌入数据聚类结果中的任何两个或更多个的组合来确定。
在另一总体方面,一种处理器实现的训练用于图像识别的神经网络的方法包括:通过将第一输入数据和第二输入数据应用于第一神经网络和第二神经网络中的每个来分别确定第一主干特征数据和第二主干特征数据,其中,第一输入数据和第二输入数据是关于相同场景的不同视图的图像数据;基于第一主干特征数据来确定基于投影的第一嵌入数据和基于丢弃的第一视图数据,并且基于第二主干特征数据来确定基于投影的第二嵌入数据和基于丢弃的第二视图数据;基于第一嵌入数据和指示第一嵌入数据所属的一个或多个簇的代码值来确定第一部分损失;基于第二嵌入数据和所述代码值来确定第二部分损失;以及基于第一部分损失和第二部分损失来训练第一神经网络和第二神经网络中的任一者或两者。
在另一总体方面,一种处理器实现的具有神经网络训练的方法包括:通过将相同场景的两组或更多组输入数据分别应用于第一神经网络模型,确定与每个输入数据对应的第一主干特征数据;通过将所述两组或更多组输入数据分别应用于第二神经网络模型,确定与每个输入数据对应的第二主干特征数据;从第一主干特征数据确定基于投影的第一嵌入数据和基于丢弃的第一视图数据;从第二主干特征数据确定基于投影的第二嵌入数据和基于丢弃的第二视图数据;以及基于损失来训练第一神经网络模型和第二神经网络模型中的任一者或两者,所述损失基于第一嵌入数据、第一视图数据、第二嵌入数据、第二视图数据和嵌入数据聚类结果中的任何两个或更多个的组合来确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210061402.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:带抖动修正功能的光学单元
- 下一篇:一种铝型材生产用熔铸铝棒熔炼装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序