[发明专利]识别图像的方法和设备在审
申请号: | 202010534666.0 | 申请日: | 2020-06-12 |
公开(公告)号: | CN112396085A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 孙辰雨;孙昌用;柳在炯;李曙炯;郑相一;崔彰仁;韩在浚 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 黄晓燕;张川绪 |
地址: | 韩国京畿*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 图像 方法 设备 | ||
提供一种识别图像的方法和设备。所述方法包括:获得输入图像;基于输入图像计算神经网络的输入特征图;针对神经网络内的至少一个层的每个层,获得所述层的输入特征图的多个输入平面之中的与第一输入通道对应的第一输入平面;接收所述层的权重核的多个权重平面之中的与第一输入通道对应的第一权重平面;通过累积第一输入平面中的第一输入元素的至少一部分与第一权重平面中的第一权重元素的至少一部分之间的乘法运算的乘法结果来生成第一累积数据;以及基于第一累积数据生成所述层的输出特征图的多个输出平面之中的与第一输出通道对应的第一输出平面;以及基于输出特征图,输出图像识别结果。
本申请要求于2019年8月13日在韩国知识产权局提交的第10-2019-0098810号韩国专利申请和于2019年10月14日在韩国知识产权局提交的第10-2019-0127258号韩国专利申请的权益,所述韩国专利申请的全部公开出于所有目的通过引用包含于此。
技术领域
以下描述涉及识别图像的方法和设备。
背景技术
图像识别可通过神经网络来实现。诸如识别(例如,语音识别和话音识别)的处理的技术自动化已经通过作为专用计算架构的处理器实现的神经网络模型实现,该神经网络模型在大量训练之后可在输入模式与输出模式之间提供计算上直观的映射。产生这样的映射的训练能力可称为神经网络的学习能力。此外,由于专门的训练,这样的专门训练的神经网络因此可具有针对例如可能尚未针对其训练神经网络的输入模式生成相对准确的输出的泛化能力。
发明内容
提供本发明内容,以便以简化的形式介绍在下面的具体实施方式中进一步描述的构思的选择。本发明内容不意图确定要求权利的主题的关键特征或必要特征,也不意图用于帮助确定要求权利的主题的范围。
在一个总体方面,一种识别图像的方法包括:获得输入图像;基于输入图像计算神经网络的输入特征图,其中,输入特征图包括多个输入平面;针对神经网络内的至少一个层的每个层,获得所述层的输入特征图的多个输入平面之中的与多个输入通道中的第一输入通道对应的第一输入平面;接收所述层的权重核的多个权重平面之中的与第一输入通道对应的第一权重平面;通过累积第一输入平面中的第一输入元素的至少一部分与第一权重平面中的第一权重元素的至少一部分之间的乘法运算的乘法结果来生成第一累积数据;以及基于第一累积数据生成所述层的输出特征图的多个输出平面之中的与多个输出通道中的第一输出通道对应的第一输出平面;以及基于输出特征图,输出图像识别结果,其中,所述多个输入平面与所述多个输入通道一一对应,所述多个权重平面与所述多个输入通道一一对应,其中,所述多个输出平面与所述多个输出通道一一对应。
基于输入图像计算神经网络的输入特征图的步骤包括:神经网络的第i层基于作为第i层的输入特征图的第i-1层的输出特征图,输出第i层的输出特征图,i为大于1的整数,其中,神经网络的第一层接收输入图像,并基于输入图像输出第一层的输出特征图作为第二层的输入特征图,其中,神经网络的最后层基于前一层的输出特征图生成并输出图像识别结果。
在一个总体方面中,一种用于识别图像的设备包括:一个或多个处理器,被配置为:获得输入图像;基于输入图像计算神经网络的输入特征图,其中,输入特征图包括多个输入平面;针对神经网络内的至少一个层的每个层,获得所述层的输入特征图的多个输入平面之中的与多个输出通道中的第一输入通道对应的第一输入平面;接收所述层的权重核的多个权重平面之中的与第一输入通道对应的第一权重平面;通过累积第一输入平面中的第一输入元素的至少一部分与第一权重平面中的第一权重元素的至少一部分之间的乘法运算的乘法结果来生成第一累积数据;以及基于第一累积数据生成所述层的输出特征图的多个输出平面之中的与多个输出通道中的第一输出通道对应的第一输出平面;基于输出特征图,输出图像识别结果,其中,所述多个输入平面与所述多个输入通道一一对应,所述多个权重平面与所述多个输入通道一一对应,其中,所述多个输出平面与所述多个输出通道一一对应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534666.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序