[发明专利]图像处理装置、图像处理方法和图像处理程序在审
申请号: | 201980053836.9 | 申请日: | 2019-08-16 |
公开(公告)号: | CN112639870A | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 增田彻 | 申请(专利权)人: | 索尼公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈炜;王伟楠 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 装置 方法 程序 | ||
根据本公开的图像处理装置(100)包括:学习数据准备单元(132),其对以目标作为被摄体的图像数据执行投影变换,并且准备以目标作为正确应答数据的学习数据;以及模型生成单元(133),其基于由学习数据准备单元(132)准备的学习数据,生成学习模型,所述学习模型用于在宽视角图像作为输入数据被输入时检测所述输入数据中所包含的目标,所述宽视角图像是使用与学习数据相同的投影变换方法创建的。
技术领域
本公开涉及图像处理装置、图像处理方法和图像处理程序。具体地,本公开涉及检测视频数据中的被摄体的处理。
背景技术
随着图像捕获设备的广泛使用,图像已被广泛使用,例如,许多用户捕获静止图像和运动图像并且将捕获的图像上传到网络上。这些图像的使用可能需要删除图像中捕获的未指定数目的人或者不适合作为被摄体的预定目标。
作为与这种图像有关的技术,已经提出了以下技术:从其中捕获了对于图像捕获人而言非意图的目标的图像中检测该目标,并且删除该目标或者用另一对象替换该目标(例如,非专利文献1)。注意,存在的图像不限于由普通摄像装置等拍摄的图像,并且因此包括各自具有比显示器上显示的视角宽的视角的图像(在下文中统称为“宽视角图像”),诸如要在例如虚拟现实(VR)技术(例如,非专利文献2)中使用的球形内容(球形图像或球形运动图像)和全景图像。
引用列表
非专利文献
非专利文献1:Guilin Liu,Fitsum A.Reda,Kevin J.Shih,Ting-Chun Wang,Andrew Tao,Bryan Catanzaro的“Image Inpainting for Irregular Holes UsingPartial Convolutions”(“使用部分卷积进行的不规则孔的图像修复”)。
非专利文献2:“Information technology-Coded representation of immersivemedia-Part 2:Omnidirectional media format”(“信息技术-沉浸媒体的编码表示-第2部分:全向媒体格式”),ISO/IEC FDIS 23090-2。
发明内容
技术问题
然而,使用上述传统技术,在某些情况下无法准确地检测目标。通常,要执行的目标检测处理包括:生成通过学习要检测的目标(正确数据)的特征量而获得的学习模型,将图像的数据等输入到所生成的学习模型中,以及确定目标是否被包括在图像中。
然而,诸如球形内容的宽视角图像以等距柱状投影方案等投影变换的格式来记录,因此目标被拉伸或者目标与图像的每个边缘部分接触。在这种情况下,要检测的对象的特征量(例如形状)与正确数据明显不同,因此可能无法使用与通过通常的透视投影获得的二维图像对应的学习模型来检测目标。
因此,本公开提出了使得能够准确地检测目标的图像处理装置、图像处理方法和图像处理程序。
问题的解决方案
为了解决上述问题,图像处理装置包括:学习数据创建单元,其被配置成对包括作为被摄体的目标的图像数据执行投影变换,创建包括作为正确数据的目标的学习数据;以及模型生成单元,其被配置成基于由学习数据创建单元创建的学习数据,生成学习模型,该学习模型用于检测包括宽视角图像的、被输入到学习模型的输入数据中所包括的目标,该宽视角图像是通过与用于创建学习数据的投影变换的方案相同的投影变换创建的。
附图说明
图1示出了根据本公开的第一实施例的图像处理的概况。
图2是示出根据本公开的第一实施例的图像处理系统的示例的图。
图3示出了根据本公开的第一实施例的图像数据存储单元的示例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980053836.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序