[发明专利]图像处理方法和装置有效
| 申请号: | 201811126509.5 | 申请日: | 2018-09-26 |
| 公开(公告)号: | CN109242801B | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 胡耀全 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 处理 方法 装置 | ||
本申请实施例公开了图像处理方法和装置。该方法的一具体实施方式包括:获取包含已标注目标的标注图像;基于已标注的目标所在的标注框的尺寸,从该标注图像中确定出子图像,其中,所确定出的子图像中的至少一个子图像包括该标注框,标注框的尺寸与标注图像尺寸的比例小于预设比例阈值;对子图像进行上采样,得到用于训练卷积神经网络的样本图像。本申请实施例可以将小目标所在的子图像进行上采样,能够放大其中的小目标,让卷积神经网络更准确地获取该小目标的完整的特征,以增强卷积神经网络对小目标的检测能力。
技术领域
本申请实施例涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及图像处理方法和装置。
背景技术
卷积神经网络是多层神经网络,擅长处理图像。而在处理图像的过程中,往往面积较大的目标容易被卷积神经网络检测到。而面积较小的一些目标,则容易被卷积神经网络忽略。
发明内容
本申请实施例提出了图像处理方法和装置。
第一方面,本申请实施例提供了一种图像处理方法,包括:获取包含已标注目标的标注图像;基于已标注的目标所在的标注框的尺寸,从标注图像中确定出子图像,其中,所确定出的子图像中的至少一个子图像包括标注框,标注框的尺寸与标注图像尺寸的比例小于预设比例阈值;对子图像进行上采样,得到用于训练卷积神经网络的样本图像。
在一些实施例中,基于已标注的目标所在的标注框的尺寸,从图像中确定出子图像,包括:获取卷积神经网络的检测精度所指示的框的尺寸;确定检测精度所指示的框和标注框中,尺寸较大的框为目标框;在标注图像中,确定宽高比等于预设宽高比的一个子图像,其中,一个子图像与目标框的宽相等和/或高相等,子图像的宽和高分别与标注图像的宽和高部分重合;按照预设移动方向,对子图像所在的窗口移动预设步长,得到标注图像中的其他子图像,其中,各个子图像所构成的集合覆盖标注图像。
在一些实施例中,检测精度所指示的框的宽和高相等;确定检测精度所指示的框和标注框中,尺寸较大的框为目标框,包括:确定标注框的宽和高是否都大于检测精度所指示的框的边长;响应于确定标注框的宽和高都大于检测精度所指示的框的边长,确定标注框为目标框;响应于确定标注框的宽和高中的至少一个不大于检测精度所指示的框的边长,确定检测精度所指示的框为目标框。
在一些实施例中,样本图像的宽高比与子图像的宽高比相同。
在一些实施例中,相邻的子图像之间有局部重合。
在一些实施例中,在对子图像进行上采样,得到用于训练卷积神经网络的样本图像之后,方法还包括:基于样本图像,训练卷积神经网络,得到训练后的卷积神经网络;获取待检测图像,从待检测图像中确定出多个待检测子图像,其中,各个待检测子图像所构成的集合覆盖待检测图像;对各个待检测子图像进行上采样,得到待输入的图像,将待输入的图像输入训练后的卷积神经网络进行检测,得到检测结果。
第二方面,本申请实施例提供了一种图像处理装置,包括:获取单元,被配置成获取包含已标注目标的标注图像;确定单元,被配置成基于已标注的目标所在的标注框的尺寸,从标注图像中确定出子图像,其中,所确定出的子图像中的至少一个子图像包括标注框,标注框的尺寸与标注图像尺寸的比例小于预设比例阈值;上采样单元,被配置成对子图像进行上采样,得到用于训练卷积神经网络的样本图像。
在一些实施例中,确定单元,包括:获取模块,被配置成获取卷积神经网络的检测精度所指示的框的尺寸;目标框确定模块,被配置成确定检测精度所指示的框和标注框中,尺寸较大的框为目标框;子图像确定模块,被配置成在标注图像中,确定宽高比等于预设宽高比的一个子图像,其中,一个子图像与目标框的宽相等和/或高相等,子图像的宽和高分别与标注图像的宽和高部分重合;移动模块,被配置成按照预设移动方向,对子图像所在的窗口移动预设步长,得到标注图像中的其他子图像,其中,各个子图像所构成的集合覆盖标注图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811126509.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





