[发明专利]图像处理方法及装置有效
申请号: | 201711456179.1 | 申请日: | 2017-12-28 |
公开(公告)号: | CN109982088B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 董晓;卢兴敬;刘雷 | 申请(专利权)人: | 华为技术有限公司;中国科学院计算技术研究所 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;G06N3/08;G06K9/46;G06K9/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 处理 方法 装置 | ||
本申请实施例提供一种图像处理方法及其装置,其中方法包括如下步骤:将原始图像对应的前景图像转换为压缩图像;预估采用所述原始图像进行深度特征提取所需的第一提取时间和采用所述压缩图像进行深度特征提取所需的第二提取时间;根据所述第一提取时间和所述第二提取时间确定采用所述原始图像进行深度特征提取或采用所述压缩图像进行深度特征提取。采用本申请实施例,可以有效降低图像深度特征提取过程的计算量,从而改善视频物体检测的执行时间。
技术领域
本申请实施例涉及图像处理技术领域,具体涉及一种图像处理方法及其装置。
背景技术
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。随着以深度学习为代表的人工智能技术的迅速发展,深度学习技术开始在真实环境下的图像分类、物体检测等场景中得以使用。物体检测指确定给定图像包含的所有目标的位置,并提供每个目标的类别。基于视频的物体检测识别技术具有广泛的应用场景,例如交通监控视频中的车辆识别可以用于交通流量的估计与交通事故辨别,道路卡口与交通枢纽监控视频中的行人身份识别对公安安防具有重要意义。
视频物体检测过程可以被分为三个阶段:视频预处理、图像特征提取和确定物体位置与类别。其中,图像预处理阶段完成对视频的解码,将视频逐帧转换为图像。图像特征提取是将图像从像素空间变换到合适的特征空间的处理过程,这一过程需要获得区分能力足够强的特征以用于后续的分类、回归等任务。根据提取图像特征使用方法的不同,可以将图像特征提取分为深度特征提取与传统特征提取两种方式。传统特征提取是指使用各种经典计算机视觉相关算法获得的颜色特征、纹理特征和形状特征等,例如图像直方图、尺度不变特征等,传统特征提取其计算比较简便,但是区分能力有限。深度特征提取实际上是将图像输入深度神经网络(deep neural network,DNN),把深度神经网络某个中间层的计算结果作为特征。深度特征提取的区分能力强,但获得图像深度特征的计算开销巨大、耗时较长。
为了加速深度神经网络的计算过程,需要降低深度神经网络执行的计算量。目前通过压缩深度神经网络模型的参数规模,以降低参数数目,进而降低模型的计算量。该方法首先对深度神经网络模型参数进行阈值剪枝,该阈值为人为设置的固定值,深度神经网络中所有低于该阈值的参数均被置为零,由于零不影响深度神经网络的运算结果,因此可以丢弃被置零的参数。然后使用聚类算法对参数进行聚类,落入一个聚类类别中所有的参数都使用聚类中心作为自己新的参数值,从而实现一个聚类类别中的参数共享,减少实际的参数数目,经过这一步,只有聚类中心的参数值被保留下来。最后使用哈夫曼编码技术对参数进行编码,降低模型参数需要占用的存储空间,从而降低模型的计算量。该方法基于阈值进行剪枝会产生没有规律的非结构稀疏性,这种稀疏性很难被转换为深度神经网络执行时间的减少,影响视频物体检测的执行时间。
发明内容
本申请实施例所要解决的技术问题在于,提供一种图像处理方法及其装置,可以有效降低图像深度特征提取过程的计算量,从而改善视频物体检测的执行时间。
本申请实施例第一方面提供一种图像处理方法,包括:
将原始图像对应的前景图像转换为压缩图像;
预估采用原始图像进行深度特征提取所需的第一提取时间和采用压缩图像进行深度特征提取所需的第二提取时间;
根据第一提取时间和第二提取时间确定采用原始图像进行深度特征提取或采用压缩图像进行深度特征提取。
本申请实施例第二方面提供一种图像处理装置,包括用于执行以上第一方面各个步骤的单元或手段(means)。
本申请实施例第三方面提供一种图像处理装置,包括至少一个处理元件和至少一个存储元件,其中至少一个存储元件用于存储程序和数据,至少一个处理元件用于执行本申请实施例第一方面中提供的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;中国科学院计算技术研究所,未经华为技术有限公司;中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711456179.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理电路及相关的图像处理方法
- 下一篇:一种编码系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序