[发明专利]基于神经网络算法的处理视频图像的方法和装置有效
申请号: | 201610252056.5 | 申请日: | 2016-04-21 |
公开(公告)号: | CN105787867B | 公开(公告)日: | 2019-03-05 |
发明(设计)人: | 费旭东 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06T1/40 | 分类号: | G06T1/40 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;刘爱平 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 算法 处理 视频 图像 方法 装置 | ||
本申请提出了一种基于神经网络算法的处理视频图像的方法,包括:确定视频图像中的当前帧的原始图像数据和前一帧的图像数据;对所述当前帧的原始图像数据和所述前一帧的图像数据进行差分运算得到差分数据,所述差分数据表示当前帧图像相对于前一帧图像的变化程度;根据所述差分数据确定第一图像数据,所述第一图像数据的数据量少于所述当前帧的原始图像数据的数据量;根据所述神经网络算法,对所述第一图像数据进行线性处理和非线性处理。因此,本发明实施例的处理视频图像的方法,通过在利用神经网络算法进行视频图像处理的过程中对每相邻两帧之间的数据进行差分处理,使得被处理的图像中的数据量减少,从而高效地完成视频图像输出。
技术领域
本发明涉及通信领域,尤其涉及通信领域中的基于神经网络算法的处理视频图像的方法和装置。
背景技术
目前,神经网络和深度学习算法已经获得了非常成功的应用,并处于迅速发展的过程中,业界普遍预期新的计算方式有助于实现更为普遍、复杂的智能应用。特别是卷积神经网络(Convolutional Neural Network,简称“CNN”),近年来在图像识别应用领域取得了非常突出的成就,因此业界对CNN算法的优化及高效率实现开始关注并重视,诸如Facebook、Qualcomm、Baidu和Google等公司都投入了CNN优化算法的研究。
Qualcomm公司发布了在下一代芯片中集成神经网络处理模块的计划,提高CNN的处理效率,相关算法的改进,以及芯片实现的效率是其关注和研究的核心问题。
随着应用和实现能力的持续提高,神经网络在视频信息处理中的应用也成为非常普遍的期待。但视频处理带来了极大的计算量和实时计算要求,如何提高视频处理的有效性和效率变得非常重要。
发明内容
有鉴于此,本发明实施例提供了一种基于神经网络算法的处理视频图像的方法和装置,以解决神经网络在视频图像处理过程中的处理效率较低的问题。
第一方面,提供了一种基于神经网络算法的处理视频图像的方法,其特征在于,所述方法包括:
确定视频图像中的当前帧的原始图像数据和前一帧的图像数据;
对所述当前帧的原始图像数据和所述前一帧的图像数据进行差分运算得到差分数据,所述差分数据表示当前帧图像相对于前一帧图像的变化程度;
根据所述差分数据确定第一图像数据,所述第一图像数据的数据量少于所述当前帧的原始图像数据的数据量;
根据所述神经网络算法,对所述第一图像数据进行线性处理和非线性处理。
可选地,所述根据所述神经网络算法,对所述第一图像数据进行线性处理和非线性处理,包括:
根据所述神经网络算法,对所述第一图像数据进行线性处理,并对所述线性处理后的所述第一图像数据进行非线性处理。
在第一方面的第一种可能的实现方式中,所述根据所述神经网络算法,对所述第一图像数据进行线性处理和非线性处理,包括:
根据所述神经网络算法,对所述第一图像数据进行线性处理;
根据所述线性处理后的所述第一图像数据和所述前一帧的图像数据,确定第二图像数据,所述第二图像数据为当前帧的处理图像数据;
根据所述神经网络算法,对所述第二图像数据进行非线性处理。
应理解,本发明实施例中的视频图像的处理过程中,可以根据所述线性处理后的第一图像数据和所述前一帧的图像数据确定第二图像数据,即确定当前帧的处理图像数据;也可以不确定所述当前帧的处理图像数据,而是直接输出线性处理后的第一图像数据给后级处理单元,以便于后续直接对图像特征进行提取。
可选地,所述根据所述线性处理后的所述第一图像数据和所述前一帧的图像数据,确定第二图像数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610252056.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:人脸图像美化方法
- 下一篇:基于多分辨率奇异值分解和混沌序列的图像加密方法