[发明专利]神经网络训练及图像处理方法、装置、系统有效
申请号: | 201711283718.6 | 申请日: | 2017-12-06 |
公开(公告)号: | CN108875931B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 赵子健;俞刚 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06N3/08;G06V20/40 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 苏胜 |
地址: | 100000 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 训练 图像 处理 方法 装置 系统 | ||
本发明提供了一种神经网络训练及图像处理方法、装置、系统,涉及视频提取技术领域,其中,该神经网络训练方法包括:首先,利用3D卷积神经网络对M帧图像进行3D卷积处理,获得M帧图像的特征图,之后,将M帧图像的特征图通过归一化指数函数,获得与M帧图像中每一帧图像为关键帧的概率值,之后,根据M个概率值以及应用端对M帧图像序列的评分,对3D卷积神经网络的网络参数进行调整,从而使经过调整后的网络参数更加适合关键帧的提取,解决了现有技术中关键帧提取时的无法适应视频内容的变化、无法借助高层的语义信息等的问题,使关键帧提取更加快速有效。
技术领域
本发明涉及视频提取技术领域,尤其是涉及一种神经网络训练及图像处理方法、装置、系统。
背景技术
在视频处理和分析过程中,需要选取其中的一些视频帧作为关键帧,之后,将关键帧作为处理和分析的对象,即关键帧提取是在一组镜头内高度冗余的连续多帧中提取具有代表性并且质量高的少数帧来保存或分析,从而降低存储空间和计算量。
目前,常见的关键帧提取的方法有:(1)固定步长采样方法,该方法虽实现简单,但是,固定的步长无法适应视频内容的变化;(2)基于变化阈值的帧差方法,该方法无法保证提取高质量的关键帧;(3)基于运动光流的关键帧选择,该方法依赖于光流计算的准确度,并且,是一种非可学习的方法;(4)基于聚类的选择方法,该方法是一种非监督方法,而且,对异常帧较为敏感,但是,无法借助高层的语义信息来进行分析。可见,现有的提取方法都无法快速有效的从视频中提取出关键帧。
针对上述问题,还未提出有效的解决方案。
发明内容
有鉴于此,本发明的目的在于提供了神经网络训练及图像处理方法、装置、系统,增加了关键帧提取的可靠性。
第一方面,本发明实施例提供了一种神经网络训练方法,包括:
利用3D卷积神经网络对M帧图像进行3D卷积处理,获得M帧图像的特征图;
将M帧图像的特征图通过归一化指数函数,获得与M帧图像中每一帧图像为关键帧的概率值;
根据M个概率值以及应用端对M帧图像序列的评分,对3D卷积神经网络的网络参数进行调整。
结合第一方面,本发明实施例提供了第一方面的第一种可能的实施方式,其中,3D卷积神经网络中,每一层的3D卷积核为五维数组,每个维度的尺寸分别表示卷积核的时间深度、高度、宽度、输入通道数和输出通道数。
结合第一方面第一种可能的实施方式,本发明实施例提供了第一方面的第二种可能的实施方式,其中,根据M个概率值以及应用端对M帧图像序列的评分,对3D卷积神经网络的网络参数进行调整,具体包括:
以M个概率值作为权重,与每一帧输入图像的评分相乘,得到每一帧输入图像的奖赏;
根据每一帧输入图像的奖赏,通过策略梯度调整3D卷积神经网络的网络参数。
结合第一方面第一种可能的实施方式,本发明实施例提供了第一方面的第三种可能的实施方式,其中,根据M个概率值以及应用端对M帧图像序列的评分,对3D卷积神经网络的网络参数进行调整,具体包括:
以M个概率值π(am|θ)作为权重,与每一帧输入图像的评分相乘,得到每一帧输入图像的奖赏Rm,其中,am表示选取第m帧作为关键帧的动作,θ为网络参数;
对每一帧输入图像的奖赏Rm进行降低方差处理,获得降低方差后的奖赏Rm-b,其中,
基于3D卷积神经网络的目标函数
以及目标函数对网络参数θ的偏导数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711283718.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序