[发明专利]图像前背景分割及网络模型训练、图像处理方法和装置有效
申请号: | 201610694814.9 | 申请日: | 2016-08-19 |
公开(公告)号: | CN107341805B | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 石建萍;栾青 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T7/194 |
代理公司: | 北京天健君律专利代理事务所(普通合伙) 11461 | 代理人: | 罗延红;纪烈超 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 背景 分割 网络 模型 训练 处理 方法 装置 | ||
本发明实施例提供了一种图像前背景分割网络模型的训练、图像前背景分割及视频图像处理的方法、装置和终端设备,其中,图像前背景分割网络模型的训练方法包括:获取待训练的样本图像的特征向量;对特征向量进行卷积处理,获取特征向量卷积结果;对特征向量卷积结果进行放大处理;判断放大后的特征向量卷积结果是否满足收敛条件;若满足,则完成对用于分割图像前背景的卷积神经网络模型的训练;若不满足,则根据放大后的特征向量卷积结果调整卷积神经网络模型的参数并根据调整后的卷积神经网络模型的参数对卷积神经网络模型进行迭代训练,直至卷积结果满足收敛条件。通过本发明实施例,提高了卷积神经网络模型的训练效率,缩短了训练时间。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种图像前背景分割网络模型的训练方法、装置和终端设备,一种图像前背景分割方法、装置和终端设备,以及,一种视频图像处理方法、装置和终端设备。
背景技术
卷积神经网络是用于计算机视觉和模式识别的一个重要的研究领域,它通过计算机仿照生物大脑思维启发进行类似人类对特定对象的信息处理。通过卷积神经网络,能够有效地进行对象检测和识别。随着互联网技术的发展,信息量的急剧增加,卷积神经网络被越来越广泛地应用于对象检测及识别领域,以从大量的信息中寻找出实际所需的信息。
目前,卷积神经网络需要采集大量的样本进行训练,以达到较为准确的预测效果。然而,目前的卷积神经网络训练过程复杂,加上训练样本数量的增加,造成训练时间长、训练成本高。
发明内容
本发明实施例提供了一种图像前背景分割网络模型的训练方案、一种图像前背景分割方案,以及,一种视频图像处理方案。
根据本发明实施例的一个方面,提供了一种图像前背景分割网络模型的训练方法,包括:获取待训练的样本图像的特征向量,其中,所述样本图像为包含有前景标注信息和背景标注信息的样本图像;对所述特征向量进行卷积处理,获取特征向量卷积结果;对所述特征向量卷积结果进行放大处理;判断放大后的所述特征向量卷积结果是否满足收敛条件;若满足,则完成对用于分割图像前背景的卷积神经网络模型的训练;若不满足,则根据放大后的所述特征向量卷积结果调整所述卷积神经网络模型的参数并根据调整后的所述卷积神经网络模型的参数对所述卷积神经网络模型进行迭代训练,直至迭代训练后的特征向量卷积结果满足所述收敛条件。
可选地,结合本发明实施例提供的任一种图像前背景分割网络模型的训练方法,其中,对所述特征向量卷积结果进行放大处理包括:通过对所述特征向量卷积结果进行双线性插值,放大所述特征向量卷积结果。
可选地,结合本发明实施例提供的任一种图像前背景分割网络模型的训练方法,其中,对所述特征向量卷积结果进行放大处理包括:将所述特征向量卷积结果放大到放大后的特征向量卷积结果对应的图像的大小与原始图像大小一致。
可选地,结合本发明实施例提供的任一种图像前背景分割网络模型的训练方法,其中,判断放大后的所述特征向量卷积结果是否满足收敛条件包括:使用设定的损失函数计算放大后的所述特征向量卷积结果和预定的标准输出特征向量的损失值;根据所述损失值判断放大后的所述特征向量卷积结果是否满足收敛条件。
可选地,结合本发明实施例提供的任一种图像前背景分割网络模型的训练方法,其中,所述方法还包括:获取测试样本图像,使用训练后的所述卷积神经网络模型对所述测试样本图像进行前背景区域的预测;检验预测的前背景区域是否正确;若不正确,则使用所述测试样本图像对所述卷积神经网络模型进行再次训练。
可选地,结合本发明实施例提供的任一种图像前背景分割网络模型的训练方法,其中,使用所述测试样本图像对所述卷积神经网络模型进行再次训练,包括:从所述测试样本图像中获取前背景区域预测不正确的样本图像;使用预测不正确的样本图像对所述卷积神经网络模型进行再次训练,其中,对所述卷积神经网络模型进行再次训练的所述预测不正确的样本图像包含有前景信息和背景信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610694814.9/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序