[发明专利]人像分割方法、装置及设备有效
申请号: | 201810709464.8 | 申请日: | 2018-07-02 |
公开(公告)号: | CN109035257B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 傅依;李旭斌;文石磊;丁二锐;刘霄 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 董建姣;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人像 分割 方法 装置 设备 | ||
本发明实施例提供一种人像分割方法、装置及设备,该方法包括:获取视频中第一图像与第二图像之间的差异值,第一图像为待进行人像分割处理的图像,第二图像为第一图像的前一帧图像,第二图像已进行人像分割处理;若差异值大于预设阈值,则根据预设模型对第一图像进行人像分割处理,得到第一图像的人像分割结果,预设模型为根据多组样本学习得到的,每组样本包括图像样本和对应的人像分割结果样本;若差异值小于或等于预设阈值,则根据第二图像的人像分割结果和运动估计算法,确定第一图像的人像分割结果。在保证对视频进行高精度的人像分割处理的基础上,提高了对视频进行高精度人像分割处理的实时性。
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种人像分割方法、装置及设备。
背景技术
人像分割是指在图像中提取人体图像,视频场景下的人像分割是指在视频中实时提取人体图像。
在现有技术中,当需要在终端设备(例如手机等)中对视频进行实时人像分割处理时,通常先在终端设备中加载预先学习得到的预设模型,再将视频输入至预设模型,以使预设模型对视频中的每一帧图像进行人像分割处理。然而,在通过预设模型对图像进行高精度的人像分割处理时,预设模型需要消耗终端设备较多的资源、且需要较长的处理时长。导致对视频进行高精度人像分割处理的实时性较差。
发明内容
本发明实施例提供一种人像分割方法、装置及设备,在保证对视频进行高精度的人像分割处理的基础上,提高了对视频进行高精度人像分割处理的实时性。
第一方面,本发明实施例提供一种人像分割方法,包括:
获取视频中第一图像与第二图像之间的差异值,所述第一图像为待进行人像分割处理的图像,所述第二图像为所述第一图像的前一帧图像,所述第二图像已进行人像分割处理;
若所述差异值大于预设阈值,则根据预设模型对所述第一图像进行人像分割处理,得到第一图像的人像分割结果,所述预设模型为根据多组样本学习得到的,每组样本包括图像样本和对应的人像分割结果样本;
若所述差异值小于或等于所述预设阈值,则根据所述第二图像的人像分割结果和运动估计算法,确定所述第一图像的人像分割结果。
在一种可能的实施方式中,在所述根据预设模型对所述第一图像进行人像分割处理之前,还包括:
获取所述视频的类型,所述视频的类型包括近景视频类型和远景视频类型;
根据所述视频的类型,加载所述视频类型对应的所述预设模型。
在另一种可能的实施方式中,所述获取所述视频的类型,包括:
确定终端设备拍摄所述视频所使用的摄像头;
若拍摄所述视频所使用的摄像头为前置摄像头,则确定所述视频的类型为近景视频类型;
若拍摄所述视频所使用的摄像头为后置摄像头,则确定所述视频的类型为远景视频类型。
在另一种可能的实施方式中,所述预设模型具有优化网络结构、优化卷积层、优化网络高层语义信息中的至少一种;其中,
所述优化网络结构为深度加逐点的网络结构。
所述优化卷积层的卷积操作包括一个第一卷积操作和K个第二卷积操作;其中,所述第一卷积操作为输入为M通道、输出为N/K通道,所述第二卷积操作的输入为N/K通道、输出为N/K通道;所述预设模型的卷积层的特征输出为所述第一卷积操作和所述K个第二卷积操作的特征组合,所述M、所述N、所述K分别为大于或等于1的正整数。
所述优化网络高层语义信息中包括扩张操作。
在另一种可能的实施方式中,所述获取视频中第一图像与第二图像之间的差异值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810709464.8/2.html,转载请声明来源钻瓜专利网。