[发明专利]一种基于AVS帧内压缩编码的视频目标分割方法在审
| 申请号: | 202111150365.9 | 申请日: | 2021-09-29 |
| 公开(公告)号: | CN113810724A | 公开(公告)日: | 2021-12-17 |
| 发明(设计)人: | 魏文应;龙仕强;张世雄;陈智敏;张伟民 | 申请(专利权)人: | 广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院 |
| 主分类号: | H04N19/593 | 分类号: | H04N19/593;H04N19/625;H04N19/136;G06N3/04;G06N3/08 |
| 代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 万学堂;王跃交 |
| 地址: | 518116 广东省深圳市龙岗区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 avs 压缩 编码 视频 目标 分割 方法 | ||
一种基于AVS帧内压缩编码的视频目标分割方法,包括以下步骤:S1.提取DCT编码:根据AVS帧内压缩编码,在视频解码阶段,获取未解码视频帧的DCT编码;S2.去除DCT高频:将提取到的DCT编码去除高频信号、保留低频信号,得到去除高频信号后的DCT编码特征图,将所述去除高频信号后的DCT编码特征图直接作为CNN模型的输入;以及S3.CNN模型分割:选择具有目标分割功能的CNN模型,并使用所述去除高频信号后的DCT编码特征图对CNN模型进行训练,最终得到具备视频目标分割功能的CNN模型。解决CNN目标分割模型输入数据缺失的问题,可以最大程度输入图像分割算法需要的DCT低频信号;解决了现有方法中因缩减CNN模型输入图像,而导致DCT信号低频缺失、高频冗余的问题。
技术领域
本发明属于计算机视觉领域,特别涉及一种基于AVS帧内压缩编码的视频目标分割方法。
背景技术
随着社会的发展,伴随着人类活动多元化,日常生活录制的视频内容也越来越多样化,对视频进行剪辑处理的要求也越来越高。比如,在替换视频画面背景时,经常需要将人物从视频中扣取出来,然后对其背景进行替换。同时,由中国主导的数字音视频编解码标准(Audio Video coding Standard,简称AVS),正在逐步推广使用,目前已推出第三代AVS3标准。在AVS标准中,使用熵编码,对视频进行帧内有损压缩。压缩过程保存的信息,主要是图像信号经离散余弦变换(Discrete Cosine Transform,简称DCT)后的低频信号。DCT高频信号去除得越多,图像细节越少,但图像中物体边缘信息依旧保存完好。而基于深度卷积神经网络(Deep Convolutional Neural Network,简称CNN)是目前主流的目标分割基础算法,比如Mask-RCNN目标分割算法。但当前图像分割算法,因需要预测物体的边缘信息,而需要大量的卷积和反卷积运算,进而需要大量的计算机系统资源进行大规模神经元计算。除了改进神经网络模型,通常做法是缩减图像大小,以此减少计算量,但常规图像缩小方式,为了考虑人眼视觉效果,保留过多图像细节,图像细节占据过多,物体轮廓和边缘信息则相应的减少。图像目标分割算法的目的,就是要找到目标物体的轮廓和边缘,轮廓和边缘信息缺失,将不利于图像目标分割。
发明内容
本发明的目的是提供一种基于AVS帧内压缩编码的视频目标分割方法,解决CNN目标分割模型输入数据缺失的问题,可以最大程度输入图像分割算法需要的DCT低频信号;特别的,使用基于AVS编解码标准进行视频DCT编码,直接从视频编码中获得DCT低频信号,从而解决旧有方法中因缩减CNN模型输入图像,而导致DCT信号低频缺失、高频冗余的问题。
本发明的技术方案如下:
本发明的基于AVS帧内压缩编码的视频目标分割方法,包括以下步骤:S1.提取DCT编码;S2.去除DCT高频;以及S3.CNN模型分割。
优选地,在上述基于AVS帧内压缩编码的视频目标分割方法中,在步骤S1中,根据AVS帧内压缩编码,在视频解码阶段,获取未解码视频帧的DCT编码。
优选地,在上述基于AVS帧内压缩编码的视频目标分割方法中,在步骤S2中,将提取到的DCT编码去除高频信号、保留低频信号,得到去除高频信号后的DCT编码特征图,将去除高频信号后的DCT编码特征图直接作为CNN模型的输入。
优选地,在上述基于AVS帧内压缩编码的视频目标分割方法中,在步骤S3中,选择具有目标分割功能的CNN模型,并使用去除高频信号后的DCT编码特征图对CNN模型进行训练,最终得到具备视频目标分割功能的CNN模型。
优选地,在上述基于AVS帧内压缩编码的视频目标分割方法中,在步骤S1中,在AVS解码阶段,解码得到DCT编码后,不再进行后续AVS其他的编码步骤,而是在数据结构上,对DCT信号按照它在原图对应的位置,一一排放即可。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院,未经广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111150365.9/2.html,转载请声明来源钻瓜专利网。





