[发明专利]一种基于AVS帧内压缩编码的视频目标分割方法在审

申请号：	202111150365.9	申请日：	2021-09-29
公开（公告）号：	CN113810724A	公开（公告）日：	2021-12-17
发明（设计）人：	魏文应;龙仕强;张世雄;陈智敏;张伟民	申请（专利权）人：	广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院
主分类号：	H04N19/593	分类号：	H04N19/593;H04N19/625;H04N19/136;G06N3/04;G06N3/08
代理公司：	北京京万通知识产权代理有限公司 11440	代理人：	万学堂;王跃交
地址：	518116 广东省深圳市龙岗区***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 avs 压缩编码视频目标分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种基于AVS帧内压缩编码的视频目标分割方法，包括以下步骤：S1.提取DCT编码：根据AVS帧内压缩编码，在视频解码阶段，获取未解码视频帧的DCT编码；S2.去除DCT高频：将提取到的DCT编码去除高频信号、保留低频信号，得到去除高频信号后的DCT编码特征图，将所述去除高频信号后的DCT编码特征图直接作为CNN模型的输入；以及S3.CNN模型分割：选择具有目标分割功能的CNN模型，并使用所述去除高频信号后的DCT编码特征图对CNN模型进行训练，最终得到具备视频目标分割功能的CNN模型。解决CNN目标分割模型输入数据缺失的问题，可以最大程度输入图像分割算法需要的DCT低频信号；解决了现有方法中因缩减CNN模型输入图像，而导致DCT信号低频缺失、高频冗余的问题。

技术领域

本发明属于计算机视觉领域，特别涉及一种基于AVS帧内压缩编码的视频目标分割方法。

背景技术

随着社会的发展，伴随着人类活动多元化，日常生活录制的视频内容也越来越多样化，对视频进行剪辑处理的要求也越来越高。比如，在替换视频画面背景时，经常需要将人物从视频中扣取出来，然后对其背景进行替换。同时，由中国主导的数字音视频编解码标准(Audio Video coding Standard，简称AVS)，正在逐步推广使用，目前已推出第三代AVS3标准。在AVS标准中，使用熵编码，对视频进行帧内有损压缩。压缩过程保存的信息，主要是图像信号经离散余弦变换(Discrete Cosine Transform,简称DCT)后的低频信号。DCT高频信号去除得越多，图像细节越少，但图像中物体边缘信息依旧保存完好。而基于深度卷积神经网络(Deep Convolutional Neural Network，简称CNN)是目前主流的目标分割基础算法，比如Mask-RCNN目标分割算法。但当前图像分割算法，因需要预测物体的边缘信息，而需要大量的卷积和反卷积运算，进而需要大量的计算机系统资源进行大规模神经元计算。除了改进神经网络模型，通常做法是缩减图像大小，以此减少计算量，但常规图像缩小方式，为了考虑人眼视觉效果，保留过多图像细节，图像细节占据过多，物体轮廓和边缘信息则相应的减少。图像目标分割算法的目的，就是要找到目标物体的轮廓和边缘，轮廓和边缘信息缺失，将不利于图像目标分割。

发明内容

本发明的目的是提供一种基于AVS帧内压缩编码的视频目标分割方法，解决CNN目标分割模型输入数据缺失的问题，可以最大程度输入图像分割算法需要的DCT低频信号；特别的，使用基于AVS编解码标准进行视频DCT编码，直接从视频编码中获得DCT低频信号，从而解决旧有方法中因缩减CNN模型输入图像，而导致DCT信号低频缺失、高频冗余的问题。

本发明的技术方案如下：

本发明的基于AVS帧内压缩编码的视频目标分割方法，包括以下步骤：S1.提取DCT编码；S2.去除DCT高频；以及S3.CNN模型分割。

优选地，在上述基于AVS帧内压缩编码的视频目标分割方法中，在步骤S1中，根据AVS帧内压缩编码，在视频解码阶段，获取未解码视频帧的DCT编码。

优选地，在上述基于AVS帧内压缩编码的视频目标分割方法中，在步骤S2中，将提取到的DCT编码去除高频信号、保留低频信号，得到去除高频信号后的DCT编码特征图，将去除高频信号后的DCT编码特征图直接作为CNN模型的输入。

优选地，在上述基于AVS帧内压缩编码的视频目标分割方法中，在步骤S3中，选择具有目标分割功能的CNN模型，并使用去除高频信号后的DCT编码特征图对CNN模型进行训练，最终得到具备视频目标分割功能的CNN模型。

优选地，在上述基于AVS帧内压缩编码的视频目标分割方法中，在步骤S1中，在AVS解码阶段，解码得到DCT编码后，不再进行后续AVS其他的编码步骤，而是在数据结构上，对DCT信号按照它在原图对应的位置，一一排放即可。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院，未经广东博华超高清创新中心有限公司;深圳龙岗智能视听研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111150365.9/2.html，转载请声明来源钻瓜专利网。

上一篇：一种用户活动状态的识别方法和系统
下一篇：一种铝合金壳体阳极氧化兼阴极极化工装

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于AVS帧内压缩编码的视频目标分割方法在审

专利文献下载