[发明专利]一种多类别图像转换与对比的超高清片源色域检测方法有效
申请号: | 201910971340.1 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110781932B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 周芸;胡潇;郭晓强;李小雨;魏建超;梁琳琳 | 申请(专利权)人: | 国家广播电视总局广播电视科学研究院;北京博雅睿视科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津盛理知识产权代理有限公司 12209 | 代理人: | 王利文 |
地址: | 100886 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 类别 图像 转换 对比 超高 片源 检测 方法 | ||
本发明涉及一种多类别图像转换与对比的超高清片源色域检测方法,其技术特点是:构造多类别图像转换与对比的色域检测网络,用于对BT.709和BT.2020两种视频片源的色域进行检测;构建图像转换与对比层,对输入图像进行转换,增加不同类别特征间的参照和对比;使用残差网络作为初始网络,将原始输入图像和转换后的图像同时输入初始网络;对色域检测网络进行训练,得到BT.709和BT.2020两类别的色域分类模型,并由该色域分类模型图像的色域类别。本发明设计合理,对超高清视频片源的色域进行技术符合性检测,将色域检测问题归结为图像分类问题,并结合图像分类任务中的卷积神经网络,获得了很好的色域检测结果,使得系统整体检测准确率大大提升。
技术领域
本发明属于计算机视觉图像分类技术领域,尤其是一种多类别图像转换与对比的超高清片源色域检测方法。
背景技术
目前,以超高清电视为代表的新一代电视技术近年来呈现快速发展的态势。与高清电视相比,超高清电视不仅仅是分辨率的提高,而且还包括高帧率、高比特深度、宽色域和高动态范围。作为超高清电视的一项关键技术,宽色域能够呈现更加丰富的色彩,给予观众身临其境的视觉体验。
然而,实际应用中,在节目制作、交换、传输等各个环节都有可能造成超高清节目质量不满足技术标准要求,严重损害了超高清市场的积极性。例如:视频封装参数为BT.709色域;或者视频封装参数符合规定,但实际内容并不符合,如封装参数是BT.2020色域,实际是 BT.709色域等。
因此,如何对网络提取到的特征鉴别待测视频的色域类别,保证超高清节目片源的色域指标把控,确保呈现给观众真正符合标准的超高清电视节目是目前迫切需要解决的问题。
发明内容
本发明的目的在于克服上述现有技术存在的不足,提供一种多类别图像转换与对比的超高清片源色域检测方法,其将色域的检测问题归结为图像分类问题,引入深度卷积神经网络,并设计了图像转换层,将对单张图像的绝对判断问题转化为两张图像的相对判断问题,能够降低网络的训练难度及训练过程中的过拟合风险。
本发明解决其技术问题是采取以下技术方案实现的:
一种多类别图像转换与对比的超高清片源色域检测方法,包括以下步骤:
步骤1、构造多类别图像转换与对比的色域检测网络,用于对BT.709和BT.2020两种视频片源的色域进行检测;
步骤2、构建图像转换与对比层,对输入图像进行转换,增加不同类别特征间的参照和对比;
步骤3、使用残差网络作为初始网络,将原始输入图像和转换后的图像同时输入初始网络;
步骤4、对色域检测网络进行训练,得到BT.709和BT.2020两类别的色域分类模型;
步骤5、将超高清片源图像输入到BT.709和BT.2020两类别的色域分类模型中,由该色域分类模型输出该图像属于两类别的概率,最终根据概率大小判别图像的色域类别。
进一步,所述步骤1构建的色域检测网络包括图像转换与对比层、五个残差单元、全连接层和输出层;原始输入图像经过图像转换与对比层进行图像转换操作,然后将图像转换与对比层输出与原始输入图像一同送入五个残差单元,每个残差单元对图像进行下采样,输出尺寸在长、宽上均减半,经过五个残差单元后输出特征图再经过全连接层,得到一维特征向量作为输入图像的最终特征表示;输出层用于输出BT.709和BT.2020两种色域分类。
进一步,所述输入图像尺寸为224×224×3,五个残差单元输出的图像尺寸为7×7,全连接层得到的一维特征向量为1×512。
进一步,所述步骤2的具体实现方法为:将BT.709和BT.2020的图像均按照BT.709转 BT.2020的方法进行转换,转换后的BT.709图像具备BT.2020的特征,转换后的BT.2020图像不具备BT.709的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家广播电视总局广播电视科学研究院;北京博雅睿视科技有限公司,未经国家广播电视总局广播电视科学研究院;北京博雅睿视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910971340.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序