[发明专利]基于深度自动编码器的视频编解码装置及方法有效
申请号: | 201710068270.X | 申请日: | 2017-02-07 |
公开(公告)号: | CN107046646B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 陈天石;支天;罗宇哲;刘少礼;郭崎;陈云霁 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | H04N19/30 | 分类号: | H04N19/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 201203 上海市浦东新区上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 自动 编码器 视频 解码 装置 方法 | ||
本披露提供了一种基于深度自动编码器的视频编解码装置及方法,构建结构对称的编码端和解码端,对视频数据进行二次压缩和解压缩,提高了视频数据的压缩率;由于人工神经网络具有非线性的特征,通过将人工神经网络的参数作为秘钥,实现了视频数据的压缩加密一体化;视频数据的编码结果包含了视频数据的特征,便于视频数据的分类与搜索,具有广阔的发展空间和应用前景;无需人工设计复杂的编解码流程,利用深度自动编码器自动提取数据特征的功能,大大减少了人工干预,实现编码过程的自动化,实现简单,并且可拓展性良好,不仅可以用于视频数据压缩,还可用于其它数据压缩。
技术领域
本披露涉及视频压缩和解压领域,尤其涉及一种基于深度自动编码器的视频编解码装置及方法。
背景技术
随着互联网时代的到来,视频数据的大量产生对传输能力提出了更高的要求。为了缓解传输压力,视频编码解码技术应运而生,并对压缩视频以便于传输发挥了巨大的作用。
传统的视频编码技术是针对视频中存在的各种类型的冗余采用不同的方法予以消除从而达到压缩视频的目的。例如,针对视频的时间冗余、空间冗余、视觉冗余和编码冗余技术人员分别采取帧间编码、帧内编码、量化和熵编码等方法。变换也是去除空间冗余的常用方法。每种视频编码方法都有对应的解码方法。复杂的编码标准通过组合不同的方法和采用不同的实现方式以达到较好的压缩比。
传统的视频编码技术虽然已经较为成熟,但是比较复杂,需要精巧的人工设计,才能达到较好的压缩效果。
发明内容
(一)要解决的技术问题
有鉴于此,本披露的主要目的在于提供一种基于深度自动编码器的视频编解码装置及方法。
(二)技术方案
本披露提供了一种基于深度自动编码器的视频编解码装置,包括:深度自动编码器模块,包括深度自动编码器,所述深度自动编码器包括编码端,所述编码端用于对原始视频进行首次压缩得到首次压缩数据;神经网络编解码模块,用于对解码端参数进行编码压缩,生成编码后的解码端参数;混合编解码模块,用于对首次压缩数据和编码后的解码端参数进行混合编码,得到视频压缩数据。
优选地,所述编码端为N层人工神经网络结构。
优选地,N层人工神经网络结构的第1层为输入层,第2至N层为隐含层,层间单元全连接,层内单元无连接,第N层隐含层的隐单元数小于输入层的输入单元数。
优选地,所述混合编码包括熵编码。
优选地,所述熵编码包括哈夫曼编码。
优选地,还包括:存储模块,用于存储所述首次压缩数据、解码端参数和视频压缩数据。
优选地,所述神经网络编解码模块用于从所述存储模块读取所述解码端参数,以对所述解码端参数进行编码压缩。
优选地,所述混合编解码模块用于从所述存储模块读取所述首次压缩数据,并从所述神经网络编解码模块读取编码后的解码端参数,以进行所述混合编码,并将所述视频压缩数据存储至所述存储模块。
优选地,所述深度自动编码器还包括:解码端;所述混合编解码模块还用于对视频压缩数据进行解码,得到首次解压数据和编码后的解码端参数;所述神经网络编解码模块还用于对编码后的解码端参数进行解码,得到解码端参数;所述解码端用于对首次解压数据解码,得到原始视频数据。
优选地,所述存储模块还用于存储所述首次解压数据、编码后的解码端参数和原始视频数据。
优选地,所述混合编解码模块还用于从所述存储模块读取所述视频压缩数据,以对所述视频压缩数据进行解码。
优选地,所述神经网络编解码模块还用于从所述存储模块读取所述编码后的解码端参数,以对所述编码后的解码端参数进行解码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710068270.X/2.html,转载请声明来源钻瓜专利网。