[发明专利]基于深度自动编码器的视频编解码装置及方法有效
申请号: | 201710068270.X | 申请日: | 2017-02-07 |
公开(公告)号: | CN107046646B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 陈天石;支天;罗宇哲;刘少礼;郭崎;陈云霁 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | H04N19/30 | 分类号: | H04N19/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
地址: | 201203 上海市浦东新区上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 自动 编码器 视频 解码 装置 方法 | ||
1.一种基于深度自动编码器的视频编解码装置,其特征在于,包括:
深度自动编码器模块,包括深度自动编码器,所述深度自动编码器包括编码端,所述编码端用于对原始视频进行首次压缩得到首次压缩数据;
神经网络编解码模块,用于对解码端参数进行编码压缩,生成编码后的解码端参数;
混合编解码模块,用于对首次压缩数据和编码后的解码端参数进行混合编码,得到视频压缩数据;
所述编码端为N层人工神经网络结构;所述N层人工神经网络结构的第1层为输入层,第2至N层为隐含层,层间单元全连接,层内单元无连接,第N层隐含层的隐单元数小于输入层的输入单元数;
所述解码端是与编码端结构对称的N层人工神经网络结构;所述解码端的第n层为所述编码端的第(N-n+1)层,所述解码端第n层与第n+1层之间的权重矩阵,为所述编码端第(N-n)层和第(N-n+1)层之间的权重矩阵的转置,其中,1≤n≤N;
所述混合编码包括熵编码。
2.如权利要求1所述的视频编解码装置,其特征在于,所述熵编码包括哈夫曼编码。
3.如权利要求1或2所述的视频编解码装置,其特征在于,还包括:
存储模块,用于存储所述首次压缩数据、解码端参数和视频压缩数据。
4.如权利要求3所述的视频编解码装置,其特征在于,
所述神经网络编解码模块用于从所述存储模块读取所述解码端参数,以对所述解码端参数进行编码压缩。
5.如权利要求3所述的视频编解码装置,其特征在于,
所述混合编解码模块用于从所述存储模块读取所述首次压缩数据,并从所述神经网络编解码模块读取编码后的解码端参数,以进行所述混合编码,并将所述视频压缩数据存储至所述存储模块。
6.如权利要求3所述的视频编解码装置,其特征在于,所述深度自动编码器还包括:解码端;
所述混合编解码模块还用于对视频压缩数据进行解码,得到首次解压数据和编码后的解码端参数;
所述神经网络编解码模块还用于对编码后的解码端参数进行解码,得到解码端参数;
所述解码端用于对首次解压数据解码,得到原始视频数据。
7.如权利要求6所述的视频编解码装置,其特征在于,所述存储模块还用于存储所述首次解压数据、编码后的解码端参数和原始视频数据。
8.如权利要求7所述的视频编解码装置,其特征在于,
所述混合编解码模块还用于从所述存储模块读取所述视频压缩数据,以对所述视频压缩数据进行解码。
9.如权利要求7所述的视频编解码装置,其特征在于,所述神经网络编解码模块还用于从所述存储模块读取所述编码后的解码端参数,以对所述编码后的解码端参数进行解码。
10.如权利要求7所述的视频编解码装置,其特征在于,所述深度自动编码器模块还用于从所述存储模块读取所述首次解压数据,从所述神经网络编解码模块读取所述解码端的参数,以使所述解码端对所述首次解压数据解码。
11.如权利要求1或2所述的视频编解码装置,其特征在于,
所述深度自动编码器模块还用于初始化所述深度自动编码器,并利用训练用视频对所述深度自动编码器进行训练,得到用于视频编码的深度自动编码器。
12.如权利要求11所述的视频编解码装置,其特征在于,所述深度自动编码器模块还用于利用训练用视频对所述深度自动编码器进行训练包括:
将所述深度自动编码器编码端的相邻两层作为一个限制玻尔兹曼机;
初始化所述限制玻尔兹曼机;
利用所述训练用视频数据对所述限制玻尔兹曼机进行训练;
用反向传播算法精细调整所述深度自动编码器编码端的权值矩阵,以最小化对原始输入的重构误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710068270.X/1.html,转载请声明来源钻瓜专利网。