[发明专利]基于多层卷积神经网络的图像压缩方法在审
申请号: | 201910366826.2 | 申请日: | 2019-05-05 |
公开(公告)号: | CN110062231A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 于治楼;戴鸿君 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/13;H04N19/147;H04N19/42;H04N19/89 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 图像压缩 多层 图像处理技术 工作自动化 工作效率 神经网络 算法体系 训练效果 级联 节约 引入 | ||
1.一种基于多层卷积神经网络的图像压缩方法,其特征在于,
使用深层卷积神经网络图像压缩的编码器,使用二值量化进行量化,同时使用香农编码作为熵编码经过训练完成端对端的图形压缩。
2.根据权利要求1所述的方法,其特征在于,
主要步骤包括:
1)设计图像压缩编码器结构;
2)将编码后的图片进行量化;
3)进行反量化和构造解码器;
4)完成熵编码是编码和量化后的图片成为码字。
5)完成率-失真优化
6)对模型进行训练得到成熟模型。
3.根据权利要求1所述的方法,其特征在于,
在步骤1)中,编码器使用多层卷积神经网络,该编码器以VGG16为基础,其中卷积层由卷积、batch normalization、relu激活函数和池化组成,通过多层的卷积操作完成图像的编码工作。
4.根据权利要求1所述的方法,其特征在于,
在步骤2)中,使用二值量化完成对编码结果的量化,达到减小模型大小的目的。
5.根据权利要求1所述的方法,其特征在于,
在步骤3)中,解码器的构造同编码器相反,编码器使用卷积和池化操作完成下采样工作,因此解码器通过上采样、卷积和反卷积工作实现图片信息流的解码工作,获得同原图片近似的图片。
6.根据权利要求1所述的方法,其特征在于,
步骤4)结合上面的编码和量化方式的选择来选择相应的熵编码方式,因此选择了香农编码。
7.根据权利要求1所述的方法,其特征在于,
所述步骤5),即将步骤3)解码后的图片与原图片对比计算得到重建误差,将步骤4)得到的码字进行码字估计得到码率,然后根据图像压缩侧重点的不同将重建误差和码率选择合适的权重后相加。
8.根据权利要求1所述的方法,其特征在于,
构建好模型后使用图片对该模型进行无监督学习形成成熟模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910366826.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像编码方法及装置
- 下一篇:一种基于超分辨率的视频压缩方法及系统