[发明专利]基于多层卷积神经网络的图像压缩方法在审
申请号: | 201910366826.2 | 申请日: | 2019-05-05 |
公开(公告)号: | CN110062231A | 公开(公告)日: | 2019-07-26 |
发明(设计)人: | 于治楼;戴鸿君 | 申请(专利权)人: | 济南浪潮高新科技投资发展有限公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/13;H04N19/147;H04N19/42;H04N19/89 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 阚恭勇 |
地址: | 250100 山东省济南市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积神经网络 图像压缩 多层 图像处理技术 工作自动化 工作效率 神经网络 算法体系 训练效果 级联 节约 引入 | ||
本发明提供一种基于多层卷积神经网络的图像压缩方法,属于图像处理技术领域,本发明在深度神经网络的基础上引入了级联算法体系,加快训练时间,提高训练效果,大大提高了工作效率,使得简单、繁琐的工作自动化,节约时间。
技术领域
本发明涉及图像处理技术,尤其涉及一种基于多层卷积神经网络的图像压缩方法。
背景技术
图像数据之所以能被压缩,就是因为数据中存在着冗余。图像数据的冗余主要表现为:图像中相邻像素间的相关性引起的空间冗余;图像序列中不同帧之间存在相关性引起的时间冗余;不同彩色平面或频谱带的相关性引起的频谱冗余。数据压缩的目的就是通过去除这些数据冗余来减少表示数据所需的比特数。由于图像数据量的庞大,在存储、传输、处理时非常困难,因此图像数据的压缩就显得非常重要。
信息时代带来了信息爆炸,使数据量大增,因此,无论传输或存储都需要对数据进行有效的压缩。在遥感技术中,各种航天探测器采用压缩编码技术,将获取的巨大信息送回地面。
图像压缩是数据压缩技术在数字图像上的应用,它的目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据。
图像压缩可以是有损数据压缩也可以是无损数据压缩。对于如绘制的技术图、图表或者漫画优先使用无损压缩,这是因为有损压缩方法,尤其是在低的位速条件下将会带来压缩失真。如医疗图像或者用于存档的扫描图像等这些有价值的内容的压缩也尽量选择无损压缩方法。有损方法非常适合于自然的图像,例如一些应用中图像的微小损失是可以接受的(有时是无法感知的),这样就可以大幅度地减小位速。
目前随着互联网和手机的快速发展催生出诸多如youtube、头条、微博等媒体巨头,使得图像和视频占据了互联网绝大部分流量,因此图像压缩算法就显得越来越重要,但是传统视频压缩算法已经基本完善没有太大的改进空间,在这种情况下,借助目前流行的深度学习技术来提高图像压缩就显得尤为重要。
发明内容
为了解决以上技术问题,本发明提出了一种基于多层卷积神经网络的图像压缩方法,提高精确度,减少训练时间。
本发明的技术方案是:
一种基于多层卷积神经网络的图像压缩方法,使用深层卷积神经网络图像压缩的编码器,使用二值量化进行量化,同时使用香农编码作为熵编码经过训练完成端对端的图形压缩。
进一步的,具体步骤如下:
步骤一:设计图像压缩编码器结构。
本发明编码器使用多层卷积神经网络,该编码器以VGG16为基础,其中卷积层由卷积、batch normalization、relu激活函数和池化组成,通过多层的卷积操作完成图像的编码工作。
步骤二:将编码后的图片进行量化。
本发明使用二值量化完成对编码结果的量化,达到减小模型大小的目的。
步骤三:进行反量化和构造解码器。
上述步骤将图像进行了编码,如果想要恢复该图像则要进行解码,因此对应上述步骤首先进行反量化,进而构造解码器完成解码工作。
解码器的构造同编码器相反,编码器使用卷积和池化操作完成下采样工作,因此解码器通过上采样、卷积和反卷积工作实现图片信息流的解码工作,获得同原图片近似的图片。
步骤四:完成熵编码是编码和量化后的图片成为码字。
该步骤结合上面的编码和量化方式的选择来选择相应的熵编码方式,因此选择了香农编码。
步骤五:完成率-失真优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南浪潮高新科技投资发展有限公司,未经济南浪潮高新科技投资发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910366826.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像编码方法及装置
- 下一篇:一种基于超分辨率的视频压缩方法及系统