[发明专利]小波域CNN学习的图像识别方法及装置在审
申请号: | 202110897466.6 | 申请日: | 2021-08-05 |
公开(公告)号: | CN113762290A | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 孙延奎;王路远 | 申请(专利权)人: | 清华大学 |
主分类号: | G06K9/52 | 分类号: | G06K9/52;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
地址: | 100084 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 小波域 cnn 学习 图像 识别 方法 装置 | ||
本发明提供一种小波域CNN学习的图像识别方法及装置,其中所述方法包括通过小波变换,将目标图像的图像通道由时域转换为小波域,得到第一数量个子带图像通道;对所述第一数量个子带图像通道进行筛选,确定第二数量个子带图像通道;将所述第二数量个子带图像通道输入图像分类器模型,得到所述目标图像的分类结果,图像分类器模型可以对高分辨率的目标图像的子带通道图像进行识别,提高了图像识别精度。
技术领域
本发明涉及计算机技术领域,尤其涉及一种小波域CNN学习的图像识别方法及装置。
背景技术
卷积神经网络(Convolutional Neural Networks,CNN)在图像识别中已得到广泛应用,为了保证CNN模型的训练和推理效率,一般将图片的输入大小设置为224像素×224像素。虽然相机拍摄的高清图片已经远远超过了这个分辨率,但是图片不得不进行压缩,以适应CNN模型的输入限制,这造成了很多信息的丢失。如何在不改变预训练CNN模型整体结构且不增加模型参数的情况下,采用较大图片分辨率输入,提升输入信息的质量,从而提升分类精度是一个重要问题。
发明内容
本发明提供一种小波域CNN学习的图像识别方法及装置,用以解决现有技术中CNN模型输入图像的分辨率较低导致的识别结果不准确的缺陷,实现较高精度的图像识别。
本发明提供一种小波域CNN学习的图像识别方法,包括:
通过小波变换,将目标图像的图像通道由时域转换为小波域,得到第一数量个子带图像通道;
对所述第一数量个子带图像通道进行筛选,确定第二数量个子带图像通道;
将所述第二数量个子带图像通道输入图像分类器模型,得到所述目标图像的分类结果。
根据本发明提供的小波域CNN学习的图像识别方法,在通过小波变换,将目标图像的图像通道由时域转换为小波域之前,还包括:
将所述目标图像的色彩空间变换到YCbCr。
根据本发明提供的小波域CNN学习的图像识别方法,所述对所述第一数量个子带图像通道进行筛选,确定第二数量个子带图像通道包括:
从所述第一数量个子带图像通道中选择第二、数量个低频子带图像通道。
根据本发明提供的小波域CNN学习的图像识别方法,所述对所述第一数量个子带图像通道进行筛选,确定第二数量个子带图像通道包括:
通过小波变换,将训练集中的训练图像的图像分量由时域转换为小波域,得到每个训练图像对应的第一数量个子带图像通道;
根据能量计算公式,计算每个所述训练图像对应的每个子带图像通道的能量;
根据所述每个训练图像对应的每个子带图像通道的能量,确定所述每个子带图像通道在所述训练图像中的排序;
根据所述每个子带图像通道在所述训练图像中的排序,计算所述训练集中的能量总体排序;
根据所述能量总体排序,确定所述第二数量个子带图像通道的位次;
根据所述第二数量个子带图像通道的位次,对所述第一数量个子带图像通道进行筛选,确定第二数量个子带图像通道;
其中所述训练集中包括至少一个训练图像。
根据本发明提供的小波域CNN学习的图像识别方法,所述能量计算公式如下:
其中,Sc为训练图像中的第c个子带图像通道的能量,Wc为训练图像中的第c个子带图像通道的小波包系数矩阵,Wc(x,y)为训练图像中的第c个子带图像通道的小波包系数矩阵中,位置坐标为(x,y)的数值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110897466.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序