[发明专利]一种图像中物体类别的识别方法、装置、设备及存储介质在审
| 申请号: | 202210242523.1 | 申请日: | 2022-03-11 |
| 公开(公告)号: | CN114612719A | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 侯卫锋;徐晓舟;叶建位 | 申请(专利权)人: | 浙江中智达科技有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张艺 |
| 地址: | 310012 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 图像 物体 类别 识别 方法 装置 设备 存储 介质 | ||
1.一种图像中物体类别的识别方法,其特征在于,包括:
接收待识别的目标图像;
利用基于特征图信息熵进行剪枝训练得到的目标物体类别识别模型对所述目标图像中的物体进行识别操作,得到目标物体类别;
对所述目标物体类别进行输出操作。
2.根据权利要求1所述的图像中物体类别的识别方法,其特征在于,还包括对所述目标物体类别识别模型的剪枝训练过程,所述对所述目标物体类别识别模型的剪枝训练过程包括:
利用预选取的训练图像集对预构建的神经网络模型进行训练,得到当前物体类别识别模型;
获取当前物体类别识别模型中各卷积层分别对应的剪枝率和原始输出通道数;
根据各所述剪枝率和各所述原始输出通道数计算各所述卷积层分别对应的剪枝后的目标通道数;
获取预设剪枝轮数;
结合所述预设剪枝轮数和所述目标通道数对当前物体类别识别模型进行逐轮剪枝操作,得到所述目标物体类别识别模型。
3.根据权利要求2所述的图像中物体类别的识别方法,其特征在于,结合所述预设剪枝轮数和所述目标通道数对当前物体类别识别模型进行逐轮剪枝操作,包括:
获取各所述卷积层输出的各特征图;
分别对各所述特征图进行信息熵计算,得到各所述特征图分别对应的信息熵;
针对每个卷积层,对各所述信息熵进行大小排序,得到排序结果;
对所述原始输出通道数和所述目标通道数进行差值计算,得到剪枝通道数;
根据所述排序结果,从信息熵小的一端选取所述剪枝通道数的特征图,并将选取到的各所述特征图确定为目标特征图;
获取当前物体类别识别模型的模型权重;其中,所述模型权重包括过滤器权重;
分别对各所述目标特征图对应的过滤器权重进行置零操作;
判断是否达到所述预设剪枝轮数;
若否,则利用所述训练图像集对过滤器权重置零操作得到的当前物体类别识别模型进行训练操作,得到重置后的各过滤器权重,并重复执行所述获取各所述卷积层输出的各特征图的步骤;
若是,则对各所述卷积层中过滤器权重为零的通道进行剪枝操作。
4.根据权利要求3所述的图像中物体类别的识别方法,其特征在于,分别对各所述特征图进行信息熵计算,得到各所述特征图分别对应的信息熵,包括:
针对每个卷积层,获取各所述特征图对应的过滤器权重中的最大值和最小值;
获取预设分区数;
根据所述最大值、所述最小值以及所述预设分区数计算各所述卷积层分别对应的权重跨度;
分别对各所述特征图对应的过滤器权重进行向量展平操作,得到各目标向量;
按照所述预设分区数分别对各所述目标向量进行平均分区操作,得到各权重分区;
根据所述权重跨度计算各所述特征图对应的过滤器权重处于每个权重分区的概率,得到各概率计算结果;
根据各所述概率计算结果计算各所述特征图分别对应的信息熵。
5.一种图像中物体类别的识别装置,其特征在于,包括:
图像接收模块,用于接收待识别的目标图像;
物体类别识别模块,用于利用基于特征图信息熵进行剪枝训练得到的目标物体类别识别模型对所述目标图像中的物体进行识别操作,得到目标物体类别;
物体类别输出模块,用于对所述目标物体类别进行输出操作。
6.根据权利要求5所述的图像中物体类别的识别装置,其特征在于,还包括剪枝训练模块,所述剪枝训练模块包括:
模型训练子模块,用于利用预选取的训练图像集对预构建的神经网络模型进行训练,得到当前物体类别识别模型;
剪枝率及通道数获取子模块,用于获取当前物体类别识别模型中各卷积层分别对应的剪枝率和原始输出通道数;
通道数计算子模块,用于根据各所述剪枝率和各所述原始输出通道数计算各所述卷积层分别对应的剪枝后的目标通道数;
剪枝轮数获取子模块,用于获取预设剪枝轮数;
模型剪枝子模块,用于结合所述预设剪枝轮数和所述目标通道数对当前物体类别识别模型进行逐轮剪枝操作,得到所述目标物体类别识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江中智达科技有限公司,未经浙江中智达科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210242523.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于ELK的日志自动化分析系统
- 下一篇:一种用于回转工作台的夹紧装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





