[发明专利]一种最大化互信息的图像分类方法、设备、介质及系统在审
申请号: | 202111170350.9 | 申请日: | 2021-10-08 |
公开(公告)号: | CN113936173A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 戴文睿;王曜明;刘育辰;李成林;邹君妮;熊红凯 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 最大化 互信 图像 分类 方法 设备 介质 系统 | ||
本发明提供一种最大化互信息的图像分类方法、设备、介质及系统,包括:采集训练图像;最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。本发明基于给定图像数据,通过最大化互信息方式,自动设计确定神经网络的网络结构和参数,用于图像分类,无需繁杂的人工设计,节省人力资源和计算资源消耗。本发明能在极短的时间内,自动设计得到基于神经网络的图像分类方法,同时能实现较高的图像分类准确率。
技术领域
本发明涉及人工智能和图像处理技术领域,具体涉及一种最大化互信息的图像分类方法,及其计算机设备及可读存储介质。
背景技术
随着大数据的发展和计算能力的提升,人工智能技术在近些年来取得了飞速的发展,工业界对于图像分类等图像处理的应用需求也越来越高。早期的图像处理受到采集设备的限制,得到图像质量不高,主要采用的技术是手工特征提取,一些手工设计的特征提取算子例如HoG和信号处理方法例如小波分析,促进了图像处理的早期发展。但是手工设计的特征提取算子是科学家基于对给定图像的先验认识和分析设计得到的,其不可避免地保留着人为先验带来的偏见,在图像分类任务上表现的性能始终无法超越人类。而神经网络则是将特征提取器和分类器联合在一起进行端到端的训练,大数据驱动的方式使得网络自动学习到最适用于图像分类目标的特征提取滤波器组。神经网络的出现摒弃了人为的手工设计特征提取算子,并且在图像分类任务上达到了超越人类专家的性能。虽然神经网络的出现使得人们无需手工设计特征提取算子,节省了人力资源消耗,并且提高了图像分类性能,但是本身神经网络的架构仍然依赖手工设计搭建。
在过去的十多年里,手工设计的神经网络在图像分类等图像处理任务上取得了不错的性能,但日益复杂的神经网络以及多元的图像分类需求使得设计神经网络成为了一种繁杂、效率低下且人力和计算资源消耗大的工作。最大化互信息的图像分类方法则赋予机器自主设计针对特定图像分类的神经网络的能力,同时能在极短的时间内自动设计得到性能较好的神经网络模型,为工业应用中针对图像分类任务的神经网络搭建提供了一种更加高效和便捷的解决方案,例如高效应用于不同种类的图像数据(如自然图像、医学图像等),高效配置于不同计算资源的设备(如中心服务器、边缘设备等)。随着大数据的发展和计算能力的提升,基于神经网络的图像分类方法在近些年来得到了一定的关注和发展,比如,Googlenet、Resnet、Densenet等神经网络架构在自然图像数据集ImageNet上的图像分类精度已经超过人类,但是繁杂的人力资源消耗,冗长的网络设计时间和特定的面向数据集使得基于神经网络的图像分类方法的实用性较差。因此,现在需要新的基于神经网络的图像分类方法能大幅度降低神经网络设计的时间,同时能保证较高的性能,使得图像分类方法能高效地部署在实际工业应用中。
另外,现有的基于神经网络的图像分类方法还存在以下不足:(1)针对特定的图像数据,专家手工设计基于神经网络的图像分类方法,设计过程繁杂且需要消耗大量的人力资源和计算资源;(2)手工设计的基于神经网络的图像分类方法,由于专家知识的局限,导致其不是最佳的神经网络,图像分类的性能有较大提升空间。(3)目前现有的自动设计神经网络的图像分类方法,其计算代价较高,需要花费大量的时间,同时性能也有一定的提升空间。
发明内容
本发明针对现有技术的不足,提供了一种最大化互信息的图像分类方法,能根据给定的图像数据,自动确定神经网络的网络结构和参数,用于图像分类,大幅度减少设计时间和人力资源消耗,同时能实现更高的图像分类准确率。
根据本发明的一个方面,提供一种最大化互信息的图像分类方法,包括:
采集训练图像;
最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数;
采用得到的所述神经网络对待分类的图像数据进行处理,得到图像分类结果。
优选地,将采集到的训练图像分为两部分;所述最大化训练图像和神经网络结构的互信息,自动确定神经网络的网络结构和参数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111170350.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆快速暖机控制方法、车辆和存储介质
- 下一篇:一种网络数据访问系统及方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序