[发明专利]图像分类过程的优化方法、图像分类方法、装置及系统有效
申请号: | 201710362944.7 | 申请日: | 2017-05-22 |
公开(公告)号: | CN108960265B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 魏溪含;申晨 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/04 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 李辉;周达 |
地址: | 英属开曼*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 过程 优化 方法 装置 系统 | ||
本申请实施方式公开了一种图像分类过程的优化方法、图像分类方法、装置及系统,其中,所述图像分类过程的优化方法包括:生成样本集中的图像样本的表征向量;基于所述表征向量输出评价信息;在属于所述第一类别的图像样本对应的表征向量中选择一个表征向量作为基准表征向量,计算所述基准表征向量对应的第一差异值和第二差异值,并根据所述第一差异值和所述第二差异值的差值生成第一反馈值;根据所述表征向量表示的图像样本在所述样本集中隶属的类别以及所述评价信息得到第二反馈值;使用所述第一反馈值和所述第二反馈值执行优化矫正过程。本申请提供的技术方案,能够提高图像分类的精度。
技术领域
本申请涉及互联网技术领域,特别涉及一种图像分类过程的优化方法、图像分类方法、装置及系统。
背景技术
随着大数据时代的来临,图像分类器正在各行各业发挥着重要的作用。图像分类器通常可以对海量的数据进行分析,提取出数据中的特征,并依据提取的特征将数据进行分类。
在图像分类器中,通常可以划分为训练阶段和预测阶段。其中,训练阶段可以采用大量的已经进行分类的数据样本,对分类器涉及的神经网络进行训练,以使得训练后的神经网络能够正确地将数据样本划分至所属的类别中。预测阶段则可以向完成训练的神经网络中输入待分类的数据,神经网络在对输入的待分类的数据进行计算之后,可以输出该数据对应的类别信息,从而完成预测的过程。
然而,在当前的图像分类器中,通常只能根据数据的全局特征对数据进行分类。例如,当前可以通过LeNet-5和softmax组合的神经网络进行图片分类,还可以通过Inception-v4和softmax组合的神经网络进行图片分类。这些分类方法在对全局特征存在明显差异的对象进行分类时效果较好。例如,现有的图像分类器在对表示“碗”、“球”、“房子”这些图片进行分类时,通常能够得到较精准的分类结果。但是在对存在相同或者相似局部特征的对象进行分类时,效果往往不够好。例如,现有的图像分类器通常难以很好地对“碗”和“盆”进行识别。由上可见,在针对特征相似的对象时,现有的图像分类器存在分类精度较低的问题。
发明内容
本申请实施方式的目的是提供一种图像分类过程的优化方法、图像分类方法、装置及系统,能够提高图像分类的精度。
为实现上述目的,本申请实施方式提供一种图像分类过程的优化方法,提供有包括图像样本的样本集,所述图像样本被划分为第一类别和第二类别;所述第一类别和所述第二类别中包括的图像样本不同;所述方法包括:生成所述样本集中的图像样本的表征向量;所述表征向量用于表示对应的图像样本;基于所述表征向量输出对应图像样本相应于所述第一类别和所述第二类别的评价信息;在属于所述第一类别的图像样本对应的表征向量中选择一个表征向量作为基准表征向量,计算所述基准表征向量与所述第一类别中其它图像样本的表征向量之间的第一差异值;以及计算所述基准表征向量与所述第二类别中图像样本的表征向量之间的第二差异值;根据所述第一差异值和所述第二差异值的差值,生成第一反馈值;根据所述图像样本在所述样本集中隶属的类别以及所述评价信息得到第二反馈值;使用所述第一反馈值和所述第二反馈值执行优化矫正过程。
为实现上述目的,本申请实施方式还提供一种图像分类过程的优化装置,所述装置包括存储器和处理器,其中:所述存储器,用于存储包括图像样本的样本集,所述图像样本被划分为第一类别和第二类别;所述第一类别和所述第二类别中包括的图像样本不同;所述处理器,用于生成所述样本集中的图像样本的表征向量;所述表征向量用于表示对应的图像样本;基于所述表征向量输出对应图像样本相应于所述第一类别和所述第二类别的评价信息;在属于所述第一类别的图像样本对应的表征向量中选择一个表征向量作为基准表征向量,计算所述基准表征向量与所述第一类别中其它图像样本的表征向量之间的第一差异值;以及计算所述基准表征向量与所述第二类别中图像样本的表征向量之间的第二差异值;根据所述第一差异值和所述第二差异值的差值,生成第一反馈值;根据所述图像样本在所述样本集中隶属的类别以及所述评价信息得到第二反馈值;使用所述第一反馈值和所述第二反馈值执行优化矫正过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710362944.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:分类模型的训练方法及装置
- 下一篇:用于模型调整的系统和方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序