[发明专利]一种基于深度相似性网络的图像分类方法有效
申请号: | 201710313616.8 | 申请日: | 2017-05-05 |
公开(公告)号: | CN108805151B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 胡东平;王兴刚 | 申请(专利权)人: | 杭州微禾迅科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 无锡市汇诚永信专利代理事务所(普通合伙) 32260 | 代理人: | 张欢勇 |
地址: | 310000 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 相似性 网络 图像 分类 方法 | ||
本发明涉及一种基于深度相似性网络的图像分类方法,包括:向训练模型输入训练图像;利用训练模型进行指定次数训练;初始化图像特征提取模型;输入目标图像提取特征;结合训练图像特征进行相似度计算;利用图像特征相似度进行图像分类。本发明通过。构建深度图像特征提取训练模型对指定训练图像进行深度训练并采用交叉熵损失函数优化训练模型,在进行实际图像特征提取时加入训练图像提取的特征值进行相似性计算,通过该计算模型实现精确图像分类,首次提出加入相似性计算的图像分类方法,有效提高了图像分类精度。
技术领域
本发明涉及一种基于深度相似性网络的图像分类方法,尤其涉及一种视频图像识别与分类处理领域的深度网络图像分类方法。
背景技术
随着多媒体和互联网技术的不断发展和相互融合,图片作为最直观传递信息的媒体形式之一正在以几何数量递增的趋势出现在互联网和人们的视线中,在给我们提供丰富而多维度的信息量同时,也因数量庞大而产生很多冗余和垃圾图片,因此如何对图片进行分类识别是提供高效图片检索和管理的前提,也是需要不断优化的技术课题。
目前已经有较为成熟的基于深度学习的图片分类方法,且已经取得较好效果。但这些深度学习模型往往都是先采用训练图片库的图片对模型进行训练,得到特定模型参数后在应用到实际的图片分类中,这样会导致训练图库与实际分类图片的关联性较弱,进而影响实际的图片分类精度,效果仍然有待提高。
发明内容
针对目前图片分类计数中存在的不足,本发明涉及一种基于深度相似性网络的图像分类方法,通过从特定的训练图片池中随机选择特定熟练的训练图片,将所述图片依次输入特定的训练模型,进行两次训练操作,在训练中根据交叉熵损失函数的计算结果不断调整模型参数值,并在训练结束后提取训练图片的图像特征值,进一步的采用该训练参数初始化实际图片分类模型,将实际待分类图片输入该模型进行特征提取,并正对提取的特征按照特定的相似度计算算法加入训练图像的特征值进行计算,根据计算结果得出更精确的高特征值,最后根据这些图像特征值对图片进行分类。本发明通过构建深度图像特征提取训练模型对指定训练图像进行深度训练并采用交叉熵损失函数优化训练模型,在进行实际图像特征提取时加入训练图像提取的特征值进行相似性计算,通过该计算模型实现精确图像分类,首次提出加入相似性计算的图像分类方法,有效提高了图像分类精度。
本发明解决其技术问题所采用的技术方案包括以下步骤:
训练图片输入步骤,从指定训练图像中随机选择特定数目以及指定类型的图片作为训练图像。
模型训练步骤,通过构建特定的训练模型并向该模型输入训练图片进行特定次数训练得到图像特征提取模型参数。
优选的,所述训练模型包括:单卷积层、ReLU激活层、池化层、全连接层、交叉熵损失函数判定层和图像特征提取层。
优选的,所述单卷积层有64个5*5卷积核,卷积公式为:
Zl(Xi)=Wl*Fl-1(Xi)+Bl
其中l表示全连接层的层数,输入为Fl-1表示第l-1层的输出,Wl为第l层的权值参数,Bl为第l层的偏置参数,Fl表示第l层的全连接后的输出。
优选的,所述池化层采用的核心大小为3*3,步长为2个像素;所述全连接层第一层采用384个输出结点,第二层采用192个输出结点。
优选的,所述训练模型的训练方法为:利用网络的预测类别标签与真实类别标签,采用反向传播算法来训练双通道卷积神经网络。
优选的,所述交叉熵损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微禾迅科技有限公司,未经杭州微禾迅科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710313616.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于格网地形特征的空域可通行性分析方法
- 下一篇:一种场景分类方法及装置