[发明专利]一种基于深度学习模型的少数民族服饰分类方法和系统在审
申请号: | 202211349937.0 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115690844A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 齐丹丹;蒋抒博;刘降斌;张淦为 | 申请(专利权)人: | 哈尔滨商业大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/764;G06V10/766;G06V10/82;G06V10/80;G06V10/28 |
代理公司: | 成都高远知识产权代理事务所(普通合伙) 51222 | 代理人: | 郑勇力;全学荣 |
地址: | 150000 黑*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 模型 少数 民族服饰 分类 方法 系统 | ||
1.一种基于深度学习模型的少数民族服饰分类方法,其特征在于,包括如下步骤:
步骤1,输入少数民族服饰图像;
步骤2,采用深度学习模型的分割模块对少数民族服饰图像中的帽子、衣服及鞋子进行分割,构造二值图像;
步骤3,采用深度学习模型的回归模块对所述二值图像进行分类,得到少数民族服饰的分类结果;
其中,所述分割模块从输入到输出依次包括如下部分:
(1)3×3卷积层;
(2)R block模块和Max pooling层;
(3)R block模块和Max pooling层;
(4)R block模块;
(5)反卷积层;
(6)反卷积层和R block模块;
(7)反卷积层和R block模块;
(8)R block模块;
(9)1×1卷积层;
其中,3×3卷积层的特征图通过快捷连接级联到部分(7)中的反卷积层,部分(2)的Maxpooling层的特征图通过快捷连接级联到部分(6)中的反卷积层,部分(3)的Max pooling层的特征图通过快捷连接级联到部分(5)中的反卷积层。
2.按照权利要求1所述的分类方法,其特征在于:所述R block模块从输入到输出依次包括如下部分:
(a)特征输入层;
(b)1×1卷积层,将通道数变为3C;
(c)3×3卷积层和批归一化层;
(d)3×3卷积层和批归一化层;
(e)Seg block层;
(f)1×1卷积层和级联操作,将通道数变为C;
(g)输出层;
其中,部分(b)中的1×1卷积层的输出通过快捷连接级联到部分(f)的级联操作。
3.按照权利要求2所述的分类方法,其特征在于:所述Seg block层从输入到输出依次包括如下部分:
(i)特征输入层;
(ii)空洞卷积层,将通道数变为C/2;
(iii)1×1卷积层和一个Hadamard product层,将通道数变为C;
(iv)输出层;
其中,一个快捷连接将特征输入层与1×1卷积层输出进行Hadamard product操作。
4.按照权利要求3所述的分类方法,其特征在于:所述Hadamard product是行列数都相同的两个矩阵进行的矩阵计算操作,新矩阵的元素定义为两个矩阵对应元素的乘积。
5.按照权利要求1所述的分类方法,其特征在于:所述二值图像中,帽子的轮廓及内部的像素值、衣服的轮廓及内部的像素值和鞋子的轮廓及内部的像素值分别为1、2、3;轮廓外部图像为背景,像素值为4。
6.按照权利要求1所述的分类方法,其特征在于:所述分割模块的训练过程中,采用损失函数L进行优化,损失函数L的表达式如下:
其中:W为二值图像的宽,H为二值图像的高,N为类别数且N=4,P(i,j,n)为神经网络输出图像中第j行第i列像素为类别n的概率,G(i,j,n)为对应训练集样本的二值图像中第j行第i列像素所属为n的类别,类别1表示像素为帽子的轮廓及内部,类别2表示像素为衣服的轮廓及内部,类别3表示像素为鞋子的轮廓及内部,类别4表示像素为背景区域。
7.按照权利要求1所述的分类方法,其特征在于:所述分割模块的训练过程中,采用损失函数Li进行优化,损失函数Li的表达式如下:
其中:为像素所在类别的概率,为像素类别的种类,N为类别数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨商业大学,未经哈尔滨商业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211349937.0/1.html,转载请声明来源钻瓜专利网。