[发明专利]一种时尚图像主色调解析方法有效
申请号: | 201910375048.3 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110097603B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 黄博;胡玉琛;吴磊彬;林博 | 申请(专利权)人: | 上海宝尊电子商务有限公司 |
主分类号: | G06T7/90 | 分类号: | G06T7/90;G06N3/0464;G06N3/084 |
代理公司: | 上海卓阳知识产权代理事务所(普通合伙) 31262 | 代理人: | 周春洪 |
地址: | 200436 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时尚 图像 色调 解析 方法 | ||
1.一种时尚图像主色调解析方法,其特征在于,包括如下步骤:
S1、深度学习时尚服饰检测框架的构建;
S2、目标检测损失函数的设计;
S3、时尚服饰前景目标区域的提取预处理;
S4、时尚服饰候选区域的主色调解析操作;
所述步骤S4包括:
S41、为了确保候选区域的主色调在人眼范围内可以明确的分辨,避免解析过程的精确度低问题,将图像的主色调人为的归纳为59种常见时尚色系,根据像素间的欧式距离判别候选区域的色调归类,在时尚单品提取解析中,遍历候选区域,以便得到最终的主色调排序,根据排序的结果,计算每一种色调所占的比例,将几种所占比例靠前的色调作为服饰的主色调;
S42、同样的,对于时尚单品牌的主色调解析,可以将该品牌的所有图像输入深度学习检测模型并做抠图预处理,融合所有的图像像素归类信息,根据排序结果选取相应的品牌主色调;
S43、在S41和S42中,采用人为的选取常见色系,类似于聚类的方式,
在特定感兴趣类别的选取上,是为了满足特定服饰的需求而制定的规则,但是这种规则在一定程度上并不具备通用性,为了降低这种不通用性的影响;在以上主色调计算的过程中加入了普适性的主色调计算方式,将全局图像的所有像素点色调信息枚举出来,并根据小的距离阈值做相邻合并处理,突出小部分的色调信息与59种色调做加权和的计算,均衡化解析结果。
2.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S1包括:
S11、深度学习时尚服饰检测框架包括服饰特征提取、检测框的预测以及包围框的回归,三个模块分别对应卷积神经网络中的卷积计算、前向传播输出和误差反向传播;卷积计算是一个滤波的过程,可以将网络学习参数逐渐收敛从而提取感兴趣的目标特征;前向传播是卷积神经网络特征提取金字塔的传递,将低层的纹理和轮廓信息逐层抽象表达;训练过程中每一次的训练都是对目标结果的收敛过程,包围框的回归是目标输出过程中对二维位置信息的逐步收敛;
S12、采用生层建议窗框形式,通过多层卷积计算和池化操作,从底层到高层逐渐的缩减特征层大小,并且将预测方式直接作用于特征图,每张图生成300个建议窗口,预测每一个特征单元的所属类归属;
S13、在每一个特征图中,构建多个预测框,预检测框映射到卷积神经网络的最后一层卷积特征层上,通过池化层使每个感兴趣区域生成固定尺寸的特征图。
3.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S2包括:
S21、在预测阶段,为了去除相关度不高且重叠率较大的默认框,常按照匹配分数从高到低排序,利用非极大值抑制的方法,搜索局部极大值,抑制非极大值;在用于时尚服饰图像识别检测过程中,采用随机梯度下降算法和端到端的检测模型,首先利用大数据集上的预训练模型权重对服饰的训练图像进行模型训练,得到目标检测模型,然后利用训练性能好的推理模型进行时尚服饰的检测测试,得到检测结果。
4.根据权利要求1所述的一种时尚图像主色调解析方法,其特征在于,所述步骤S3包括:
S31、经过时尚服饰的位置区域提取之后,表明该区域内为服饰前景,根据抠图原理:对于一幅图像I,可表示为前景F和背景B在因子α作用下的加权和:
I=αF+(1-α)B,α∈[0,1]
S32、对于S31中的式子,其中I为已知量,而α、F、B均为未知量,要解决这样一个病态的方程必须附加一定的约束条件,恰好在深度学习检测模型的辅助之下,找到了属于背景B的归属像素区域,同样的,感兴趣区域的前景F部分也在标注框内,进一步明确了下一步的工作是重点突破α值的确定;
S33、在深度学习检测模型的帮助下检测到的时尚服饰区域,该区域内存在多种噪声,为了降低噪声对抠图精度的影响,采用双边滤波方式将噪声滤除,使得该区域内的边缘信息更加明确突出。
5.根据权利要求1所述的方法,其特征在于,步骤S1中构建含有11层卷积层、11层池化层和6层特征提取层,每一层特征提取层预测300个候选框,在训练阶段候选框中的正负样本保持在1:3维持正常训练,在测试阶段设置0.6的重叠联合比,并以非极大值抑制算法减小大量多余的预测候选框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海宝尊电子商务有限公司,未经上海宝尊电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910375048.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序