[发明专利]用于画作多标签识别的神经网络及相关方法、介质和设备有效
申请号: | 201910001380.3 | 申请日: | 2019-01-02 |
公开(公告)号: | CN109754015B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 王婷婷 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 付生辉 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 画作 标签 识别 神经网络 相关 方法 介质 设备 | ||
1.一种利用神经网络进行多标签识别的训练方法,其特征在于,
所述神经网络包括:
残差注意力网络,用于接收画作图像并输出第一特征图;
内容标签网络,用于接收所述第一特征图并输出内容标签的预测概率;
题材标签网络,用于接收所述第一特征图并输出题材标签的预测概率;以及
类别标签网络,用于接收所述第一特征图并输出类别标签的预测概率;
所述训练方法包括:
使用类别标签训练数据集对残差注意力网络和类别标签网络进行训练;
使用内容标签训练数据集进行训练,调整所述残差注意力网络参数并对内容标签网络进行训练,同时保持类别标签网络参数不变;
使用题材标签训练数据集进行训练,保持残差注意力网络、内容标签网络和类别标签网络参数不变,调整题材标签网络参数;以及
使用类别标签训练数据集进行训练,仅对类别网络进行训练。
2.根据权利要求1所述的训练方法,其特征在于,还包括:
残差网络,用于接收所述第一特征图并输出降维的第二特征图。
3.根据权利要求2所述的训练方法,其特征在于,所述内容标签网络包括:
空间正则化子网络,用于接收所述第一特征图并输出内容标签的第一预测概率;
第一子网络,用于接收所述第二特征图并输出内容标签的第二预测概率;
其中所述第一预测概率和第二预测概率通过取平均值计算得到所述内容标签的预测概率。
4.根据权利要求3所述的训练方法,其特征在于,所述第一子网络包括:
第一卷积层,用于接收所述第二特征图并输出第三特征图;
第一平均池化层,用于接收第三特征图并输出第四特征图;
第一全连接层,用于接收第四特征图并输出所述第二预测概率。
5.根据权利要求2所述的训练方法,其特征在于,所述题材标签网络包括:
第一加权模块,用于对所述第二特征图的每个通道生成权重并将所述权重加权到所述第二特征图的特征上,从而生成第五特征图;
标签相关性网络,包括顺序连接的多个卷积层,用于对所述第五特征图进行卷积输出第六特征图;
第二全连接层,用于接收第六特征图并输出所述题材标签的预测概率。
6.根据权利要求2所述的训练方法,其特征在于,所述类别标签网络包括:
第二加权模块,用于对所述第二特征图的每个通道生成权重并将所述权重加权到所述第二特征图的特征上,从而生成第七特征图;
第二卷积层,用于接收第七特征图并输出第八特征图;
第二平均池化层,用于接收第八特征图并输出第九特征图;
第三全连接层,用于接收第九特征图并输出所述类别标签的预测概率。
7.根据权利要求4所述的训练方法,其特征在于,
所述残差网络包括1*1*512卷积层、3*3*512卷积层和1*1*2048卷积层,所述第一特征图连续经过1*1*512卷积层、3*3*512卷积层和1*1*2048卷积层输出7*7*2048大小的第二特征图;
所述第一卷积层由2048个3*3大小步长为2的卷积层组成;
所述第一平均池化层为3*3大小,所述第四特征图具有2048维特征向量。
8.根据权利要求5所述的训练方法,其特征在于,
所述残差网络包括1*1*512卷积层、3*3*512卷积层和1*1*2048卷积层,所述第一特征图连续经过1*1*512卷积层、3*3*512卷积层和1*1*2048卷积层输出7*7*2048大小的第二特征图;
所述第五特征图为7*7*2048大小;
所述多个卷积层包括K个1*1*2048卷积层,512个1*1*K卷积层,512个1*1*512卷积层以及2048个7*7*1大小并且分为512组每组4个卷积核的卷积层,所述第五特征图连续经过所述多个卷积层,输出所述第六特征图,其中K为题材标签种类个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910001380.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:工业模型训练方法、装置、设备及介质
- 下一篇:图片数据智能识别系统