[发明专利]语义多头注意力机制的高分辨率遥感影像多标签分类方法在审
| 申请号: | 202111090408.9 | 申请日: | 2021-09-17 |
| 公开(公告)号: | CN114091509A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 肖志峰;谈筱薇 | 申请(专利权)人: | 武汉大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语义 多头 注意力 机制 高分辨率 遥感 影像 标签 分类 方法 | ||
1.语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于,包括如下步骤:
步骤1),将样本放入输入到所构建的模型中进行训练,获得训练好的权重,所构建的模型包括特征提取模块、语义敏感模块、语义关系构建模块;
步骤2),将测试区遥感影像作为输入源输入进步骤1)中的构建的模型;
步骤3),利用特征提取模块对图像进行特征编码,得到特征图F,所述特征提取模块为DCNN模型;
步骤4),将F输入语义敏感模块,得到内容感知的类别表达S;所述语义敏感模块包含两个分支,其中一个分支为一个1*1的卷积层,对特征图F进行尺度变换,得到F‘;另一个分支为1*1的卷积层和一个Sigmoid的激活函数,得到类别激活图A;最后将A与F‘相乘,得到内容感知的类别表达S;
步骤5),将S输入语义关系构建模块,得到特征表达T;所述语义关系构建模块包含多头注意力机制的语义关系推理子模块、1*1的卷积层和Sigmoid激活层;每个多头注意力机制的语义关系推理子模块包含归一化层、多头注意力层MSA、归一化层和前馈网络FFN;
步骤6),将T输入到二值分类器中,得到最终的分类结果。
2.如权利要求1所述的语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于:所述多头注意力层MSA是定义h个注意力头,也就是用h个自注意力模块应用于S,S可以分为h个X序列,每一个X序列的大小为N×d,其中D=hd,N为类别数,D为每一个类别特征表达的维度;将h个注意力头的结果连接在一起,最终通过线性变换WO得到输出H,H的大小是N×D,如公式(1)所示;其中,对于第i个h序列,注意力模块会学习三个权重矩阵,分别为由公式(2)可以得到Q、K、V三个向量。对于给定的Q向量,通过内积计算匹配k个关键向量,维数为d,也就是说通过公式(3)可以计算自注意力的输出;
MSA(S)=Concat(head1,…headh)WO
headi=Attention(Qi,Ki,Vi) (1)
其中,headi为第i个自注意力模块;
其中,Softmax(·)为Softmax函数,上标T表示转置,dk为k个关键向量的维度。
3.如权利要求1所述的语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于:所述前馈网络FFN包含两个全连接层和一个GeLU激活层。
4.如权利要求1所述的语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于:步骤5)的具体处理过程如下;
将S输入多头注意力机制的语义关系推理子模块中,得到特征表达H,对H进行1*1的卷积操作,然后利用Sigmoid激活函数激活得到关系矩阵R,将R与H相乘在利用LeakyReLU激活函数激活得到特征表达T,T通过公式(4)计算,
T=f(S(Conv(H,w)H) (4)
其中Conv(H,w)表示H与w的卷积,w是滤波器,S(·)表示Sigmoid激活函数,f(·)表示LeakyReLU激活函数。
5.如权利要求4所述的语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于:步骤6)中二值分类器的表达式如下;
其中,Ti表示第i个类别的特征表达。
6.如权利要求1所述的语义多头注意力机制的高分辨率遥感影像多标签分类方法,其特征在于:所述DCNN模型包括VGG16、ResNet50、DenseNet201。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090408.9/1.html,转载请声明来源钻瓜专利网。





