[发明专利]一种基于方向性全卷积网络的语义分割方法有效
| 申请号: | 202010669134.8 | 申请日: | 2020-07-13 |
| 公开(公告)号: | CN111882563B | 公开(公告)日: | 2022-05-27 |
| 发明(设计)人: | 武伯熹;蔡登 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06N3/04;G06N3/08 |
| 代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 彭剑 |
| 地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 方向性 卷积 网络 语义 分割 方法 | ||
1.一种基于方向性全卷积网络的语义分割方法,其特征在于,包括:
(1)构建一个方向性全卷积网络;
(2)将构建的方向性全卷积网络的顶层加入池化层和全连接层,构成第一深度模型,并在大型数据集上进行预训练;
(3)提取预训练好的第一深度模型中的方向性全卷积网络部分,使用全卷积层初始化方向性全卷积网络的参数,并在其后加入新的全连接层,构成第二深度模型;
(4)使用图片语义分割的数据集训练第二深度模型,直到模型收敛;
(5)利用训练后的第二深度模型对待测图片进行分析,预测图像中每个像素所属的类别,形成图像语义分割图输出。
2.根据权利要求1所述的基于方向性全卷积网络的语义分割方法,其特征在于,步骤(1)中,方向性卷积的定义如下:
其中,yco是输出的第co个特征,ci代表输入特征的索引,总计Ci个特征值;S为卷积计算过程中采样的像素的位置集合;ws,ci、xs,ci和bco分别代表线性运算过程中所需的权重、输入以及偏移量;S的选取从如下动态集合中选取:
Mk={(s1,s2)|(s1-e1)2+(s2-e2)2≤22;
s1,s2∈[-2,2];s1,s2∈Z}∪{(0,0)}
其中,k的取值范围为0到15的整数,代表着16个不同的方向;S的具体取值规则为:
S=M(ci%16)
其中,ci代表输入通道的索引,除以16取余代表将其分类至16个不同的组别。
3.根据权利要求1所述的基于方向性全卷积网络的语义分割方法,其特征在于,步骤(2)中,所述的大型数据集采用大规模图像识别数据集ImageNet。
4.根据权利要求3所述的基于方向性全卷积网络的语义分割方法,其特征在于,步骤(2)的具体步骤为:
(2-1)在方向性全卷积网络的顶层加入图像池化层,使得图像由三维特征图变成特征向量,随后使用全连接层,将其变形为1000维的向量,对应着ImageNet的1000个图像种类;
(2-2)将构建的第一深度模型在GPU上进行训练,每个GPU单次计算32个图像,8个GPU并行训练;
(2-3)使用SGDM优化算法,初始学习率0.256,并在每30次循环后将学习率降低为10%,共计训练90个循环,Momentum参数设置为0.9,直到模型收敛。
5.根据权利要求1所述的基于方向性全卷积网络的语义分割方法,其特征在于,步骤(3)中,新加入的全连接层采用高斯分布的随机初始化。
6.根据权利要求1所述的基于方向性全卷积网络的语义分割方法,其特征在于,步骤(4)的具体过程如下:
(4-1)将训练集的图片输入第二深度模型中,经计算后产生特征图;
(4-2)将第二深度模型中最后一个跨度卷积置换为非跨度卷积,并将最后一个跨度卷积后所有卷积的扩散率调整为2;
(4-3)采用双线性插值将特征图放大至原始图像大小;
(4-4)将产生的特征送入softmax函数中得到预测序列的概率分布,使用cross-entropy损失函数计算网络上参数的梯度,并使用SGDM优化算法更新参数值;初始学习率设置为10-3;
(4-5)重复上述步骤,直到模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010669134.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钻攻夹具
- 下一篇:一种复合型陶瓷3D打印机的出料控制机构





