[发明专利]用于语义分割的系统、方法和非暂时性计算机可读介质在审
申请号: | 202010004326.7 | 申请日: | 2020-01-02 |
公开(公告)号: | CN111209910A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 毛红达;项伟 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;京东美国科技公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 范芳茗 |
地址: | 100086 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 语义 分割 系统 方法 暂时性 计算机 可读 介质 | ||
1.一种用于语义分割的系统,所述系统包括计算设备,所述计算设备包括处理器和存储计算机可执行代码的非易失性存储器,其中所述计算机可执行代码当在所述处理器处执行时被配置为:
接收场景的图像;
由编码器处理所述图像以形成编码器特征图;
由金字塔池化模块PPM处理所述编码器特征图以形成PPM特征图;并且
由解码器处理所述PPM特征图以形成分割特征图。
2.根据权利要求1所述的系统,其中所述编码器包括ResNet18主干网,所述ResNet18主干网的第四块被截去。
3.根据权利要求2所述的系统,其中所述编码器顺序地由以下组成:
具有两个层的根、第一块、第二块和第三块,
其中所述块中的每一个具有第一重复单元、第二重复单元、第三重复单元和第四重复单元,所述第一重复单元被卷积并添加到所述第二重复单元的输出,所述第三重复单元被卷积并添加到所述第四重复单元的输出,并且所述根的所述两个层中的每一个和所述第一块、第二块和第三块中的每个重复单元由3×3卷积层、批量归一化BN层和整流线性单元ReLU组成。
4.根据权利要求3所述的系统,其中所述根的两层、所述第一块、所述第二块和所述第三块的高度、宽度和通道尺寸分别为256×512×64、128×256×64、128×256×64、64×128×128和32×64×256。
5.根据权利要求1所述的系统,其中所述PPM包括:
不同大小的金字塔池化特征;
双线性上采样层;
1×1卷积层;以及
ReLU层。
6.根据权利要求5所述的系统,其中所述金字塔池化特征包括1×1×512特征、2×2×512特征、3×3×256特征和6×6×256特征。
7.根据权利要求6所述的系统,其中所述双线性上采样层的尺寸为32×64×1536,并且所述1×1卷积层和所述ReLU层中的每一个的尺寸为32×64×256。
8.根据权利要求1所述的系统,其中所述解码器顺序地包括:
第一级反卷积上采样块;
第二级反卷积上采样块;以及
双线性上采样块。
9.根据权利要求8所述的系统,其中:
所述第一级反卷积上采样块包括第一卷积层、第一反卷积上采样层、第一BN层、第二卷积层、第二BN层和第一ReLU层;
所述第二级反卷积上采样块包括第三卷积层、第二反卷积上采样层、第三BN层、第四卷积层、第四BN层和第二ReLU层;
所述双线性上采样块包括双线性上采样层和第五卷积层;并且
所述第一卷积层被卷积并添加到所述第二BN层,并且所述第三卷积层被卷积并添加到所述第四BN层。
10.根据权利要求9所述的系统,其中:
所述第一反卷积层的尺寸为32×64×256;
所述第一反卷积上采样层和所述第一BN层的尺寸为64×128×256;
所述第二卷积层、所述第二BN层、所述第一ReLU层和所述第三卷积层的尺寸为64×128×128;
所述第二反卷积上采样层和所述第三BN层的尺寸为128×256×128;
所述第四卷积层、所述第四BN层和所述第二ReLU层的尺寸为128×256×64;
所述双线性上采样层的尺寸为512×1024×64;并且
所述第五卷积层的尺寸为512×1024×20。
11.根据权利要求1所述的系统,其中所述计算机可执行代码还被配置为基于所述分割图来控制所述场景中的操作设备。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;京东美国科技公司,未经北京京东尚科信息技术有限公司;京东美国科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010004326.7/1.html,转载请声明来源钻瓜专利网。