[发明专利]一种用于建筑物变化检测的局部背景语义信息增强方法在审
申请号: | 202110382282.6 | 申请日: | 2021-04-09 |
公开(公告)号: | CN112801929A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 吴敦;应良中;孙华;高广;费佳宁;李东;卞婷玉 | 申请(专利权)人: | 宝略科技(浙江)有限公司 |
主分类号: | G06T5/50 | 分类号: | G06T5/50;G06T7/00;G06T3/40 |
代理公司: | 宁波甬致专利代理有限公司 33228 | 代理人: | 高瑞霞 |
地址: | 315199 浙江省宁波市鄞*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 建筑物 变化 检测 局部 背景 语义 信息 增强 方法 | ||
1.一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:该方法包括下列步骤:
步骤一、对比前后时相的两张建筑物原图,在两张建筑物原图上标注出建筑物变化的区域,生成标注矢量文件,其中建筑物原图的高度设为OH,宽度设为OW;
步骤二、分别将前后时相的两张原图裁切成N块高为H、宽为W的小图,其中OH大于H,OW大于W;
步骤三、将步骤一中生成的标注矢量文件,转换为高度为OH、宽度为OW的二值图,再将得到二值图裁切为N块高为h、宽为w的标签,每块标签均位于对应的每块小图的正中间,其中h=H/2,w=W/2;
步骤四、将步骤二中前时相的N块小图分别与后时相的N块小图一一对应进行拼接,拼接后形成的图作为训练样本,并生成训练样本集;
步骤五、构建出深度学习模型;
步骤六、对深度学习模型进行训练:将步骤四中生成的训练样本集输入到步骤五中的深度学习模型勾网络结构中,获得深度学习模型的输出结果,将输出结果与步骤三中的标签输入到损失函数中计算出损失值,再通过反向传播算法以损失值等于0为目标来更新网络权重,不断迭代,实现深度学习模型的训练;
步骤七、任意选取一张待检测的遥感图像,在该遥感图像上应用步骤六中训练得到的深度学习模型。
2.根据权利要求1所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:在步骤六中,勾网络结构包括特征提取模块以及位于特征提取模块一侧的特征映射模块,特征提取模块为四层结构,特征映射模块为三层结构,特征提取模块包括第一模块(1)、第二模块(3)、第三模块(4)以及第四模块(5),第一模块(1)包括:卷积、最大池化以及卷积层,第二模块(3)、第三模块(4)以及第四模块(5)均包括:最大池化以及卷积层,特征映射模块包括第五模块(9)、第六模块(8)以及第七模块(6),第五模块(9)包括:双线性插值上采样、合并以及膨胀卷积层,第六模块(8)以及第七模块(6)均包括:双线性插值上采样、合并以及卷积层。
3.根据权利要求2所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:训练样本集输入到勾网络结构中,获得深度学习模型的输出结果的具体过程为:将训练样本集中的训练样本满尺寸输入到勾网络结构中,经过特征提取模块,生成特征矩阵,再经过特征映射模块,得到输出结果,所述输出结果为两通道的输出结果,所述输出结果的两通道中,一通道代表建筑物没有发生变化,另一通道代表建筑物发生了变化。
4.根据权利要求1所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:在步骤六中,损失函数定义为:,其中,k为像素位置,P为像素总数,为k位置的像素的真实值,令深度学习模型为f(),x为输入图像,那么为模型输出值,为k位置的模型输出值。
5.根据权利要求3所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:步骤七中,在任意选取的一张待检测遥感图像上应用步骤六中训练得到的深度学习模型的具体过程为:将任意选取的一张待检测遥感图像的高度设为OH,宽度设为OW,将该遥感图像裁切成N块高为H,宽为W的小图,将N块小图输入到训练好的深度学习模型中进行计算得到输出结果,把得到的输出结果再拼接成一张高度为OH,宽度为OW的图像,从而完成对遥感图像在深度学习模型模型中的应用。
6.根据权利要求5所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:在将待检测遥感图像上应用到训练得到的深度学习模型的过程中,采用滑动窗口来完成对待检测遥感图像的全覆盖。
7.根据权利要求6所述的一种用于建筑物变化检测的局部背景语义信息增强方法,其特征在于:采用滑动窗口来完成对待检测遥感图像的全覆盖的具体过程为:将待检测图作为底部框图(10),其高度为OH,宽度为OW,设第一方框图(11)为t1时刻输入到深度学习模型中的图像,第一方框图(11)的高度为H、宽度为W,深度学习模型通过计算得到输出结果,输出结果为第二方框图(12),第二方框图(12)的高度为h,宽度为w,其中h=H/2,w=W/2,将t1时刻的输出结果暂存,至此完成t1时刻的模型计算;在t2时刻,检测框向右移动,即沿水平方向滑动,其滑动步幅为标签的宽度w,本次滑动仅在水平方向发生,但在换行时则需要在垂直方向进行滑动,垂直方向为标签的高度h,滑动完成,设第三方框图(13)为t2时刻输入到模型中的图像,第四方框图(14)为t2时刻模型的输出结果,将t2时刻的输出结果暂存,此时t2时刻的模型计算完成,以此种方式进行迭代,最终完成全图的深度学习模型计算,将每次暂存的输出结果按照顺序拼接成与待检测遥感图像相同的尺寸,即完成待检测遥感图像在训练得到的深度学习模型中的应用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宝略科技(浙江)有限公司,未经宝略科技(浙江)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110382282.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据聚类方法、相关设备及存储介质
- 下一篇:一种基于机器视觉的套准装置