[发明专利]一种基于图像的疫木检测与定位方法及系统在审
申请号: | 202110821397.0 | 申请日: | 2021-07-20 |
公开(公告)号: | CN113379738A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 侯俊岭;李伟红;杨利平;张超;王欣然 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/70;G06N3/04;G06N3/08 |
代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕 |
地址: | 400030 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 检测 定位 方法 系统 | ||
1.一种基于图像的疫木检测与定位方法,其特征在于,包括以下步骤:
步骤1:视频预处理:将云台观测塔拍摄的视频抽取出单帧图像,进行图像预处理和标注,制作成数据集供网络模型训练、验证和测试;
步骤2:构建多尺度候选区域融合网络,在步骤1获得的数据集上训练该模型;
步骤3:将待测试图像输入到训练好的多尺度候选区域融合检测网络,得到输出结果,根据疫木三维定位几何模型,计算出疫木具体的地理三维坐标。
2.根据权利要求1所述基于图像的疫木检测与定位方法,其特征在于:所述步骤2具体步骤为:
步骤2-1:对多尺度候选区域融合网络的输入图像进行预处理,然后将图像缩放固定到224*224像素,最后将224*224像素的图像和放大一倍图像、缩小一倍图像分别作为多尺度候选区域融合网络的输入;
步骤2-2:分别将224*224像素的图像输入到卷积神经网络(ResNet32)中,将224*224像素放大一倍的图像输入到卷积神经网络(ResNet18)中,将224*224像素缩小一倍的图像输入到卷积神经网络(ResNet50)中,得到相对应的特征图;
步骤2-3:从特征图得到不同的候选区域。以ResNet18的特征图检测小目标的候选区域生成网络RPN,为S-RPN;以ResNet32的特征图检测中型目标的RPN,为M-RPN;以ResNet50的特征图检测大型目标的RPN,为L-RPN;采用非最大抑制NMS减少冗余的候选区域;
步骤2-4:通过步骤1获得的数据集在深度学习机上训练该多尺度候选区域融合网络,反复调节参数直至网络收敛,保存训练好的网络参数。
3.根据权利要求2所述基于图像的疫木检测与定位方法,其特征在于:所述步骤2-1对多尺度候选区域融合网络的输入图像进行预处理,包括图像翻转、旋转、色彩变换、加入高斯噪声等数据增强处理。
4.根据权利要求2所述基于图像的疫木检测与定位方法,其特征在于:所述步骤2-3的采用非最大抑制NMS减少冗余的候选区域,具体如下:
对于每个RPN模型,首先,为每个锚框分配一个正标签或负标签。正标签的遵循两个原则:(1)与真值区域具有最高IoU(交并比)的Anchor;或者(2)与真值区域的IoU值高于0.7的Anchor。负标签则是与真值区域的IoU值低于0.3的Anchor。而IoU分数在0.3-0.7范围内的Anchor则既不属于正标签也不属于负标签,在RPN模型训练中无作用;
然后,采用多任务损失函数作为模型训练的损失函数,其具体定义如下:
其中,i是一个批量的索引,pi表示第i个锚生成的候选区域是目标区域的预测概率,表示该区域的真值标签,其中0表示负,1表示正。上述公式中对分类损失函数和回归损失函数分别采用Ncls、Nreg以平衡权重λ进行归一化。对于分类损失函数采用log损失函数,对于回归损失函数采用smoothL1损失函数。在边界框回归中,分别对预测框的中心点坐标以及预测框的宽高进行回归,预测框ti和真值框分别如下定义。
其中,x、y分别表示预测框中心坐标,w、h分别表示预测框的宽和高;xa、ya分别表示锚的中心坐标,wa、ha分别表示锚的宽和高;x*、y*分别表示真值框的中心坐标,w*、h*分别表示真值框的宽和高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110821397.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗温热病的熏蒸药剂
- 下一篇:一种市政抢修用便携式消防水炮
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序