[发明专利]一种基于深度学习的图片自动调整对齐的方法及装置在审
| 申请号: | 202110954272.5 | 申请日: | 2021-08-19 |
| 公开(公告)号: | CN113837998A | 公开(公告)日: | 2021-12-24 |
| 发明(设计)人: | 曾亚光;刘明迪;麦浩基;翁祥涛;覃楚渝;刘奕桦;杨尚潘;林思蕾;高墨涵;王茗祎;熊红莲;韩定安;黄鸿衡;吴南寿 | 申请(专利权)人: | 佛山科学技术学院;佛山市灵觉科技有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/187;G06T7/62;G06N3/04;G06N3/08 |
| 代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 许英伟 |
| 地址: | 528000 广东省佛山市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 图片 自动 调整 对齐 方法 装置 | ||
1.一种基于深度学习的图片自动调整对齐的方法及设备,其特征在于,包括以下步骤:
1)模型的建立包括以下步骤:采用卷积神经网络对图像进行学习,在训练阶段,首先转换现有的所需调整对齐的图片和模板图片为灰度图并标注标签信息,形成的训练数据集中的标签集;然后将训练数据集输入U-net网络中,采用随机梯度下降法更新网络的参数,迭代多次,得到U-net网络模型;
2)对船上拍摄获取的初图片和模板图进行变换,均得到变换后的灰度图;
3)将变换后的灰度图均输入模型,模型将初图片的灰度图输出分割为初图片背景S1和与非背景部分的二值图像,模板图的灰度图输出分割为模板背景S2和非背景部分的二值图像;
4)计算初图片背景S1和模板背景S2的质心点z1和z2;
5)比较质心点z1和z2在图片中的相对位置,得到偏移量,然后根据该偏移量用计算机调整得到自适应调整后的准确图片。
2.按照权利要求1所述的一种基于深度学习的图片自动调整对齐的方法,其特征在于:步骤4)中,质心以及相对位置,已知初图片背景S1与模板背景S2的面积图,则求质心点是通过使用连通域的方法计算不规则多边形范围矩形bounds的中心点,方法如下:
1)用连通域的方法获取背景分区,如果背景被目标物分开则会有多个背景,连通域标记会有从1到n个(n≥1);
2)任意选用一个连通域标记的背景S1’和S2’,分别将S1’,S2’区域内的横坐标与纵坐标求和在求平均,即为区域中心坐标的横坐标x和纵坐标y,如公式1-1和公式1-2所示;
k代表着所用连通域标记的目标背景所含的像素点个数
以不规则多边形范围矩形bounds的中心点作为质心点z1(x1’,y1’)和z2(x2’,y2'),相对位置就比较质心点z1与z2的x,y的差即可得到应该调整的距离x1和y1。
3.按照权利要求2所述的一种基于深度学习的图片自动调整对齐的方法,其特征在于:步骤5)中,通过步骤4)中的方法得到相对位置x1和y1,通过计算机计算得到调整x1和y1后的像,其中x1若为正,则根据图像的x横坐标像素点坐标增大的方向移动图片,反之,则根据图像的x横坐标像素点坐标减小的方向移动图片;y的移动方式同理。
4.按照权利要求1所述的一种基于深度学习的图片自动调整对齐的方法,其特征在于:所述卷积神经网络结构为:U-Net输入256×256×1的图像,卷积核的大小为3×3,池化采用的是最大池化,窗口大小为2×2,本网络结构图中所有卷积核的步长为1,池化的步长为2,所有的卷积层和全连接层之后连接的是激励层,激活函数是relu。
5.按照权利要求4所述的一种基于深度学习的图片自动调整对齐的方法,其特征在于:所述U-Net的任务是背景分类,背景点位置回归;对于背景分类任务,损失函数采用交叉熵损失函数。
6.按照权利要求5所述的一种基于深度学习的图片自动调整对齐的方法,其特征在于:所述U-Net的关键点位置回归任务采用平滑的L1损失函数,因此整个网络的损失函数为两种损失函数的加权之和。
7.按照权利要求1所述的一种基于深度学习的图片自动调整对齐的装置,其特征在于:包括处理器、存储器以及存储在该存储器中并可在所述处理器上运行的计算机程序,该处理器执行所述计算机程序,所述计算机程序:运行软件python使用搭建U-net神经网络代码进行深度学习的网络训练得到模型,使用代码输入图片到U-net网络模型中,运行软件matlab进行连通域,找不规则图像的中心,移动图像代码。
8.按照权利要求7所述的一种基于深度学习的图片自动调整对齐的装置,其特征在于:所述计算机程序被分割成一个或多个模块,所述一个或者多个模块被存储在所述存储器中,并由所述处理器执行,所述一个或多个模块为完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序的执行过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院;佛山市灵觉科技有限公司,未经佛山科学技术学院;佛山市灵觉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110954272.5/1.html,转载请声明来源钻瓜专利网。





