[发明专利]一种基于全卷积神经网络的相位主值提取方法有效
| 申请号: | 201910347403.6 | 申请日: | 2019-04-28 |
| 公开(公告)号: | CN110163817B | 公开(公告)日: | 2021-06-18 |
| 发明(设计)人: | 王海霞;吴晨阳;胡苏杭;陈朋;梁荣华 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T7/00;G06N3/08;G06N3/04;G01B11/25 |
| 代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 卷积 神经网络 相位 提取 方法 | ||
1.一种基于全卷积神经网络的相位主值提取方法,其特征在于,所述方法包括以下步骤:
1)在计算机上将预先编码所需的按正弦分布的条纹图,预先编码好的条纹图投影至待测物,并使用工业相机采集待测物条纹图;
2)构建全卷积神经网络模型,设定训练参数和损失函数,将1)中得到的待测物条纹图输入至全卷积神经网络模型中,运行全卷积神经网络模型,获得所需的相位主值;
所述步骤2)中,提取相位主值过程包括以下步骤:
2.1)全卷积神经网络模型构建
在投影仪将预先编码好的条纹图投影至待测物表面时,由于受到物体表面高度的调制,被CCD相机获取的变形条纹表示为:
其中a(x,y)和b(x,y)分别反映背景光和表面反射率的变化;是待计算的相对相位值,也称作相位主值,它反映了物体对应点上高度信息;
构建一个全卷积神经网络模型,整个全卷积神经网络的层包括十个部分,其中第一层到第五层为编码层,每一层由两个卷积层和两个BN层组成,其中第一卷积层的卷积核大小为3×3,数量为128个,步幅为2,第二卷积层的卷积核大小为3×3,数量为128个,步幅为1,输入的图像首先经过第一卷积层、BN层以及Leaky ReLU激活函数,再经过第二卷积层、BN层以及Leaky ReLU激活函数处理;
第六层到第十层为解码层,每一层由两个卷积层、三个BN层以及一个上采样层组成,其中两个卷积层的卷积核大小为3×3,数量为128个,步幅为1,输入特征依次经过BN层,第一卷积层、BN层以及Leaky ReLU激活函数;再依次经过第二卷积层、BN层以及Leaky ReLU激活函数处理,最后经过上采样层,通过双线性插值或者最邻近点法对特征进行上采样;
另外,第一层与第十层,第二层与第九层,第三层与第八层,第四层与第七层,第五层与第六层之间还增加了skip connections,skip connections由卷积层、BN层以及LeakyReLU激活函数构成,其中卷积层的卷积核大小为1×1,卷积核数量为4个;
将大小为512×512×1的图像输入全卷积神经网络模型,依次经过第一层到第六层,输出的特征大小为16×16×128,再依次经过第六层到第十层,输出的特征大小为512×512×128;
最后一个卷积层经过1个大小为1×1的卷积核和RELU激活函数处理,输出特征大小为512×512×1;
2.2)运行全卷积神经网络模型
全卷积神经网络模型的输入为三幅大小与1)中拍摄图像相同的随机产生的均匀噪声图像,分别使其拟合为背景a(x,y),表面反射率b(x,y)以及相位主值φ(x,y),其中,采用两种方法来构建输入图像:第一、在[0,0.1]的区间内产生随机数以填充整个图像;第二、使用meshgrid函数产生[0,1]区间的网格作为输入;
确定全卷积神经网络模型的参数,将上述三幅图像输入神经网络进行拟合后相加,其能量函数为相加后的图像与步骤1)中拍摄得到图像的均方根MSE最小,所述MSE定义如下:
其中yi为步骤1)中拍摄得到的图像,为三幅输入图像相加后的图像;
使用Adam Optimizer优化器对进行优化迭代,迭代多次后得到最优解,此时三幅输入图像便会分别拟合为所需的相位主值、表面反射率以及背景光强;
3)使用基于质量图导向的方法对2)中得到的相位主值进行解缠,得到准确相位值。
2.如权利要求1所述的一种基于全卷积神经网络的相位主值提取方法,其特征在于,所述步骤1)中,采集条纹图过程包括以下步骤:
1.1)在计算机上进行条纹预编码,构建出所需的按正弦规律分布的条纹图,条纹按照以下公式进行编码:
其中I(x,y)为图像灰度值,x为横坐标;
1.2)设计拍摄光路,并按设计好的光路放置工业相机、DLP投影仪以及待测物;
1.3)使用工业相机依次采集高清的条纹图像。
3.如权利要求1或2所述的一种基于全卷积神经网络的相位主值提取方法,其特征在于,所述步骤3)中,使用基于质量图导向法的相位解缠,步骤如下:
3.1)从质量高的像素点出发,然后检查这个像元点附近的4个像素点,然后对这4个像素点进行相位展开即相位解缠,其中相位解缠的公式为:
3.2)将进行了相位解缠的临近像元周围的像素储存到“邻接列”中;
3.3)根据相位的质量图,从“邻接列”中选出质量高的像素进行解缠,并更新这一列;
3.4)重复3.1)、3.2)步骤,直至所有相位解缠完毕;
其中质量M的定义为:
D为二阶差分,其定义为:
其中,V=unwrap(A(i,j-1)-A(i,j))-unwrap(A(i,j)-A(i,j+1))
H=unwrap(A(i-1,j)-A(i,j))-unwrap(A(i,j)-A(i+1,j))
D1=unwrap(A(i-1,j-1)-A(i,j))-unwrap(A(i,j)-A(i+1,j+1))
D2=unwrap(A(i-1,j+1)-A(i,j))-unwrap(A(i,j)-A(i+1,j-1))
Unwrap表示解缠操作即式(4)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910347403.6/1.html,转载请声明来源钻瓜专利网。





