[发明专利]基于深度学习实现图像分割和分类的骨龄评估方法有效
申请号: | 201911194448.0 | 申请日: | 2019-11-28 |
公开(公告)号: | CN111080579B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 高云园;朱涛;高博;王翔坤;甘海涛;张启忠 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06V10/82;G06N3/0464;G06N3/06;G06N3/08;G06T7/155 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 实现 图像 分割 分类 评估 方法 | ||
1.基于深度学习实现图像分割和分类的骨龄评估方法,其特征在于,该方法具体包括如下步骤:
(1)采用数字图像处理方法对原始的手骨图像样本进行增强,得到整幅手骨X线片样本图像;所述增强包括对原始的手骨图像样本进行直方图均衡、高斯滤波、幂律变换和锐化;
(2)选取一定数量的手骨X线片样本图像进行标记,得到手骨部分的掩模,将掩模作为分割数据集用来训练U-Net网络模型;用训练好的U-Net网络模型对原始数据集进行分割,得到手掌分割结果;使用形态学方法对手掌分割结果进行后处理,保留最大连通域;
(3)将得到的手掌分割结果制作成训练集、验证集和测试集;使用制作好的训练集对改进后的VGG16网络进行训练;
改进后的VGG16网络结构包含17个卷积层、1个BN层、2个全局平均池化层、1个Multiply层、1个Lambda层、2个Dropout层和2个全连接层;其中前13个卷积层来自VGG16,将这部分卷积层当作特征提取器,提取的特征图大小为12×12×512,后四个卷积层所包含的卷积核的数量依次为64、8、1和512,在这两个卷积块之间,加入BN层,对提取的特征进行归一化处理;所述Lambda层对2个全局平均池化层输出的特征图进行了融合;
BN层对一个batch-size中特征图的每个通道上计算平均值和方差,计算公式如下:
xi表示第i个特征图,m表示一个batch-size的大小,μβ表示一个batch-size中所有特征图的平均值,表示所有特征图的方差;
接着对特征图进行归一化处理,归一化公式为:
表示归一化后的输入,其均值为0,标准差为1;ε是为了防止分母为0而引入的一个很小的正数;为了防止网络学习到的特征被破坏,BN层引入了可学习参数γ和β,用来调节非线性函数和线性函数之间的平衡,公式如下所示:
γ和β表示两个可学习参数,其训练算法为BP算法,yi表示调整后的输入;
4个卷积层连接在BN层之后,通过1×1的卷积核对经过BN层归一化后的特征图做特征提取,特征图维度依次变为12×12×64、12×12×8、12×12×1和12×12×512;先降维,再将维度扩展为与BN层输出特征图的维度相同,通过Multiply层将BN层输出的特征图和后面4个卷积层输出的特征图做点积,这个过程是一个加权求和过程,将其视为一种注意力机制,两个特征图点积公式如下:
X=fm·fn (5)
fm表示BN层输出的特征图,fm表示后面4个卷积层输出的特征图,二者维度均为12×12×512,X表示二者点积后的特征图;
训练改进后的VGG16网络至模型收敛;
(4)利用训练得到的改进后的VGG16网络对测试集进行测试,并利用MAE对所得结果进行评价;其中MAE即Mean Absolute Error;
fi表示骨龄真实值,fr表示骨龄预测值,N表示样本数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911194448.0/1.html,转载请声明来源钻瓜专利网。