[发明专利]一种基于深度卷积神经网络的中医舌图像自动分割方法有效
申请号: | 201710498517.1 | 申请日: | 2017-06-27 |
公开(公告)号: | CN107316307B | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 卓力;屈盼玲;肖庆新;张辉;张菁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/90;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 神经网络 中医 图像 自动 分割 方法 | ||
1.一种基于深度卷积神经网络的中医舌图像自动分割方法,包含离线训练阶段和在线分割阶段,其特征在于:
具体包括以下步骤:
步骤1:构建数据集;针对封闭式和开放式的舌象采集环境,分别构建了舌图像分割数据集TonsegDataset1和TonsegDataset2;其中,TonsegDataset1具有光照统一和舌图像位置相对一致的特点;TonsegDataset2具有尺寸大小不一,光照复杂多变,舌体的大小形状各异和位置不固定特点;
步骤2:标注语义分割标签;即分别对图像上的舌体区域和背景区域的像素点进行标注;
步骤3:卷积神经网络的结构设计和网络训练;
设计的卷积神经网络包括编码网络和解码网络,其中,编码网络由卷积层、BatchNormalization层、激活层和池化层堆叠而成,解码网络则由反池化层、反卷积层、BatchNormalization层和激活层堆叠而成,并采用跳跃连接结构将池化层的输出特征图与反池化层的输出特征图进行融合,利用融合后的特征图对图像信息进行复原;解码网络的输出连接sigmoid层,该层实现像素的二分类,得到语义分割结果;将舌图像的像素分为2类,即舌体区域和背景区域;
步骤4:利用训练好的网络模型对图像进行舌体区域分割;首先对待分割舌图像的光照情况进行预判,如果图像过亮或者过暗,则不对其进行分割;否则,对该图像的嘴区进行失焦检测,如果嘴区失焦,则不进行分割;否则,利用步骤3中训练好的卷积神经网络对该图像进行舌体分割。
2.根据权利要求1所述方法,其特征在于:
步骤3中设计的卷积神经网络简称为TonsegNet,包括输入层、编码网络、解码网络和输出层;其中,输入层为含有舌体的图像,图像尺寸为512×512;编码网络包含15个卷积层,卷积核的大小均为3×3,每个卷积层后面均连接着Batch Normalization层和激活层;将编码网络分为5组,每组包含3个卷积层,每组输出的特征图个数分别为32,64,128,256,512,且每组中的卷积层输出特征图个数相同;此外,每组后面连接一个池化层,编码网络共包含5个池化层,采用核尺寸为2×2大小的最大池化层;解码网络与编码网络对称,由反池化层、卷积层、Batch Normalization层和激活层堆叠而成,其中,采用跳跃连接结构将反池化层的输出特征图与池化层的输出特征图进行融合,利用融合后的特征图对图像信息进行复原;解码网络的输出连接sigmoid层,通过该层可以得到每个像素的类别概率,实现语义分割;将舌图像的像素分为2类,即舌体区域和背景区域。
3.根据权利要求1所述方法,其特征在于:
步骤3中采用的激活函数是Rectified Linear Units(ReLU)。
4.根据权利要求1所述方法,其特征在于:
步骤3中池化层对图像进行子抽样,池化层首先把输入分块,然后把分块做下采样处理,将得到的值加上偏置值输入到激活函数中;
采用max-pooling进行下采样,使用尺寸为2x2的滤波器,取出4个权值中最大的一个,并将该权值在2x2滤波器中的相对位置进行保存;反池化是池化的逆过程,先对输入的特征图放大两倍,再将输入特征图的数据根据保存的相对位置放入相应的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710498517.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑装修用的墙纸粘贴装置
- 下一篇:一种建筑装修用的贴墙纸设备