[发明专利]一种基于深度学习的染色体自动分割和分类方法有效
| 申请号: | 202110970922.5 | 申请日: | 2021-08-23 |
| 公开(公告)号: | CN113658150B | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 胡娜;吴晓明;祖建;胡曦;王彤;马欣越;刘红星 | 申请(专利权)人: | 西安交通大学;河北燕达陆道培医院有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/12;G06T7/194;G06T7/62;G06T5/00;G06T5/30;G06V10/764 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 王艾华 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 染色体 自动 分割 分类 方法 | ||
1.一种基于深度学习的染色体自动分割和分类方法,其特征在于,包括以下步骤:
S1、获取染色体图像并使用Attention U-Net模型过滤掉非染色体的细胞杂质;
S2、对S1中的染色体图像使用Attention U-Net分割出染色体的轮廓,并使用带标记的分水岭算法进行分割优化,最终裁剪出各个染色体区域图像;
S3、对S2中获取的染色体区域提取基于轮廓的关键特征,采用提取的关键特征训练支持向量机、随机森林、逻辑回归分类器,并且采用投票法对三种分类器进行模型集成,最后将染色体区域判别为重叠\粘连染色体或单条染色体;
S4、对判别为重叠\粘连染色体分别设计单独的分割模块,针对重叠染色体,利用先分离再拼接的办法分割;针对粘连染色体,利用凸缺陷点检测的方法进行分割;
S5、构建基于ResNet20、ResNet32、ResNet44的染色体24分类模型,然后用堆叠法进行模型集成,输出最终的染色体分类结果以及核型分析图,供专业人员进行染色体异常识别。
2.根据权利要求1所述的方法,其特征在于,步骤S1具体为:
S101、统一原始染色体图像尺寸、图像格式、通道数,数据增广;
S102、将含细胞等杂质的染色体图片输入到Attention U-Net网络进行训练,识别结果为对应杂质的掩膜,从而去除细胞杂质;
S103、使用中值滤波法对图像去噪。
3.根据权利要求1所述的方法,其特征在于,步骤S2具体为:
S201、对染色体图像使用Attention U-Net分割出染色体的轮廓,并与原始图片进行或运算,得到带有染色体轮廓的图像;
S202、对带有染色体轮廓的图像进行二值化、形态学开运算,形态学膨胀操作得到背景区域,即染色体外部;
S203、距离变换得到前景区域,即染色体内部;
S204、前景区域减去背景区域得到未知区域;
S205、设置标记,背景和前景设为1,未知区域为0;
S206、执行分水岭得到染色体轮廓图;
S207、通过二值化、腐蚀膨胀填充细微断点;
S208、获得轮廓点集;
S209、判断并保存染色体内轮廓点;
S210、利用区域生长法制作每条染色体对应的掩膜,为了减小运算量,可以先对目标区域进行外接矩形裁剪,尽可能缩小需要遍历的区域;然后以矩形中心为种子进行填充,填充完的掩膜再原位替换回图片中;最后将掩膜依次与原图像或运算,将目标染色体分离出来;
S211、通过染色体的最小外接矩形顶点坐标,剪裁矩形区域,根据顶点坐标以及边长间的几何关系推算出矩形的旋转角度;然后旋转裁剪出来的染色体图像,使其在图片中竖直摆放。
4.根据权利要求1所述的方法,其特征在于,步骤S3具体为:
S301、对提取出来的染色体进行标注,单条染色体标注为0,重叠\粘连染色体标注为1,由于重叠\粘连染色体远比单条染色体图像少,存在数据不平衡的现象,因此对非单条染色体进行数据增广;
S302、提取染色体轮廓的关键特征,包括:将所获得染色体轮廓形状拟合成凸包,计算闭合轮廓的面积和凸包面积的比值;将所获得染色体轮廓形状拟合成多边形,记录多边形的边数等特征;
S303、使用上述提取的染色体轮廓关键特征训练支持向量机、随机森林、逻辑回归分类器,并且采用投票法对三种分类器进行模型融合,判定染色体轮廓特征是否满足重叠条件,用以识别重叠\粘连染色体和单条染色体。
5.根据权利要求1所述的方法,其特征在于,步骤S4具体为:
S401、针对重叠染色体的分割,首先利用Attention U-Net提取重叠区域,再使用分水岭算法将交叉重叠区域中的重叠染色体分为两组:重叠部分和非重叠部分,对所有不重叠的部分进行配对后,将它们与交叉重叠部分相结合,输出所有的单条染色体;
S402、针对粘连染色体的分割,先找到所有的凸缺陷点,然后画出分割线来消除粘连。
6.根据权利要求1所述的方法,其特征在于,步骤S5具体为:
S501、模型的训练数据使用从已标注好的91组正常核型分析图中截取的单条染色体,包含44条常染色体以及XX或XY两条性染色体,一共有4184张单条染色体图片;
S502、将训练数据分别输入到ResNet20、ResNet32、ResNet44模型中进行训练,得到一个新的训练集和测试集;
S503、再用一个简单的两层全连接分类模型以真实训练集标签为标签训练,以新的训练集为特征进行训练,在新的测试集上得到最终的测试集分类准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;河北燕达陆道培医院有限公司,未经西安交通大学;河北燕达陆道培医院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110970922.5/1.html,转载请声明来源钻瓜专利网。





