[发明专利]一种基于深度学习的染色体自动分割和分类方法有效

申请号：	202110970922.5	申请日：	2021-08-23
公开（公告）号：	CN113658150B	公开（公告）日：	2022-12-09
发明（设计）人：	胡娜;吴晓明;祖建;胡曦;王彤;马欣越;刘红星	申请（专利权）人：	西安交通大学;河北燕达陆道培医院有限公司
主分类号：	G06T7/00	分类号：	G06T7/00;G06T7/12;G06T7/194;G06T7/62;G06T5/00;G06T5/30;G06V10/764
代理公司：	西安通大专利代理有限责任公司 61200	代理人：	王艾华
地址：	710049 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度学习染色体自动分割分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度学习的染色体自动分割和分类方法，其特征在于，包括以下步骤：

S1、获取染色体图像并使用Attention U-Net模型过滤掉非染色体的细胞杂质；

S2、对S1中的染色体图像使用Attention U-Net分割出染色体的轮廓，并使用带标记的分水岭算法进行分割优化，最终裁剪出各个染色体区域图像；

S3、对S2中获取的染色体区域提取基于轮廓的关键特征，采用提取的关键特征训练支持向量机、随机森林、逻辑回归分类器，并且采用投票法对三种分类器进行模型集成，最后将染色体区域判别为重叠\粘连染色体或单条染色体；

S4、对判别为重叠\粘连染色体分别设计单独的分割模块，针对重叠染色体，利用先分离再拼接的办法分割；针对粘连染色体，利用凸缺陷点检测的方法进行分割；

S5、构建基于ResNet20、ResNet32、ResNet44的染色体24分类模型，然后用堆叠法进行模型集成，输出最终的染色体分类结果以及核型分析图，供专业人员进行染色体异常识别。

2.根据权利要求1所述的方法，其特征在于，步骤S1具体为：

S101、统一原始染色体图像尺寸、图像格式、通道数，数据增广；

S102、将含细胞等杂质的染色体图片输入到Attention U-Net网络进行训练，识别结果为对应杂质的掩膜，从而去除细胞杂质；

S103、使用中值滤波法对图像去噪。

3.根据权利要求1所述的方法，其特征在于，步骤S2具体为：

S201、对染色体图像使用Attention U-Net分割出染色体的轮廓，并与原始图片进行或运算，得到带有染色体轮廓的图像；

S202、对带有染色体轮廓的图像进行二值化、形态学开运算，形态学膨胀操作得到背景区域，即染色体外部；

S203、距离变换得到前景区域，即染色体内部；

S204、前景区域减去背景区域得到未知区域；

S205、设置标记，背景和前景设为1，未知区域为0；

S206、执行分水岭得到染色体轮廓图；

S207、通过二值化、腐蚀膨胀填充细微断点；

S208、获得轮廓点集；

S209、判断并保存染色体内轮廓点；

S210、利用区域生长法制作每条染色体对应的掩膜，为了减小运算量，可以先对目标区域进行外接矩形裁剪，尽可能缩小需要遍历的区域；然后以矩形中心为种子进行填充，填充完的掩膜再原位替换回图片中；最后将掩膜依次与原图像或运算，将目标染色体分离出来；

S211、通过染色体的最小外接矩形顶点坐标，剪裁矩形区域，根据顶点坐标以及边长间的几何关系推算出矩形的旋转角度；然后旋转裁剪出来的染色体图像，使其在图片中竖直摆放。

4.根据权利要求1所述的方法，其特征在于，步骤S3具体为：

S301、对提取出来的染色体进行标注，单条染色体标注为0，重叠\粘连染色体标注为1，由于重叠\粘连染色体远比单条染色体图像少，存在数据不平衡的现象，因此对非单条染色体进行数据增广；

S302、提取染色体轮廓的关键特征，包括：将所获得染色体轮廓形状拟合成凸包，计算闭合轮廓的面积和凸包面积的比值；将所获得染色体轮廓形状拟合成多边形，记录多边形的边数等特征；

S303、使用上述提取的染色体轮廓关键特征训练支持向量机、随机森林、逻辑回归分类器，并且采用投票法对三种分类器进行模型融合，判定染色体轮廓特征是否满足重叠条件，用以识别重叠\粘连染色体和单条染色体。

5.根据权利要求1所述的方法，其特征在于，步骤S4具体为：

S401、针对重叠染色体的分割，首先利用Attention U-Net提取重叠区域，再使用分水岭算法将交叉重叠区域中的重叠染色体分为两组：重叠部分和非重叠部分，对所有不重叠的部分进行配对后，将它们与交叉重叠部分相结合，输出所有的单条染色体；

S402、针对粘连染色体的分割，先找到所有的凸缺陷点，然后画出分割线来消除粘连。

6.根据权利要求1所述的方法，其特征在于，步骤S5具体为：

S501、模型的训练数据使用从已标注好的91组正常核型分析图中截取的单条染色体，包含44条常染色体以及XX或XY两条性染色体，一共有4184张单条染色体图片；

S502、将训练数据分别输入到ResNet20、ResNet32、ResNet44模型中进行训练，得到一个新的训练集和测试集；

S503、再用一个简单的两层全连接分类模型以真实训练集标签为标签训练,以新的训练集为特征进行训练，在新的测试集上得到最终的测试集分类准确率。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西安交通大学;河北燕达陆道培医院有限公司，未经西安交通大学;河北燕达陆道培医院有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110970922.5/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载