[发明专利]一种基于深度学习的染色体自动分割和分类方法有效

专利信息
申请号: 202110970922.5 申请日: 2021-08-23
公开(公告)号: CN113658150B 公开(公告)日: 2022-12-09
发明(设计)人: 胡娜;吴晓明;祖建;胡曦;王彤;马欣越;刘红星 申请(专利权)人: 西安交通大学;河北燕达陆道培医院有限公司
主分类号: G06T7/00 分类号: G06T7/00;G06T7/12;G06T7/194;G06T7/62;G06T5/00;G06T5/30;G06V10/764
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 王艾华
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 学习 染色体 自动 分割 分类 方法
【权利要求书】:

1.一种基于深度学习的染色体自动分割和分类方法,其特征在于,包括以下步骤:

S1、获取染色体图像并使用Attention U-Net模型过滤掉非染色体的细胞杂质;

S2、对S1中的染色体图像使用Attention U-Net分割出染色体的轮廓,并使用带标记的分水岭算法进行分割优化,最终裁剪出各个染色体区域图像;

S3、对S2中获取的染色体区域提取基于轮廓的关键特征,采用提取的关键特征训练支持向量机、随机森林、逻辑回归分类器,并且采用投票法对三种分类器进行模型集成,最后将染色体区域判别为重叠\粘连染色体或单条染色体;

S4、对判别为重叠\粘连染色体分别设计单独的分割模块,针对重叠染色体,利用先分离再拼接的办法分割;针对粘连染色体,利用凸缺陷点检测的方法进行分割;

S5、构建基于ResNet20、ResNet32、ResNet44的染色体24分类模型,然后用堆叠法进行模型集成,输出最终的染色体分类结果以及核型分析图,供专业人员进行染色体异常识别。

2.根据权利要求1所述的方法,其特征在于,步骤S1具体为:

S101、统一原始染色体图像尺寸、图像格式、通道数,数据增广;

S102、将含细胞等杂质的染色体图片输入到Attention U-Net网络进行训练,识别结果为对应杂质的掩膜,从而去除细胞杂质;

S103、使用中值滤波法对图像去噪。

3.根据权利要求1所述的方法,其特征在于,步骤S2具体为:

S201、对染色体图像使用Attention U-Net分割出染色体的轮廓,并与原始图片进行或运算,得到带有染色体轮廓的图像;

S202、对带有染色体轮廓的图像进行二值化、形态学开运算,形态学膨胀操作得到背景区域,即染色体外部;

S203、距离变换得到前景区域,即染色体内部;

S204、前景区域减去背景区域得到未知区域;

S205、设置标记,背景和前景设为1,未知区域为0;

S206、执行分水岭得到染色体轮廓图;

S207、通过二值化、腐蚀膨胀填充细微断点;

S208、获得轮廓点集;

S209、判断并保存染色体内轮廓点;

S210、利用区域生长法制作每条染色体对应的掩膜,为了减小运算量,可以先对目标区域进行外接矩形裁剪,尽可能缩小需要遍历的区域;然后以矩形中心为种子进行填充,填充完的掩膜再原位替换回图片中;最后将掩膜依次与原图像或运算,将目标染色体分离出来;

S211、通过染色体的最小外接矩形顶点坐标,剪裁矩形区域,根据顶点坐标以及边长间的几何关系推算出矩形的旋转角度;然后旋转裁剪出来的染色体图像,使其在图片中竖直摆放。

4.根据权利要求1所述的方法,其特征在于,步骤S3具体为:

S301、对提取出来的染色体进行标注,单条染色体标注为0,重叠\粘连染色体标注为1,由于重叠\粘连染色体远比单条染色体图像少,存在数据不平衡的现象,因此对非单条染色体进行数据增广;

S302、提取染色体轮廓的关键特征,包括:将所获得染色体轮廓形状拟合成凸包,计算闭合轮廓的面积和凸包面积的比值;将所获得染色体轮廓形状拟合成多边形,记录多边形的边数等特征;

S303、使用上述提取的染色体轮廓关键特征训练支持向量机、随机森林、逻辑回归分类器,并且采用投票法对三种分类器进行模型融合,判定染色体轮廓特征是否满足重叠条件,用以识别重叠\粘连染色体和单条染色体。

5.根据权利要求1所述的方法,其特征在于,步骤S4具体为:

S401、针对重叠染色体的分割,首先利用Attention U-Net提取重叠区域,再使用分水岭算法将交叉重叠区域中的重叠染色体分为两组:重叠部分和非重叠部分,对所有不重叠的部分进行配对后,将它们与交叉重叠部分相结合,输出所有的单条染色体;

S402、针对粘连染色体的分割,先找到所有的凸缺陷点,然后画出分割线来消除粘连。

6.根据权利要求1所述的方法,其特征在于,步骤S5具体为:

S501、模型的训练数据使用从已标注好的91组正常核型分析图中截取的单条染色体,包含44条常染色体以及XX或XY两条性染色体,一共有4184张单条染色体图片;

S502、将训练数据分别输入到ResNet20、ResNet32、ResNet44模型中进行训练,得到一个新的训练集和测试集;

S503、再用一个简单的两层全连接分类模型以真实训练集标签为标签训练,以新的训练集为特征进行训练,在新的测试集上得到最终的测试集分类准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;河北燕达陆道培医院有限公司,未经西安交通大学;河北燕达陆道培医院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110970922.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top