[发明专利]细胞分类方法、装置、计算机设备和存储介质在审
申请号: | 202010840988.8 | 申请日: | 2020-08-20 |
公开(公告)号: | CN112133370A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 印明柱;李轶群;陈翔 | 申请(专利权)人: | 中南大学湘雅医院 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 黄恕 |
地址: | 410008 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 细胞 分类 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种细胞分类方法、装置、计算机设备和存储介质。所述方法包括:获取第一细胞亚群分类数据,识别第一细胞亚群分类数据中的特征基因、并根据特征基因对第一细胞亚群分类数据进行罕见亚群分类,得到第二细胞亚群分类数据,抽取第二细胞亚群分类数据中的细胞亚群数据,对抽取出的细胞亚群数据进行半监督回归分析,筛选出与生物学状态相关的目标特征基因,根据目标特征基因,对第二细胞亚群分类数据进行罕见亚群分类,得到第三细胞亚群分类数据,根据预设约束条件,筛选出第三细胞亚群分类数据中与生物学状态相关的罕见细胞亚群,得到细胞分类结果。采用本方法能够提高细胞类型纯度。
技术领域
本申请涉及生物学技术领域,特别是涉及一种细胞分类方法、装置、计算机设备和存储介质。
背景技术
随着单细胞测序技术的兴起,单个细胞的类型和生物学状态可以用其基因表达构成的特征向量来描述。即,通过这些特征基因的表达情况,人们可以识别某一特定类型细胞的状态和区别。因此,以区分不同细胞类型为目标的细胞聚类算法及软件成为了当下的研究热点。通过细胞聚类方法,可以将生物组织中包含的不同细胞进行区分(例如,将肿瘤组织中的癌症细胞和攻击肿瘤的免疫细胞加以区分),得到多种具有较高相似性的细胞类型,可用于后续的科学和医学研究,有助于识别疾病的发病机理并针对性的研发相关药物。
目前,常用的细胞聚类算法多种多样,然而,由于算法的计算原理不同,不同算法的计算速度和聚类结果通常会有较大差异,有些算法对于成分简单的生物样本聚类效果较好,有些则对包含复杂细胞类型的生物样本进行分析时更具优势。简而言之,目前的细胞聚类算法得到的分析结果一致性通常较差,存在聚类结果中细胞类型不纯的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高细胞聚类结果中细胞类型纯度的细胞分类方法、装置、计算机设备和存储介质。
一种细胞分类方法,方法包括:
获取第一细胞亚群分类数据;
识别第一细胞亚群分类数据中的特征基因、并根据特征基因对第一细胞亚群分类数据进行罕见亚群分类,得到第二细胞亚群分类数据;
抽取第二细胞亚群分类数据中的细胞亚群数据,对抽取出的细胞亚群数据进行半监督回归分析,筛选出目标特征基因,目标特征基因包括与生物学状态相关的基因;
根据目标特征基因,对第二细胞亚群分类数据进行罕见亚群分类,得到第三细胞亚群分类数据;
根据预设约束条件,筛选出第三细胞亚群分类数据中与生物学状态相关的罕见细胞亚群,得到细胞分类结果。
在其中一个实施例中,识别第一细胞亚群分类数据中的特征基因包括:
调用Gini系数,识别第一细胞亚群分类数据中细胞表达量分布不均匀的基因,得到特征基因。
在其中一个实施例中,根据特征基因对第一细胞亚群分类数据进行罕见亚群分类,得到第二细胞亚群分类数据包括:
基于特征基因,计算第一细胞亚群分类数据中细胞间的相似度,结合DBSCAN(Density-Based Spatial Clustering of Applications with Noise)密度聚类方法对第一细胞亚群分类数据进行罕见亚群分类,得到第二细胞亚群分类数据。
在其中一个实施例中,抽取第二细胞亚群分类数据中的细胞亚群数据包括:
根据蒙特卡罗算法,随机抽取第二细胞亚群分类数据中的细胞亚群数据。
在其中一个实施例中,根据预设约束条件,筛选出第三细胞亚群分类数据中与生物学状态相关的罕见细胞亚群,得到细胞分类结果包括:
计算第三细胞亚群分类数据中属于不同生物学状态样本的细胞的质心距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学湘雅医院,未经中南大学湘雅医院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010840988.8/2.html,转载请声明来源钻瓜专利网。