[发明专利]基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备有效
| 申请号: | 202110844660.8 | 申请日: | 2021-07-26 |
| 公开(公告)号: | CN113611368B | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 李君一;石乃乐;杜林林;刘博;王亚东 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
| 主分类号: | G16B40/30 | 分类号: | G16B40/30;G16B40/20;G16B25/10;G06V10/762;G06V10/764;G06V10/774;G06V10/77;G06V10/82;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 深圳市道勤知酷知识产权代理事务所(普通合伙) 44439 | 代理人: | 何兵;吕诗 |
| 地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 嵌入 监督 单细胞 方法 装置 计算机 设备 | ||
本发明公开了一种基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备。其中,所述方法包括:对每个细胞进行数据预处理,和将该经对数据预处理后的每个细胞的基因表达数据都使用2D嵌入的方式,生成一张张合成图像形成图像集,和将该图像集输入到自编码器模型中进行预训练和聚类,和基于该将该图像集输入到自编码器模型中进行预训练和聚类后的聚类结果,构建网络,并运用社区发现算法对该构建网络中的图像集数据进行分类,以及采用将基于卷积神经网络模型来配置的半监督神经网络,对该经分类后的图像集中的所有细胞图像数据进行特征提取,并对该提取的特征进行聚类。通过上述方式,能够实现提高在单细胞数据上进行聚类时的聚类效果。
技术领域
本发明涉及细胞聚类技术领域,尤其涉及一种基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备。
背景技术
相关技术中,单细胞RNA(Ribonucleic Acid,核糖核酸)测序(scRNA-seq)的分析有助于了解生物组织的多样性和异质性。有效的分析方法可以区分单细胞数据中的不同细胞,对相似细胞进行分类,并找到它们之间的潜在关系。scRNA-seq RNA数据通常用于查找与疾病相关的基因。特别是对于复杂疾病,单细胞数据更有助于发现这些疾病的潜在原因。聚类分析是单细胞数据分析方法中最重要的一种。常用和经典的聚类算法是k均值聚类和频谱聚类。但是,由于正常物种有超过一万个基因,因此scRNA-seq数据的维数非常高。同时,scRNA-seq数据中存在许多零计数。因此,当前的scRNA-seq数据的高维,高差异性给数据分析带来了巨大挑战。
随着scRNA-seq测序技术的不断发展,提出了相应的分析方法。针对scRNA-seq数据的高维问题,提出了一种共享最近邻的概念,即SNN-Clip(Spiking Neural NetworkClip,脉冲神经网络聚类)聚类方法。当传统的距离测量方法例如向量相似度不适用时,也提出了一种基于多核的光谱聚类方法(SIMLR),该方法结合了多个核心来学习并且适合于scRNA数据。随着现代测序技术的进步,测序细胞的数量和基因的数量不断增加,这使得难以将基于拉普拉斯矩阵的方法应用于大规模数据。鉴于scRNA-seq数据中存在许多零值问题,许多研究人员还开发了一些方法,例如CIDR(Classless Inter-Domain Routing,无类别域间路由)、Deeplmpute(神经网络深入学习模式)、ZINB(Zero-inflated models,零膨胀模型)、scScope(基于智能计算成像的三维定量相位显微镜)、ScGSLC(图卷积神经网络模式)等。CIDR专注于降维,其聚类方法基于更具代表性的坐标。Deeplmpute使用神经网络来预测基因的缺失值,并估计基因和簇的比率作为改进的输入数据。ScScope使用多个自动编码器的嵌套,并将上一个自动编码器的输出用作下一个自动编码器的输入。 ScGSLC将scRNA-seq数据与蛋白质数据结合在一起,并使用图卷积网络将细胞之间的相似性转换为子图的相似性。并基于相似度矩阵对数据进行聚类。
随着测序数据量的逐步提高,拉普拉斯矩阵的存储和计算面临着计算机的巨大挑战。因此基于拉普拉斯矩阵的算法如SIMLR就很难在大规模数据中应用。然而,一些经典的聚类方法如PCA(PCA Principal Component Analysis,主成分分析)、谱聚类并没有针对单细胞数据的高维性与稀疏性进行一些合适的调整,因此当直接将这些方法用在单细胞数据上进行聚类时会导致聚类效果一般。
发明内容
有鉴于此,本发明的目的在于提出一种基于2D嵌入的半监督单细胞聚类方法、装置、计算机设备,能够实现提高在单细胞数据上进行聚类时的聚类效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110844660.8/2.html,转载请声明来源钻瓜专利网。





