[发明专利]二维分布结构判定的单细胞转录组测序数据聚类推荐方法有效
申请号: | 202110061290.0 | 申请日: | 2021-01-18 |
公开(公告)号: | CN112750502B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 李敏;田宇;郑瑞清 | 申请(专利权)人: | 中南大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B35/00;G16B30/00;G06K9/62 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 熊开兰 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二维 分布 结构 判定 单细胞 转录 序数 类推 方法 | ||
本发明公开了一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,包括:获取多个细胞的单细胞转录组测序数据得到的基因表达矩阵,在过滤和标准化处理后,构建二维特征矩阵并进行线性归一化;根据归一化后的二维特征矩阵计算细胞间的欧式距离,从而建立细胞最小生成树;通过自适应阈值对细胞最小生成树进行切割,并以切割后构成的簇的平衡性来确定数据的二维分布结构;对具有模糊簇间边界和连续二维分布结构的数据,推荐并应用层次聚类算法,而对具有明显簇间边界和分块二维分布结构的数据,推荐并应用谱聚类算法。本发明能为单细胞转录组测序数据在层次聚类和谱聚类中推荐更适合其二维分布结构的方法作为下游聚类分析方法,提高聚类准确性。
技术领域
本发明涉及生物信息学领域,涉及一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法。
背景技术
在细胞生物学领域,单细胞分析是在单细胞水平上对基因组学、转录组学、蛋白质组学和代谢组学的研究。它提供了一种超灵敏的工具来阐明特定的分子机制和途径,并揭示了细胞异质性的本质。随着技术的发展和成本的下降,应用于单细胞全基因组的转录组测序(scRNA-seq)技术正在迅速成为生物学和生物医学研究等许多领域的选择。在单细胞分辨率下研究全基因组的基因表达克服了传统RNA测序的内在局限性,单细胞转录组测序使研究人员能够更严格地解决有关组织的细胞组成,转录物异质性和细胞类型的问题,使单细胞转录组测序已用于研究癌症,宏基因组学以及调控和进化网络。近些年来,单细胞异质性分析研究成为了生物信息领域的一大研究热点。为了剖析细胞异质性,就有必要在单细胞水平进行基因表达分析。单细胞转录组测序技术能获得单个细胞内近万个基因的表达信息,为辨别生物组织中各种细胞类型的转录特征和全面揭示细胞之间的基因表达差异提供了有力的工具。在单细胞转录组测序数据分析中,鉴定种群结构是至关重要的一步。对单细胞转录组测序数据进行的下游分析涉及多个步骤,包括质量控制,定量,归一化,聚类,寻找轨迹和鉴定差异表达的基因等。目前已经提出了很多单细胞聚类方法来对细胞进行划分,其中层次聚类和谱聚类是下游聚类分析中应用最多的两个聚类方法:
层次聚类:将单个数据迭代的合并为较大的簇(凝聚聚类)或将一个大类迭代的划分为较小的簇(分裂聚类),并通过得到的树状图中层次树的分支结构来表示最终的聚类结果。层次聚类可以通过切割树状图来获得不同的聚类结果,但方法缺少对簇间边界的精准定义,这将导致其在具有模糊边界结构的数据上的聚类效果不够理想。
谱聚类:将所有数据看作空间中的点,点之间用边连接起来。距离较远的两个点之间的边权重值较低,而距离较近的两个点之间的边权重值较高,通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。因此,谱聚类可以处理更为复杂的数据分布结构,例如模糊边界问题,但方法缺点在于十分依赖相似性矩阵的准确性。
两种聚类方法由于基于不同的理论和策略,因而可能在具有不同分布结构的数据上的聚类结果存在差异。在通过分析每组数据的二维分布结构以选择更合适的聚类方法方面,还有进一步提升的空间。
因此,有必要提供一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法。
发明内容
本发明所要解决的技术问题是,针对现有技术不足,提供一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,能够为具有不同二维分布结构的数据在层次聚类和谱聚类中推荐更合适的聚类方法,提高聚类准确性。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,包括以下步骤:
步骤1,获取N个细胞的单细胞转录组测序数据,通过统计基因在每个细胞中的表达量得到基因表达矩阵,并进行过滤和标准化处理;然后通过均匀流形近似和投影构建二维特征矩阵,并将二维特征矩阵进行线性归一化;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110061290.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:腰椎保护装置
- 下一篇:图像配准方法、装置、计算机设备和存储介质