[发明专利]一种适用于10x单细胞转录组测序数据的分析方法在审
| 申请号: | 202011592574.4 | 申请日: | 2020-12-29 |
| 公开(公告)号: | CN112599199A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 沈立;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00 |
| 代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 胡志强 |
| 地址: | 200030 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 10 单细胞 转录 序数 分析 方法 | ||
本发明公开了一种适用于10x单细胞转录组测序数据的分析方法,1)测序数据处理,2)Seurat数据过滤,3)细胞聚类分群,4)细胞群标记基因分析,本发明进行测序减少了数据前期处理的步骤,提高了分析的速度,增强了测序效率,便于操作使用,提供多种的结果展示形式,结合UMAP降维结果,更方便理解标记基因在细胞中的动态变化。
技术领域
本发明涉及基因检测技术领域,尤其涉及一种适用于10x单细胞转录组测序数据的分析方法。
背景技术
转录组是某个物种或者特定细胞类型产生的所有转录本的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程中的分子机理,已广泛应用于基础研究、临床诊断和药物研发等领域。
普通转录组是生物组织样品中在某个时间对应的所有mRNA转录情况,通常作为组织或者样品某个时刻状态的重要指标,不同的样品、不同组织、不同物种、不同的处理都会造成mRNA表达情况的改变,从而调控机体的生命状态或者执行某些细胞功能,相对于蛋白而言,mRNA的稳定性和检测的便利性,大大促进了转录组技术的发展和应用。
但是样品或者组织的转录组是所有细胞的一个转录组表达量的平均值,不能反映样品中所有细胞或者某群细胞的状态,因此需要对单个细胞的或者某群细胞的转录状态进行深入的研究,这样将更精细、更准确反映组织的状态。如果在进行免疫或者药物反应研究的时候,可以更精准地针对细胞或者细胞亚群进行免疫治疗或者靶向治疗,这是精准医疗必要条件。
发明内容
本发明的提供一种适用于10x单细胞转录组测序数据的分析方法。
本发明的方案是:
一种适用于10x单细胞转录组测序数据的分析方法,包括下列步骤:
1)测序数据处理,
使用10x genomics官方的cellranger count流程对原始数据进行处理:
使用count程序对下机的Fastq文件进行处理,得到每个细胞的基因的表达reads数;
根据count程序生成的网页中的信息,对测序结果进行质控;
2)Seurat数据过滤,
使用Seurat软件包对步骤1)中获取的表达数据进一步去除低质量细胞,获得过滤后的细胞;
3)细胞聚类分群,使用Suerat软件包将过滤后的细胞进行聚类;
4)细胞群标记基因分析,使用Suerat软件包分析各细胞群的标记基因,获得结果。
作为优选的技术方案,所述步骤1)中质控的主要指标包括有效细胞数,所述有效细胞数接近建库时预估的细胞数;基因组比对率,所述基因组对比率大于70%;基因集比对率,基因集比对率大于30%。
作为优选的技术方案,所述步骤1)中质控的主要指标包括有效细胞数,所述有效细胞数接近建库时预估的细胞数;基因组比对率,所述基因组对比率大于80%;基因集比对率,基因集比对率大于50%。
作为优选的技术方案,所述步骤2)中去除低质量细胞,所述低质量细胞包括表达基因数过高的细胞、表达reads数过低的细胞与线粒体基因表达reads占比超过10%的细胞。
作为优选的技术方案,使用Suerat软件包将过滤后的细胞进行聚类具体为:
将过滤的细胞表达矩阵进行标准化和归一化;
选择在细胞间表达变异最高的2000个基因作为主成分分析的因子;
使用PCA算法分析挑选基因的主成分分析的因子,挑选前20个主成分分析的因子作为聚类分析的输入项;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592574.4/2.html,转载请声明来源钻瓜专利网。





