[发明专利]一种适用于10x单细胞转录组测序数据的分析方法在审
| 申请号: | 202011592574.4 | 申请日: | 2020-12-29 |
| 公开(公告)号: | CN112599199A | 公开(公告)日: | 2021-04-02 |
| 发明(设计)人: | 沈立;姜丽荣;孙子奎 | 申请(专利权)人: | 上海派森诺生物科技股份有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00 |
| 代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 胡志强 |
| 地址: | 200030 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 适用于 10 单细胞 转录 序数 分析 方法 | ||
1.一种适用于10x单细胞转录组测序数据的分析方法,其特征在于,包括下列步骤:
1)测序数据处理,
使用10x genomics官方的cellranger count流程对原始数据进行处理:
使用count程序对下机的Fastq文件进行处理,得到每个细胞的基因的表达reads数;
根据count程序生成的网页中的信息,对测序结果进行质控;
2)Seurat数据过滤,
使用Seurat软件包对步骤1)中获取的表达数据进一步去除低质量细胞,获得过滤后的细胞;
3)细胞聚类分群,使用Suerat软件包将过滤后的细胞进行聚类;
4)细胞群标记基因分析,使用Suerat软件包分析各细胞群的标记基因,获得结果。
2.如权利要求1所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于:
所述步骤1)中质控的主要指标包括有效细胞数,所述有效细胞数接近建库时预估的细胞数;基因组比对率,所述基因组对比率大于70%;基因集比对率,基因集比对率大于30%。
3.如权利要求2所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于:
所述步骤1)中质控的主要指标包括有效细胞数,所述有效细胞数接近建库时预估的细胞数;基因组比对率,所述基因组对比率大于80%;基因集比对率,基因集比对率大于50%。
4.如权利要求1所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于:
所述步骤2)中去除低质量细胞,所述低质量细胞包括表达基因数过高的细胞、表达reads数过低的细胞与线粒体基因表达reads占比超过10%的细胞。
5.如权利要求1所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于,使用Suerat软件包将过滤后的细胞进行聚类具体为:
将过滤的细胞表达矩阵进行标准化和归一化;
选择在细胞间表达变异最高的2000个基因作为主成分分析的因子;
使用PCA算法分析挑选基因的主成分分析的因子,挑选前20个主成分分析的因子作为聚类分析的输入项;
根据PCA主成分,构建KNN图,使用Louvain algorithm算法对细胞进行聚类;
使用UMAP算法对聚类结果进行非线性降维,根据前两个维度对聚类结果进行可视化。
6.如权利要求1所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于,使用Suerat软件包分析各细胞群的标记基因具体是:
将各细胞群的细胞表达量与其他细胞群的表达量均值进行比较,找到在本细胞群中高表达,在其他细胞群中低表达的基因;
对找到的标记基因进行筛选;
使用Suerat软件包的VlnPlot函数将标记基因在各个细胞群的表达情况进行展示。
7.如权利要求6所述的一种适用于10x单细胞转录组测序数据的分析方法,其特征在于:所述标记基因进行筛选为在本细胞群中表达比例大于25%,logfc大于0.25的结果保留。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海派森诺生物科技股份有限公司,未经上海派森诺生物科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011592574.4/1.html,转载请声明来源钻瓜专利网。





