[发明专利]来自大量组织转录组的准确稳健的信息反卷积在审
| 申请号: | 202080085042.3 | 申请日: | 2020-11-06 |
| 公开(公告)号: | CN115136242A | 公开(公告)日: | 2022-09-30 |
| 发明(设计)人: | 杨韬;白玉;W·弗瑞;G·阿特瓦尔 | 申请(专利权)人: | 雷杰纳荣制药公司 |
| 主分类号: | G16B25/10 | 分类号: | G16B25/10;G16B40/00 |
| 代理公司: | 深圳永慧知识产权代理事务所(普通合伙) 44378 | 代理人: | 黄鑫 |
| 地址: | 美国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 来自 大量 组织 转录 准确 稳健 信息 卷积 | ||
1.一种对大量或空间RNA测序数据进行反卷积的方法,所述方法包括以下步骤中的任何一个或多个:
a)从包含大量或空间RNA-seq数据、单细胞RNA-seq数据和细胞类型注释的来源获得输入,并且从基于计数的测序数据的归一化矩阵选择最可变表达基因的子集;
b)估计每个细胞类型每个基因的表达的均值和离散参数;
c)计算每个基因的跨细胞类型特异性;
d)取决于多样本可用性,根据所述大量或空间RNA-seq数据或单细胞样本估计跨样本基因可变性;
e)使用所述大量或空间RNA-seq数据和单细胞数据两者估计基因方面的缩放因子;以及
f)使用所有已知量建立加权和正则化回归模型,并使用所述模型估计在所述大量或空间RNA测序数据中的细胞类型比例;
从而推断在所述大量或空间RNA测序数据中的细胞类型的百分比。
2.根据权利要求1所述的方法,其中所述基于计数的测序数据的矩阵包括针对固定数量细胞的多个基因中的每个基因的基于计数的测序计数。
3.根据权利要求1或权利要求2所述的方法,其中所述输入是具有与每个细胞相关联的细胞类型注释的单细胞UMI计数矩阵。
4.根据权利要求1或权利要求2所述的方法,其中有待反卷积的所述大量数据是每千碱基百万的转录物(TPM)或读取计数。
5.根据权利要求1或权利要求2所述的方法,其中所述有待反卷积的空间数据是UMI计数矩阵。
6.根据权利要求1至5中任一项所述的方法,其中选择不包括可能引入噪声的非信息性基因的含有区分细胞类型的重要信息的基因作为来自基于计数的测序数据的归一化矩阵的最可变表达基因的子集。
7.根据权利要求6所述的方法,其中所述基因的子集选自标记基因的联合,所述标记基因在单细胞UMI计数矩阵中的每个细胞类型中表达丰富。
8.根据权利要求7所述的方法,其中内置工具将单细胞UMI计数矩阵和细胞类型注释作为输入。
9.根据权利要求8所述的方法,其中对于每个细胞类型,所述工具计算所述细胞类型中的平均UMI与所有其他细胞类型中的平均UMI之间的倍数变化,并且按照降序的倍数变化将基因进行排序。
10.根据权利要求9所述的方法,其中从每个细胞类型选择约前200个基因。
11.根据权利要求9所述的方法,其中选择存在于不超过五个细胞类型中的所选标记基因。
12.根据权利要求9所述的方法,其中选择存在于固定数量的细胞类型或细胞类型总数的一部分中的所选标记基因,以较小者为准。
13.根据权利要求9所述的方法,其中选择约总共1,000个独特基因。
14.根据权利要求6所述的方法,其中所述基因的子集选自在单细胞UMI计数矩阵中的跨所有细胞的变化最大的高度可变基因的联合。
15.根据权利要求14所述的方法,其中计算每个基因在细胞数平衡和VST归一化之后的方差。
16.根据权利要求15所述的方法,其中选择具有最高方差的基因。
17.根据权利要求14至16中任一项所述的方法,其中通过找到所有细胞簇的中值大小来平衡单细胞UMI计数矩阵中的细胞类型,其中对来自每个簇的细胞进行采样以使它们等于此大小。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雷杰纳荣制药公司,未经雷杰纳荣制药公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080085042.3/1.html,转载请声明来源钻瓜专利网。





