[发明专利]一种鳞癌组织功能状态与细胞组分评估方法及系统有效
申请号: | 202110884396.0 | 申请日: | 2021-08-03 |
公开(公告)号: | CN113593640B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 区乐淳;赵二杰;梁继生 | 申请(专利权)人: | 哈尔滨市米杰生物科技有限公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/30 |
代理公司: | 黑龙江立超同创知识产权代理有限责任公司 23217 | 代理人: | 孙春玲 |
地址: | 150000 黑龙江省哈尔滨市*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 组织 功能 状态 细胞 组分 评估 方法 系统 | ||
1.一种鳞癌组织功能状态与细胞组分评估方法,其特征在于,包括下述步骤:
步骤一、获取鳞状细胞癌组织单细胞测序数据;
步骤二、对所述单细胞测序数据进行无监督聚类分析,识别获得包含以下细胞类型的单细胞样本数据:B/Plasma细胞、T/NK细胞、内皮细胞、上皮细胞、成纤维细胞、Langerin树突细胞、肥大细胞、成熟树突细胞、黑色素细胞、浆细胞样树突细胞和单核细胞;
步骤三、通过对各个细胞类型的单细胞样本数据进行无监督聚类分析,识别获得各个细胞类型内的细胞亚群样本数据;
步骤四、获取14种单细胞组织功能状态相关基因集,根据所述基因集对待评估鳞癌组织进行组织功能状态的评估;具体步骤包括:
从CancerSEA数据库中提取与组织功能状态相关的14种单细胞组织功能状态基因集并以其在CancerSEA数据库中对应的编号数据集的数目作为权重;
在待评估鳞癌组织的测序数据中提取14种功能状态基因;
以所述权重对每个功能状态基因进行加权,并计算各个功能状态基因的均值,从而获得组织功能状态的得分;
所述组织功能状态包括血管生成、细胞凋亡、细胞周期、细胞分化、DNA损伤、DNA修复、细胞上皮间质化、细胞缺氧、炎症发生、癌细胞侵袭、癌细胞转移、癌细胞增殖、细胞静息、干细胞性;
步骤五、根据所述单细胞样本数据或各个细胞类型内的细胞亚群样本数据对待评估鳞癌组织的各个细胞类型或各个细胞亚群类型进行细胞组分的评估;具体步骤包括:
样本间细胞组分的评估功能:通过基因差异表达分析,筛选获得单细胞样本数据或细胞亚群样本数据中的样本细胞特征表达基因;根据所述样本细胞特征表达基因计算待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达基因的均值,输出不同细胞类型或细胞亚群类型的浸润含量评分;
样本内细胞组分的评估功能:通过基因差异表达分析,筛选获得单细胞样本数据或细胞亚群样本数据中的细胞特征表达基因,并生成样本特征表达矩阵;通过非负线性最小二乘回归方法计算待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达矩阵与样本特征表达矩阵的拟合回归系数,通过不断迭代获得最终拟合回归系数,并通过以下公式处理使所得回归系数总和为1,从而获得待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞组分含量百分比;
其中,P表示细胞组分含量百分比,Lm表示拟合回归系数,i表示待评估鳞癌组织中的细胞类型或细胞亚群类型,j表示待评估鳞癌组织中的所有细胞类型或所有细胞亚群类型;
在计算拟合回归系数之前,根据特征表达基因在各个细胞类型或细胞亚群类型内的基因表达量方差与该细胞类型或细胞亚群类型的平均文库对特征表达基因施加权重,获得样本特征表达矩阵的附加特征数据,并将上述附加特征数据和样本特征表达矩阵结合作为最终的样本特征表达矩阵;其中,权重计算公式为:
其中,W为基因的权重得分,R为拟合残差,Lm为拟合回归系数,Lib为细胞类型或细胞亚群类型平均文库,V为细胞类型或细胞亚群类型内的基因表达量方差,nu为常数1e-04。
2.根据权利要求1所述的一种鳞癌组织功能状态与细胞组分评估方法,其特征在于,在计算拟合回归系数之前,通过以下公式将待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达矩阵与样本特征表达矩阵进行均值方差归一化以消除矩阵间的量纲:
其中,x表示待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达矩阵;表示样本特征表达矩阵的均值,σ表示样本特征表达矩阵的标准差。
3.一种鳞癌组织功能状态与细胞组分评估系统,其特征在于,包括:
数据获取模块,包括测序数据获取子模块和基因功能状态获取子模块,所述测序数据获取子模块用于获取鳞状细胞癌组织单细胞测序数据,所述基因功能状态获取子模块用于获取14种单细胞组织功能状态相关基因集;
聚类分析模块,用于对所述单细胞测序数据进行无监督聚类分析,识别获得包含以下细胞类型的单细胞样本数据:B/Plasma细胞、T/NK细胞、内皮细胞、上皮细胞、成纤维细胞、Langerin树突细胞、肥大细胞、成熟树突细胞、黑色素细胞、浆细胞样树突细胞和单核细胞;对各个细胞类型的单细胞样本数据进行无监督聚类分析,识别获得各个细胞类型内的细胞亚群样本数据;
组织功能状态评估模块,用于根据14种单细胞组织功能状态相关基因集,对待评估鳞癌组织进行组织功能状态的评估;所述组织功能状态包括血管生成、细胞凋亡、细胞周期、细胞分化、DNA损伤、DNA修复、细胞上皮间质化、细胞缺氧、炎症发生、癌细胞侵袭、癌细胞转移、癌细胞增殖、细胞静息、干细胞性;具体步骤包括:从CancerSEA数据库中提取与组织功能状态相关的14种单细胞组织功能状态基因集并以其在CancerSEA数据库中对应的编号数据集的数目作为权重;在待评估鳞癌组织的测序数据中提取14种功能状态基因;以所述权重对每个功能状态基因进行加权,并计算各个功能状态基因的均值,从而获得组织功能状态的得分;
细胞组分评估模块,用于根据所述单细胞样本数据或各个细胞类型内的细胞亚群样本数据对待评估鳞癌组织的各个细胞类型或各个细胞亚群类型进行细胞组分的评估;具体包括:通过基因差异表达分析,筛选获得单细胞样本数据或细胞亚群样本数据中的样本细胞特征表达基因;根据所述样本细胞特征表达基因计算待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达基因的均值,输出不同细胞类型或细胞亚群类型的浸润含量评分;或者,
通过基因差异表达分析,筛选获得单细胞样本数据或细胞亚群样本数据中的细胞特征表达基因,并生成样本特征表达矩阵;根据特征表达基因在各个细胞类型或细胞亚群类型内的基因表达量方差与该细胞类型或细胞亚群类型的平均文库对特征表达基因施加权重,获得样本特征表达矩阵的附加特征数据,并将上述附加特征数据和样本特征表达矩阵结合作为最终的样本特征表达矩阵;权重计算公式为:
其中,W为基因的权重得分,R为拟合残差,Lm为拟合回归系数,Lib为细胞类型或细胞亚群类型平均文库,V为细胞类型或细胞亚群类型内的基因表达量方差,nu为常数1e-04;
通过非负线性最小二乘回归方法计算待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞特征表达矩阵与样本特征表达矩阵的拟合回归系数,通过不断迭代获得最终拟合回归系数,并通过以下公式处理使所得回归系数总和为1,从而获得待评估鳞癌组织中各个细胞类型或细胞亚群类型的细胞组分含量百分比;
其中,P表示细胞组分含量百分比,Lm表示拟合回归系数,i表示待评估鳞癌组织中的细胞类型或细胞亚群类型,j表示待评估鳞癌组织中的所有细胞类型或所有细胞亚群类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨市米杰生物科技有限公司,未经哈尔滨市米杰生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110884396.0/1.html,转载请声明来源钻瓜专利网。