[发明专利]基于单样本sKLD指标检测复杂生物系统相变临界点的方法在审
申请号: | 201911142801.0 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111009292A | 公开(公告)日: | 2020-04-14 |
发明(设计)人: | 刘锐;钟佳元;马硕;金海洋;陈培 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G16H10/20 | 分类号: | G16H10/20;G16H50/00 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 蒋剑明 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 skld 指标 检测 复杂 生物 系统 相变 临界点 方法 | ||
本发明公开了一种基于单样本sKLD指标检测复杂生物系统相变临界点的方法,通过从高通量的数据中挖掘丰富的动态信息并利用正常状态和临界状态之间的不同动态特性,量化单一样本对参照组样本分布的干扰,从而确定临界状态或相变的早期预警信号。为了验证算法的有效性,本发明将该算法应用于一个基于模拟数据集的调控网络和六个真实的数据集。这六个真实数据集分别是:小鼠实验中通过吸入羰基氯引发肺水肿生成的基因表达谱的数据集、5个TCGA数据库的癌症数据集(肺鳞癌、肺腺癌、胃腺癌、甲状腺癌、结肠癌)。
技术领域
本发明涉及生物系统相变临界点检查的技术领域,具体涉及一种基于单样本sKLD指标检测复杂生物系统相变临界点的方法。
背景技术
生物系统的发展进程通常是一个非线性过程,具有三个阶段,即正常状态、临界状态和疾病状态,其中临界状态是正常状态进入疾病状态的临界点。传统的生物标记物旨在通过利用观察到的分子的差异表达信息来识别疾病状态,但是由于正常和临界状态之间通常没有显著差异,所以可能无法检测到复杂生物系统相变的临界。因此,对临界状态进行信号预警是一个挑战,这实际上意味着对复杂生物系统相变临界点进行预测。
下面介绍计算方法的理论推导如下:
在临界相变之前和附近不同的动态特性:
复杂生物系统相变临界点进展的动力学可以通过以下非线性离散时间动态系统来表示:Z(t)=f(Z(t-1);P),这里Z(t)= (z1(t),z2(t),…,zn(t))是n维状态向量或在时间t=1,2,…的变量,P= (P1,…,Ps)是一个代表缓慢变化因素的参数向量或者驱动因素,例如,遗传因素(SNP,CNV等),表观遗传因素(methylation,acetylation等)或者环境因素。f:Rn×Rs×Rn是一个非线性函数。对于这样一个非线性系统,该系统在处将经历一个相变或者是一种当参数P达到阈值Pc时来自稳定平衡的分叉(Gilmore,1993)。
对于z附近的系统(1),在P到达Pc之前,系统应该保持稳定的平衡因而所有的特征值的绝对值都在(0,1)内。使系统状态发生移位的参数值Pc称为一个分岔参数值或一个临界值,而在这种分歧之前的状态被称为前疾病状态。为了从理论和数学上描述生物系统的动力学,通常将其演化建模为一个含时非线性动力学系统,在该系统中,突变被视为分叉点处的时期转移。在小噪声的理想情况下,当一个复杂系统接近临界点时,在所有观测变量中,存在一个被定义为动态网络生物标记物生物分子的优势群,它基于观测数据满足以下三个条件(Chen et al.,2012;Liu et al.,2012,2013a, 2014b)
1.动态网络生物标记物组中任何一对分子之间的相关性迅速增加;
2.动态网络生物标记物组中任何的一个分子与任何其他非动态网络生物标记物分子之间的相关性迅速降低;
3.动态网络生物标记物组中任何一个分子的标准差急剧增加。
因此,从上述三个性质可以看出,系统的临界转变实际上可以由“分布转变”来表示,即对于动态网络生物标记物,当系统接近临界转变点时,它们的分布会发生显著变化。因此,通过探索这些变量的分布,我们可以预测即将到来的定性时期转变。另一方面,一个高通量数据样本使研究者能够同时分析成千上万种生物分子的表达。这样一个高维的样本实际上富含了累积效应的动态信息,比如相关生物系统在长期发展中的生物分子的相互作用。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911142801.0/2.html,转载请声明来源钻瓜专利网。