[发明专利]提升计算机辅助诊断系统候选疾病基因识别性能的方法在审
申请号: | 202111444124.5 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114334126A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 丁苍峰;王君;张紫芸;刘翼 | 申请(专利权)人: | 延安大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16B25/10 |
代理公司: | 北京正阳理工知识产权代理事务所(普通合伙) 11639 | 代理人: | 张利萍 |
地址: | 716000 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提升 计算机辅助 诊断 系统 候选 疾病 基因 识别 性能 方法 | ||
1.提升计算机辅助诊断系统候选疾病基因识别性能的方法,其特征在于,包括以下步骤:
步骤1:建立包括基因多网络、表型网络和基因-表型网络的多层异构生物网络;
步骤2:利用游走于多层和多层异构网络的拓扑偏置随机游走算法BRWR,识别疾病基因;
首先,采用一种拓扑偏置随机游走方法,允许随机游走偏置目标节点的各种拓扑属性;
所述拓扑偏置随机游走表示为马尔可夫过程,其转移概率是游走偏置参数函数;将拓扑偏置随机游走引入到重启随机游走RWR中,通过调整偏置函数的参数,使得游走者优先访问或避开具有高拓扑属性值的节点;通过将基于拓扑偏置随机游走的RWR方法应用于描述多种基因相互作用关系的基因网络和多层异构生物网络;
其中,基于BRWR的单层网络基因识别,方法如下:
随机游走者在每个时间步骤上,或者从当前节点迭代地移动到其直接邻居,或者重启在具体的种子节点上;
对于随机游走者的每次迭代,随机游走者以预先设定的概率r∈(0,1)在种子节点上重启,游走者将探索整个网络从而获得种子近邻的中心性排名;稳态概率给出了种子与网络中所有其它节点之间的中心性排名;
用来获得候选基因中心性排名的RWR方法,优先访问生物网络中高度连接节点或中心节点;设pi(t)是给定时间步骤t下的特定节点i的时间相关概率变量,πg表示与基因网络相关的转移矩阵,有:
从时间t到t+1的基因网络下BRWR如下:
p(t+1)=(1-r)πgp(t)+rp0 (3)
其中,p(t)=[p1(t),p2(t),…,pN(t)],p(t)表示在时间步骤t下有N个元素的向量,p0是种子节点的位置不等于零的初始概率向量;r是随机游走重启概率,r∈(0,1);
经过多次迭代后,向量p(t+1)和向量p(t)之间的差异将变得忽略不计;通过调整偏置参数,概率将达到稳定状态;稳定概率p(∞)表示节点i到给定种子节点的中心性排名,如果pi(∞)>pj(∞),则节点i相较于节点j更加接近种子节点;
基于BRWR的多层网络基因识别,方法如下:
在非重启步骤中,相互连接多层网络上的随机游走者有两种行走情况:第一种是随机游走者从当前节点跳转到同一层的一个直接邻接节点,第二种是从当前节点跳跃其它层中的其对应的节点;
其中,针对节点对齐和连接的基因多网络,该基因多网络由L个单层基因网络组成,每层分享同样的基因节点集V={1,2,…,N};每一单层基因网络α对应的邻接矩阵为Aα,表示邻接矩阵Aα中一个元素;层之间连接所对应的矩阵为Dα,β,它指示了层α中的节点和层β中同样节点之间的连接,其中,量化了从层α中节点i游走到层β中节点i的“代价”,将一个层间连接基因多网络表示为一个超级邻接矩阵AM,即:
其中,δ∈[0,1]控制随机游走在不同层之间跳跃或停留在同一层中的概率,如果δ=0,则随机游走者将会仅在同一层内移动;
用AM(ij)取代式(1)中的gij,同样能得到多层网络上随机游走者的偏置转移概率矩阵πM,
将偏置重启随机游走BRWR方法引入多层网络BRWR-M,则式(2)变为:
pM(t+1)=(1-r)πMpM(t)+rpM0 (5)
其中,pM(t)是一个具有NL成份的超向量,NL表示基因多网络总节点数;pM(t)=[p1(t),p2(t),…,pL(t)],它描述多层网络随机游走的概率分布,这些向量由每一层上节点的概率分布组成;pM0为重启向量,它描述每个层的初始概率分布,设pM0=τp0,参数τ量化了多层网络中每一层种子节点的重启概率,τ=[τ1,τ2,…,τL,];通过修改参数τ来调整每一层的重要性;
基于BRWR的多层异构网络基因识别,方法如下:
将拓扑偏置重启随机游走BRWR方法引入到多层异构网络BRWR-MH;
一个给定步骤的随机游走者,初始定位于多层网络中某一层的一个具体节点上;在下一个非重启步骤,随机游走者能够在相同的层内移动,或跳到其它层中与其对应的一样节点上,或借助基因-表型关联关系跳到另一个网络中;
设一个有L层和N个蛋白质/基因节点组成的基因多网络,其对应的超级邻接矩阵AM(NL×NL)由式(3)得知;具有M个表型的表型网络,其对应邻接矩阵为AP(M×M),并构建超级二分关联矩阵;根据二分的基因-表型关联关系,对应邻接矩阵为的多层二分网络将基因多网络每一层中的基因节点与表型节点关联起来;
多层二分网络是由L个相同的异构二分网络组成,使用B(N×M)来描述所有的二分网络,并通过堆叠L个二分网络B(N×M)来创建一个与多层异构网络相关联的二分关联超邻接矩阵BMP,表示一个向量或矩阵的转置;
然后,构建多层异构网络所对应的全局邻接矩阵AMH,其中BPM是对应BMP的转置矩阵;同样计算BRWR在不同网络上的转移概率,以便将其引入到多层异构网络中;令R表示多层异构网络所对应的转移矩阵,其中,RMM和RPP分布表示位于基因多网络和表型网络内的随机游走的转移概率,RMP和RPM分别描述了基因多网络和表型网络之间的随机游走的跳跃概率;
对于一个给定的节点,如果存在二分基因-表型关联关系,则随机游走者将在基因多网络和表型网络之间跳跃,或者以跳跃概率λ∈[0,1]停留在当前网络;跳跃概率λ控制着多层异构网络中两个子网络的强化作用,λ值越大,网络间跳跃概率就越高,如果λ=0则基因和表型独立排名;
设随机游走者位于多层异构基因网络中某一层的一个基因节点为gi,在下一时间步,随机游走者将按照以下两种方式之一跳跃:
第一,按照以下的转移概率RMM(i,j)跳跃到基因节点gj:
其中,bM为实数值的控制参数,fj表示目标节点的拓扑属性,AM(i,j)表示超级邻接矩阵AM的一个元素值,λ表示基因多层网络和表型网络间的跳跃概率;
第二,随机游走者通过一个二分基因-表型关联关系,按照转移概率RMP(i,j)跳跃到一个表型节点pj上:
其中,BMP为二分关联超邻接矩阵,bMP为实数值的控制参数;
同理,当随机游走者位于表型网络中一个表型节点pi时,随机游走者将按照以下两种方式之一跳跃:
第一,以RPP(i,j)概率跳跃到表型网络中另一节点pj:
其中,AP(i,j)表示表型网络所对应邻接矩阵的一个元素,bP为实数值的控制参数。
第二,以RPM(i,j)概率跳跃到一个基因节点gj:
其中,与每个子网络相关的bM、bP、bMP和bPM均为控制参数,允许调整随机游走者对目标节点拓扑属性的依赖性,fj表示目标节点的拓扑属性;
在多层异构网络上BRWR-MH如下:
pMH(t+1)=(1-r)RpMH(t)+rpMH0 (10)
其中,pMH(t+1)和pMH(t)分别表示在时间t+1和t步骤时随机游走者在多层异构网络上的概率分布,pMH0表示处于多层异构网络上随机游走者的初始概率分布,R表示多层异构网络所对应的转移矩阵;r∈(0,1)表示随机游走重启概率;t表示时间步骤;
由于BRWR-MH方法能够对L个不同层的N个基因节点和表型网络的M个表型同时进行排序,这些向量数pMH(t+1)、pMH(t)和pMH0的维是N×L+M;
最后,计算机辅助诊断系统将疾病基因识别结果进行呈现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于延安大学,未经延安大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111444124.5/1.html,转载请声明来源钻瓜专利网。