[发明专利]一种基于基因调控网络识别驱动调控因子的方法在审
| 申请号: | 202310524599.8 | 申请日: | 2023-05-10 |
| 公开(公告)号: | CN116486902A | 公开(公告)日: | 2023-07-25 |
| 发明(设计)人: | 曾坚阳;王培卓;赵诞 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 黄德海 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 基因 调控 网络 识别 驱动 因子 方法 | ||
1.一种构建基因调控网络的方法,其特征在于,所述方法包括以下步骤:
S01:获取细胞内部基因相互作用网络作为背景基因网络;
S02:获取单细胞转录组数据,对所述数据进行预处理,获取单细胞发育轨迹信息;
S03:基于图注意力神经网络构建所述基因调控网络的编码器;
S04:输入所述背景基因网络和所述单细胞发育轨迹信息,基于图对比学习框架对所述编码器进行训练;
S05:获取基因相互关系,利用注意力系数为所述基因相互关系赋权;
S06:设定基因相互关系权重阈值,选取高于所述阈值的基因相互关系,得到所述基因调控网络。
2.根据权利要求1所述的方法,其特征在于,步骤S01中所述细胞内部基因相互作用网络来自NicheNet、OmniPath、InbioMap、PathwayCommons中的至少一个,其中所述NicheNet、OmniPath、InbioMap和PathwayCommons剔除掉细胞间的配体-受体相互作用关系,将无向边处理为双向边。
3.根据权利要求1所述的方法,其特征在于,步骤S02中所述预处理包括:
基于所述单细胞转录组数据中每个细胞表达的基因数量对细胞进行过滤,根据每个基因参与表达的细胞数目对基因进行过滤,去除低质量细胞和基因后,对基因表达量进行归一化处理,获取单细胞发育轨迹信息;
任选地,所述单细胞发育轨迹信息包括采用Slingshot、DPT、Palantir中的至少一种方法获取。
4.根据权利要求1所述的方法,其特征在于,步骤S03中所述编码器包括:
注意力机制函数、批量归一化、前馈神经网络和激活函数。
5.根据权利要求4所述的方法,其特征在于,所述编码器的组成方式包括:每一层图注意力神经网络之前进行所述批量归一化,每一层图注意力神经网络之后连接所述前馈神经网络;
任选地,所述组成方式堆叠两层。
6.根据权利要求4所述的方法,其特征在于,所述注意力机制函数包括如下公式:
其中,att函数为注意力函数,度量节点vi和节点vj间的相关性;l表示所述图注意力神经网络中的层;和分别为与源节点和目标节点相关的权重矩阵;和分别为节点vi和节点vj的基因特征表示,其中对于第一层为输入的基因表达谱数据;Dscore为基因差异表达得分;
eij通过softmax函数归一化得到注意力系数αij;τ为温度参数,且τ<1;
最终节点vi的输出特征是得到的注意力系数αij所对应的特征的线性组合,使用多头注意力机制同时捕捉多个表征子空间的基因特征表示得到是GELU激活函数;K是多头注意力的总头数;||表示连接操;
任选地,所述批量归一化包括采用如下公式对节点vi的基因表达谱进行处理:
其中,BN为Batch Normalization函数;
任选地,所述前馈神经网络包括如下函数:
其中,w1和w2为系数矩阵,b1和b2为偏置项;
任选地,所述激活函数如下式所示:
7.根据权利要求6所述的方法,其特征在于,所述步骤S03进一步包括:将背景基因网络划分为传入网络和传出网络,所述传入网络和传出网络上的计算同时进行,根据以下公式将节点vi的基因特征表示连接起来:
其中,和分别表示传入网络和传出网络上的基因特征表示,concat表示拼接操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310524599.8/1.html,转载请声明来源钻瓜专利网。





