[发明专利]一种用于预测转录因子-靶基因相互作用的方法及模型在审
| 申请号: | 202111493609.3 | 申请日: | 2021-12-08 |
| 公开(公告)号: | CN114420203A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 黄裕安;潘贵青;王佳;林秋镇;李坚强 | 申请(专利权)人: | 深圳大学 |
| 主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B10/00 |
| 代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 庄敏芳 |
| 地址: | 518060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 预测 转录 因子 基因 相互作用 方法 模型 | ||
本发明公开的一种用于预测转录因子‑靶基因相互作用的方法及模型,所述用于预测转录因子‑靶基因相互作用的方法是基于随机游走的异构图嵌入算法来预测TF与靶基因潜在的相互作用关系,采用随机游走方式在异构图中生成节点的语句,然后采用滑动窗口方式提取训练样本,经过异构图嵌入算法生成节点的特征,进而预测TF与靶基因之间未被发现的相互作用关系。并且,由于本发明在异构图中添加了TG节点,采用随机游走生成样本路径的过程中,在选择TG或者疾病节点时,设定一个概率,以一定概率选择TG或者疾病,在解决冷启动问题的同时,能够更好地捕获异构网络的节点信息。
技术领域
本发明涉及生物信息学技术领域,尤其涉及一种用于预测转录因子-靶基因相互作用的方法及模型。
背景技术
转录调控通过调节转录速率来协调转录过程中发生的基因调控,它决定细胞发育命运和细胞对遗传和环境扰动的反应。在这个过程中,转录因子(TF)与DNA的顺式调控元件结合,激活RNA聚合酶来调控靶基因的转录。鉴于其对生物过程的重要性,所以确定TF与其靶基因相互作用的相互作用模式对于生物学和医学的研究至关重要。
Yang等人提出了GripDL模型,该模型由卷积神经网络(CNN)组成,从基因(包括TF及其目标基因)的原位杂交(ISH)图像中学习嵌入特征,以推断它们之间潜在的相互作用关系。但是基因表达图像数据对于一些研究目标而言仍然非常昂贵,很难在实际研究中广泛采用。Lin等人利用基于三因子分解的协同过滤技术,使用相关的蛋白质-蛋白质相互作用作为训练数据来预测特定TF的潜在的目标基因。但是这种方法并不能全面的考虑TF及其靶基因的连接。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供一种用于预测转录因子-靶基因相互作用的方法及模型,旨在解决现有技术中在预测转录因子和靶基因之间的相互作用时不能直接得出TF-靶基因相互作用的结果以及不能更全面的考虑TF与靶基因的连接的问题。
本发明的技术方案如下:
一种用于预测转录因子-靶基因相互作用的方法,具体包括步骤:
从基因数据库提取转录因子与靶基因的连接和从疾病数据库提取基因与疾病的连接,构建一个三种节点类型的第一异构网络;
假设转录因子与目标基因之间的节点为TG,所述第一异构网络与所述节点TG形成第二异构网络;
采用基于元路径的随机游走方式,从所述第二异构网络生成样本路径;
基于所述样本路径构建图嵌入模型,给定样本对节点,利用所述图嵌入模型将所述样本对节点的嵌入向量连接起来作为全连接层的输入,获得所述节点的结果;
根据所述结果从所述第二异构网络中获得所述节点最终的嵌入,分别形成转录因子嵌入矩阵F和靶基因的嵌入矩阵G,计算两个矩阵的点积获得预测得分矩阵R,其中第i行第j列的值表示第i个转录因子与第j个靶基因的预测得分。
所述的用于预测转录因子-靶基因相互作用的方法,所述节点类型包括转录因子、靶基因、疾病。
所述的用于预测转录因子-靶基因相互作用的方法,所述节点TG设置为常数1的向量。
所述的用于预测转录因子-靶基因相互作用的方法,所述元路径的表示形式为其中表示两个不同类型节点V1和Vn之间的关联。
所述的用于预测转录因子-靶基因相互作用的方法,根据所述元路径的表示形式,计算第k步转移的概率p,其公式如下:
其中表示节点的Vt+1类型的相邻节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111493609.3/2.html,转载请声明来源钻瓜专利网。





