[发明专利]基于知识图谱的分子调控关系预测方法及系统在审
申请号: | 202111650470.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114154758A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 薛宇;张玮之;王晨玮 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/08;G06N3/04;G06F16/36 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 许恒恒 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 知识 图谱 分子 调控 关系 预测 方法 系统 | ||
本发明属于图论学习、深度学习分析领域,具体涉及一种基于知识图谱的分子调控关系预测方法及系统,其中的预测方法包括以下步骤:(1)训练数据集的准备;(2)有向图模型的构建与训练;(3)神经网络的构建与训练;(4)实际预测。本发明通过对预测方法整体流程设计进行改进,首先结合图学习将有向图中的有向调控关系和各调控分子节点(即各调控分子实例)进行最优特征编码,接着在获得各节点与关系的特征编码后,利用深度神经网络框架进一步加强有向图的预测能力,经过迭代训练后提升有向调控的预测准确度。
技术领域
本发明属于图论学习、深度学习分析领域,更具体地,涉及一种基于知识图谱的分子调控关系预测方法及系统,利用对知识图谱的神经网络学习加上深度学习框架训练,达到对构建的先验知识进行合理分子预测的目的,为后续组学数据分析及实验设计作为指导。
背景技术
现有的分子间作用关系繁多,且大多研究构建的分子间相互作用网络为无向网络,因此基于无向图的各种分析推断不能有效挖掘分子间的相互作用顺序信息。例如在对分子调控网络构建中,如若使用无向网络进行构建与建模,使用者只能获取到分子间相互作用的关系,即只能得知两分子存在调控关系,但是具体调控过程未知,所以训练的模型在预测时会存在预测结果与真实结果相反但仍然预测分值很高的情况。但在有向网络中,因存在节点与节点间的有向调控关系,因此在训练过程中较少出现反向预测的情况,有向网络相较于无向网络包含了更多调控信息,对于后续实验的设计更具有指导意义。
另一方面,依赖公共的分子相互作用数据库中的分子有向调控关系数据,可以构建出更为精准的分子有向调控网络。
发明内容
针对现有图结构分析方法的改进需求,本发明的目的在于提供基于知识图谱的分子调控关系预测方法及系统,其中通过对预测方法整体流程设计进行改进,首先结合图学习将有向图中的有向调控关系和各调控分子节点(即各调控分子实例)进行最优特征编码,接着在获得各节点与关系的特征编码后,利用深度神经网络框架进一步加强有向图的预测能力,经过迭代训练后提升有向调控的预测准确度。本发明能够获取分子间有向调控信息后能构建出有向图,可较为准确预测分子调控关系(如后文的图3所示),为数据分析和实验设计提供指导。
为实现上述目的,按照本发明的一个方面,提供了一种基于知识图谱的分子调控关系预测方法,其特征在于,包括以下步骤:
(1)训练数据集的准备:
以某种基因或某种代谢物分子为节点,两两节点之间的关系构成分子调控关系,每一个分子调控关系对应一组头节点-关系-尾节点的组合;其中,所述关系选自:激活、抑制和相互作用,所述激活和所述抑制对应单向关系,所述相互作用对应双向关系;
从分子相互作用数据库中提取分子间有向调控关系,获得多个节点所对应的已知分子调控关系构建阳性数据集;并且,在所述阳性数据集的全部数据中,至少存在一个数据其头节点或尾节点为预测所针对的待预测节点;所述待预测节点具体为预先选定的基因或代谢物分子;
在所述阳性数据集已有节点的范围内,随机变化头节点、关系和尾节点,得到的不在阳性数据集内的分子调控关系记为伪调控关系,用于构建阴性数据集;
(2)有向图模型的构建与训练:
构建图学习模型,按预先设定的迭代次数要求,利用所述步骤(1)得到的所述阳性数据集,以阳性数据作为输入,对该图学习模型进行训练;
训练后的图学习模型,能够针对每个节点和每个关系分别赋予目标维度的特征向量;
(3)神经网络的构建与训练:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111650470.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理