[发明专利]一种基于图表示学习的关键蛋白质识别方法和装置在审
| 申请号: | 202210182217.3 | 申请日: | 2022-02-25 |
| 公开(公告)号: | CN114664377A | 公开(公告)日: | 2022-06-24 |
| 发明(设计)人: | 杨合;朱媛 | 申请(专利权)人: | 中国地质大学(武汉) |
| 主分类号: | G16B25/10 | 分类号: | G16B25/10;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 430000 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 图表 学习 关键 蛋白质 识别 方法 装置 | ||
1.一种基于图表示学习的关键蛋白质识别方法,其特征在于,包括:
从数据库中筛选关键蛋白质作为标签,标记提取的蛋白质相互作用网络数据中的蛋白质节点,获得带节点标签的蛋白质相互作用网络;
使用DeepWalk算法对所述蛋白质相互作用网络数据进行图表示学习,获得图表示矩阵数据;
将所述带节点标签的蛋白质相互作用网络、从蛋白质节点的同源生物信息中提取的蛋白质节点属性特征以及所述图表示矩阵数据输入图卷积神经网络模型进行迭代训练;
利用训练好的图卷积神经网络模型识别待测蛋白质网络中的关键蛋白质节点。
2.如权利要求1所述的一种基于图表示学习的关键蛋白质识别方法,其特征在于,使用DeepWalk算法对所述蛋白质相互作用网络数据进行图表示学习,获得图表示矩阵数据,包括:
使用随机游走的方式在标记后的所述蛋白质相互作用网络数据中进行节点采样,获得节点访问序列;
使用skip-gram模型对所述节点访问序列进行向量学习,获得所述图表示矩阵数据。
3.如权利要求2所述的一种基于图表示学习的关键蛋白质识别方法,其特征在于,使用随机游走的方式在标记后的所述蛋白质相互作用网络数据中进行节点采样,获得节点访问序列,包括:
从网络中的每个节点开始,分别进行Random Walk采样,得到局部相关联的训练数据。
4.如权利要求1所述的一种基于图表示学习的关键蛋白质识别方法,其特征在于,将所述带节点标签的蛋白质相互作用网络、从蛋白质节点的同源生物信息中提取的蛋白质节点属性特征以及所述图表示矩阵数据输入图卷积神经网络模型进行迭代训练,包括:
将输入所述图卷积神经网络模型的所述带节点标签的蛋白质相互作用网络、从蛋白质同源生物信息中提取的蛋白质节点的属性特征以及所述图表示矩阵数据划分为训练集和测试集;
利用所述训练集训练所述图卷积神经网络模型;
利用所述测试集验证训练后的所述图卷积神经网络模型是否满足预设识别精度,若满足,则停止训练,若不满足,则继续进行迭代训练。
5.如权利要求1所述的一种基于图表示学习的关键蛋白质识别方法,其特征在于,将所述带节点标签的蛋白质相互作用网络、从蛋白质节点的同源生物信息中提取的蛋白质节点属性特征以及所述图表示矩阵数据输入图卷积神经网络模型进行迭代训练,还包括:
当迭代达到预设迭代次数时训练停止,得到训练好的图卷积神经网络模型。
6.如权利要求1所述的一种基于图表示学习的关键蛋白质识别方法,其特征在于,所述蛋白质的同源生物信息包括计算得到的基因表达信息、亚细胞定位信息和蛋白质复合物信息。
7.一种基于图表示学习的关键蛋白质识别装置,其特征在于,所述关键蛋白质识别装置包括存储器、处理器;
所述存储器上存储有可在所述处理器上运行的基于图表示学习的关键蛋白质识别程序,所述基于图表示学习的关键蛋白质识别程序被所述处理器执行时实现如权利要求1至6中任一项所述的基于图表示学习的关键蛋白质识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210182217.3/1.html,转载请声明来源钻瓜专利网。





