[发明专利]一种药物与靶点蛋白的匹配方法及系统在审

专利信息
申请号: 202110656718.6 申请日: 2021-06-11
公开(公告)号: CN113450870A 公开(公告)日: 2021-09-28
发明(设计)人: 侯艳;王萌 申请(专利权)人: 北京大学
主分类号: G16B15/30 分类号: G16B15/30;G16B40/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京天达知识产权代理事务所(普通合伙) 11386 代理人: 庞许倩
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 药物 蛋白 匹配 方法 系统
【说明书】:

发明涉及一种药物与靶点蛋白的匹配方法及系统,属于药物研发技术领域,解决了现有技术中药物与靶点蛋白匹配难度大、计算量大且准确度低的问题。该方法包括,获取多组样本训练集;对样本训练集中药物靶点蛋白对中药物和靶点蛋白的特征向量进行编码、解码并获得损失函数,进而获得优化好的栈式自编码网络;获取样本训练集中药物靶点蛋白对中药物、靶点蛋白的深度表征向量,并获得深度神经网络的损失函数,进而获得优化好的深度神经网络,以获得优化好的匹配模型;用该匹配模型预测待匹配药物和待匹配靶点蛋白是否匹配,该方法通过对药物、靶点蛋白的特征进行降维并经深度神经网络进行匹配,减少了计算量,提高了匹配精度,有利于新药的快速研发。

技术领域

本发明涉及药物研发技术领域,尤其涉及一种药物与靶点蛋白的匹配方法及系统。

背景技术

药物的研发对人类健康和幸福做出了巨大的贡献。然而,传统新药研发是一个非常复杂、昂贵且长期的过程,且失败率较高。研发成本过高、投资回报率不足给制药行业发展带来了巨大的困难。越来越多的研究人员开始研究已知药物可作用的多个靶点蛋白,因为这种药物-靶点相互作用(DTI)可能出现在多种相似疾病中,从而加速药物研发。

现有的药物与靶点蛋白匹配预测方法主要包括配体方法(Ligand-based)、分子对接方法(Docking Simulation)以及化学基因组(Chemogenomic)的方法。配体方法的匹配原理是根据化学分子的相似性确定其作用的靶点蛋白也具有一定的相似性;分子对接方法主要基于靶点蛋白的三维结构,化学基因组方法主要通过机器学习的方法挖掘化合物的活性和生物医学数据,以将化学空间与基因空间联系起来以发现潜在的药物与靶点蛋白的相互作用关系;其中,化学基因组方法主要包括相似性方法、网络方法、矩阵分解方法、基于特征的方法以及深度学习方法。

现有技术至少存在以下缺陷,一是配体方法,当已知的化学分子较少时,其预测结果准确度低;二是分子对接方法,需要靶点蛋白的3维结构,然而诸如G-蛋白偶联受体(GPCRs)的3维结构常常不可获得,因此具有一定的局限性;三是化学基因组的方法,其中,基于相似性的方法主要缺陷为仅有小部分药物和靶点及它们的相互作用是已知的,其余大多数均是没有标签的数据,增加了计算药物-药物和靶点蛋白-靶点蛋白相似性的难度;基于网络的方法需要大量的分子相互作用的先验知识且计算量较大;矩阵分解方法的计算能力有限,在处理大量数据时具有一定的局限性;基于特征的方法在计算高维特征向量时常常需要花费大量的时间,大量的噪声数据会导致预测结果产生较大误差。

发明内容

鉴于上述的分析,本发明旨在提供一种药物与靶点蛋白的匹配方法及系统,用以解决现有技术中药物与靶点蛋白匹配难度大、计算量大且准确率低的问题。

一方面,本发明提供了一种药物与靶点蛋白的匹配方法,包括:

获取多组样本训练集,每组所述样本训练集包括多个药物靶点蛋白对;

利用栈式自编码网络对每组样本训练集中每一药物靶点蛋白对中药物的分子指纹特征向量和靶点蛋白的特征向量,进行编码、解码进而获得损失函数,基于该损失函数确定优化好的栈式自编码网络;以及利用优化好的栈式自编码网络获取每组样本训练集中每一药物靶点蛋白对中药物、靶点蛋白对应的深度表征向量,进而获得深度神经网络的二分类交叉熵损失函数,并基于该二分类交叉熵损失函数确定优化好的深度神经网络,从而获得优化好的匹配模型;

利用优化好的匹配模型获得待匹配药物和待匹配靶点蛋白间存在相互作用关系的概率,以确定其是否匹配。

进一步的,所述匹配模型包括依次连接的栈式自编码网络和深度神经网络;

所述栈式自编码网络包括用于处理药物的分子指纹特征向量的第一栈式自编码子网络和用于处理靶点蛋白的特征向量的第二栈式自编码子网络,所述第一栈式自编码子网络和第二栈式自编码子网络均包括依次连接的输入层、至少两个隐藏层以及输出重构层;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110656718.6/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top