[发明专利]一种基于多维度信息的药物小分子-蛋白靶点反应预测方法在审
| 申请号: | 202011168551.0 | 申请日: | 2020-10-28 |
| 公开(公告)号: | CN112331273A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 柳俊宏;李成涛 | 申请(专利权)人: | 星药科技(北京)有限公司 |
| 主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/50;G16C20/70 |
| 代理公司: | 北京中南长风知识产权代理事务所(普通合伙) 11674 | 代理人: | 郑海 |
| 地址: | 100083 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多维 信息 药物 分子 蛋白 反应 预测 方法 | ||
1.一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,
(1)获取蛋白靶点的特征表示,包括氨基酸向量、蛋白质三维空间结构特征、蛋白质化学特征;
(2)获取药物小分子的特征表示,包括药物分子的语义特征、BERT的通用网络特征、药物分子本身的化学特征;
(3)融合蛋白靶点和药物小分子的特征;
(4)将融合后的特征作为分类器的输入,再结合训练集中的标签即可训练整个网络。
2.根据权利要求1所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的获取蛋白靶点的特征表示:
(a)以氨基酸为单位分割蛋白靶点的氨基酸序列,得到一组氨基酸向量;
(b)将蛋白质的三维空间结构作为输入,通过定义的图网络GCN,得到基于三维空间结构的特征;
(c)将氨基酸序列作为输入,基于之前预训练的BERT获得通用的蛋白质特征;
(d)由先验知识获取蛋白质本身的化学特征:结构特征和化学性质。
3.根据权利要求2所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的结构特征为碳原子个数、是否含羧基、共价键的类型;化学性质为水解反应、沉淀、变性。
4.根据权利要求1所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的获取药物小分子的特征表示:
(a)设计特定的分词器,对给定的药物小分子SMILES进行分词并数字化,得到相应的数字向量;
(b)将数字化的向量作为输入,通过ELMo网络得到药物的语义特征;
(c)将数字化的向量作为输入,基于之前预训练的BERT获得通用的分子特征;
(d)由先验知识获取药物本身的化学特征:结构特征和药学特征。
5.根据权利要求4所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的结构特征是碳原子个数、是否含苯环、双键;药学特征是水溶性、不稳定性、毒性。
6.根据权利要求1或2或4所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的获取蛋白质的特征表示:
(1)获取蛋白质的三维空间结构数据P={(xi,yi,zi)},其中(xi,yi,zi)表示第i个氨基酸的空间坐标,将P作为GCN的输入,得到256维的特征向量Pc;
(2)分割蛋白质,得到氨基酸向量S=(M,Q,S,K,…);将S作为BERT网络的输入,得到256维的基于BERT的通用网络特征Pb;
(3)通过先验知识获取蛋白质化学特征Ph,即64维one-hot编码的特征向量。
7.根据权利要求1或2或4所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的获取药物分子的特征表示:
(1)按给定的正则表达式分割药物分子的SMILES序列D,得到向量M=(CNC,=O,C1=C,…);
(2)将向量M输入善于发掘语义信息的ELMo网络中,获取256维德药物分子内部语义特征De;
(3)将向量M输入通用网络BERT中,获取256维的特征向量Db;
(4)通过先验知识获取药物分子的化学特征Dh,即64维one-hot编码的特征向量。
8.根据权利要求1或2或4所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的药物-蛋白质的特征融合:
(1)将蛋白相关特征进行组合,得到R=[Pc,Pb,Ph],并通过两层全连接网络进行非线性变换,得到最终的蛋白特征表示Pa;
(2)将分子相关特征进行组合,得到H=[De,Db,Dh],并通过两层全连接网络进行非线性变换,得到最终的分子特征表示Ma。
9.根据权利要求1或2或4所述的一种基于多维度信息的药物小分子-蛋白靶点反应预测方法,其特征在于,所述的DTI分类器:将蛋白质-药物的特征向量Pa和Ma归一化后输入包含全连接的分类层中,再结合训练集中的标签及给定的损失函数训练整个网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星药科技(北京)有限公司,未经星药科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011168551.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





