[发明专利]分子特征的提取及三维定量构效关系的计算方法及装置在审

专利信息
申请号: 202011025440.4 申请日: 2020-09-25
公开(公告)号: CN112185477A 公开(公告)日: 2021-01-05
发明(设计)人: 贾伯阳 申请(专利权)人: 北京望石智慧科技有限公司
主分类号: G16C20/20 分类号: G16C20/20;G06F17/16;G06N3/04
代理公司: 北京三聚阳光知识产权代理有限公司 11250 代理人: 李博洋
地址: 100080 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分子 特征 提取 三维 定量 关系 计算方法 装置
【说明书】:

发明公开了一种分子特征的提取及三维定量构效关系的计算方法及装置,其中,该提取方法包括:获取分子的第一特征矩阵;根据所述第一特征矩阵及预设图卷积神经网络模型,生成分子第二特征矩阵;根据预设正方体像素模型及第二特征矩阵,生成第三特征矩阵;根据第三特征矩阵及预设三维图卷积神经网络模型,生成第四特征矩阵;根据第三特征矩阵及第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵;或据第四特征矩阵,计算生成用以表征分子特征的第五特征矩阵。通过实施本发明,解决了只能根据分子二维坐标对神经网络进行训练,导致提取出的分子特征较为片面的问题,可以使用表征分子键的连接关系的三维图结构直接训练神经网络模型。

技术领域

本发明涉及数据处理领域,具体涉及一种分子特征的提取及三维定量构效关系的计算方法及装置。

背景技术

定量构效关系(QSAR),是使用某种数学模型来描述分子结构与某种分子的生物活性之间的关系。QSAR的基本假设是分子的结构信息包含了与其物理、化学及生物等性质相关的信息,而再通过这些理化性质进而决定该化合物的生物活性。因此化合物的分子结构信息与生物活性也有一定程度的相关。具体的,二维定量构效关系(2D QSAR)有hansch方法、free-wilson方法。基于分子构象的进行QSAR预测的称为三维定量构效关系(下文称3D-QSAR)。

现有技术中有根据分子化合物的smiles编码及其原子坐标,确定分子化合物的QSAR的拟合值;也有将分子表达为图结构,并经由图卷积神经网络(GCN)提取特征矩阵;但是上述方法只能根据大量的分子二维坐标对神经网络进行训练,导致提取出的分子特征表达分子的结构信息较为片面。

发明内容

因此,本发明要解决的技术问题在于克服现有技术中的提取出的分子特征表达分子的结构信息较为片面的缺陷,从而提供一种分子特征的提取及三维定量构效关系的计算方法及装置。

根据第一方面,本发明实施例提供了一种分子特征的提取方法,包括:获取分子的第一特征矩阵,所述第一特征矩阵用以表征所述分子的初始特征维度以及原子数目;根据所述第一特征矩阵以及预设图卷积神经网络模型,生成所述分子的第二特征矩阵;所述第二特征矩阵用以表征所述分子的第一特征维度以及原子数目;根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵,所述第三特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第一特征维度;根据所述第三特征矩阵以及预设三维图卷积神经网络模型,生成第四特征矩阵,所述第四特征矩阵用以表征所述分子中各原子在空间坐标系的坐标信息以及第二特征维度;根据所述第三特征矩阵以及所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵;或根据所述第四特征矩阵,计算生成用以表征所述分子特征的第五特征矩阵。

结合第一方面第一实施方式,在第一方面第一实施方式中,所述获取分子的第一特征矩阵,具体包括:获取分子中的多个原子及原子数目;根据预设编码方式将各原子编码,生成各原子对应的编码向量;根据各编码向量,确定分子的初始特征维度;根据所述原子数目以及初始特征维度,确定所述分子的第一特征矩阵。

结合第一方面,在第一方面第二实施方式中,所述根据预设正方体像素模型以及所述第二特征矩阵,生成第三特征矩阵的步骤中,包括:将所述预设正方体像素模型划分为多个三维像素;当所述原子在所述三维像素的中心时,将所述原子填充至所述三维像素,并确定所述原子在空间坐标系的坐标信息。

结合第一方面,在第一方面第三实施方式中,该方法还包括:根据第一维度参数确定所述第一特征维度,根据第二维度参数确定第二特征维度。

根据第二方面,本发明实施例提供了一种分子三维定量构效关系的计算方法,包括:获取分子的计算层次参数;根据所述计算层次参数确定分子的目标特征矩阵,所述目标特征矩阵是通过多个计算单元生成的,所述计算单元用于执行如第一方面或第一方面任一实施方式所述的分子特征的提取方法;根据预设的全联接层函数,将所述目标特征矩阵转换为一维特征矩阵;根据所述一维特征矩阵,计算生成所述分子的三维定量构效关系值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京望石智慧科技有限公司,未经北京望石智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011025440.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top