[发明专利]一种基于深层图神经网络的分子表示方法及系统在审
申请号: | 202211560221.5 | 申请日: | 2022-12-06 |
公开(公告)号: | CN116504333A | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 魏骁勇;田奇;杨震群;曹溢;黄文禹;严丽巧 | 申请(专利权)人: | 四川大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C20/50;G06N3/0464;G06N3/08 |
代理公司: | 成都正煜知识产权代理事务所(普通合伙) 51312 | 代理人: | 袁宇霞 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深层 神经网络 分子 表示 方法 系统 | ||
1.一种基于深层图神经网络的分子表示方法,其特征在于,包括如下步骤:
S1.调用第三方库将分子的计算机存储数据转化为分子图,分子图包括邻接矩阵、结点和边,其中,调用第三方库包括RDKit;
S2.分析分子图得到分子图的结点和边的初始特征向量;
S3.基于图神经网络和邻接矩阵对结点和边的初始特征向量进行密集残差图卷积运算,得到新的结点和边的特征向量;
S4.对新的结点和边的特征向量进行池化操作,得到分子表示。
2.根据权利要求1所述的一种基于深层图神经网络的分子表示方法,其特征在于:所述步骤S1的具体步骤为:
S1.1.获取分子的计算机存储数据,其中,计算机存储数据是以“.MOL”、“.SDF”、“.KCF”为后缀存储起来的分子的文本文件,或一串基于SMILES表示法的分子字符串;
S1.2.若计算机存储数据为以“.MOL”、“.SDF”、“.KCF”后缀存储起来的分子的文本文件,转到步骤S1.3,若计算机存储数据为以SMILES表示法存储起来的分子的文本文件,转到步骤S1.4,否则,跳过;
S1.3.初始化一个空的分子类,并采用开源工具包rdkit中的函数从上到下逐行扫描分子的文本文件,在分子类中依次读入原子信息和化学键信息,将原子信息和化学键信息分别存储进分子类中的结点和边,得到一个存储了结点和边的分子类,其中,原子信息包括原子位置、原子描述符、化学键类型和作为结点唯一标识的原子ID,化学键信息以原子IDi-原子IDj关系对记录,i表示第i个原子,j表示第j个原子,且i≠j,化学键类型包括以“-”表示的单键,“=”表示的双键,“#”表示的三键,“:”表示的芳香键,“*”代表的其他键,原子描述符包括“C”、“H”、“0”;
S1.4.初始化一个空的分子类,采用开源工具包rdkit中的函数分析存储的一维序列分子字符串的字符中的原子、原子的边类型、支链结构和环结构,并基于原子、原子的边类型、支链结构和环结构得到原子信息和化学键信息,将原子信息和化学键信息分别存储进分子类中的结点和边,得到一个存储了结点和边的分子类,其中,一个结点存储一个原子信息,一个边存储一个化学键信息,一维序列分子字符串包含以英文字母元素符号表示的原子,“-”表示的单键,“=”表示的双键,“#”表示的三键,“:”表示的芳香键,“()”内表示碳链分支和环的断开处用数字标记,分子类中原子信息包括原子位置、原子描述符、化学键类型和作为结点唯一标识的原子ID,化学键信息以原子IDi-原子IDj关系对记录,i表示第i个原子,j表示第j个原子,且i≠j,化学键类型包括以“-”表示的单键,“=”表示的双键,“#”表示的三键,“:”表示的芳香键,“*”代表的其他键,原子描述符包括“C”、“H”、“0”、“N”、“S”、“P”、“Cl”、“Si”,氢原子“H”、单键和芳香键在SMILES和分子类中省略或保留;
S1.5.初始化一个分子图类以及一个行和列都为结点数大小的零矩阵,行列索引步骤S1.3或步骤S1.4得到的分子类中对应的原子ID,根据原子IDi-原子IDj关系对,在零矩阵中对应的位置填入1,得到基于无向图的邻接矩阵A,邻接矩阵蕴含了分子图的拓扑结构,将分子类中存储了原子信息的结点和存储了化学键信息的边,与邻接矩阵一同存储进分子图类作为属性,得到一个存储了结点、边、邻接矩阵的分子图类,即分子图。
3.根据权利要求2所述的一种基于深层图神经网络的分子表示方法,其特征在于:所述步骤S2的具体步骤为:
步骤S2.1:根据分子图中原子在元素周期表中的原子序号,为每个存储了原子信息的结点构造一个118维为长度的one-hot向量,得到的向量作为结点的初始向量,存储在分子图中,其中,118维基于最大原子序数确定的;
步骤S2.2:传入步骤S2.1得到的分子图,初始化一个长度为5的列表:[0:单键,1:双键,2:三键,3:芳香键,4:其他],初始化一个5维的零向量,根据化学键类型的对应数字,在对应位置赋值为1,得到一个5维的one-hot向量,并将得到的向量作为边的初始特征向量,存入分子图中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211560221.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:双轴承绕线轮
- 下一篇:一种对甘蔗渣进行快速炭化的方法