[发明专利]基于注意力机制和图卷积神经网络的晶体性质预测方法有效
申请号: | 202110509660.2 | 申请日: | 2021-05-11 |
公开(公告)号: | CN113327652B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 王步维;范谦;邵宇;乐云亮 | 申请(专利权)人: | 扬州大学 |
主分类号: | G16C20/70 | 分类号: | G16C20/70;G16C60/00;G06N3/042 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 225009 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 机制 图卷 神经网络 晶体 性质 预测 方法 | ||
1.一种基于注意力机制和晶体图卷积神经网络的晶体性质预测和分类方法,其特征在于,包括如下步骤:
S1:获取晶体的晶体学信息文件和DFT计算数据,并将其分为训练集、验证集和测试集;
S2:从晶体学信息文件中,提取晶体特征,将晶体特征输入神经网络,获取到神经网络输出;
S3:采用训练集和验证集分别对构建好的神经网络模型进行训练和验证,获取到预测模型和分类模型,通过预测模型完成对于晶体性质的预测;通过分类模型完成对于晶体性质的分类;
所述步骤S1中晶体的结构数据和DFT计算数据的获取方法为:
A1:通过python软件中的pymatgen程序包连接Materials Project数据库,从中将晶体的id号码以及物理性质的DFT计算数据导出到.csv文件中;
A2:通过python软件中的pymatgen程序包连接Materials Project数据库,并读取导出的.csv文件中的晶体id号码,将对应的晶体学信息文件导出;
A3:存储每个元素的初始化向量;
所述步骤S2中神经网络输出的获取过程为:
B1:提取cif文件中的原子特征,每个原子与其邻居原子之间的键特征,每个原子的邻居原子的索引以及晶体映射到原子的索引,作为神经网络的输入;
B2:输入网络的原子特征经过嵌入层生成新的向量,然后将新的原子特征向量和键特征向量以及邻居原子的索引向量一起输入到卷积层中;
B3:在卷积层中,将原子看成节点,原子键看作边,先通过索引向量连接节点向量、邻居节点向量和边向量组成新的嵌入向量,新向量经过一个全连接层1后先对输出进行节点归一化处理;
B4:经过节点归一化和softplus函数激活后的节点向量h(t)是M个融入邻居特征的隐藏向量ZT∈R1×F组合成的数组,通过非线性变换对向量进行变换,然后用一个共享的注意向量q∈RF′×1得到注意值ωT;
B5:用softmax函数将注意值ω1,ω2,…,ωM标准化,得到最终的权重;
B6:将这M个融入邻居特征的隐藏向量和它们的注意值组合起来得到最终的节点嵌入H(t),进行批量归一化,归一化后与输入卷积层的原节点特征向量相加后经softplus函数激活并输出;
B7:经过3层卷积层后,生成融合了局部化学环境的新向量,新向量再通过池化层生成代表整个晶体的向量,通过softplus函数激活后连接到全连接层2接着再通过同样的函数激活然后输入全连接层3输出。
2.根据权利要求1所述的一种基于注意力机制和晶体图卷积神经网络的晶体性质预测和分类方法,其特征在于,所述步骤B3中节点归一化处理的公式为:
其中,h(t)为新生成的节点嵌入向量,μ(t)是节点h(t)的平均值,σ(t)是节点的偏差;
所述步骤B4中的节点向量h(t)的表达为:
其中,T就是h(t)的第T行,T∈M,M代表邻居原子的最大数量,F是原子隐藏特征的数量;
所述步骤B4中注意值ωT的表达式为:
ωT=qT·tanh(W·(ZT)T+b) (3)
其中W∈RF′×F是权值矩阵,b∈RF′×1是偏置向量;
所述步骤B5中最终的权重的表达式为:
所述步骤B6中节点嵌入H(t)的表达式为:
H(t)=a1Z1+a2Z2+…+aMZM (5)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110509660.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种制备高伸长率石墨烯纤维的方法
- 下一篇:实时监测充油变压器的前端架构