[发明专利]一种适用于机器学习势能面构造的物质结构描述方法在审
申请号: | 201810178485.1 | 申请日: | 2018-03-05 |
公开(公告)号: | CN108536998A | 公开(公告)日: | 2018-09-14 |
发明(设计)人: | 刘智攀;商城;黄思达 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于计算化学和物理技术领域,具体为一种适用于机器学习势能面构造的物质结构描述方法。本发明利用输入的原子坐标,构造一系列特征函数作为输入信息,利用机器学习方法训练物质体系的全局势能面数据,得到机器学习势能面。这些特征函数以原子间键长、键角为基本变量,通过组合幂函数、截断函数、球谐函数及三角函数构造原子周围环境,包含成键、配位等结构信息;物质体系的全局势能面数据来源于量子力学计算,包含大量不同物质结构的能量、力和应力信息。本发明的特征函数具有坐标旋转不变,原子交换不变,一阶和二阶导数连续等特性,适用于复杂的多元素物质体系。基于这些特征函数,训练得到的高维机器学习势能面可以用于材料结构搜索、反应机理预测研究等。 | ||
搜索关键词: | 势能面 机器学习 特征函数 物质结构 物质体系 物理技术领域 材料结构 二阶导数 反应机理 基本变量 结构信息 球谐函数 三角函数 输入信息 应力信息 原子交换 原子坐标 坐标旋转 多元素 幂函数 成键 高维 截断 配位 一阶 全局 搜索 预测 研究 | ||
【主权项】:
1.一种适用于机器学习势能面构造的物质结构描述方法,其特征在于,通过构建一系列数学函数来描述物质结构特征,用于构建机器学习复杂体系势能面;具体来说,利用物质体系的原子笛卡尔坐标qi,i=1,2,…n为原子序号,n为体系的原子数,根据给定的截断半径构造截断函数和径向函数,再结合角向函数和球谐函数,形成:双体特征函数
三体特征函数
四体特征函数
这些结构特征函数具有旋转不变、原子交换不变、一阶和二阶导数连续性质;将这些结构特征函数的组合作为训练高维机器学习势能面的输入层,用于构建高维机器学习势能面;其中:所述的截断函数fc为:
i,j=1,2,…n,为原子序号且i≠j,tanh为双曲正切函数,rij为i,j原子间的距离,rc为截断半径,取值范围1.0到10埃;所述的径向函数R为:![]()
为i,j原子间距离的幂函数,n为可调参数,n取范围‑3~24的整数;所述的角向函数有两种:A1,A2:A1(θijk)=[(1+λcosθijk)/2]ζ(sin2θijk)ζA2(δijkl)=[(1+λcosδijkl)/2]ζ(sin2δijkl)ξcos为余弦三角函数,sin为正弦三角函数,i,j,k,l=1,2,…n,为原子序号且i,j,k,l两两不等;θijk为以i原子为中心,i,j,k原子之间的夹角;δijkl为以i,j原子为中心,i,j,k,l原子之间的二面角;λ,ζ,ξ为可调参数,且λ为+1或者‑1,ζ,ξ取范围0~24的整数;所述的球谐函数
是拉普拉斯方程的球坐标系形式解的角度部分,在球坐标系中,球谐函数
表达为:
这里的YLm称为L和m的球谐函数,i是虚数单位,
是伴随勒让德多项式,用方程定义为:
PL(x)是L阶勒让德多项式,用罗德里格公式表示为:![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810178485.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用