[发明专利]基于量子化学和集成学习的分子毒性预测方法在审
| 申请号: | 202211508861.1 | 申请日: | 2022-11-29 |
| 公开(公告)号: | CN115732039A | 公开(公告)日: | 2023-03-03 |
| 发明(设计)人: | 王珣;王璐璐;请求不公布姓名;焦麟钫;任咏琪;高畅楠 | 申请(专利权)人: | 中国石油大学(华东) |
| 主分类号: | G16C20/30 | 分类号: | G16C20/30;G16C20/70;G16B15/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 266580 山*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 量子 化学 集成 学习 分子 毒性 预测 方法 | ||
1.基于量子化学和集成学习的分子毒性预测方法,其特征在于,包括以下步骤:
1)提取分子的RDKit指纹,获取分子的2D特征;
2)提取分子的能带隙、偶极矩等量子化学信息,将这些数据进行归一化操作,获取分子的3D特征;
3)将得到的2D信息与3D信息进行拼接,得到分子表示。
4)将GBDT作为基学习器,Bagging作为集成学习框架,训练分子毒性预测模型,训练好的模型可以对分子的毒性进行预测,从而快速筛选候选药物,加速药物研发进程。
2.根据权利要求1所述的基于量子化学和集成学习的分子毒性预测方法,其主要特征在于,分子毒性预测方法包括分子二维结构信息提取模块、分子三维结构信息提取模块和分子毒性预测模块。分子二维结构信息提取模块通过分子指纹获取分子的2D信息;分子三维结构信息提取模块通过量子化学获取分子的3D信息;分子毒性预测模块将得到的分子表示输入到集成学习模型中,得到最终的毒性预测值。
3.根据权利要求2所述的基于量子化学和集成学习的分子毒性预测方法,其主要特征在于,分子二维结构信息提取模块具体包括:
1)使用PandasTools工具包生成分子的mol对象;
2)利用化学信息学的开源工具包Rdkit中的Chem.RDKFingerprint方法将药物分子的mol对象转换为化学指纹。
4.根据权利要求3所述的基于量子化学和集成学习的分子毒性预测方法,其主要特征在于,分子三维结构信息提取模块具体包括:
1)数据预处理:从原始数据集中取出分子的ID号、SMILES串以及活性数据,以csv格式输出;然后通过工具包RDKit判断分子是否可以通过SMILES串生成Mol对象,无法生成的分子将会被删除;
2)生成波函数的输入数据:从预处理后生成的csv文件中读取ID与SMILES,由SMILES生成Mol对象,将其转化为三维结构,为了保证分子的完整性,加氢后才能生成用于计算波函数的输入数据;
3)计算波函数:将制作的输入数据作为参考交给设定的超时函数,使用量子化学计算的psi4库计算分子的波函数;
4)从波函数中取出各种各样的分子信息,并将这些数据进行归一化操作,即可得到分子的量子化学信息。
5.根据权利要求4所述的基于量子化学和集成学习的分子毒性预测方法,其主要特征在于,分子毒性预测模块具体包括:
1)对二维结构信息提取模块和三维结构信息提取模块得到的信息进行拼接,得到最终的分子表示;
2)使用GBDT作为基学习器,Bagging作为集成学习框架,训练分子毒性预测模型。
3)将药物分子输入到训练好的模型中,得到毒性预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211508861.1/1.html,转载请声明来源钻瓜专利网。





