[发明专利]定量构效关系辅助匹配分子对分析方法在审
申请号: | 202010098622.8 | 申请日: | 2020-02-18 |
公开(公告)号: | CN111341390A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 曹东升;付丽;杨梓宜 | 申请(专利权)人: | 中南大学 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 李喆 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 定量 关系 辅助 匹配 分子 分析 方法 | ||
本发明提供了一种定量构效关系辅助匹配分子对分析方法,包括:对分子的结构进行清洗、除盐、去复合物,收集实验数据,并对所述实验数据进行预处理;计算分子描述符,根据所述分子描述符建立定量构效关系模型;根据所述定量构效关系模型预测现有的数据库,扩增实验数据;选出预测准确的分子,将标准偏差作为到定量构效关系模型的距离,从而评估模型的定量构效关系应用域;将挑选出来预测准确的数据和收集的实验数据混合进行匹配分子对分子。本发明解决了匹配分子对分析在小数据上应用得到限制的问题,挖掘出了一些还未被探索的新的化学规则,有更多的知识指导先导化合物的优化,加速了药物设计周期。
技术领域
本发明涉及计算机辅助药物设计的技术领域,特别涉及一种定量构效关系辅助匹配分子对分析方法。
背景技术
先导化合物的优化是一项复杂、耗时的任务,优化的目的是为了找到更理想的理化性质,良好的药代动力学性质,提高化合物的生物利用度,降低毒性等等,使其值得让一个分子进入到药物发现的候选阶段。如果药物化学家能够设想一个合适的取代基来修饰核心骨架来解决以上的所有问题,那么一种新的潜在的价值数十亿美元的产品就可能被发明并获得专利。而药物化学家们的灵感主要取决于已知的药物、文献知识、过去的合成经验或者是其他项目的同事。在这个过程中,总结经验知识,掌握这些化学结构的变化规律对制药企业和药物设计者合理的改造先导化合物,提高药物优化是至关重要的。
匹配分子对对分析(matched molecular pair analysis,MMPA)作为一个从大量实验数据中,提出药物化学知识并指导先导化合物的改造的工具脱颖而出。一个匹配分子对(Matched molecular pair,MMP)定义为一对化合物,它们只有一个位点发生结构改变。形成匹配分子对的化合物通过两个子结构的交换而相互转化,这称为化学转换。对于由同一转换连接的所有对,我们通过匹配分子对分析计算属性差异并汇总统计信息,从而获得使用化学语言描述的规则指导先导化合物的优化。但是,进行匹配分析对分析的数据缺少的问题,研究者们并没有关注。目前大多数关于匹配分子对分析的出版物都是来自于拥有庞大实验室数据的制药公司。虽然有来自学术团队的匹配分析对分析的出版物存在,但是相对较少,最可能的原因就是在这个以专利为基础的竞争环境下,药物公司只公开内部产生的所有信息中的部分数据。对于小数据集,它们缺少分子对,缺乏特定的化学转化的知识,从而不足以执行匹配分子对分析。导致有许多有价值的化学规则还未被挖掘或者开发。因此,基于以上分析,数据的缺乏成为了限制MMPA应用的一个关键问题。
发明内容
本发明提供了一种定量构效关系辅助匹配分子对分析方法,其目的是为了解决匹配分子对分析在小数据上应用得到限制的问题。
为了达到上述目的,本发明的实施例提供了一种定量构效关系辅助匹配分子对分析方法,包括:
步骤1,对分子的结构进行清洗、除盐、去复合物,收集实验数据,并对所述实验数据进行预处理;
步骤2,计算分子2D描述符,根据所述分子2D描述符建立定量构效关系模型;
步骤3,根据所述定量构效关系模型预测现有的数据库,扩增实验数据;
步骤4,选出预测准确的分子,将标准偏差作为到定量构效关系模型的距离,从而评估模型的应用域;
步骤5,将挑选出来预测准确的数据和收集的实验数据混合进行匹配分子对分子。
其中,所述步骤1还包括:
对分子结构进行标准化处理,如一个分子对应多个目标值,则取中位数。
其中,所述步骤2具体包括:
使用极度梯度提升树、支持向量机、随机森林、Cubist、相关向量机、梯度提升树、深度学习、高斯建立分类或回归预测模型;
对上述方法进行排列组合,通过求算数平均值建立共识模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010098622.8/2.html,转载请声明来源钻瓜专利网。