[发明专利]使用强化学习的分子设计在审
申请号: | 201980033304.9 | 申请日: | 2019-03-29 |
公开(公告)号: | CN112136181A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | D.普拉姆利;M.H.S.塞格勒 | 申请(专利权)人: | 伯耐沃伦人工智能科技有限公司 |
主分类号: | G16C20/50 | 分类号: | G16C20/50;G16C20/70 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张贵东 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 强化 学习 分子 设计 | ||
提供了使用机器学习(ML)技术来设计表现出一项或多项所需性质的化合物的(多个)方法、装置和(多个)系统。这可以通过以下方法来实现:使用基于(多项)所需性质和用于修饰化合物的规则集合修饰第一化合物的ML技术来生成第二化合物;基于(多项)所需性质对第二化合物评分;基于评分确定是否重复生成步骤;以及在重复生成步骤之前基于评分更新所述ML技术。
技术领域
本申请涉及使用机器学习技术来设计表现出一项或多项所需性质的化合物的装置、系统和方法。
背景技术
信息学是在一个或多个学术和/或科学领域中用于解释数据的计算机、信息技术和资源应用。化学信息学和生物信息学包括用于解释化学和/或生物数据的计算机、信息技术和资源应用。这可以包括解决和/或模拟化学和/或生物学领域中的过程和/或问题。例如,这些计算、信息技术和资源可以将数据转换为信息,并且随后将信息转换为知识,用于快速产生化合物和/或做出改进后的决定,仅作为示例而不限于药物鉴定、研发和优化领域。
机器学习技术是可用于设计复杂分析模型和算法的计算方法,该复杂分析模型和算法适于解决复杂问题,例如产生或预测具有所需特性和/或性质的化合物。存在可用于或可被选择用于产生化合物的多种机器学习技术,但没有一种可用于基于所需特性或性质的集合来产生或优化化合物。期望使用机器学习技术以使得研究者、数据科学家、工程师和分析师在药物鉴定、研发和优化领域实现快速改进。
下面描述的实施例不限于解决了上述已知方法的部分或全部不足之处的实现方式。
发明内容
本节是为了以简化的形式介绍将在下文具体实施方式一节中进一步描述的一些概念。本节不旨在明确所述的主题的关键特征或必要特征,也不旨在用于确定所述的主题的范围;应当认为促进本发明的工作和/或用于实现基本上相似的技术效果的变型和替代特征落入在此公开的本发明的范围内。
本公开提供了使用机器学习技术来设计和生成表现出所需性质的候选分子/化合物的方法、装置和系统。机器学习技术可以依据初始化合物,学习如何扰动该化合物,直到实现具有所需性质的化合物或达到停止标准。本文描述的方法不需要人工干预,可以自动执行。导致最终化合物的所执行的规则、操作和/或扰动的序列还可以输出,并且向研究人员提供关于如何形成化合物以及化合物具有所需性质和/或特性的其他见解和/或证据。
在第一方面,本公开提供了一种使用机器学习技术来设计表现出一项或多项所需性质的化合物的由计算机实现的方法,该方法包括:使用基于所需性质和用于修饰化合物的规则集合来修饰第一化合物的机器学习技术来生成第二化合物;基于所需性质对第二化合物评分;基于评分确定是否重复生成步骤;以及在重复生成步骤之前基于评分更新机器学习技术。
优选地,确定是否重复生成步骤基于评分,该评分指示第二化合物更加接近于表现出所需性质的化合物。
优选地,确定是否重复生成步骤基于评分,该评分指示第二化合物表现出所需性质。
优选地,确定是否重复生成步骤还包括确定是否已经实现了重复生成步骤的预定次数的迭代。
优选地,确定是否重复生成步骤还包括:基于表现出至少一项或多项所需性质的第二化合物,确定对第二化合物的任何进一步改进是否可能。
优选地,生成第二化合物还包括生成第二化合物集合;以及基于所需性质对第二化合物集合进行评分。
优选地,该方法还包括:基于评分对第二化合物集合进行分级,其中产生第二化合物还包括基于层级最高的第二化合物集合产生其他第二化合物。
优选地,该规则集合还包括表示与修饰化合物相关的一个或多个操作的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯耐沃伦人工智能科技有限公司,未经伯耐沃伦人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980033304.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于主动学习的候选列表选择模型
- 下一篇:主动学习模型验证
- 同类专利
- 生理药代动力学核心模型-202180091800.7
- 赵慧瑛;崔高云;崔恩祯;金周姬;姜东昱 - 车医科学大学校产学协力团
- 2021-10-25 - 2023-09-12 - G16C20/50
- 一方面提供一种可共同应用于共享同一母核的两种或多种化合物的生理药代动力学核心模型,和生理药代动力学核心模型的构建方法。根据所述生理药代动力学核心模型和生理药代动力学核心模型的构建方法,其效果在于,无需为每个化合物建立独立的PBPK模型,只需导出分配系数即可容易进行剂量评估。
- 提供τ蛋白聚集调节剂的方法-202180053945.8
- 迈克尔·菲利普·马扎内茨;克劳德·米歇尔·维斯奇克;路易丝·夏洛特·塞尔佩尔;约翰·默文·大卫·斯托里 - GT英威特有限公司
- 2021-07-06 - 2023-05-30 - G16C20/50
- 本发明总体上涉及选择或设计用于调节τ蛋白聚集的化合物的方法。所述方法包括使用计算机实现的分子建模方式,以将候选化合物的三维结构与所述τ蛋白的包含氨基酸315‑378的至少一部分的三维结构进行比较并确定所述候选化合物是否能够与Leu315、Ser341、Glu342、Lys343、Phe346、Lys347、Val350、Ser352、Ile354、Lys369、Ile371、Glu372、Phe378和Thr373中的两个或更多个同时形成非共价相互作用。预测能够形成所述相互作用的候选化合物调节所述τ蛋白或其截短形式的聚集。还描述了使用所述τ蛋白的包含氨基酸315‑378的至少一部分的三维结构模型的方法,其中所述模型是所述τ蛋白的部分与成对螺旋丝(PHF)的聚集过程中的中间体;以及计算系统和产品。
- 用于催化剂结构预测和设计的机器学习与统计分析-202180056800.3
- S·M·比索夫;U·J·基尔戈;O·L·悉多拉;D·H·艾斯;D-H·全;N·K·罗林斯 - 切弗朗菲利浦化学公司
- 2021-06-09 - 2023-05-16 - G16C20/50
- 公开了一种已经针活性、纯度和/或对选择性乙烯寡聚的选择性开发的杂原子配体‑金属化合物络合物过渡态模型,并且公开了用于确定杂原子配体‑金属化合物络合物的反应性、产物纯度和/或对乙烯三聚和/或四聚的选择性的密度泛函理论计算。使用反应基态和过渡态,和/或与能量跨度模型结合的反应基态和过渡态,本公开揭示一种铬色环机制,即存在多个基态和多个过渡态,其可以说明活性、纯度和/或对选择性乙烯寡聚的选择性。基于所述反应基态和过渡态,和/或与所述能量跨度模型结合的反应基态和过渡态,本文公开的方法可以定性和半定量地用于预测相对的杂原子配体‑金属化合物络合物的活性、纯度和/或选择性,并产生用于催化剂设计和实施的成功方法,其中可以成功地鉴定新配体并使其通过实验验证。
- 用于分层分子生成的图归一化流-202180026296.2
- M·库兹涅托夫;D·波利科夫斯基;A·扎沃隆科夫 - 英矽智能科技有限公司
- 2021-05-27 - 2022-11-22 - G16C20/50
- 用于归一化分子图数据以用于分层分子生成的计算方法可以包括:提供具有节点的分子的分子图数据;递归地将节点分裂为两个节点;迭代地递归地将其他节点分裂为两个节点;生成来自节点分裂的生成的分子的生成分子图数据;并提供具有生成分子图的报告。一种计算方法可以包括:将分子图数据提供到多个具有正向路径和反向路径的层级的潜在代码生成器中;以及由通过多个操作层级处理分子图数据来生成潜在代码,其中每个操作层级在正向路径和反向路径中具有一系列操作子层级,其中操作子层级至少包括节点合并操作和节点分裂操作;从潜在代码生成至少一种分子结构;并输出具有所述至少一种分子结构的生成分子图数据。
- 使用强化学习的分子设计-201980033304.9
- D.普拉姆利;M.H.S.塞格勒 - 伯耐沃伦人工智能科技有限公司
- 2019-03-29 - 2020-12-25 - G16C20/50
- 提供了使用机器学习(ML)技术来设计表现出一项或多项所需性质的化合物的(多个)方法、装置和(多个)系统。这可以通过以下方法来实现:使用基于(多项)所需性质和用于修饰化合物的规则集合修饰第一化合物的ML技术来生成第二化合物;基于(多项)所需性质对第二化合物评分;基于评分确定是否重复生成步骤;以及在重复生成步骤之前基于评分更新所述ML技术。
- 专利分类