[发明专利]预测细胞色素P4501A2抑制剂抑制浓度的方法有效
申请号: | 201510234047.9 | 申请日: | 2015-05-08 |
公开(公告)号: | CN104866710B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 卢小泉;张苗;陈晶;王世霞;关志强;马琴 | 申请(专利权)人: | 西北师范大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 北京中恒高博知识产权代理有限公司11249 | 代理人: | 吕玉博 |
地址: | 730070 甘肃*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,包括如下步骤1)样本集的收集、处理及优化;2)抑制剂分子描述符的构建;3)抑制剂分子描述符的初步筛选;4)抑制剂分子描述符数据集的重新标度;5)抑制剂分子描述符数据集的划分;6)建立QSAR模型;7)预测细胞色素P450酶CYP1A2抑制剂的抑制浓度。本发明利用偏最小二乘法(PLS)具有在自变量存在严重多重相关性的条件下也能够进行回归建模的基础上对偏最小二乘回归(PLS)的组分进行进一步的估计和简化,得到简化后的偏最小二乘法(SIMPLS)对细胞色素P450抑制剂的抑制浓度进行准确预测。 | ||
搜索关键词: | 一种 简化 最小 预测 细胞 色素 p450 cyp1a2 抑制剂 抑制 浓度 方法 | ||
【主权项】:
一种用简化偏最小二乘预测细胞色素P450酶CYP1A2抑制剂的抑制浓度的方法,其特征在于:包括如下步骤,1)样本集的收集、处理和优化;收集细胞色素P450抑制剂分子的结构以及相对应的抑制浓度,对收集的每个抑制剂分子进行结构优化;2)抑制剂分子描述符的构建输入优化之后的细胞色素P450抑制剂分子结构,计算出与其对应的分子描述符值,每个抑制剂分子包括若干个变量;3)抑制剂分子描述符的初步筛选删除对矩阵没有意义的描述符,降低冗余度;采用以下具体步骤:(ⅰ)删除对矩阵没有意义的描述符,降低冗余度;(ⅱ)选择某一变量对应不同的样本时具有较大的方差,表征的信息量大,在统计分析中才会显著;(ⅲ)相关性较高的变量说明该变量包括了另一变量含有的信息,相关性较高的变量同时引入模型,会导致预测结果变差,应剔除二者之一;(ⅳ)剔除化合物的活性/性质和变量相关性极差的变量; (ⅴ)使用逐步多元和无用信息变量结合的方法挑选最终的描述符;4)抑制剂分子描述符数据集的重新标度将经过初步筛选的抑制剂分子描述符利用matlab工具,采用Standardization这个函数将抑制剂分子描述符的数据映射到一个范围内,所述范围为‑6~6之间;5)抑制剂分子描述符数据集的划分将步骤2)至4)处理后的抑制剂分子描述符数据集,利用kennard‑stone方法将数据集分为训练集和测试集;6)建立模型用细胞色素P450抑制剂分子结构即就是用步骤2)至4)处理之后的抑制剂描述符与其对应的抑制浓度建立关系模型,即QSAR模型;7)预测细胞色素P450酶CYP1A2抑制剂的抑制浓度根据所述步骤5)所得的测试集与所述步骤6)所建立的QSAR模型来预测细胞色素P450抑制剂的抑制浓度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北师范大学,未经西北师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510234047.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用