[发明专利]基于多元线性回归快速预测黄嘌呤衍生物抑制活性的QSAR方法有效
申请号: | 202010881483.6 | 申请日: | 2020-08-27 |
公开(公告)号: | CN112151111B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 赵娟娟;刘秀娟;陆文聪 | 申请(专利权)人: | 上海大学 |
主分类号: | G16B15/00 | 分类号: | G16B15/00;G16B40/00 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多元 线性 回归 快速 预测 黄嘌呤 衍生物 抑制 活性 qsar 方法 | ||
1.一种基于多元线性回归快速预测黄嘌呤衍生物抑制活性的QSAR方法,其特征在于,包括如下步骤:
1)利用计算机系统,从文献中查找能够抑制DPP-IV活性的黄嘌呤衍生物结构及其对应的IC50值,作为数据集样本;
2)用Chemdraw画出收集到的黄嘌呤结构,再用Dragon软件生成描述符;
3)以IC50值的负对数为目标变量,Dragon生成的描述符为自变量,以互信息阈值为0.45初步筛选数据集;对初步筛选的数据集,随机划分训练集和测试集,测试集的比例占整个数据集的20%;
4)利用最大相关最小冗余方法结合多元线性回归留一法,验证筛选变量,选出建模的最优变量子集;
5)对筛选出的最优自变量进行转换,获得新的自变量;
6)在生成新的描述符的基础上,用多元线性回归方法,建立黄嘌呤衍生物抑制活性的快速预报模型;
7)根据建立的黄嘌呤衍生物的快速预报模型和待检测的黄嘌呤衍生物,快速预报待检测物的抑制活性;
所述步骤5)中获得的新的自变量为:
P(1)=+0.5318X1+0.1015X2+0.01403X3+3.751X4+0.08761X5+0.08958X6+0.5885X7+0.1830X8+0.004620X9+0.9556X10-51.580
P(2)=-0.7803X1-0.2487X2-0.005499X3+4.865X4+0.01781X5+0.06662X6+0.2001X7+0.09473X8-0.006231X9+0.7070X10-16.425
P(3)=-1.326X1+0.2069X2-0.01321X3+5.587X4-0.006104X5+0.05154X6+0.3427X7-0.002190X8-0.008101X9+0.6040X10-8.878
P(4)=-1.085X1+0.04423X2+0.0003891X3+5.462X4-0.1017X5-0.02304X6+0.1587X7-0.2447X8+0.005499X9+1.322X10-10.836
P(5)=-0.1980X1-0.01055X2-0.02453X3+8.016X4-0.09841X5-0.004190X6+0.9428X7-0.3690X8+0.006330X9+0.1503X10-24.193
P(6)=-0.5804X1-0.006145X2+0.0003567X3+8.097X4-0.1426X5+0.04710X6+0.5413X7-0.1006X8+0.007435X9-1.881X10-7.663
P(7)=-0.9359X1-0.05420X2+0.01620X3+2.366X4-0.0156X5-0.04107X6+1.580X7-0.1670X8+0.003524X9-1.594X10+15.090
P(8)=+0.4573X1+0.002638X2+0.02015X3+2.915X4-0.1471X5-0.09858X6+0.7866X7-0.01202X8-0.006955X9-0.1316X10-12.377
P(9)=-0.09285X1-0.005898X2-0.006817X3-3.525X4-0.1834X5+0.01118X6+0.9294X7+0.2454X8+0.0009003X9+0.4599X10+10.845。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010881483.6/1.html,转载请声明来源钻瓜专利网。