[发明专利]采用定量结构-活性关系模型预测有机化合物的土壤或沉积物吸附系数有效
申请号: | 201310442993.3 | 申请日: | 2013-09-25 |
公开(公告)号: | CN103488901A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 李雪花;王雅;乔显亮;陈景文 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 116024*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种采用定量结构-活性关系模型预测有机化合物的土壤/沉积物吸附系数的方法。在已知有机化合物分子结构的基础上,仅通过计算具有结构特征的分子描述符,应用所构建的QSAR模型,即能快速、高效地预测有机化合物的土壤/沉积物吸附系数,该方法简单快捷、成本低,且能节省实验测试所需的人力、物力和财力。本发明依据经济合作与发展组织关于QSAR模型的构建和使用导则进行建模,运用简单、透明的多元线性回归分析方法,易于理解和应用;具有明确的应用域、良好的拟合能力、稳健性和预测能力,能够有效地预测应用域内有机化合物的土壤/沉积物吸附系数,为化合物的生态风险性评价和管理提供必要的基础数据,具有重要的意义。 | ||
搜索关键词: | 采用 定量 结构 活性 关系 模型 预测 有机化合物 土壤 沉积物 吸附 系数 | ||
【主权项】:
采用定量结构‑活性关系模型预测有机化合物的土壤/沉积物吸附系数,其特征在于,首先,搜集得到813种有机化合物的logKoc值;将上述的813种有机化合物的logKoc值划分为训练集和验证集,训练集包括609种有机化合物,验证集包括204种有机化合物;其中,训练集中的有机化合物用于构建模型,验证集中的有机化合物用于模型构建后的外部验证;采用去一法对上述构建的模型进行内部验证;上述模型所使用的描述符均为Dragon描述符,用3545个Dragon描述符和训练集中的有机化合物的logKoc值进行逐步回归分析,得到模型的线性关系式如下:logKoc=0.063×MLOGP2+0.332×WiA_Dt+0.260×nHM‑0.002×H_D/Dt+0.338×O‑061‑1.037×HATS4v‑0.803×P‑117+1.011×nR=CRX‑0.123×F05N‑O+1.185×B08Br‑Br‑1.868×R3e+‑0.537×B03N‑S‑0.227×CATS2D_05_NL+0.220×F02S‑S+0.627×nRCN+0.546其中,MLOGP2表示Moriguchi辛醇‑水分配系数的平方;WiA_Dt表示由迂回矩阵得到的Wiener‑like指数;H_D/Dt表示由迂回矩阵得到的Harary‑like指数;nHM表示重原子个数;O‑061表示硝基上的氧原子碎片数;HATS4v和R3e+是GETAWAY描述符,HATS4v与分子的范德华体积有关,R3e+与分子尺寸、电负性相关;P‑117表示分子中X3‑P=X结构存在与否,存在取1,不存在取0;nR=CRX表示分子中R=CRX结构个数;F05[N‑O]表示分子中N‑O在拓扑距离5处出现的频率;B08[Br‑Br]表示分子中Br‑Br结构存在与否,存在取1,不存在取0;B03[N‑S]表示分子中N‑S结构存在与否,存在取1,不存在取0;CATS2D_05_NL是CATS2D描述符,与分子的亲脂性有关;F02[S‑S]分子中S‑S在拓扑距离2处出现的频率;nRCN表示亚硝基个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310442993.3/,转载请声明来源钻瓜专利网。
- 上一篇:指纹认证方法和装置
- 下一篇:机动车生活用燃料零售业环境风险源评价方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用