[发明专利]基于分子结构预测有机化合物的牛血清白蛋白‑水分配系数的方法及模型建立方法有效
申请号: | 201410251455.0 | 申请日: | 2014-09-26 |
公开(公告)号: | CN104200056B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 于海瀛;陈伟;郭婷 | 申请(专利权)人: | 浙江师范大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16;G06F19/18;G06F19/12 |
代理公司: | 杭州丰禾专利事务所有限公司33214 | 代理人: | 王从友 |
地址: | 321004 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分子结构 预测 有机化合物 血清 白蛋白 水分 系数 方法 模型 建立 | ||
1.基于分子结构预测有机化合物的牛血清白蛋白-水分配系数的方法,其特征在于该方法采用以下的模型进行牛血清白蛋白-水分配系数预测:
logKBSA/W = 0.747×logKow + 0.476×EHOMO - 0.024×CCR + 0.870×q+ + 0.007×CSEV + 4.342;
其中,logKow 表示正辛醇-水分配系数,EHOMO表示最高占据分子轨道能,CCR表示核-核排斥能, q+表示最正净电荷,CSEV 表示Connolly溶剂排斥体积;
所述的模型建立的方法包括以下的步骤:
1) 首先,选择了来自于同一个实验室使用相同方法测定的logKBSA/W值;整个数据集共包括75个中性有机化合物,logKBSA/W的数值范围为1.19~4.76,跨越3.6个数量级;
2) 根据化合物在BSA和水相之间分配机理的分析,共选择21种分子结构描述符用于模型的构建;所述的21种分子结构描述符分别为平均分子极化率α、偶极矩μ、μ2、标准生成热ΔHf、总能量TE、电子能EE、核-核排斥能CCR、最低未占据分子轨道能ELUMO、最高占据分子轨道能EHOMO、碳原子最负净电荷qC–、氢原子最正净电荷qH+、最负净电荷q–、最正净电荷q+、COSMO面积Acosmo、COSMO体积Vcosmo、分子量Mw、Connolly溶剂可及分子表面积CAA、Connolly分子表面积CMA、Connolly溶剂排斥体积CSEV、椭圆度Ov和正辛醇-水分配系数logKow;
使用MOPAC2012中的PM6算法对分子结构进行优化并计算平均分子极化率α、偶极矩μ、μ2、标准生成热ΔHf、总能量TE、电子能EE、核-核排斥能CCR、最低未占据分子轨道能ELUMO、最高占据分子轨道能EHOMO、碳原子最负净电荷qC–、氢原子最正净电荷qH+、最负净电荷q–、最正净电荷q+、COSMO面积Acosmo和COSMO体积Vcosmo15种量子化学描述符,使用ChemOffice 2010和EPI Suite分别计算分子量Mw、Connolly溶剂可及分子表面积CAA、Connolly分子表面积CMA、Connolly溶剂排斥体积CSEV、椭圆度Ov和正辛醇-水分配系数logKow 6种性质参数;
3) 采用多元线性回归MLR方法中的逐步回归理论建立模型,具体过程由SPSS 17.0执行;使用相关系数的平方r2和均方根误差rms作为统计学指标表征模型的拟合性能,使用预测相关系数的平方q2表征模型的预测性能;
经MLR分析得到的最优模型为:
logKBSA/W = 0.747×logKow + 0.476×EHOMO - 0.024×CCR + 0.870×q+ + 0.007×CSEV + 4.342;
其中,logKow 表示正辛醇-水分配系数,EHOMO表示最高占据分子轨道能,CCR表示核-核排斥能,q+表示最正净电荷,CSEV 表示Connolly溶剂排斥体积。
2.根据权利要求1所述的基于分子结构预测有机化合物的牛血清白蛋白-水分配系数的方法,其特征在于:有机化合物包括烷烃、烯烃、卤代烃、醇、苯酚、醚、酮、苯胺、脂肪胺、硝基化合物、多环芳烃、杂环化合物和苯的衍生物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410251455.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用