[发明专利]基于分子结构预测有机化合物的牛血清白蛋白‑水分配系数的方法及模型建立方法有效
申请号: | 201410251455.0 | 申请日: | 2014-09-26 |
公开(公告)号: | CN104200056B | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 于海瀛;陈伟;郭婷 | 申请(专利权)人: | 浙江师范大学 |
主分类号: | G06F19/16 | 分类号: | G06F19/16;G06F19/18;G06F19/12 |
代理公司: | 杭州丰禾专利事务所有限公司33214 | 代理人: | 王从友 |
地址: | 321004 *** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于分子结构快速预测有机化合物牛血清白蛋白‑水分配系数(logKBSA/W)的及模型建立方法,该方法采用以下的模型进行牛血清白蛋白‑水分配系数预测logKBSA/W=0.747×logKow+0.476×EHOMO‑0.024×CCR+ 0.870×q++0.007×CSEV+4.342;其中,logKow表示正辛醇‑水分配系数,EHOMO表示最高占据分子轨道能,CCR表示核‑核排斥能,q+表示最正净电荷,CSEV 表示Connolly溶剂排斥体积。本发明的有益效果是采用本发明方法可以快速预测多个种类的中性有机化合物在牛血清白蛋白和水之间的分配系数。所使用的分子结构描述符容易获得,回归分析方法简单,因此该方法方便快捷、成本低廉、性能优异。 | ||
搜索关键词: | 基于 分子结构 预测 有机化合物 血清 白蛋白 水分 系数 方法 模型 建立 | ||
【主权项】:
基于分子结构预测有机化合物的牛血清白蛋白‑水分配系数的方法,其特征在于该方法采用以下的模型进行牛血清白蛋白‑水分配系数预测:logKBSA/W = 0.747×logKow + 0.476×EHOMO ‑ 0.024×CCR + 0.870×q+ + 0.007×CSEV + 4.342;其中,logKow 表示正辛醇‑水分配系数,EHOMO表示最高占据分子轨道能,CCR表示核‑核排斥能, q+表示最正净电荷,CSEV 表示Connolly溶剂排斥体积;所述的模型建立的方法包括以下的步骤:1) 首先,选择了来自于同一个实验室使用相同方法测定的logKBSA/W值;整个数据集共包括75个中性有机化合物,logKBSA/W的数值范围为1.19~4.76,跨越3.6个数量级;2) 根据化合物在BSA和水相之间分配机理的分析,共选择21种分子结构描述符用于模型的构建;所述的21种分子结构描述符分别为平均分子极化率α、偶极矩μ、μ2、标准生成热ΔHf、总能量TE、电子能EE、核‑核排斥能CCR、最低未占据分子轨道能ELUMO、最高占据分子轨道能EHOMO、碳原子最负净电荷qC–、氢原子最正净电荷qH+、最负净电荷q–、最正净电荷q+、COSMO面积Acosmo、COSMO体积Vcosmo、分子量Mw、Connolly溶剂可及分子表面积CAA、Connolly分子表面积CMA、Connolly溶剂排斥体积CSEV、椭圆度Ov和正辛醇‑水分配系数logKow;使用MOPAC2012中的PM6算法对分子结构进行优化并计算平均分子极化率α、偶极矩μ、μ2、标准生成热ΔHf、总能量TE、电子能EE、核‑核排斥能CCR、最低未占据分子轨道能ELUMO、最高占据分子轨道能EHOMO、碳原子最负净电荷qC–、氢原子最正净电荷qH+、最负净电荷q–、最正净电荷q+、COSMO面积Acosmo和COSMO体积Vcosmo15种量子化学描述符,使用ChemOffice 2010和EPI Suite分别计算分子量Mw、Connolly溶剂可及分子表面积CAA、Connolly分子表面积CMA、Connolly溶剂排斥体积CSEV、椭圆度Ov和正辛醇‑水分配系数logKow 6种性质参数;3) 采用多元线性回归MLR方法中的逐步回归理论建立模型,具体过程由SPSS 17.0执行;使用相关系数的平方r2和均方根误差rms作为统计学指标表征模型的拟合性能,使用预测相关系数的平方q2表征模型的预测性能;经MLR分析得到的最优模型为:logKBSA/W = 0.747×logKow + 0.476×EHOMO ‑ 0.024×CCR + 0.870×q+ + 0.007×CSEV + 4.342;其中,logKow 表示正辛醇‑水分配系数,EHOMO表示最高占据分子轨道能,CCR表示核‑核排斥能,q+表示最正净电荷,CSEV 表示Connolly溶剂排斥体积。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江师范大学,未经浙江师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410251455.0/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用