[发明专利]一种基于多元数据预测DNA突变影响蛋白互作的预测方法有效
申请号: | 201611255461.9 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106778065B | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 赵兴明;何峰 | 申请(专利权)人: | 同济大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多元 数据 预测 dna 突变 影响 蛋白 方法 | ||
一种基于多元数据预测DNA突变影响蛋白互作(Protein‑Protein Interaction,PPI)的预测方法。本方法以DNA上SNP(Single Nucleotide Polymorphisms,SNP)是否对蛋白互作产生影响为研究对象,使用蛋白质的结构、功能和氨基酸序列相关的七类特征,采用支持向量机(Support Vector Machine,SVM)和集成学习算法作为分类器,就SNP是否破坏蛋白互作进行预测。同时,对蛋白之间是否存在相互作用以及SNP引起的氨基酸变异是否发生在蛋白互作面(PPI interface)上进行判断。
技术领域
本发明涉及一种在机器学习与生物信息学知识背景下,预测DNA突变影响蛋白互作的算法,尤其是涉及一种基于多元数据预测DNA突变影响蛋白互作的预测方法。
背景技术
DNA单位点核苷酸突变(Single Nucleotide Polymorphisms,SNP)导致蛋白质氨基酸变异从而破坏蛋白质互作(Protein Protein Interaction,PPI)可能引发多种疾病,给人类的健康带来很大威胁。例如由SNP rs17646665引起蛋白质APOE发生氨基酸突变,破坏APOE和SORT1之间的蛋白质互作,促进APOE/Aβ化合物的生成,加大了阿尔海默茨病(AD)的患病风险。
目前预测SNP对PPI稳定性影响的算法主要有以下四种:
1.基于蛋白质结构进行预测的算法,如AUTO-MUTE[Masso,M.and Vaisman,I.(2008)Accurate prediction of stability changes in protein mutants bycombining machine learning with structure based computationalmutagenesis.Bioinformatics,24,2002–2009],CUPSAT[Parthiban,V.,et al.(2006)CUPSAT:prediction of protein stability upon point mutations.Nucleic AcidsRes.,34,239–242]等。这一类方法主要使用蛋白质化合物的结构特征,如溶剂可及面积、氨基酸之间距离、残疾深度等,结合机器学习和统计学方法对结合自由能(Binding freeenergy)进行回归预测。
2.基于蛋白质能量信息的算法,如MutaBind[Li M,Simonetti FL,GoncearencoA,Panchenko AR.(2016)MutaBind estimates and interprets the effects ofsequence variants on protein-protein interactions.Nucleic Acids Res.,44(W1),W494–501]。这一类方法主要利用了蛋白氨基酸残基突变前后能量的改变,如利用能量模块算法计算出的范德华力等对结合自由能进行回归。
3.基于蛋白质序列的算法,如iPTREE-STAB[Huang,L.T.et al.(2007)iPTREE-STAB:interpretable decision tree based method for predicting proteinstability changes upon mutations.Bioinformatics,23,1292–1293],MuStab[Teng,S.et al.(2010)Sequence feature-based prediction of protein stability changesupon amino acid substitutions.BMC Genomics,11,5.Bioinformatics,23,1292–1293]等,使用蛋白质化合物残基序列信息作为特征,拟合突变前后结合自由能的变化量,从而对SNP是否破坏蛋白互作进行判断。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611255461.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置