[发明专利]一种蛋白质糖化位点鉴定方法有效
申请号: | 201910061890.X | 申请日: | 2019-01-23 |
公开(公告)号: | CN109726510B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 杨润涛;陈金桂;张承进;张丽娜;宋勇 | 申请(专利权)人: | 山东大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00;G06K9/62 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 264200 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 糖化 鉴定 方法 | ||
本申请提供了一种蛋白质糖化位点鉴定方法,收集糖化位点训练数据集,从所述糖化位点训练数据集中提取肽链,利用肽链数字矢量、肽链中氨基酸的可及表面积、肽链中氨基酸的二级结构概率和肽链的灰色关联度来编码表征蛋白质,选用最大相关性最小冗余(mRMR)特征选择算法找到最佳特征集,然后在支持向量机上训练获得预测器,从而进行蛋白质糖化位点鉴定。本申请提供的蛋白质糖化位点鉴定方法,充分考虑肽链中氨基酸序列、肽链中氨基酸的可及表面积、肽链中氨基酸的二级结构概率和肽链的灰色关联度,有助于提高蛋白质糖化位点鉴定的准确性。
技术领域
本申请涉及蛋白质功能预测技术领域,尤其涉及一种蛋白质糖化位点鉴定方法。
背景技术
在没有酶参与下,还原糖分子与蛋白质通过共价键结合的过程称为糖化。糖化是蛋白质最重要的翻译后修饰过程(PTM)之一,涉及两步反应。首先,对不稳定的希夫碱进行重排,形成更稳定的Amadori产物;然后,生成了晚期糖化终产物(AGEs)。AGEs本身或其交联产物会导致蛋白质结构和功能的直接变化。当AGEs堆积到一定程度的时候就会侵害身体的各个器官。越来越多的研究表明在眼球蛋白,血浆,红细胞,动脉和肾脏等部位中均存在AGEs,而通过免疫化学方法也发现,各组织中AGEs的量随着年龄增长而增加,从而导致各种疾病,如糖尿病、阿尔茨海默病和动脉粥样硬化等。糖尿病前期的主要症状是高血糖,诱发高血糖的两个因素是胰岛素抵抗和β细胞衰竭。越来越多的证据表明,AGEs不仅有助于胰岛素抵抗,还会直接损害β细胞,从而导致功能受损甚至β细胞死亡。因为糖化反应大多发生在赖氨酸的ε氨基与还原糖的醛或酮基之间,所以赖氨酸糖化和氧化之间的协同相互作用引起了研究人员的强烈兴趣。
在高通量测序技术的支持下,已发现的蛋白质数量呈指数式增长,仅由基于质谱分析等的传统方法来鉴别蛋白质各糖化位点功能耗时且昂贵。为此研究人员们开发了各种基于机器学习的方法来预测蛋白质糖化位点。如:Johansen等人通过手动收集400篇论文得到了第一个糖化位点数据集,并在此数据集的基础上构建基于神经网络的糖化位点预测器;基于Johansen等人收集的数据集上,刘等人使用支持向量机算法开发了改进的预测器;徐等人讨论了序列顺序信息和位置特异性氨基酸倾向在糖化位点预测中的应用,并使用另一个训练数据集来训练了一个称为“Gly-PseAAC”的预测器;赵等人利用二级结构信息,AAindex,k间隔氨基酸对等特征来编码肽,在徐等人收集的数据集基础上使用新的两步特征选择算法筛选特征并构建预测模型;Islam等人提出了一种名为iProtGly-SS的方法,用于从序列和二级结构信息中提取特征,使用特征选择算法来找到最佳特征集,基于支持向量机算法训练了一个预测器。
尽管已经开发出这些模型来预测糖化位点,但仍存在一些问题。首先,之前文章所用的数据集中的一些蛋白质肽链已在Uniprot中更新,如果继续使用会在训练时引入不必要的噪声。其次,研究人员只使用了单肽链的特征而忽略了肽链之间的关系,提取出的特征信息不完善,会影响结果的准确性。
发明内容
本申请提供了一种蛋白质糖化位点鉴定方法,用于蛋白质糖化位点的鉴定,提高蛋白质糖化位点鉴定的准确性。
本申请提供了一种蛋白质糖化位点鉴定方法,所述方法包括:
收集糖化位点训练数据集,从所述糖化位点训练数据集中提取肽链P=A-ηA-(η-1)...A-2A-1KA1A2...Aη-1Aη,K为赖氨酸,η是赖氨酸上游或下游的氨基酸数量,A为20种天然氨基酸之一;
采用20维二进制编码表示所述肽链中的氨基酸,将所述肽链转换为20(2η+1)维数字矢量;
计算所述肽链中氨基酸的可及表面积;
计算所述肽链中氨基酸的二级结构概率;
计算所述肽链的灰色关联度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910061890.X/2.html,转载请声明来源钻瓜专利网。