[发明专利]一种蛋白质翻译后修饰定位的方法有效
申请号: | 201510197719.3 | 申请日: | 2015-04-21 |
公开(公告)号: | CN104820011B | 公开(公告)日: | 2017-10-24 |
发明(设计)人: | 肖开捷;沈赟;王悦;田志新 | 申请(专利权)人: | 同济大学 |
主分类号: | G01N27/62 | 分类号: | G01N27/62 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 翻译 修饰 定位 方法 | ||
技术领域
本发明涉及一种蛋白质分析方法,尤其是涉及一种蛋白质翻译后修饰定位的方法,属于与生物质谱相关的蛋白质组学与生物信息学领域。
背景技术
随着软电离技术(如电喷雾电离)及高分辨质量分析器(如轨道阱)的发展和商业化,质谱越来越多地用于蛋白质组学的研究与分析。
中国专利CN 103389335 A公布了一种通过分析生物大分子质谱数据来鉴定生物大分子一级结构和组成的分析装置和方法。该分析装置和方法基于所述生物大分子的原始一级和二级质谱,通过同位素峰质荷比及轮廓指纹比对从而对该生物大分子进行鉴定。上述分析方法直接利用质谱仪所采集的原始实验质谱数据,对前体离子和碎片离子同位素轮廓中每个原始实验同位素峰的精确质荷比和相对强度与相应的理论值进行比对,分别用于从数据库中找到候选生物大分子和利用串级质谱确认其中可信度最高的一个,从而对生物分子进行高可信度的定性、定量分析。
在生物信息学技术方面,与肽段的质谱鉴定方法相似,完整蛋白质的鉴定同样也是主要采用数据库搜索的方法。在蛋白质鉴定中,我们需要考虑蛋白质不同的变体形式(包括修饰、氨基酸突变等)。
蛋白质通过其完整的结构来实现其生物功能,其中,一级结构主要包含了蛋白质的氨基酸序列信息以及蛋白质的翻译后修饰的信息。对于每一个完整蛋白质,发生翻译后修饰的位点和种类很多,由翻译后修饰不同组合产生的该完整蛋白质的变体的数量很大;且每一个变体蛋白是完全独立的,有着自己独有的结构和功能。因此,有效地区分与鉴定这些结构上很接近但功能完全不同的蛋白质变体是必需的;但同时也是很艰难的。在蛋白质序列相同的情况下,具有不同的修饰组合及位点,这些蛋白质被称为蛋白质变体。其中,在现有质谱仪器分辨率下,无法有效分辨其完整蛋白质的质量差异的蛋白质变体,被称为同重异构体(可以是相同分子式,也可以是不同的分子式)。根据修饰种类的组合是否相同,同重异构体可以分为两类:一类为组合异构体,组合异构具有不同的修饰种类组合,但其修饰组合总的分子质量相同或十分接近;另一类为位置异构体,位置异构具有相同的修饰,但其修饰发生的位点不同。由蛋白质翻译后修饰带来的复杂多样,但又极其相似的蛋白质变体及同重异构体是高通量的蛋白质精确鉴定的一个巨大挑战。
现有搜索引擎,如Prosight PC,对蛋白质翻译后修饰的定位没有设置独立的打分与评价指标或参数,而是通过鉴定结果蛋白质的最佳匹配次序进行评价,无法提供高可信度的准确定位翻译后修饰的位点的鉴定结果。
中国专利CN 104134015 A公布了一种蛋白质翻译后修饰的定位方法,包括对于一条蛋白质序列,计算发生的修饰的总质量,得到该总质量对应的一个或多个修饰组合;将与所述蛋白质序列上的每个氨基酸对应的一个或多个修饰集合作为图中的顶点,根据所述一个或多个修饰组合连接该顶点,并且根据与所述蛋白质序列对应的谱图设置该顶点的权值。其中,所述修饰集合是从所述蛋白质序列的第一个氨基酸到对应的氨基酸上能够发生的修饰的集合并且是所述一个或多个修饰组合中的一个修饰组合的子集。所述方法还包括根据路径上所有顶点的权值选择所述图中的路径,并且将该路径转换为修饰位点信息。
上述专利提供了一种翻译后修饰快速组合的方法,但在修饰组合与位点的确定上采用的策略,与上文中的Prosight PC相似,用所有匹配的碎片离子进行统计打分,该打分本质上是对修饰后的序列打分,不是专门针对修饰的打分方法,最后只将打分最高的蛋白质变体进行输出。但是,实验中往往是一张二级质谱图中包含了多种蛋白质变体,该方法只输出一个结果,追求的是最佳匹配的蛋白质变体,丢失了许多的信息。而且,由于多种蛋白质变体的数据混杂,部分所谓最佳匹配的蛋白质变体的准确性仍有待讨论。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种直接的、高可信度的蛋白质翻译后修饰定位的方法。
本发明的目的可以通过以下技术方案来实现:
一种蛋白质翻译后修饰定位的方法,包括以下步骤:
(1)根据标准蛋白质序列数据库中的序列与修饰信息,分别生成所有对应蛋白变体的理论一级质谱数据库与二级质谱数据库;
(2)将实验的一级质谱与理论的一级质谱相比较,找出所有与该一级质谱匹配的候选蛋白质变体;
(3)将实验的二级质谱数据与所有候选蛋白质变体的理论的二级质谱数据进行匹配,得到各候选蛋白质变体的匹配碎片离子信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510197719.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多层粘接结构界面形态检测方法
- 下一篇:一种全景式自动修补的银浆线检测机