[发明专利]一种提取荟萃生物标志物的方法及装置有效

专利信息
申请号: 201310213816.8 申请日: 2013-05-31
公开(公告)号: CN103336914A 公开(公告)日: 2013-10-02
发明(设计)人: 刘伟;谢红卫 申请(专利权)人: 中国人民解放军国防科学技术大学
主分类号: G06F19/18 分类号: G06F19/18
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 李志刚;吴贵明
地址: 410073 湖*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 提取 荟萃 生物 标志 方法 装置
【说明书】:

技术领域

发明涉及生物标志物提取领域,特别地,涉及一种提取荟萃生物标志物的方法及装置。

背景技术

生物标志物,是指可以标记系统、器官、组织、细胞及亚细胞结构或功能的改变或可能发生的改变的生化指标,其主要功能是指明疾病的病理状况和应当采行的治疗方法及效果。生物标志物通常从病人的离体的肿瘤、血液、血浆或体液等组织中获得。生物标志物在临床上具有重要的应用价值,可用于疾病诊断、判断疾病分期或者用来评价新药或新疗法在目标人群中的安全性及有效性。

蛋白质组学是研究特定时空条件下细胞、组织等所含蛋白表达谱的有效手段,也是寻找生物标志物的重要方法。其基本思想是通过蛋白质组学的方法比较疾病状态和正常生理状态下蛋白质表达的差异,寻找有效的生物标志物,其中应用较多的是二维凝胶电泳和质谱分析技术。在二维凝胶电泳中,蛋白质样品根据其等电点和相对分子质量的不同而分离,在得到的电泳图谱中,疾病状态和正常生理状态的蛋白质染色斑点的分布会出现差异,以此为线索,可以发现新的生物标志物。

现有技术中针对不同来源数据的分析方法是对数据集进行简单的平均化处理,分析结果不具有统计显著性的意义,得到的生物标志物不具有明显的通用性。

发明内容

本发明目的在于提供一种提取荟萃生物标志物的方法及装置,以解决现有技术中针对不同来源数据的分析方法是对数据集进行简单的平均化处理,分析结果不具有统计显著性的意义,使得到的生物标志物不具有明显的通用性的技术问题。

为实现上述目的,本发明提供了一种提取荟萃生物标志物的方法,包括:

步骤S1:取与同一疾病相关的n个疾病质谱数据集,并分别对每个疾病质谱数据集中的蛋白进行蛋白质定量,得到n个蛋白质定量结果,所述n为正整数;

步骤S3:将每个所述蛋白质定量结果分别与对应的基准对照组进行比较,得到每个所述蛋白质定量结果中蛋白的统计差异概率值,将统计差异概率值小于预设显著阈值的蛋白作为候选生物标志物,得到m个候选生物标志物,所述m为正整数且m≤n;

步骤S5:将所述m个候选生物标志物进行荟萃分析,提取在所述n个疾病质谱数据集中统计数量大于预设统计值的候选生物标志物的集合作为荟萃生物标志物。

进一步地,在所述步骤S5之后,所述方法还包括:

步骤S6:验证所述荟萃生物标志物是否正确,

其中,当验证所述荟萃生物标志物的结果为不正确时,返回所述步骤S3。

进一步地,所述步骤S6包括:

步骤S61:根据所述荟萃生物标志物对p个疾病质谱数据集以及k个正常质谱数据集进行分类,得到分类结果,所述p和k均为正整数;

步骤S62:根据所述分类结果判断所述荟萃生物标志物是否正确。

进一步地,所述步骤S61中,所述进行分类的算法是投票法、支持向量机算法及决策树算法中的一种或者任意几种的组合。

进一步地,所述步骤S62中,所述根据所述分类结果判断所述荟萃生物标志物是否正确的判断方法为交叉验证法或独立测试集法。

进一步地,所述步骤S3中,每个所述蛋白质定量结果与基准对照组的统计差异是通过T检验方法计算得到的P值。

进一步地,所述步骤S5包括:

步骤S51:根据所述m个候选生物标志物在所述n个疾病质谱数据集中的统计数量,将所述m个候选生物标志物排列成第一蛋白序列;

步骤S52:从所述第一蛋白序列中取出小于等于m个蛋白,组成多个随机蛋白序列,从所述多个随机蛋白序列中取出一个随机蛋白序列,将对照蛋白随机替换该随机蛋白序列中的一个或多个蛋白,生成该随机蛋白序列的多个随机蛋白子序列,针对所述多个随机蛋白序列,共生成S个随机蛋白子序列,将所述S个随机蛋白子序列一一对应进行S次扰动实验,将每次所述扰动实验使用的所述随机蛋白子序列中的蛋白的数目记为第一蛋白数目集合,其中S取正整数且S远大于m;

步骤S53:针对多个疾病质谱数据集以及多个正常质谱数据集,计算在每次所述扰动实验使用的所述随机蛋白子序列中各蛋白的预估阳性发现率,统计预估阳性发现率小于预设阳性发现阈值的蛋白质的数目,并将这些蛋白质的数目的集合记为第二蛋白数目集合;

步骤S54:针对多个疾病质谱数据集以及多个正常质谱数据集,根据所述第一蛋白数目集合和所述第二蛋白数目集合,计算每个所述随机蛋白子序列的最小荟萃阳性发现率;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科学技术大学,未经中国人民解放军国防科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310213816.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top