[发明专利]一种基于二代测序的冠心病遗传风险评估方法有效
申请号: | 201510556934.8 | 申请日: | 2015-09-06 |
公开(公告)号: | CN105279369A | 公开(公告)日: | 2016-01-27 |
发明(设计)人: | 张鑫磊;朱文杰;袁骁 | 申请(专利权)人: | 苏州协云和创生物科技有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 范晴 |
地址: | 215123 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于二代测序的冠心病遗传风险评估方法。特别的,本发明涉及冠心病遗传风险位点的筛选和基于风险位点的冠心病遗传风险评估模型的建立。依赖于此模型,对个体基因组进行靶向测序,最终得到个体的冠心病遗传风险。 | ||
搜索关键词: | 一种 基于 二代 冠心病 遗传 风险 评估 方法 | ||
【主权项】:
一种基于二代测序的冠心病遗传风险评估方法,其特征在于,其包括如下步骤:(1)选取风险SNPs位点和加权重:输入已知风险SNPs位点和进行GWAS数据质量控制,所述的数据质量控制步骤如下:检查个体自报性别和预测的遗传性别的一致性,去除两者之间不一致的个体;只保留位于常染色体的SNPs并且去除所有样本中具有单一多态性的SNPs;去除样本间成功分型率小于0.95的SNPs;去除SNPs间有效分型率小于0.95的样本;检查样本间的亲缘关系和种群结构,样本间亲缘系数大于或等于0.125则被认为亲缘关系很近;种群结构分析用主成分分析的方法,R包SNPRelate被用来进行主成分分析和亲缘关系的分析,如果一个样本与前十个主成分中的任何一个的偏离超过6个标准差,则被认为是异常值,将被移除;当异常值和亲缘关系近的样本同时存在时,先移除异常值,然后移除亲缘关系近的样本中的一个;移除哈代‑温伯格平衡P值小于0.000001的SNPs;(2)遗传风险值GRS的计算:个体的遗传风险值GRS通过公式(1)计算得到;其中ωi为每个SNP的log odds‑ratio,RAi为Risk Allele的数目;公式(1)基于两个基本假设:第一,选取的SNPs不存在连锁不平衡关系(Linkage Disequilibrium),rsq<0.2,也就是SNPs之间互相独立;第二,SNPs之间主要通过线性加和作用和疾病关联,而不是相互作用;![]()
公式(1)公式(2)为风险预测模型,其中β为相关系数,而α为模型的截距;GRS需要基于群体的GRS进行Z‑score归一化处理。log(P(CHD|Genetic Factors))=α+βGRS 公式(2)公式(2)是对数的形式,两边取指数后,变换为公式(3);公式(3)为最终的患病预测模型。P(CHD|Genetic Factors)=eα+βGRS 公式(3)(3)模型参数估计:公式(3)的参数模型参数α和β的估计是基于全部dbGap和WTCCC中搜集得到的病人和对照样本;模型评价采用采用10‑fold交叉验证,其中9/10用作训练数据集,剩下1/10数据作为测试数据集,模型好坏的评价采用ROC曲线的AUC面积,也就是C统计量,ROC曲线可以评估模型区分GRS的能力;(4)个体风险评估报告:采用NextSeq500测序仪,对公式(3)中的风险位点进行靶向测序,获得个体风险信息,由公式(3)给出个体的冠心病患病风险;用个体相对与群体的遗传患病风险分布图表示。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州协云和创生物科技有限公司,未经苏州协云和创生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510556934.8/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用