[发明专利]一种筛选疾病表型相关突变位点的方法及其应用在审
申请号: | 202011599663.1 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112735594A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 张静波;姬晓勇;徐冰;单光宇;伍启熹;王建伟;刘倩;唐宇 | 申请(专利权)人: | 北京优迅医疗器械有限公司 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16B20/20;G16B20/50 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 钱云 |
地址: | 102600 北京市大兴区中关村科技园区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 筛选 疾病 表型 相关 突变 方法 及其 应用 | ||
本发明涉及生物信息学技术领域,尤其涉及一种筛选疾病表型相关突变位点的方法及其应用。所述方法包括获得多个疾病样本和正常样本的测序数据,进行变异检出;以样本的表型、检出的突变位点的突变类型作为项目总集进行关联规则挖掘,获得和疾病样本的表型具有强关联关系的突变位点;针对经过关联规则挖掘筛选得到的突变位点进行建模分析得到和疾病表型相关的突变位点。本发明通过将等位基因转换为分类变量进行关联规则挖掘,后针对和疾病表型强关联的位点进行建模分析,可以有效降低分析的样本总量,并且避免等位基因频率对分析结果的影响,只需获得突变基因型信息即可完成疾病表型相关位点的筛选和分析。
技术领域
本发明涉及生物信息学技术领域,尤其涉及一种筛选疾病表型相关突变位点的方法及其应用。
背景技术
人类遗传学的中心目标是识别常见复杂疾病(如精神分裂症和Ⅱ型糖尿病)和罕见孟德尔疾病(如囊性纤维化和镰状细胞性贫血)的遗传风险因素。虽然了解人类健康和疾病的复杂性是目前研究的关键之一,但不是人类遗传学研究的唯一焦点,药理学领域也是同样重要的领域。药物基因学的目的是识别与药物代谢、疗效以及副作用相关的DNA序列变异。例如,法华林是一种稀释血液的药物,有助于防止患者生成的血凝块。在使用法华林的同时,需要严格把控为每个病人制定的药物剂量,并且现有技术普遍认为剂量的多少受到基因所调控。最近的全基因组关联性分析(Genome-wide association studies,GWAS)表明,几个基因的DNA序列变异对华法林剂量有很大影响。这些结果,以及验证性研究,主导了可以用于临床的华法林剂量的基因测试。这种类型的基因检测催生了名为“个性化医疗”的新领域,该领域旨在根据患者的遗传背景和其他生物特征,为其量身定制医疗服务。
GWAS分析应用基因组中数百万计的单核苷酸多态(single nucleotidepolymorphism,SNP),进行全基因组水平上的对照分析或相关性分析,是通过比较发现影响复杂性状的基因变异的一种新策略。GWAS分析在全基因组范围内选择遗传变异进行基因分析,基于病例-对照样本,比较两组之间每个遗传变异及其频率的差异,统计分析每个变异与目标性状之间的关联性大小,选出最相关的遗传变异进行验证,并根据验证结果最终确认其与目标性状之间的相关性。GWAS预测性状与基因的关联,其分析结果受多种因素的影响:1)性状受多少个位点的影响;2)这些位点的等位基因频率和它们效应量的联合分布情况;3)实验的样本量;4)用于GWAS分析的全基因组变异平台;5)研究的性状或疾病的异质性。GWAS的分析结果需要大量样本来支撑,以便有足够大的统计学功效,因此,进行GWAS分析的成本往往较高。
Logistic回归模型是一个分析二分类(如病例-对照等)反应变量的基本工具,也可以分析基因-基因间交互作用。但是Logistic回归模型在用小样本量来估计较多参数(如单核苷酸多态性)时存在一定的局限性,每增加一个SNP位点,所需的样本量将呈指数倍增加,考虑到基因型频率,即使样本量较大,数据分布在高维空间仍显得相对稀疏,很可能出现某系基因组组合没有观察值的情况,这种情况称为“维度困扰”。
关联规则挖掘被认为是可以从大量数据中筛选新颖、潜在未知的知识和信息的一种有效工具,可以为发现各种属性包括属性组合之间的复杂关联提供许多有益的信息,并且对于处理稀疏和弱相关的数据,效率较高。
发明内容
为了解决现有技术存在的问题,本发明提供一种筛选疾病表型相关突变位点的方法及其应用。本发明通过将等位基因转换为分类变量进行关联规则挖掘,后针对和疾病表型强关联的位点进行建模分析,可以有效降低分析的样本总量,并且避免等位基因频率对分析结果的影响。
第一方面,本发明提供一种筛选疾病表型相关突变位点的方法,包括:
获得多个疾病样本和正常样本的测序数据,进行变异检出;
以样本的表型、检出的突变位点的突变类型作为项目总集进行关联规则挖掘,获得和疾病样本的表型具有强关联关系的突变位点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京优迅医疗器械有限公司,未经北京优迅医疗器械有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011599663.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可折向的等截面圆自动煤粉取样枪
- 下一篇:一种弱口令设备的扫描方法及装置