[发明专利]一种基因分析方法及装置有效
申请号: | 201280060150.0 | 申请日: | 2012-12-03 |
公开(公告)号: | CN103975329B | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | S·库马尔;R·辛格;B·查克拉巴蒂;S·库马尔 | 申请(专利权)人: | 皇家飞利浦有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 李光颖;王英 |
地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因序列 组装 电子处理设备 测序 标准选择 存储介质 基因分析 随机选择 非暂态 比对 配置 存储 验证 | ||
一种非暂态存储介质存储包括比对测序读数的组装基因序列。一种电子处理设备配置为执行包括以下的操作:识别组装基因序列中的可能的变异;计算针对组装基因序列的读数的至少一个读数属性的值;以及,以包含可能的变异的组装基因序列的测序读数的至少一个读数属性的计算值满足接受标准的条件下调入可能的变异。所述电子处理设备还可以被配置为基于非随机选择标准选择组装基因序列的至少一个区域进行验证。
技术领域
下文涉及基因分析技术,并且涉及对该基因分析技术的应用,诸如,医疗技术、兽医技术、肿瘤学技术等。
背景技术
基因分析应用于很多医疗和兽医领域当中,诸如,肿瘤学以及各种基因相关疾病。通常,执行临床研究以识别基因变异,所述基因变异的存在与特定的肿瘤或疾病存在关联。作为说明性范例,这样的变异可以包括:单核甘酸多态(SNP);插入或缺失(indel);拷贝数变异(CNV);染色体畸变或重排;等等。
基因分析通常涉及以下操作。从患者采集组织样本,对其进行处理并将其加载到测序装置当中,所述装置生成表示通常具有大约几十到几百个碱基(base)的长度的基因序列的短部分的测序“读数”。对所述测序读数进行过滤,以丢弃重复读数,并且去除具有不可接受的低覆盖度和/或不可接受的低碱基质量的任何读数,例如,按照phred碱基质量分数对其进行测量。一般采用低于20的phred分数作为丢弃读数的标准。其余读数被组装,以生成比对的基因序列。所述组装能够是基于测序读数的重叠部分的比对而重新做的,或者能够基于测序读数到参考序列的映射,同时允许某一百分比(例如,5-10%)的碱基失配。通过将经组装的基因序列与参考序列(有可能是与基于映射的组装当中使用的相同的参考序列)进行比较而检测出变异,并且对经组装的基因序列进行注解,以识别变异及其临床意义(其中可获得变异疾病相关信息)。执行验证,以检测/表征测序或计算误差(如果有的话)。生成描述基因分析的输出的医疗报告。优选地用不熟知基因的治疗医生能够容易地理解的说法来书写医疗报告,并且其应当包括与验证结果有关的信息。
这样的分析当中的关键操作是变异识别或“调入(calling)”。这是这样一项操作,其中,对检测到的变异进行评估,以识别所述变异是否实际存在于患者的基因组中,或者反而是测序和/或组装处理当中的伪像或其中的误差。通常,基于核苷酸碱基质量和覆盖度执行变异调入。通常通过phred 之类的质量分数来测量碱基质量。就Sanger测序而言,通过计算序列碱基的参数(诸如,峰形和分辨率),并将这些值与根据经验开发的查找表格进行比较而从谱图数据中计算phred质量分数。phred分数通常被认为与不正确地调入碱基的概率对数相关。例如,Q=20的phred分数(Q)对应于99%的碱基调入准确度,而Q=30对应于99.9%的准确度,Q=40对应于99.99%的准确度,等等。覆盖度是读数的数量的度量标准,经常以倍数的形式来表达覆盖度。例如,8×的覆盖度表示平均而言,在测序期间对核甘酸读取八次。一般而言,由于覆盖度指示冗余度,较高的覆盖度对应于较高的读数可靠性。
所谓的“下一代”测序(NGS)方案采用并行处理技术,其以数量级增强吞吐量。常规的phred分数计算一般不适用于NGS技术,但是大部分 NGS平台生成可与从谱图数据中计算的常规phred分数进行比较或者换算的“phred类”碱基质量分数。但是,一般认为其比旧有技术(诸如,Sanger 测序)的可靠性低。为了增强NGS的可靠性,通常使用诸如Sanger测序、外显子捕获、基因分型(genotyping)阵列等的技术来验证输出。由于针对 NGS和这些较早技术的不同的吞吐量尺度,因而通常要对(大得多的)NGS 输出的几个随机选定的目标部分执行验证。
NGS的高吞吐量使得其对于临床应用颇具吸引力。然而,由于医疗处置决定基于临床NGS结果,临床应用还要求高可靠性。因而,与较早的技术相比,NGS的较低的可靠性使得NGS难以应用于临床环境中。
Y.Shen等人;Genome Research,vol.20,no.2,2010年2月1日,第 273-280页涉及一种SNP发现方法,以采用逻辑回归方法和标准分数来从下一代重测序数据中评估变异等位基因概率,以解释系统测序误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280060150.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种废料边折断机构
- 下一篇:多孔线夹专用钻孔装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用