[发明专利]从目标测序面板中寻找变异的方法有效

专利信息
申请号: 201410355823.6 申请日: 2014-07-24
公开(公告)号: CN104346539B 公开(公告)日: 2019-09-03
发明(设计)人: A.阿舒特什;D.乔希;C.A.勒科克 申请(专利权)人: 安捷伦科技有限公司
主分类号: G16B30/00 分类号: G16B30/00
代理公司: 北京坤瑞律师事务所 11494 代理人: 封新琴
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要: 本文提供了在富集样本中识别序列变异的方法。在某些实施例中,这种方法可以包含:(a)获取:(i)来自对于基因组区已经富集的样本的多个序列读数以及(ii)基因组区的参考序列;(b)组装序列读数以便获取与潜在变异相对应的多个离散序列集合;(c)通过检查构成每个离散序列集合的序列读数确定哪些潜在变异是真的,哪些是赝生物;(d)可选地确定每种真潜在变异是否包含已知与参考序列相联系的突变;以及(e)输出指示该样本是否包含序列变异的报告。
搜索关键词: 目标 面板 寻找 变异 方法
【主权项】:
1.一种识别序列变异的方法,包含:(a)获取:(i)来自对于基因组区已经富集的样本的多个序列读数以及(ii)基因组区的参考序列;(b)组装序列读数以便获取多个离散序列集合,其每个与潜在变异相对应;(c)通过检查构成每个离散序列集合的序列读数的参数,包括读数质量、碱基调用的置信度、和对准的置信度,确定哪些潜在变异是真的,哪些是赝生物;(d)可选地确定每种真潜在变异是否包含已知与参考序列相联系的突变;以及(e)输出指示所述样本是否包含序列变异的报告,其中该方法不用于诊断或治疗疾病。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安捷伦科技有限公司,未经安捷伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410355823.6/,转载请声明来源钻瓜专利网。

同类专利
  • 联合归一化和差异检测方法-201910687058.0
  • 汤斌华;王宇琦 - 河海大学常州校区
  • 2019-07-29 - 2019-11-08 - G16B30/00
  • 本发明公开了一种联合归一化和差异检测方法,基于高通量染色质相互作用数据集进行差异比较预处理和可视化处理;基于已进行差异比较预处理的高通量染色质相互作用数据集进行联合归一化;基于完成联合归一化的高通量染色质相互作用数据集进行差异检测与分析。优点:本发明开创性提出了差异比较预处理和可视化处理,填补了目前对于多个数据集的归一化和差异检测方法的空白;能够实现多个高通量染色体相互作用数据集的高效准确归一化和差异检测;另外该技术方法相对高效且快速,且可视化程度高。
  • 基于生物云平台的测序数据分析系统及方法-201910560395.3
  • 郑洪坤;刘东源;罗江华;苗蓉;魏铮;白洁;刘威 - 北京百迈客云科技有限公司
  • 2019-06-26 - 2019-10-18 - G16B30/00
  • 本发明实施例提供一种基于生物云平台的测序数据分析系统及方法,包括用户界面模块,用于获取待分析的测序数据,并将测序数据发送到特征提取模块;特征提取模块,用于对接收到的测序数据进行特征提取处理,得到测序数据特征值,根据测序数据特征值获取对应的样本测序数据,并将样本测序数据发送到图表呈现模块;图表呈现模块,用于接收特征提取模块发送的样本测序数据,并将样本测序数据转换成可视化样本图表进行显示;云端综合分析模块,用于根据可视化样本图表对测序数据进行分析,并将分析结果数据发送到图表呈现模块,以生成可视化测序报告图表。本发明实施例提高了测序数据的处理效率,使得测序数据分析方式更加多样化。
  • 基于标准熵的局部敏感哈希的DNA序列聚类-201710285598.7
  • 江秉华;江育娥;徐彭娜;林劼 - 福建师范大学
  • 2017-04-27 - 2019-10-18 - G16B30/00
  • 本发明公开基于标准熵的局部敏感哈希的DNA序列聚类,通过对原始的DNA序列按着L‑Gram模型进行映射,通过计算N条序列的LF熵值构成的矩阵,进而得出其标准熵,使用Locality‑Sensitive Hashing对标准熵进行哈希映射,得到DNA片段序列的候选集合,在候选集合中计算编辑距离小于d的DNA片段序列得到聚类结果。本发明综合考虑到在转换后的特征空间包含足够的原始DNA信息,避免DNA信息的丢失,将每一段DNA序列转为一个新的空间,并计算每一条DNA片段序列的候选DNA片段序列集合,可以提高运算速度和精确度。
  • 基因组/蛋白质组序列的表示、可视化,比较以及报告-201910585009.6
  • R·辛格;S·库马尔;B·查克拉巴蒂 - 皇家飞利浦有限公司
  • 2012-07-04 - 2019-10-15 - G16B30/00
  • 基因组或蛋白质组数据被编码为包括生物信息学字符集(20)的字符的基因组或蛋白质组字符串。基因组或蛋白质组数据的每一个碱基或肽通过生物信息学字符集的单个字符来表示,以及生物信息学字符集的每个字符编码(I)碱基或肽以及(II)与该碱基或肽相关联的至少一个注释的数据值。该基因组或蛋白质组数据通过使用映射到生物信息学字符集的生物信息学字体(40)显示基因组或蛋白质组字符串来被显示。至少一个字符串函数可在基因组或蛋白质组字符串上执行以生成更新的基因组或蛋白质组字符串,其中至少一个碱基或肽由编码了至少一个附加的或修改的注释的数据的单个字符表示,该字符由执行的字符串操作生成。
  • 一种基于局部异常因子的拷贝数变异检测方法-201910381315.8
  • 袁细国;李俊萍;李杰;张军英;杨利英;习佳宁 - 西安电子科技大学
  • 2019-05-08 - 2019-10-08 - G16B30/00
  • 本发明属于数据异常程度检测技术领域,公开了一种基于局部异常因子的拷贝数变异检测方法;本发明首先对数据进行预处理,减少了测序过程中带来的误差;本发明使用局部异常因子的算法将低敏感度的拷贝数变异区域的特征凸显出来,更容易,更准确的检测出低敏感度的拷贝数变异位置;操作简单,本发明只需要bam文件和参考序列即可完成检测,并且检测速度较快。同时,通过仿真数据的测试,可以发现本发明的测试结果相对于其它方法来说更为准确。本发明针对低敏感度区域的检测与现有方法做对比,正确率较高。现有技术对于低敏感度的拷贝数变异的检测造成遗漏,而本发明通过使用局部异常因子算法将该类型的变异区域的特征凸显出来,可以准确的检测出变异区域。
  • 一种基因组岛预测识别系统及应用-201910539935.X
  • 魏闻;李咏梅;王欢;党亚梅;陈雪纯;邵晓雯;吴菲 - 天津医科大学
  • 2019-06-21 - 2019-09-13 - G16B30/00
  • 本发明公开了一种基因组岛预测识别系统及应用。本发明的识别系统实验结果表明,ZIE的真阳性率(TPR)至少比其他四种常用工具高10.3%。另一方面,新工具在提高TPR的同时并没有失去整体精度,且各评价指标之间也表现出较好的均衡性。ZIE对实验基因组岛数据的预测精度较高。总体而言,该工具提供了一个替代其他工具的解决方案,并提供一个弥补结果以提高联合预测策略的性能。本发明为ZIE提供了一个web服务、图形用户界面和跨多个平台的开源代码,可以通过http://cefg.uestc.edu.cn或http://tubic.tju.edu.cn获得。
  • 优化基因组测序结果的分类方法-201810155742.X
  • 谭宇翔;张宇;尹芝南 - 暨南大学;谭宇翔
  • 2018-02-23 - 2019-09-06 - G16B30/00
  • 本发明公开了一种优化基因组测序结果的分类方法,包括如下步骤:A)读取输入的多态性记录文本文件;B)根据注解对所述多态性记录文本文件的内容进行分类,得到相应的分类信息;所述分类信息包括同源单核苷酸多样性、同源插入缺失变化、异源单核苷酸多样性和异源插入缺失变化;C)对应不同的分类信息使用不同的过滤指标进行过滤,将不符合过滤标准的内容过滤掉,得到过滤后的结果;D)将所述过滤后的结果进行汇总并输出。实施本发明的优化基因组测序结果的分类方法,具有以下有益效果:能提高全基因组测序结果的精度。
  • 从目标测序面板中寻找变异的方法-201410355823.6
  • A.阿舒特什;D.乔希;C.A.勒科克 - 安捷伦科技有限公司
  • 2014-07-24 - 2019-09-03 - G16B30/00
  • 本文提供了在富集样本中识别序列变异的方法。在某些实施例中,这种方法可以包含:(a)获取:(i)来自对于基因组区已经富集的样本的多个序列读数以及(ii)基因组区的参考序列;(b)组装序列读数以便获取与潜在变异相对应的多个离散序列集合;(c)通过检查构成每个离散序列集合的序列读数确定哪些潜在变异是真的,哪些是赝生物;(d)可选地确定每种真潜在变异是否包含已知与参考序列相联系的突变;以及(e)输出指示该样本是否包含序列变异的报告。
  • 用于在有向非循环结构中使用双端数据的系统和方法-201480067827.2
  • 丹尼斯·库拉尔;南森·梅维斯 - 七桥基因公司
  • 2014-10-15 - 2019-08-27 - G16B30/00
  • 本申请涉及一种分析转录组的方法,该方法包括从来自生物体的转录组获得至少一对双端读数,找出在该对的第一读数和有向非循环数据结构(该数据结构具有表示RNA序列诸如外显子或转录本的节点和连接多对节点的边缘)中的节点之间的具有最佳评分的比对,识别包含节点的候选路径,该节点通过具有与该对双端读数的插入长度大体上类似的长度的路径连接到下游节点,并且将双端读数与候选路径比对以确定最佳评分比对。
  • 用于编码和解码数据结构的质量值的方法-201680091520.5
  • J·伏格斯;M·海纳斯;J·奥斯特曼 - 汉诺威戈特弗里德威廉莱布尼茨大学;斯坦福大学
  • 2016-10-12 - 2019-08-23 - G16B30/00
  • 本发明涉及用于编码数据结构的质量值的方法,其中,所述数据结构包括多个连续片段,每个连续片段包括从符号字母表导出的符号序列并且对应于一个或多个参考序列中的一个参考序列的片段,其中,每个连续片段与所述参考序列之一的基因座索引对齐,并且所述连续片段的至少一部分在对齐的基因座索引处重叠,并且还包括多个质量值,每个质量值从质量值字母表导出并且被分配给连续片段之一的对应符号,其中,每个质量值指示对应连续片段中的对应符号正确的似然度,其中,该方法包括能够由数据处理系统执行的步骤:确定特定基因座索引处的质量值,质量值被分配给与所述特定基因座索引对齐的连续片段的符号;以及基于所确定的质量值计算特定基因座索引处的估计确定性,其中,所述估计确定性指示与对应符号相关的所确定的质量值中每个质量值的正确性的似然度;以及通过基于所计算的估计确定性将每个确定的质量值变换为变换后质量值来对所确定的质量值进行编码。
  • 一种基于Spark框架的重测序序列比对方法-201810133759.5
  • 郑志春;郭宁;魏彦杰;冯圣中;周家秀 - 深圳先进技术研究院
  • 2018-02-09 - 2019-08-16 - G16B30/00
  • 本发明涉及计算机科学与生物信息学技术领域,特别涉及一种基于Spark框架的重测序序列比对方法;在本发明中包括三个步骤,分别为RDDs创建步骤、Map步骤和Reduce步骤,先是基于FASTQ文件创建相应的RDDs,并储存在HDFS中;再将BWA的序列比对算法应用到每一个RDDs上,同时RDDs进行多节点映射;最后根据处理需求选择是否执行最后的合并阶段;本发明将重测序流程中使用的序列比对BWA集成到Spark大数据处理框架中,通过分布式计算的方式完成重测序的比对流程优化,从而有效提高重测序数据分析的效率。
  • 一种分布式基因大数据存储平台-201810024030.4
  • 陈墩金;祁建明;周峻松;徐继峰 - 广州明领基因科技有限公司
  • 2018-01-14 - 2019-08-13 - G16B30/00
  • 本发明公开了一种分布式基因大数据存储平台,涉及基因大数据压缩平台领域,该平台将输入FASTQ数据分割成元数据、碱基和质量分数三个数据流,并根据它们自身特点分别独立地压缩:去除元数据流中的重复片段并使用LZMA算法进行压缩;对质量分数流使用游程编码和算术编码压缩;使用匹配工具BWA将短读与参考基因组比对,提取比对结果中的碱基流表达信息并使用LZMA算法、游程编码、算术编码进行压缩;最后采用分布式框架将数据放在不同的数据节点中存储,既保证了数据的可靠性,同时增加了数据的安全性。该平台针对DNA序列本身具有的冗余性进行压缩,减少了压缩所需的存储空间。
  • 一种基因数据解读注释系统-201810085446.7
  • 刘欣;黄晶盈;徐丽 - 深圳百诺国际生命科技有限公司
  • 2018-01-29 - 2019-08-09 - G16B30/00
  • 本发明涉及核酸序列数据技术领域,具体指一种在核酸序列数据中检测的基因数据解读注释系统,它包括用于配置存储经预处理的测试样本基因序列信息的第一数据存储器,用于配置存储基因序列注释数据的第二数据存储器,以及通信连接第一数据存储器和第二数据存储器注释组件,所述注释组件包括功能注释引擎和解释注释引擎,通过索引项将基因序列信息与之相关联,报告模块用于配置生成所述功能类型注释和解释性注释的报告。相比现有技术,本发明更能准确高效的对基因分析注释。
  • 一种序列自动拼接方法及装置-201710104162.3
  • 段广有;金亮;徐凤丹;廖国娟;葛毅 - 苏州金唯智生物科技有限公司
  • 2017-02-24 - 2019-07-26 - G16B30/00
  • 本发明公开了一种序列自动拼接方法及装置,该方法包括以下步骤:S1:获取测序样本并对其进行预处理,所述测序样本包括多个测序数据序列;S2:计算每个测序数据序列的长度,选择长度最长的测序数据序列并记为起始序列;S3:从其余测序数据序列中选择一个并记为待拼接序列;S4:将所述起始序列与所述待拼接序列进行比对;S5:当该起始序列与所述待拼接序列存在长度大于预设值M的公共子串时,则将该起始序列与该待拼接序列进行拼接并得到一拼接序列,并将该拼接序列记为新的起始序列;S6:判断是否还有测序数据序列未拼接,若是,则依次执行S3、S4和S5;若否,则执行S7;S7:生成测序结果文件。本发明大大提高了拼接结果的准确性。
  • 利用转录组数据获取岷县龙胆叶绿体基因组序列的方法-201810008272.4
  • 高庆波;迟晓峰;张发起;王文娟;陈世龙;李彦;王久利 - 中国科学院西北高原生物研究所
  • 2018-01-04 - 2019-07-16 - G16B30/00
  • 本发明公开了一种利用转录组数据获取岷县龙胆叶绿体基因组序列的方法,通过二代测序技术获得岷县龙胆的转录组测序原始数据,经过过滤以及与已知的龙胆属叶绿体基因组进行比对,筛出叶绿体基因reads,将筛出的reads组装成叠连群,其后将叠连群建成本地比对数据库,与参考序列比对,根据比对结果排序和拼接,每拼接5—6kb,将新组装的序列与其它叶绿体基因组序列进行比对,以检查所拼接的序列,最后根据首尾的重叠区将序列组装成环,再通过PCR和一代测序技术填补其中的间隙,最终获得岷县龙胆的叶绿体基因组序列。本发明有利于了解岷县龙胆叶绿体基因组结构等重要信息,也进一步地开发了转录组数据的价值。
  • 体细胞拷贝数变化检测-201780070781.3
  • 庄涵宇;赵晨 - ILLUMINA公司
  • 2017-09-21 - 2019-07-16 - G16B30/00
  • 本文中提出用于评估拷贝数变化的技术。所述技术包含从一组基线样本产生基线,所述基线代表或模仿个别生物样本的假定匹配的样本,所述一组基线样本不与所述个别生物样本匹配。来自这组基线样本的经归一化的测序数据被提供给用户,所述经归一化的测序数据包含感兴趣区的至少一个拷贝数基线。
  • 基于BSA-TS算法的蛋白质三维结构预测方法-201510589301.7
  • 张强;许岩;周昌军;王宾 - 大连大学
  • 2015-09-16 - 2019-07-12 - G16B30/00
  • 本发明涉及生物计算蛋白质结构预测领域,设计了一种基于BSA算法与TS算法的混合搜素优化方法。该方法将BSA算法应用到蛋白质三维结构预测中,并对BSA算法与TS算法分别进行了一定的改进。在目前广泛使用的斐波纳契序列和真实蛋白质序列上进行实验,从实验得出的数据和与其他方法的比较结果来看,该方法较好的克服了传统算法对于控制参数的初值比较敏感,并且易陷入局部最优的缺点,具有良好的性能和精度。
  • 一种含报告模板信息管理模块的精准用药智能报告系统-201910304417.X
  • 袁鹏;李琦;辛盛;孟海波 - 北京中佰耀因医药科技有限公司
  • 2019-04-16 - 2019-07-09 - G16B30/00
  • 本发明提供一种含报告模板信息管理模块的精准用药智能报告系统,所述系统包括信息管理模块和信息分析及处理模块,所述信息管理模块包括药物基因对项目信息管理模块和报告模板信息管理模块,所述信息分析及处理模块包括信息自动匹配模块和样本信息处理及分析模块;所述报告模板信息管理模块用于用户对系统中涉及的报告模板信息进行新增和/或编辑管理。本发明中报告模板信息管理模块中对应管理的多种报告模板信息,对应本发明系统中多种不同的药物基因对项目的需求。本发明所述系统适应性广,且该系统对实验结果的分析和给出包含精准药物指导的基因检测报告的速度快。
  • 基于转录组的肿瘤新抗原鉴定方法-201810101545.X
  • 莫凡;陈荣昌;罗凯;马志明;周秀卿;黄灵灵 - 杭州纽安津生物科技有限公司
  • 2018-02-01 - 2019-07-09 - G16B30/00
  • 本发明公开了基于转录组的肿瘤抗原鉴定方法,包括获取患者肿瘤组织的RNA样本,对RNA样本建库和扩增,获得肿瘤组织的RNA样本测序结果;将RNA样本测序结果的短读段比对到人类参考基因组,获得RNA比对结果;根据RNA比对结果计算基因表达量,根据RNA比对结果进行突变检测和预测融合基因事件;根据比对结果预测转录组HLA分型;计算基因表达量、突变检测和预测融合基因事件;将转录组样本的基因表达量,转录组突变位点在全外测序样本中的深度,新生短肽与患者HLA分型的结合力作为分析结果交给下游分析人员四个步骤。本发明提供了一种能够从肿瘤患者转录组NGS数据中鉴定出个体样本的肿瘤特异性抗原的方法。
  • 一种生物学基因DNA序列比对方法-201810586206.5
  • 黄娅琳;吴思;郭海涛;蒋敬;马艳君;陈云霞;李文骞;徐燕红;刘昌景;刘大伟 - 南京森林警察学院
  • 2018-06-08 - 2019-07-05 - G16B30/00
  • 本发明公开了一种生物学基因DNA序列比对系统,系统包括序列检索比对模块、检索历史模块、序列提交模块、提交ID查询模块和提交历史查询模块,其中检索历史模块从序列检索比对模块中读取用户的查询记录,检索历史模块分为读取用户未登录状态和用户登录状态,如果是未登录状态则输出需要登陆的信息,如果是用户登录状态则读取相关用户的查询记录,提交ID查询模块从序列提交模块中读取特定ID的记录详细信息,提交历史查询模块从序列提交模块中读取对应用户的提交记录。另外,还公开了一种获取生物学基因DNA序列的方法,包括三个步骤:提取样本DNA,PCR扩增和PCR扩增片段测序。本发明解决了基因序列数据库的垄断问题和国内对现有比对系统使用的局限问题。
  • 一种基于大数据的基因条形码生物物种识别系统及方法-201910171223.7
  • 于维森;孙治涛;吕晓静;牛娟娟 - 青岛市疾病预防控制中心(青岛市预防医学研究院)
  • 2019-03-07 - 2019-06-25 - G16B30/00
  • 本发明公开了一种基于大数据的基因条形码生物物种识别系统,具体涉及生物物种系统领域,包括数据处理装置,所述数据处理装置连接端分别设有查看端、反馈端和扫描器,所述数据处理装置输出端设有数据传输站,所述数据传输站输出端设有服务器,所述服务器通过传输线缆连接有监控管理端。本发明通过设有数据处理装置和数据传输站,多个数据传输站依据区域面积进行设置,可以保证能够稳定接收相应区域内数据处理装置传输的数据信号,数据传输站通过服务器提取数据库内相应的符合的物种数据进行提取,并及时反馈信号至数据处理装置和用户,数据传输更加稳定,能够实现数据传输速度快,识别速率高,大大提高了用户的工作效率。
  • 一种测序仪用的基因检测数据的分析方法及系统-201910116664.7
  • 曹彦东;周洋;马懿;陈建齐 - 北京安智因生物技术有限公司
  • 2019-02-14 - 2019-06-21 - G16B30/00
  • 本发明公开了一种测序仪用的基因检测数据的分析方法及系统,该分析方法包括:对测序仪中的基因检测数据进行数据质控,使扩增片段的覆盖率达到预设覆盖率且扩增片段的覆盖深度达到预设覆盖深度且扩增片段的均一性达到预设值,过滤掉待处理数据中的无效扩增片段数据以及无效碱基数据,以得到有效数据,从有效数据中筛选出具有突变特征的碱基数据,对具有突变特征的碱基数据进行多层次注释,以得到分析结果数据;该分析系统包括质控模块、分析模块及注释模块。本发明在测序仪上对测序下机数据自动进行数据批量数据质控、分析、注释,大大减小了人为引入误差、显著提高了基因检测数据分析的客观性,而且极大降低了成本。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top