[发明专利]用于传送并且预处理测序数据的系统和方法在审
| 申请号: | 201910873177.5 | 申请日: | 2014-11-13 |
| 公开(公告)号: | CN110570906A | 公开(公告)日: | 2019-12-13 |
| 发明(设计)人: | S·C·本茨;J·Z·萨伯恩;C·J·瓦斯凯 | 申请(专利权)人: | 凡弗3基因组有限公司 |
| 主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B30/10 |
| 代理公司: | 11038 中国国际贸易促进委员会专利商标事务所 | 代理人: | 王玉玺 |
| 地址: | 美国加*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 组学 传输服务器 输出文件 数字数据传输系统 预处理 测序数据 测序装置 传输组 传送 | ||
本公开涉及用于传送并且预处理测序数据的系统和方法。公开了“组学”数字数据传输系统和方法。公开的系统和方法采用传输服务器,该传输服务器基于来自一个或多个测序装置的机器专用注释和与组学输出文件的一种或多种属性相关的用户输入来聚集较大量的组学输出文件的传输组。
本申请是中国专利申请号为201480071385.9、申请日为2014年11月13日的PCT申请PCT/US2014/065562、发明名称为“用于传送并且预处理测序数据的系统和方法”的发明专利申请的分案申请。
本申请要求2013年11月13日提交的序列号为61/903903的美国临时申请的优先权。美国临时申请No.61/903903和本文中参考的其它外部参考文献的全文以引用方式并入本文。
技术领域
本发明的领域是传送并且预处理基因组测序数据的系统和方法,尤其地,当其涉及从一个或多个测序仪(sequencer)到序列分析引擎的基因组测序文件的注释、排队和批量传递时。
背景技术
背景描述包括可用于理解本发明的信息。这并非承认本文中提供的信息中的任何信息是现有技术或与当前要求保护的本发明相关,或者具体或隐含引用的任何公布文献是现有技术。
随着测序装置中的样本吞吐量增大,基因组数据的量和传输速度不免变成分析整个基因组的限制因素。例如,许多现代测序装置具有1-20Gb/日的吞吐量并且可合理地预期新测序技术将更进一步增大这个吞吐量。遗憾的是,至少在一些情况下,用于将数据传递到序列分析引擎的当前协议不再能够有效操纵此数据量并且将最终使处理速度减慢,并且据此延迟序列分析和潜在的患者护理。
为了克服与路由生物序列信息关联的困难,一个或多个网络节点可包括分组生成器,分组生成器生成包括第一报头和第二报头的数据分组,其中第一报头包含网络路由信息,第二报头具有与代表生物序列数据的现有知识的分层数据模型关联的属性,如US2012/0236861和US 2012/0233201中描述的。在US 2014/0278461中描述了设施中的高序列信息量的操纵。然而,已知系统和方法都并不特别适于以简化后续分析的方式管理大量的数据,尤其是当这种分析涉及医疗专业人员的特定分析需要或要求时。
显然,即使本领域已知操纵序列信息的众多方式,但也需要允许利用测序技术的最新进展的新数据操纵模式。
发明内容
本发明的主题涉及各种系统和方法,在这些系统和方法中,来自一个或多个数据源(例如,测序装置)的多个组学(omic)序列被供给到传输服务器,传输服务器对序列进行预处理并且将其分组成传输组,传输组随后被路由至序列分析引擎。在特别优选的方面中,基于组学序列中的机器专用注释和从用户输入的注释,完成预处理和分组。以这种方式,组学序列可被实时分组,并且被路由至下游序列分析引擎。因为组学序列被优选地分组,使得序列分析所需的所有序列在单个传输组中(即,在一个逻辑单元)中,与中断序列分析关联的延迟(例如,由于缺少供分析的一个或多个序列或者加载丢失的序列花费的时间)减少,并且更典型地,被完全避免。在使用序列分析引擎处理来自众多用户和/或患者样本的众多组学数据的情况下,这种优点是特别有益的。从不同的角度来看,本文中料想到的系统和方法允许序列分析引擎在最大速度下操作,因为与通过序列分析引擎的分析任务相关的所有数据被设置在单个组或匹配/对应的组中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凡弗3基因组有限公司,未经凡弗3基因组有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910873177.5/2.html,转载请声明来源钻瓜专利网。





