[发明专利]一种生物信息变异位点数据格式转换方法在审
申请号: | 202010029898.0 | 申请日: | 2020-01-13 |
公开(公告)号: | CN111210875A | 公开(公告)日: | 2020-05-29 |
发明(设计)人: | 罗奇斌;申玉林;廖胜光;任毅 | 申请(专利权)人: | 北京奇云诺德信息科技有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B30/00;G16B50/00 |
代理公司: | 北京中财易清专利代理有限公司 11518 | 代理人: | 陈桂兰 |
地址: | 101300 北京市顺义区经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物 信息 变异 数据格式 转换 方法 | ||
本发明涉及基因工程技术领域,且公开了一种生物信息变异位点数据格式转换方法,所述转换方法的步骤包括有S1:通过转换系统的配置文件输入配制数据,确定转换系统参考序列文件和指定数据路径、相关软件的调用等参数;S2:启动转换系统,转换系统根据指定数据路径获取相关数据。该生物信息变异位点数据格式转换方法,只需在配置文件中修改添加参数即可完成对所有的软件进行配置,避免了对大量软件的直接操作,提高了生物信息分析效率,实现了原始数据到中间数据及最终数据的一键式转换过程,直接获取关键SNP分型信息,操作过程大大的简化,并且还支持任何运行阶段的数据输出,便于验证和检查。
技术领域
本发明涉及基因工程技术领域,具体为一种生物信息变异位点数据格式转换方法。
背景技术
基因体检的基础是基因测序技术的飞速发展和科学家对基因研究的日益深入,上世纪九十年代人类启动了“人类基因组计划”,利用荧光标记碱基后捕捉荧光信号,从而获得基因碱基序列信息,测序技术从第一代到如今的第三代第四代测序技术,发展经历了三十多年,测序通量、准确率大幅提高,耗时、成本大幅降低。随着基因检测由单独用于科研发展到临床级别和消费级别,市场对基因数据的高效准确处理的要求也越来越高,针对不同的测序方法,基因数据的分析方法也不尽相同,以二代测序技术(NGS)为例,测序下机数据一般会经过质量分析、数据过滤、序列比对、短序列排序、突变获取与注释等,最终获得SNP基因型数据,进一步进行解读并出具报告。数据分析流程和文件格式等如图1所示,测序数据的好坏会直接影响下有分析的结果,因此获取了NGS下机数据后需要分析数据的质量,常用的软件有 fastqc、multiqc等;数据通过质检后,我们将取出接头序列和低质量序列,以便后续分析,常用工具有SOAP等;下来需要把这些短序列与参考基因组进行对比,确定短序列在基因组上的位置,通常使用BWA软件生成*.sam文件;比对后用samtools进行排序、建索引,得到reads在参考序列中的位置和质量,得到*.bam文件;最后用GATK等得到*.vcf文件,对*.vcf文件中感兴趣的SNP和基因型提取最终获取SNP基因分型数据。
在上述过程中,流程处理数据过程繁琐,不同数据格式间的转换需要进行不同的分析流程,因此我们开发这套格式转换系统的目的是简化生物信息分析流程,做到“一键化”格式转换和数据处理,直接简单的获取SNP分型数据。
发明内容
针对上述背景技术的不足,本发明提供了一种生物信息变异位点数据格式转换方法,具备“一键化”格式转换和数据处理的优点,解决了背景技术提出的问题。
本发明提供如下技术方案:一种生物信息变异位点数据格式转换方法,所述转换方法的步骤包括有:
S1:通过转换系统的配置文件输入配制数据,确定转换系统参考序列文件和指定数据路径、相关软件的调用等参数;
S2:启动转换系统,转换系统根据指定数据路径获取相关数据;
S3:识别相关数据类型,并根据数据类型和配置文件数据确定调用的程序和顺序;
S4:依次调用并配置程序相关参数,读取上一步获得的相关数据后运行程序,获得特定数据类型的数据并按照配置文件中路径保存数据;
S5:运行结束,输出SNP分型数据。
优选的,所述转换系统包括有数据识别模块、配置模块和程序调用模块,所述配置模块根据用户输入的配置文件数据对转换系统和相关应用程序的参数进行配置,所述数据识别模块根据配置模块指定的路径调取数据并识别,根据识别需要调用的程序,所述程序调用模块设置有与程序对应的调用单元,所述调用单元在调用对应程序时先根据配置文件数据对程序进行配置。
优选的,所述程序运算结束后输出并保存特定类型的数据,然后返回给转换系统一个数据保存路径,所述转换程序在调用下一个程序时将该数据保存路径指定为下一个程序的数据读取路径。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇云诺德信息科技有限公司,未经北京奇云诺德信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010029898.0/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置