[发明专利]基因样本分析方法及电子设备有效
申请号: | 201710546112.0 | 申请日: | 2017-07-06 |
公开(公告)号: | CN107480468B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 蔡文君;何光铸;王东辉;侯晓帆 | 申请(专利权)人: | 荣联科技集团股份有限公司 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G06F16/25 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李莎;李弘 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 样本 分析 方法 电子设备 | ||
本发明公开了一种基因样本分析方法,包括:接收基因样本选取指令;显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;接收过滤条件选取指令;从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。本发明公开了一种采用了所述基因样本分析方法的电子设备。本发明提供的基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。
技术领域
本发明涉及数据处理技术领域,特别是指一种基因样本分析方法及电子设备。
背景技术
基因样本变异分析需要对比多个基因样本,而每个基因样本可含几十万个变异,数据量可达十个GB。例如,一个人外显子(WES)数据,每个基因样本大约有20万个变异,每个变异信息数据大约在1-2KB左右,所以一个基因样本大约有200-400MB的数据。在小规模的群体数据分析中,当有40个基因样本的时候,数据量便达到了10GB之多。
基因样本变异分析是要从这几十万个变异当中,找出几个最可能致病的变异,而过程中需要多次反复使用多种不同的过滤和对比条件,所以用户界面的反应速度是影响用户体验和工作效率的重要因素。
一般来说,对应于不同的病人症状,一个病理学医生会有一系列不同的过滤条件。另一方面,虽然变异总数有很多,但与病人的疾病相关的变异却不多,与之关联的每一条医疗记录都必须被详细检查是否支持病人的症状。所以,医生使用变异过滤系统来筛选出相关的变异需要经过很多轮。
在多基因样本变异分析系统中,需要对变异进行频繁的过滤和比较,每次操作可能需要几十秒以上才能反应过来,如Garven Institute的Seave系统,输入3个基因样本的数据,每次操作反应时间在15秒以上,用户界面反馈较慢,操作体验不佳。
此外,由于基因样本的数据量较大,无法把基因样本数据缓存在有限的内存之中,而单是从一般的储存设备(如硬盘)中把基因样本数据读一次,就可能需要长达十秒的时间。同时,由于可供过滤和对比条件太多,也无法通过预先建立索引的方式来降低需要读取的数据量。
发明内容
有鉴于此,本发明的目的在于提供一种基因样本分析方法及电子设备,能够提高基因样本分析的反应速度。
基于上述目的本发明提供的基因样本分析方法,包括:
接收基因样本选取指令;
显示变异过滤选取界面;同时,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据并将其缓存在内存中;
接收过滤条件选取指令;
从内存中调用所述待分析样本数据,并根据过滤条件完成基因样本变异分析。
可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,包括:
在同一个变异信息出现在多个基因样本之中时,仅设置一个记录,每条记录里设置标记字段来记录该变异信息在每个样品中是否出现。
可选的,根据被选取的基因样本,提取各被选取的基因样本的共同变异信息,形成待分析样本数据,还包括:
保留各被选取的基因样本的独有变异信息,以支持关于所述独有变异信息的查询。
可选的,所述方法还包括:
采用Manifest.json文件来管理每个基因样本的共同变异信息。
可选的,根据过滤条件完成基因样本变异分析的步骤之后,还包括:
输出基因样本变异分析结果。
可选的,所述基因样本变异分析结果为output.json格式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于荣联科技集团股份有限公司,未经荣联科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710546112.0/2.html,转载请声明来源钻瓜专利网。