[发明专利]一种生物基因检测的大数据分析方法在审
申请号: | 202310285341.7 | 申请日: | 2023-03-22 |
公开(公告)号: | CN116312819A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 赵大琛;栾尚国;栾建文;刘斌 | 申请(专利权)人: | 国检测试控股集团北京京诚检测服务有限公司 |
主分类号: | G16B50/00 | 分类号: | G16B50/00;G16B20/20 |
代理公司: | 重庆百润洪知识产权代理有限公司 50219 | 代理人: | 陈万江 |
地址: | 100000 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 生物 基因 检测 数据 分析 方法 | ||
本发明公开一种生物基因检测的大数据分析方法,包括步骤:S1、采集生物个体单个特征表现,根据单个特征表现为显性或隐性进行分类;S2、通过基因检测设备逐一提取该单个特征表现的基因序列;S3、构建该单个特征显性基因池和隐性基因池;S4、分析并识别该单个特征表达的基因序列显性和隐性片段;S5、判断该基因序列片段为DNA序列/RNA序列片段;S6、根据DNA序列/RNA序列片段碱基排列顺序设置替换码,及每个替换码对应出现在基因序列片段的位置数据;S7、将碱基的替换码和替换码在基因序列片段的位置数据存储至数据库。本发明减少了基因序列的存储空间和降低了传输数据的数据量。
技术领域
本发明属于大数据处理技术领域,具体来说,涉及一种生物基因检测的大数据分析方法。
背景技术
基因是遗传的基本单元,携带有遗传信息的DNA或RNA序列,通过复制,把遗传信息传递给下一代,指导蛋白质的合成来表达自己所携带的遗传信息,从而控制生物个体的性状表达。基因测序方法是对基因表达序列的一种定性方式,但每种生物表达特征随基因序列的不同,其序列排列差异较大。生物个体特征较多,所以每个个体产生的基因序列各不相同,若对每个特征表达序列进行分析,则会产生高通量的不同基因序列数据表,不利于每个不同个体基因序列数据的存储和传输。
在专利号为CN201810228004.3的中国发明专利中,公开了一种高通量基因测序大数据分析云平台系统,包括数据文件管理模块、样品与实验管理模块、工作流管理模块、分析任务管理模块、工单管理模块、移动终端服务模块、磁盘配额管理模块、资源分享管理模块以及用户与权限控制模块,实现了数据的导入、分析、报告生成与推送的一站式服务,提供数据分析结果一键重现的解决方案,该发明可促进云存储与高性能计算集群在生物组学大数据领域的应用。
现有专利的缺陷在于,虽然实现了基因序列数据的导入、分析、报告生成与推送的一站式服务,但是缺乏对高通量的基因序列数据表存储或者传输时的数据量的考虑,导致其不利于基因序列数据的存储和传输。
发明内容
针对现有高通量的基因测序大数据不利于序列数据的存储和传输的问题,本发明提供了一种生物基因检测的大数据分析方法。
为实现上述技术目的,本发明采用的技术方案如下:
一种生物基因检测的大数据分析方法,包括步骤:
S1、采集生物个体单个特征表现,根据单个特征表现为显性或隐性进行分类;
S2、通过基因检测设备逐一提取该单个特征表现的基因序列;
S3、构建该单个特征显性基因池和隐性基因池;
S4、分析并识别该单个特征表达的基因序列显性和隐性片段;
S5、判断该基因序列片段为DNA序列/RNA序列片段;
S6、根据DNA序列/RNA序列片段碱基排列顺序设置替换码,及每个替换码对应出现在基因序列片段的位置数据;
S7、将碱基的替换码和替换码在基因序列片段的位置数据存储至数据库。
进一步地,碱基的替换码为预设码。
进一步地,步骤S4的详细步骤包括:
S401、正向或者反向读取基因序列片段;
S402、先获取基因序列显性片段;
S403、同位置截取基因序列隐性片段。
进一步地,步骤S5的详细步骤包括:
S501、获取基因序列显性和隐性片段;
S502、识别序列中碱基包含的种类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国检测试控股集团北京京诚检测服务有限公司,未经国检测试控股集团北京京诚检测服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310285341.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置