[发明专利]一种多模态组学数据管理系统有效
申请号: | 202210271132.2 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114627968B | 公开(公告)日: | 2023-10-20 |
发明(设计)人: | 辜永红;应志野;陈一龙;于浩澎;赵顺存;李斌杰;张凯丽;任沛;成孝禹;葛平;周梦琳 | 申请(专利权)人: | 四川大学华西医院;华为技术有限公司;赛乐基因科技(北京)有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00 |
代理公司: | 成都高远知识产权代理事务所(普通合伙) 51222 | 代理人: | 郑勇力;全学荣 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多模态组学 数据管理 系统 | ||
本发明属于组学研究技术领域,具体涉及一种多模态组学数据管理系统。本发明的系统包括:采集模块、数据存储模块、数据分析模块和应用系统,其中,所述数据采集模块用于采集业务系统数据并导入到数据存储模块,设置或更新用户元数据信息并将元数据信息保存至数据存储模块;所述数据存储用于存储数据和元数据信息,提供元数据检索能力;所述数据分析模块用于提供数据分析功能。本发明基于多组学数据的海量性,提出了基于多组学数据特征和元数据标签的数据自动识别技术,具有很好的应用前景。
技术领域
本发明属于组学研究技术领域,具体涉及一种多模态组学数据管理系统。
背景技术
组学研究向定量化,高通量的发展, 成为人们发现生命化学物质基础和深入了解其分子机制的新方向。通过对多模态组学数据的整合分析,有利于系统性地研究临床发病机理、确认疾病靶点,发现生物标志物与进行疾病早期诊断,从而对个体化治疗和用药指导发挥重要作用。
多组学方法通过将基因、mRNA、调控因子、蛋白、代谢等不同层面之间信息进行整合,构建基因调控网络,深层次理解各个分子之间的调控及因果关系。通量组学方法在生物样品分析中的使用,每天都生成万亿到千兆字节大小的数据文件,如何对这些数据进行高效采集、处理和分析是多组学数据研究的关键技术。
多组学数据分析流程包括文库制备(样本上机+数据下机)、生信分析(测序分析+报告解读)、分析后解读(报告交付+归档分发)。文件的元数据包括系统元数据(例如文件大小、文件修改时间等)和用户元数据(例如文件的扩展属性xAttr,自定义标签等)。如何设置统一的管理标签,支持用户在海量数据及复杂查询条件下快速识别符合条件的文件特征是用户高效管理数据的关键技术。然而,现有测序平台、组学分析、数据归档等多是独立系统,数据采集、数据分析、数据归档等流程相对割裂,各流程数据通常是进行人工管理及人工比对,无法有效识别垃圾数据和冗余数据等。
发明内容
针对现有技术的缺陷,本发明提供一种多模态组学数据管理系统,目的在于建立一种对多组学数据进行统一管理的系统,提出基于多组学数据特征和元数据标签的数据自动识别技术,实现对多组学元数据的快速检索、分析等功能。
一种多模态组学数据管理系统,包括:数据采集模块、数据存储模块、数据分析模块和应用系统,
其中,所述数据采集模块用于采集业务系统数据并导入到数据存储模块,设置或更新用户元数据信息并将元数据信息保存至数据存储模块;
所述数据存储用于存储数据和元数据信息,提供元数据检索能力;
所述数据分析模块用于提供数据分析功能。
优选的,所述数据采集模块的功能模块包括测序仪下机数据、外送测序数据导入和其他系统数据导入。
优选的,所述数据存储模块支持如下数据访问协议中的至少一种:NFS、CIFS、HDFS、S3或POSIX。
优选的,所述数据存储模块包括:
数据IO模块,用于前台业务IO和数据的处理
元数据管理模块,用于处理元数据变更信息并将设置或更新元数据持久化到存储资源池池;
元数据检索模块用于提供元数据检索和分析能力,用于查询符合条件的文件或对象列表。
优选的,所述数据分析模块用于提供基因比对、基因测序HPC工作流、大数据分析和AI分析。
优选的,所述元数据包括:姓氏、家族关系、样本信息和变异点位。
多组学数据具有海量性,因而其数据管理具有很大的难度。本发明通过元数据标签技术,实现数据采集、分析、归档等环节数据资产全生命周期可视化管理,通过元数据检索和数据分析技术,实现快速数据查询和分类分析及自动识别,适用于众多基于多组学数据的应用,例如,家族遗传病诊断等。因此,本发明具有很好的应用前景。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学华西医院;华为技术有限公司;赛乐基因科技(北京)有限公司,未经四川大学华西医院;华为技术有限公司;赛乐基因科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210271132.2/2.html,转载请声明来源钻瓜专利网。