[发明专利]一种多模态医疗数据湖构建方法及系统有效
| 申请号: | 202211436205.5 | 申请日: | 2022-11-16 |
| 公开(公告)号: | CN115579094B | 公开(公告)日: | 2023-02-28 |
| 发明(设计)人: | 陈一超;车涛锋;刘士懂;王磊;张伯慧;李云锋;弓孟春;史文钊 | 申请(专利权)人: | 神州医疗科技股份有限公司 |
| 主分类号: | G16H10/00 | 分类号: | G16H10/00;G16H30/00;G16H50/70 |
| 代理公司: | 北京星通盈泰知识产权代理有限公司 11952 | 代理人: | 夏晶 |
| 地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多模态 医疗 数据 构建 方法 系统 | ||
本发明提供了一种多模态医疗数据湖构建方法及系统,该方法包括:S1:获取临床数据,并汇聚进入数据湖中;S2:获取影像、病理以及基因的医疗多模态数据,并形成影像、病理以及基因数据文件;S3:根据患者信息和就诊信息,将临床数据与影像、病理以及基因数据文件进行整合,构建DHCDM多模态模型。本发明所提供的一种多模态医疗数据湖构建方法及系统,将医疗临床数据与医疗多模态数据进行整合,兼容多种格式的医疗数据,并形成多模态医疗模型,进而能够通过多模态平台对医疗多模态数据进行分析和处理,且模型具备伸缩性强、实时性高、读取速度快以及应用范围广的优势。
技术领域
本发明涉及数据信息处理技术领域,具体涉及一种多模态医疗数据湖构建方法及系统。
背景技术
随着信息技术的快速发展,现代化的医院管理离不开计算机、网络、数据库等信息技术的支持,同时,对于医疗数据的研究也具备了积极的意义,如实现临床辅助决策、预测药物副作用、实现医院科学化管理等。然而,由于医疗数据具备数据量庞大以及结构关系复杂的特点,采用常规数据库以及分析手段难以对多模态的医疗数据进行整合分析与研究。
发明内容
数据湖是以集中方式存储各种类型数据,提供弹性的容量和吞吐能力,能够覆盖广泛的数据源,支持多种计算与处理分析引擎直接对数据进行访问的统一存储平台。能够实现数据分析、机器学习,数据访问和管理等细粒度的授权、审计等功能。
而相较于传统结构化数据库,数据湖则是先用三范式建表建模,然后再存储的方式。数据湖是开放式的存储模型,各类数据都以数据文件(FileGroup)格式进行存储,并不需要固定的数据表规范,可以兼容各类数据源,可以容纳各类数据库的数据字段,并且提供弹性的容量和吞吐能力,数据存储不够时候,只要有足够硬件资源可以动态扩容,不需要手动处理。
基于此,本方案利用数据湖得特点,在医疗方面,可以充分融合临床以及多模态得数据进行数据得整合,从而达到便于医疗数据整合分析科研的目的。
本发明提供的一种多模态医疗数据湖构建方法及系统,能够解决上述过程中的技术问题。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供了一种多模态医疗数据湖构建方法,包括以下步骤:
S1:获取临床数据,并汇聚进入数据湖中;
S2:获取影像、病理以及基因的医疗多模态数据,并形成影像、病理以及基因数据文件;
S3:根据患者信息和就诊信息,将临床数据与影像、病理以及基因数据文件进行整合,构建DHCDM多模态模型。
在一些实施例中,所述S1包括以下步骤:
S11:采用批式处理的方式,对医院系统的镜像库进行处理,通过Spark定时任务,将镜像库的数据定时抽取到数据湖中,完成全量数据汇聚;
S12:对医院系统的同步日志进行实时监控,并通过Flink实时抓取同步日志,将同步日志流入数据湖中,完成增量数据汇聚。
在一些实施例中,所述S1还包括以下步骤:
S13:若医院系统存在接口客户端,通过数据共享交换平台与接口对接,获取接口数据,并通过Flink将接口数据流入数据湖,并覆盖数据湖中的数据。
在一些实施例中,所述S2中获取影像、病理以及基因的医疗多模态数据包括以下步骤:
S21:通过Dicom3.0协议,对标准化Dicom格式的影像原文件进行数据采集;通过FTP,对非标准化格式的影像原文件进行数据采集;
S22:通过FTP或者HTTP,对病理原文件进行数据采集;
S23:通过FTP或者HTTP,对基因原文件进行数据采集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神州医疗科技股份有限公司,未经神州医疗科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211436205.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





