[发明专利]一种hadoop环境下的数据处理方法在审
申请号: | 201810402034.1 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108595663A | 公开(公告)日: | 2018-09-28 |
发明(设计)人: | 王海风;王书勤;张红昌 | 申请(专利权)人: | 尚谷科技(天津)有限公司;王海风;王书勤;张红昌 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 天津市尚文知识产权代理有限公司 12222 | 代理人: | 张东浩 |
地址: | 300457 天津市滨海新区天津开发区信环西路19号泰达服*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据字典 逻辑数据 数据处理 索引 标识符 自然语言解析 待调度数据 处理负荷 方式处理 目标数据 判断结果 数据分布 数据判断 数据投影 提升系统 投影数据 物理模型 需求提取 展示数据 不均匀 解析 分担 | ||
1.一种hadoop环境下的数据处理方法,其特征在于,包括如下特点:
建立多个数据字典索引,根据用户的需求依靠多个数据字典索引选取合适的数据字典;通过标识符模式搭建hadoop环境下的物理模型库,按照用户的需求提取逻辑数据,对提取的逻辑数据实施自然语言解析,采用数据投影的方式处理解析后的数据得到投影数据用于完成数据判断,并展示数据判断结果。
2.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,其特征是,hadoop环境下的数据处理方法由下列步骤构成:
A:用户向hadoop环境下的系统服务器提出数据判断需求,系统服务器定时更新,所述数据判断需求不局限于用户根据该数据所使用的事务类型和事务目标;
B:依照用户的需求识别数据字典索引,根据数据字典索引与数据字典的映射关系,选择正确的数据字典;
C:构建标识符模式,当用户进行需求有关的数据检索时 ,能够按照需求所使用的标识符在标识符库中进行粗查询和细查询相结合的搜索,如果标识符库中的标识符与需求所使用的标识符存在相一致的,则调用该一致的标识符结果,如果标识符库中的标识符与需求所使用的标识符不存在相一致的,则退回从数据字典索引中查找,并将查找的数据字典的结果存储在标识符库中;
D:依据步骤C中的查找搜索结果搭建hadoop环境下的物理模型库,并将标识符、用户判断需求和数据字典建立映射关系模型,将该映射关系模型存储在物理模型库中;
E:对建立的物理模型库中的用户需求数据进行逻辑数据的抽取,采用隐马尔科夫模型对逻辑数据进行自然语言处理分析,
F:采用数据投影的方式处理解析后的数据得到投影数据用于完成数据判断,并通过图形化用户界面的形式展示数据判断结果。
3.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,其特征是,所述数据字典是被整理形成的一份医学专业的数据字典,包括基础知识库和元数据库,涵盖医学疾病说明书中所有疾病名称、适应症状名称、治疗用药名称、治疗人群名称等词汇。
4.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,还包括:
所述基础知识库由疾病知识库、药品知识库、症状知识库、易感染人群知识库等基础知识构成;
所述数据共享库用于存放各类医疗业务系统日常业务操作产生的业务数据。
5.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,其特征是,所述基础模型包含疾病墒情预警模型、疾病爆发预测模型、医学推广模型。
6.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,在E中,调用物理模型库时如果物理模型库中没有满足用户判断需求的物理模型,则建立新的物理模型并将该模型存储至物理模型库。
7.如前述任一权利要求所述的一种hadoop环境下的数据处理方法,展示数据判断结果时,展示的可视化模型包括折线图、饼状图、柱形图等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于尚谷科技(天津)有限公司;王海风;王书勤;张红昌,未经尚谷科技(天津)有限公司;王海风;王书勤;张红昌许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810402034.1/1.html,转载请声明来源钻瓜专利网。