[发明专利]一种酸碱指标医疗大数据分析方法及系统有效
申请号: | 201911404671.3 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111177356B | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 黄峰;许红龙;张占英;黄劲涛;郑浩洋 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/31;G06F16/35;G16H50/30;G16H50/70 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 蔡伟杰 |
地址: | 528000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 酸碱 指标 医疗 数据 分析 方法 系统 | ||
1.一种酸碱指标医疗大数据分析方法,其特征在于,所述方法包括以下步骤:
步骤1,通过基于先验知识的决策树分类算法建立酸碱诊断医疗大数据的决策树,将决策树作为诊断辅助决策树,通过诊断辅助决策树进行粗分类得到病历和病历对应的酸碱疾病症状;
步骤2,提取酸碱疾病症状的关键词,将关键词构建的词库作为标准症状关键词库;
步骤3,构建标准症状关键词库对应的同义词库;
步骤4,在病历中提取症状的关键词;
步骤5,建立各个关键词的倒排索引并与病历的名称建立对应关系;
步骤6,通过哈希算法将每个关键词转换成哈希值;
步骤7,使用BitMap算法将每份病历分别映射到一个bit数组;
步骤8,将每份病历的bit数组视为二进制数,对每个粗分类内的病历基于该二进制数的大小进行升序排序;
步骤9,对诊断辅助决策树得到的每个粗分类里面的病历,通过K-Modes算法进行细分类;
方法实际应用步骤为:医生根据病人症状撰写病历,执行步骤1,得出粗分类,再执行步骤4,得出症状关键词,执行步骤6与步骤7,得到bit数组,计算出该二进制数的值,通过步骤8的有序病历序列,直接查看其二进制数值对应的病历是否存在,如果存在则调取该病历及诊断信息作为参考;无论是否存在,都与步骤9建立的聚类质心计算距离,从而得到其所属细分类类别,进而在该细分类类别里与每份病历计算距离,输出距离最小的m份病历,作为诊断辅助参考。
2.根据权利要求1所述的一种酸碱指标医疗大数据分析方法,其特征在于,在步骤1中,酸碱诊断医疗大数据至少包括病历的数据以及每个病历中对应记录的检测到的pH、PaCO2、HCO3-、AG的物理量。
3.根据权利要求1所述的一种酸碱指标医疗大数据分析方法,其特征在于,在步骤2中,提取酸碱疾病症状的关键词的方法为:通过TF-IDF算法、Topic-model算法、RAKE算法提取酸碱疾病症状的关键词。
4.根据权利要求1所述的一种酸碱指标医疗大数据分析方法,其特征在于,在步骤4中,使用基于词库的分词方法的方法为:借助标准症状关键词库、同义词库,使用基于词库的分词方法,即通过逆向最大匹配法对包括有酸碱平衡紊乱的症状的文本进行关键词提取;设置分词的最大长度,即关键词最大可能的字数为10个,从病历中提取除酸碱指标之外的与词库匹配的症状关键词,舍弃其它汉字或词语。
5.根据权利要求1所述的一种酸碱指标医疗大数据分析方法,其特征在于,在步骤6中,通过哈希算法将每个关键词转换成哈希值的方法为以下步骤:
步骤6.1:检查关键词的汉字编码是否GBK编码;
步骤6.2:如果检查发现不是GBK编码,则转换为GBK编码;
步骤6.3:对于GBK编码,设第i个症状关键词由n个汉字组成,则可存储在二维unsignedchar数组GBKword,则该关键词的第j个汉字(0≤jn)的哈希值为
GBKindex[j] = ((unsignedchar)GBKword[j] [0]-129)*190 + ((unsigned char)GBKword[j] [1]-64) -(unsigned char)GBKword[j] [1]/128,
第i个症状关键词的哈希值为。
6.根据权利要求1所述的一种酸碱指标医疗大数据分析方法,其特征在于,在步骤7中,使用BitMap算法将每份病历分别映射到一个bit数组的方法为以下步骤:
步骤7.1:为每份病历建立一个bit数组,该数组的长度不小于所有病历所有症状关键词哈希值的最大值,设症状关键词最大可能字数为symNum,GBK编码汉字哈希值的最大可能值hashVal,则设置bit数组长度bitLen为两者之乘积,即
bitLen= symNum * hashVal;
其中,symNum为正整数,默认设置为10;
步骤7.2:将bit数组每位都初始化为0;
步骤7.3:对于每份病历的bit数组,将病历各个症状关键词哈希值对应的位置设置为1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911404671.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置