[发明专利]一种应用于多数据源的医疗患者主索引发现方法有效
申请号: | 202110344519.1 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113111063B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈杰;聂小明;张志强;赵睿 | 申请(专利权)人: | 中电健康云科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G16H10/60;G16H50/70 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 孟仕杰 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 多数 医疗 患者 索引 发现 方法 | ||
本发明涉及医疗互联互通领域,具体是一种应用于多数据源的医疗患者主索引发现方法,包括如下步骤:步骤一、获取医疗记录;步骤二、计算两两医疗记录之间的相似度;步骤三、基于相似度构建有权无向图;步骤四、基于有权无向图计算各医疗记录的记录主索引支持度;步骤五、标准化记录主索引支持度,确定主索引记录;旨在提高主索引准确性,克服现有技术在大数据场景下出现的数据冗余和高成本的缺陷,提供一种新的主索引发现算法。
技术领域
本发明涉及医疗互联互通领域,具体是指一种应用于多数据源的医疗患者主索引发现方法。
背景技术
为了在区域范围内实现各医疗机构的数据共享或业务协同,有效地保存、分类、归档、查阅大批量的医疗信息,实现医疗记录在各个信息系统中的互联互通,需要针对患者建立统一的身份机制,该机制使得区域范围内,同一患者在多家医疗机构注册的多条医疗记录能够被识别为同一个人,并对患者的所有医疗信息建立关联关系,为此,患者需要一条最为准确的记录来标识其区别于其他患者存在的唯一性,进而保证分布在多个系统中的同一患者拥有完整、准确的个人信息采集结果,患者主索引(Master Patient Index,MPI)是指在一个区域范围内用以标识该域内每个患者实例并保持其唯一性的编码,而企业级患者主索引(Enterprise Master Patient Index,EMPI)系统则将来自多个系统的患者标识进行关联,实现同一病人多业务ID的关联和患者信息的统一或关联,确保患者信息映射、应用的准确性。
在这一应用场景下,现有技术大致可以划分为三类:一、基于概率的匹配算法,对关键字段进行索引匹配得到基础分数,然后在匹配结果中对候选记录的其余参考字段分别计算相似性分数,最后利用基础分数及各参考分数进行投票,筛选出总分超过设定阈值的结果集;二、在数据量小的情况下,操作者也可以凭经验和供以参考的患者信息,人工判断多条索引记录是否描述同一人;三、考虑到计算成本、数据安全等因素,直接将每一条记录都当作主索引。
上述方法在应对主索引发现任务时,仅考虑了字段间的直接关系,缺乏对全局信息以及隐含信息的捕捉和利用,这导致计算结果极大地依赖于相似度计算的精度,依据先验知识选择匹配字段后计算的投票结果并不理想,如果采用人工方法,无论是直接判断还是校验评估都相当的费时费力,而将每条数据都当作主索引则会造成大量的数据冗余,增加数据的存储和后续应用计算成本,效率低下。
发明内容
基于以上问题,本发明提供了一种应用于多数据源的医疗患者主索引发现方法,旨在提高主索引准确性,克服现有技术在大数据场景下出现的数据冗余和高成本的缺陷,提供一种新的主索引发现算法。
为解决以上技术问题,本发明采用的技术方案如下:
一种应用于多数据源的医疗患者主索引发现方法,包括如下步骤:
步骤一、获取医疗记录;
步骤二、计算两两医疗记录之间的相似度;
步骤三、基于相似度构建有权无向图;
步骤四、基于有权无向图计算各医疗记录的记录主索引支持度;
步骤五、标准化记录主索引支持度,确定主索引记录。
进一步,所述步骤1具体包括:
获取多数据源的医疗记录后对其去重,将各字段完全一样的记录视为同一患者。
进一步,计算两两医疗记录之间的相似度,并形成相似度矩阵,其计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电健康云科技有限公司,未经中电健康云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344519.1/2.html,转载请声明来源钻瓜专利网。