[发明专利]一种应用于多数据源的医疗患者主索引发现方法有效
申请号: | 202110344519.1 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113111063B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 陈杰;聂小明;张志强;赵睿 | 申请(专利权)人: | 中电健康云科技有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G16H10/60;G16H50/70 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 孟仕杰 |
地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 多数 医疗 患者 索引 发现 方法 | ||
1.一种应用于多数据源的医疗患者主索引发现方法,其特征在于,包括如下步骤:
步骤一、获取医疗记录;
步骤二、计算两两医疗记录之间的相似度;
步骤三、基于相似度构建有权无向图;
步骤四、基于有权无向图计算各医疗记录的记录主索引支持度,
各医疗记录的记录主索引支持度计算方式如下:
计算与某节点有连接的链路权重之和,即得到每条记录的相似度总分数si,计算公式为:
定义记录主索引支持度MI为每条医疗记录作为主索引记录候选的评分,初始化每个节点的MI值为1,迭代更新各节点的MI值,直到MI值收敛或计算超过最大迭代次数,其计算公式为:
其中,MIi(n)为第n次迭代医疗记录i的MI值,α为常数0.85;
步骤五、标准化记录主索引支持度,确定主索引记录。
2.根据权利要求1所述的一种应用于多数据源的医疗患者主索引发现方法,其特征在于:所述步骤1具体包括:
获取多数据源的医疗记录后对其去重,将各字段完全一样的记录视为同一患者。
3.根据权利要求1所述的一种应用于多数据源的医疗患者主索引发现方法,其特征在于:计算两两医疗记录之间的相似度,并形成相似度矩阵,其计算公式为:
其中,lij表示两两医疗记录之间的相似度,L表示医疗记录的相似度矩阵,sq为医疗记录i和医疗记录j对于第q个字段精确匹配检索后的相似度,wq为医疗记录i和医疗记录j对于第q个字段在投票时占据的权重,m表示字段数量。
4.根据权利要求3所述的一种应用于多数据源的医疗患者主索引发现方法,其特征在于:筛选出相似度大于等于设定阈值的记录对,形成三元组表,基于三元组表构建有权无向图。
5.根据权利要求4所述的一种应用于多数据源的医疗患者主索引发现方法,其特征在于:在有权无向图中,每一个节点为某一条医疗记录,链路权重为两条医疗记录间的相似度。
6.根据权利要求1所述的一种应用于多数据源的医疗患者主索引发现方法,其特征在于:标准化记录主索引支持度MI值后,选择MI值最大的节点作为主索引记录,若MI值相同则选择ID最小的医疗记录。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电健康云科技有限公司,未经中电健康云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110344519.1/1.html,转载请声明来源钻瓜专利网。