[发明专利]基于关联算法的手术缺漏自动检测方法有效
申请号: | 202011264688.6 | 申请日: | 2020-11-12 |
公开(公告)号: | CN112349399B | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 徐伟风;李易平 | 申请(专利权)人: | 杭州火树科技有限公司 |
主分类号: | G16H40/20 | 分类号: | G16H40/20;G06N5/02;G06N7/00 |
代理公司: | 杭州融方专利代理事务所(普通合伙) 33266 | 代理人: | 沈相权 |
地址: | 310013 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 关联 算法 手术 缺漏 自动检测 方法 | ||
1.基于关联算法的手术缺漏自动检测方法,其特征在于,手术缺漏自动检测方法实现过程如下:
步骤A1,提取数据库中所有患者所有手术及收费项目,并按7∶3比例拆分为训练集和测试集;
步骤A2,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值,将该比例的值记为区分度阈值,用D表示,具体计算公式如下:
D=I_i/S_i∈{1,2,…,m} (1)
其中,I_i表示第i类收费项目在训练集中关联到的手术种类数量;S表示训练集中手术种类总数量;
步骤A3,结合医学知识及数据分布特点,初步设置区分度阈值D=0.6,剔除训练集中低于该区分度 阈值D的收费项目;
步骤A4,获取训练集中修正后的所有手术及收费项目集合,基于独热码技术构建患者手术收费项目矩阵;
独热码是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效;
步骤A5,基于步骤4建立的患者手术收费项目矩阵,使用开源工具包mlxtend中封装的关联算法Apriori,根据支持度提取频繁项集,支持度定义如下:
Sup(A→B)=S_AB/M
其中M表示数据集中总的记录数;S_AB表示项目A和项目B一起出现的次数;步骤A5中的支持度为5/M;
步骤A6,在频繁项集的基础上,修改关联算法Apriori,限制前项为收费项目的项集,在算法层次上避免无效规则的产生,并有效降低数据的存储空间,将修改后的关联算法命名为Crop-Apriori算法;优化后的关联算法保证算法仅生成前项为收费项目,后项为手术的关联规则,然后根据置信度确定最终的关联规则;置信度定义如公式2所示:
Conf(A→B)=(Sup(A→B))/(P(A)) (2)
其中P(A)表示项目A在数据集中出现的概率;
步骤A7,Crop-Apriori算法具体流程如下:
遍历步骤A5,找到的所有频繁项集,找出所有的2-项集,记为C_1,根据置信度确定符合条件的关联规则,前项为收费项目,后项为手术,记为L_1;
在L1基础上,频繁2-项集两两组合,生成3-项集,记为C_2,根据置信度确定符合条件的关联规则,记为L_2;
在L_2基础上,频繁3-项集两两组合,生成4-项集,记为C_3,根据置信度确定符合条件的关联规则,记为L_3,依此类推,直到找到所有符合条件的关联规则;
步骤A8,使用在训练集上获得的关联规则,根据患者的收费项目检测测试集中患者可能遗漏的手术,具体策略如下:
遍历步骤7获得的所有关联规则,计算规则前项与测试患者收费项目交集的数量;
使用交集最多的关联规则的规则后项作为该测试患者可能的遗漏手术;
步骤A9,计算手术遗漏预测准确率,如果准确率达不到要求,回到步骤3,调整区分度阈值、支持度阈值及置信度阈值,直至获得满意的准确率。
2.根据权利要求1所述的基于关联算法的手术缺漏自动检测方法,其特征在于,在步骤A2中,计算训练集中每类收费项目涉及到的手术种类占整个训练集中所有手术种类的比例的值时,需要判断比例的值是否大于区分度阈值;如果比例的值大于区分度阈值,则进行收费项目手术矩阵构建,然后进行Apriori算法训练;如果比例的值小于或等于区分度阈值则直接剔除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州火树科技有限公司,未经杭州火树科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011264688.6/1.html,转载请声明来源钻瓜专利网。