[发明专利]围术期患者样本数据集均衡方法及样本数据集获取系统在审
| 申请号: | 202210760514.1 | 申请日: | 2022-06-30 |
| 公开(公告)号: | CN115206538A | 公开(公告)日: | 2022-10-18 |
| 发明(设计)人: | 卢莉;王琳娜;朱涛;郝学超;桑永胜 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/30;G06F16/215;G06K9/62;G06N3/12 |
| 代理公司: | 重庆西南华渝专利代理有限公司 50270 | 代理人: | 陈香兰 |
| 地址: | 610000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 围术期 患者 样本 数据 均衡 方法 获取 系统 | ||
本发明提供了一种围术期患者样本数据集均衡方法及样本数据集获取系统。样本数据集均衡方法包括:S1,对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本,为合成样本生成对应的合成标签集,样本数据集包括多个样本和样本对应分类标签集;S2,将合成样本和合成标签集加入样本数据集获得临时样本数据集;S3,对临时样本数据集中的样本进行清洗获得均衡样本数据集。对样本数据集中的少数类标签样本进行过采样以增加少数类标签样本数量,均衡多数类标签样本和少数类标签样本,清洗噪声样本提升输出的均衡样本数据集中样本质量,均衡样本数据集用于后续分类处理时能够提升分类模型的表现效果。
技术领域
本发明涉及计算机技术领域,尤其涉及一种围术期患者样本数据集均衡方法及样本数据集获取系统。
背景技术
围术期即围手术期,围手术期是围绕手术的一个全过程,从病人决定接受手术治疗开始,到手术治疗直至基本康复,包含手术前、手术中及手术后的一段时间,具体是指从确定手术治疗时起,直到与这次手术有关的治疗基本结束为止,时间约在术前5-7天至术后7-12天。
据世界卫生组织(WHO)发布的《World health statistics 2021》报告数据来看,全球人口预期寿命增加到73.3岁,预计到2050年,全球老年人将超过15亿人。世界各地不断增加的老年人口已被确定为外科手术市场的主要人群,且老年患者的风险事件预测已经成为了热门研究方向之一。对老年手术患者群体进行术后风险预测,有助于医生制定诊治计划,合理配置救治资源,进而降低术后风险事件发生的概率。目前,一些诊断工具可以帮助医院为高风险病人提供全面、可靠的救治,如公开号为CN111009322A和CN114038565A的中国专利已公开了基于患者围术期数据集利用预测模型进行围术期风险评估,然而,在患者围术期数据集中,多存在数据集标签不平衡问题,这会直接影响到围术期预测模型的表现效果。
发明内容
本发明旨在解决现有技术中存在的技术问题,提供一种围术期患者样本数据集均衡方法及样本数据集获取系统。
为了实现本发明的上述目的,根据本发明的第一个方面,本发明提供了一种围术期患者样本数据集均衡方法,包括:步骤S1,利用MLSMOTE算法对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本,为合成样本生成对应的合成标签集,所述样本数据集包括多个样本和样本对应分类标签集;步骤S2,将合成样本加入样本数据集获得临时样本数据集;步骤S3,对临时样本数据集中的样本进行清洗获得均衡样本数据集。
上述技术方案:对样本数据集中的少数类标签样本进行过采样以增加少数类标签样本数量,达到多数类标签样本和少数类标签样本的均衡,此外,对于在对少类标签样本生成的过程中产生的噪声样本在全部样本中进行清洗,提升输出的均衡样本数据集中样本质量,有效增强数据,当均衡样本数据集用于后续分类处理时能够提升分类模型的表现效果。
为了实现本发明的上述目的,根据本发明的第二个方面,本发明提供了一种围术期患者的样本数据集均衡装置,包括:样本合成模块,利用MLSMOTE算法对围术期患者的样本数据集中的少数类标签样本进行过采样获得合成样本,为合成样本生成对应的合成标签集,所述样本数据集包括多个样本和样本对应分类标签集;临时样本数据集获取模块,将合成样本加入样本数据集获得临时样本数据集;清洗模块,对临时样本数据集中的样本进行清洗获得均衡样本数据集。
上述技术方案:通过MLSMOTE算法对样本数据集中的少数类标签样本进行过采样以增加少数类标签样本数量,达到多数类标签样本和少数类标签样本的均衡,此外,对于MLSMOTE在对少类标签样本生成的过程中产生的噪声样本在全部样本中进行清洗,提升输出的均衡样本数据集中样本质量,有效增强数据,当均衡样本数据集用于后续分类处理时能够提升分类模型的表现效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210760514.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





