[发明专利]一种数据处理方法及装置有效
申请号: | 201711461721.2 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108206046B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 樊芳利 | 申请(专利权)人: | 新华三大数据技术有限公司 |
主分类号: | G16H10/00 | 分类号: | G16H10/00 |
代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
地址: | 450000 河南省郑州市郑州高新*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 | ||
本公开涉及一种数据处理方法及装置,包括从样本数据包含的所有指标中选取目标指标,得到指标集合;从指标集合中选取作为Logistic回归主模型的特征的指标,得到至少一个特征集合;针对每个特征集合:得到与每个样本数据对应的第一特征值集合;利用所有第一特征值集合训练Logistic回归主模型,得到与特征集合对应的Logistic回归子模型;得到与每个样本数据对应的第二特征值集合;基于所有第二特征值集合,确定Logistic回归子模型对样本数据的分类准确率。通过得到与特征集合对应的Logistic回归子模型以及对应分类准确率,根据本公开实施例的数据处理方法及装置能够提供辅助决策支持,提高分类的正确率。
技术领域
本公开涉及模式识别及分类技术领域,尤其涉及一种数据处理方法及装置。
背景技术
随着大数据技术、人工智能的发展,医疗、交通、金融等行业可以通过挖掘历史数据对各自的问题进行辅助决策和诊断。这种以行业业务经验决策为主、以数据挖掘结果为辅的新型诊断、决策方式正在影响着各行各业。
以医疗行业为例,大数据医疗辅助决策系统可以用于医疗行业数据的整合、检索,以及专业的医疗数据分析,支撑医疗的科研研究、临床分析、辅助决策,从而向医生提供辅助决策支持,提高人工诊断正确率。
发明内容
有鉴于此,本公开提出了一种数据处理方法及装置,能够构提供辅助决策支持,提高分类的正确率。
根据本公开的一方面,提供了一种数据处理方法,该方法包括:从样本数据包含的所有指标中选取目标指标,得到指标集合;从所述指标集合中选取作为Logistic回归主模型的特征的指标,得到至少一个特征集合;针对每个所述特征集合:随机选取多于一个样本数据,从所选取的每一个样本数据中获取与所述特征集合中的所有特征对应的特征值,得到与每一个样本数据对应的第一特征值集合;利用获取的所有第一特征值集合训练Logistic回归主模型,得到与所述特征集合对应的Logistic回归子模型;随机选取多于一个样本数据,从所选取的每一个样本数据中获取与所述特征集合中的所有特征对应的特征值,得到与每一个样本数据对应的第二特征值集合;基于获取的所有第二特征值集合,确定所述Logistic回归子模型对样本数据的分类准确率。
根据本公开的另一方面,提供了一种数据处理装置,该装置包括:第一选取模块,用于从样本数据包含的所有指标中选取目标指标,得到指标集合;第二选取模块,用于从所述指标集合中选取作为Logistic回归主模型的特征的指标,得到至少一个特征集合;第一确定模块,用于针对每个所述特征集合:随机选取多于一个样本数据,从所选取的每一个样本数据中获取与所述特征集合中的所有特征对应的特征值,得到与每一个样本数据对应的第一特征值集合;利用获取的所有第一特征值集合训练Logistic回归主模型,得到与所述特征集合对应的Logistic回归子模型;随机选取多于一个样本数据,从所选取的每一个样本数据中获取与所述特征集合中的所有特征对应的特征值,得到与每一个样本数据对应的第二特征值集合;基于获取的所有第二特征值集合,确定所述Logistic回归子模型对样本数据的分类准确率。
通过从样本数据包含的所有指标中选取目标指标,得到指标集合;从指标集合中选取作为Logistic回归主模型的特征的指标,得到至少一个特征集合;针对每个特征集合:选取多个样本数据,利用每个样本数据对应的第一特征值集合训练Logistic回归主模型,得到与特征集合对应的Logistic回归子模型;选取多个样本数据,基于每个样本数据对应的第二特征值集合,确定Logistic回归子模型对样本数据的分类准确率,根据本公开的各方面实施例的数据处理方法及装置能够得到与所述特征集合对应的Logistic回归子模型以及该Logistic回归子模型的分类准确率,从而能够提供辅助决策支持,提高分类的正确率。
根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三大数据技术有限公司,未经新华三大数据技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711461721.2/2.html,转载请声明来源钻瓜专利网。