[发明专利]数据处理方法、装置、存储介质及计算机设备在审
申请号: | 202110069802.8 | 申请日: | 2021-01-19 |
公开(公告)号: | CN112990958A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 刘紫薇;宋辉;董井然;陈守志 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q40/02;G06F17/16 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 刘自丽 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 存储 介质 计算机 设备 | ||
本发明实施例公开了一种数据处理方法,通过获取训练样本数据;将训练样本数据输入至预设模型,并对预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数;对目标损失函数进行多阶求导处理,并根据多阶求导的结果对第一模型参数进行更新,得到第二模型参数;基于第二模型参数更新第一模型参数,并返回执行对预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数并进行迭代训练,直至第一模型参数收敛。以此,通过对损失函数中的模型参数进行预补偿,使得模型参数可以进行多阶迭代更新,从而提升了模型参数迭代更新的效率。即提升了数据处理效率,进而提高了模型训练的速度。
技术领域
本发明涉及机器学习技术领域,具体涉及一种数据处理方法、装置、存储介质及计算机设备。
背景技术
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。
在机器学习领域中,逻辑回归模型扮演者十分重要的角色,逻辑回归模型非常广泛地用于数据挖掘,疾病自动诊断,经济预测等领域。
在现有技术中,当训练样本数据量较大时,逻辑回归模型的模型参数计算的效率较低。
发明内容
本发明实施例提供一种数据处理方法、装置、存储介质及计算机设备,该方法可以对模型进行多阶迭代训练,提升了数据处理的效率,进而提高了模型的训练效率。
本申请第一方面提供一种数据处理方法,包括:
获取训练样本数据;
将所述训练样本数据输入至预设模型,并对所述预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数;
对所述目标损失函数进行多阶求导处理,并根据多阶求导的结果对所述第一模型参数进行更新,得到第二模型参数;
基于所述第二模型参数更新所述第一模型参数,并返回执行对所述预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数并进行迭代训练,直至所述第一模型参数收敛。
相应的,本发明实施例第二方面提供一种数据处理装置,包括:
获取单元,用于获取训练样本数据;
补偿单元,用于将所述训练样本数据输入至预设模型,并对所述预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数;
更新单元,用于对所述目标损失函数进行多阶求导处理,并根据多阶求导的结果对所述第一模型参数进行更新,得到第二模型参数;
训练单元,用于基于所述第二模型参数更新所述第一模型参数,并返回执行对所述预设模型的损失函数中的第一模型参数进行补偿处理,得到补偿处理后的目标损失函数并进行迭代训练,直至所述第一模型参数收敛。
在一些实施例中,所述补偿单元,包括:
第一确定子单元,用于根据所述训练样本数据确定所述预设模型的损失函数;
获取子单元,用于获取所述预设模型的第一模型参数的权重约束;
补偿子单元,用于根据所述权重约束对所述损失函数中的第一模型参数进行补偿处理。
在一些实施例中,所述获取子单元,包括:
获取模块,用于获取所述预设模型中的第一模型参数对所述预设模型的期望贡献度;
第一确定模块,用于根据所述期望贡献度确定所述预设模型的第一模型参数的权重约束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110069802.8/2.html,转载请声明来源钻瓜专利网。