[发明专利]损失函数动态加权的方法、装置、设备和存储介质在审
| 申请号: | 202111242467.3 | 申请日: | 2021-10-25 |
| 公开(公告)号: | CN114090952A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 周开龙;陈颖辉;王范萍;张玥 | 申请(专利权)人: | 上海小零网络科技有限公司 |
| 主分类号: | G06F17/15 | 分类号: | G06F17/15;G06F17/18;G06N20/00 |
| 代理公司: | 北京万思博知识产权代理有限公司 11694 | 代理人: | 秦贺余 |
| 地址: | 201306 上海市浦东新区中国(上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 损失 函数 动态 加权 方法 装置 设备 存储 介质 | ||
1.一种损失函数动态加权的方法,其特征在于,包括:
获取样本集内每个类别的先验概率;
根据所述先验概率和当次模型训练中所输出的每个类别的预测概率,确定每个类别的难易权值;
基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新,得到难易权值更新后的损失函数,以利用更新后的损失函数,确定当次模型训练的损失值。
2.根据权利要求1所述的损失函数动态加权的方法,其特征在于,获取类别集内每个类别的先验概率,包括:
利用预设的先验概率计算式,获取样本集内每个类别的先验概率;
所述先验概率计算式为:
其中,p(ci)表示先验概率,ci表示第i个类别,ni表示ci对应的样本数量,K表示样本集中类别的数量,nk表示第k个类别对应的样本数量,Y表示类别难易控制参数,Y为常数。
3.根据权利要求1所述的损失函数动态加权的方法,其特征在于,根据所述先验概率和当次模型训练中所输出的每个类别的预测概率,确定每个类别的难易权值,包括:
将所述先验概率和当次模型训练中所输出的每个类别的预测概率代入预设的难易权值计算式,计算每个类别的难易权值;
所述难易权值计算式为:
Wd=(p(ci)-p)2
其中,Wd表示难易权值,p(ci)表示先验概率,p表示预测概率。
4.根据权利要求1所述的损失函数动态加权的方法,其特征在于,基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新,得到难易权值更新后的损失函数,包括:
将所述每个类别的难易权值代入预设的权值变量更新计算式中,得到难易权值更新后的损失函数;
所述权值变量更新计算式为:
Loss=-Wd*log p
其中,Loss表示更新后的损失函数,Wd表示难易权值,-log p表示预设的损失函数。
5.一种损失函数动态加权的装置,其特征在于,包括:
获取模块,用于获取样本集内每个类别的先验概率;
确定模块,用于根据所述先验概率和当次模型训练中所输出的每个类别的预测概率,确定每个类别的难易权值;
更新模块,用于基于所述每个类别的难易权值对预设的损失函数中的权值变量进行更新,得到难易权值更新后的损失函数,以利用更新后的损失函数,确定当次模型训练的损失值。
6.根据权利要求5所述的损失函数动态加权的装置,其特征在于,所述获取模块,具体用于:
利用预设的先验概率计算式,获取类别集内每个类别的先验概率;
所述先验概率计算式为:
其中,p(ci)表示先验概率,ci表示第i个类别,ni表示ci对应的样本数量,K表示样本集中类别的数量,nk表示第k个类别对应的样本数量,γ表示类别难易控制参数,γ为常数。
7.根据权利要求5所述的损失函数动态加权的装置,其特征在于,所述确定模块,具体用于:
将所述先验概率和当次模型训练中所输出的每个类别的预测概率代入预设的难易权值计算式,计算每个类别的难易权值;
所述难易权值计算式为:
Wd=(p(ci)-p)2
其中,Wd表示难易权值,p(ci)表示先验概率,p表示预测概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海小零网络科技有限公司,未经上海小零网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111242467.3/1.html,转载请声明来源钻瓜专利网。





