[发明专利]一种基于Mixup的长尾数据增强处理方法在审

申请号：	202211628965.6	申请日：	2022-12-19
公开（公告）号：	CN115861970A	公开（公告）日：	2023-03-28
发明（设计）人：	叶海波;周芳宇	申请（专利权）人：	南京航空航天大学
主分类号：	G06V20/58	分类号：	G06V20/58;G06V10/82;G06N3/08;G06N3/0464
代理公司：	南京合砺专利商标代理事务所(普通合伙) 32518	代理人：	鲍小龙
地址：	210016***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 mixup 长尾数据增强处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于Mixup的长尾数据增强处理方法，其特征在于：所述方法对于长尾数据训练的过程包括如下步骤：

(1)输入原始的长尾数据集S；

(2)初始化混淆概率矩阵cf为0；

(3)通过θ～Beta(α,α)得到参数，Mixup使用参数θ生成新样本数据将新样本作为模型的输入；

(4)利用θ和混淆概率矩阵cf，使用平衡的损失函数l_BaMix计算模型的总损失，模型的总损失被计算为：

(5)更新模型参数，使用验证集验证模型精度；

(6)计算混淆矩阵，更新混淆概率矩阵cf；

(7)更新学习次数；

(8)如果学习次数大于指定学习次数，结束模型训练；否则重复步骤(3)，继续对模型进行训练，更新模型参数。

2.根据权利要求1所述的基于Mixup的长尾数据增强处理方法，其特征在于：步骤(3)通过Mixup对长尾数据集进行数据增强，新样本数据的生成包括如下计算：

其中，(x_i,y_i)，(x_j,y_j)∈S，y_i是输入x_i的真实标签，θ～Beta(α,α)，α∈(0,+∞)，(x_i,y_i)，(x_j,y_j)是Mixup随机挑选的两个样本，通过参数θ将两个样本进行结合，生成新的样本

3.根据权利要求1所述的基于Mixup的长尾数据增强处理方法，其特征在于：步骤(4)对于模型总损失的计算过程如下：

假设为原始样本x_i被预测为标签y_i的概率，/为使用Mixup后的虚拟样本/被预测为y_i的条件概率，cf(class₁,class₂)为类别class₁被识别为class₂的概率，n_t为类别t的样本总数，t∈{1,…,k}，k为类别数量，有：

其中存在：

式中，为输入/的第y_i个输出，/为输入x_i的第y_i个输出，使用Mixup后，模型的输出受/影响，偏向于头部类，为了避免模型预测对头部类的偏向，引入平衡项//其中，/可能是一个接近于0的数，导致B(y,θ)趋于负无穷，为了使B(y,θ)大于0，将/放大为/并且为了使n·cf(y,y)这一分母不为0，在这一分母项上加1，则平衡项B(y,θ)最终为：

模型的总损失被计算为：

4.根据权利要求1所述的基于Mixup的长尾数据增强处理方法，其特征在于：步骤(6)通过混淆矩阵更新混淆概率矩阵cf，具体如下：

通过验证集的验证，得到当前验证集的预测标签和真实标签，通过统计预测标签和真实标签，得到混淆矩阵，而混淆概率矩阵cf只需将混淆矩阵每一行除以该行的总数，在每一轮训练结束后，都会对混淆概率矩阵进行更新。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京航空航天大学，未经南京航空航天大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211628965.6/1.html，转载请声明来源钻瓜专利网。

上一篇：基于多回路改进SNA-PID的炉膛温度智能优化控制方法
下一篇：一种合成5-硝基水杨醛的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Mixup的长尾数据增强处理方法在审

专利文献下载