[发明专利]一种噪声鲁棒性的半监督学习数据增强方法在审
申请号: | 202310162372.3 | 申请日: | 2023-02-23 |
公开(公告)号: | CN116108352A | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 李佳笑 | 申请(专利权)人: | 杭州微士科技有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/213 |
代理公司: | 北京亿知臻成专利代理事务所(普通合伙) 16123 | 代理人: | 张毅 |
地址: | 310000 浙江省杭州市余杭区仓前街*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 噪声 鲁棒性 监督 学习 数据 增强 方法 | ||
1.一种噪声鲁棒性的半监督学习数据增强方法,其特征在于:包括引入in-trust loss的半监督数据增强技术建模,该方法包括以下步骤:
S1、使用现有的标注数据对模型M进行训练;
S2、使用模型M在未标注的数据B进行预测得到伪标注数据C,在通常情况下,数据B的数据量远大于数据A;
S3、使用标注数据A和伪标注数据C训练一个新的模型N,训练过程中为了消除伪标签的错误数据,使用In-trust loss进行训练。
2.根据权利要求1所述的一种噪声鲁棒性的半监督学习数据增强方法,其特征在于:所述半监督学是监督学习与无监督学习相结合的一种学习方法。
3.根据权利要求1所述的一种噪声鲁棒性的半监督学习数据增强方法,其特征在于:所述半监督学习使用大量的未标记数据,以及同时使用标记数据,来进行模式识别工作。当使用半监督学习时,将会要求尽量少的人员来从事工作,同时,又能够带来比较高的准确性。
4.根据权利要求1所述的一种噪声鲁棒性的半监督学习数据增强方法,其特征在于:所述伪标注数据是指数据标签是模型预测生成的,而不是人工标注的数据集。
5.根据权利要求1所述的一种噪声鲁棒性的半监督学习数据增强方法,其特征在于:In-trust loss的公式如下:
LCross-entropy=-log(p)
LDCE=-plog(δp+(1-δ)q)
LIn-trust=αLCross-entropy-βLDCE
其中,为多分类的交叉熵损失函数,为预测的概率为真实的概率,δ、α、β都为超参数,在本方法中δ=0.4,α=0.5,β=0.5。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微士科技有限公司,未经杭州微士科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310162372.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗重点垃圾人工智能消毒收运装置及其收运方法
- 下一篇:玩具和玩具套装