[发明专利]基于机器学习的模型训练方法和装置在审
| 申请号: | 201910141312.7 | 申请日: | 2019-02-26 |
| 公开(公告)号: | CN109886342A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 别晓辉;徐盼盼;别伟成;单书畅 | 申请(专利权)人: | 视睿(杭州)信息科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 杭州华知专利事务所(普通合伙) 33235 | 代理人: | 张德宝 |
| 地址: | 310000 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标注 损失函数 方法和装置 产品样本 基于机器 模型训练 训练模型 迭代训练 工业检测 样本数据 学习 检测 | ||
本发明公开了一种基于机器学习的模型训练方法和装置。其中,该方法包括:从产品样本中获取标注数据和无标注数据;根据标注数据得到第一损失函数;根据无标注数据得到第二损失函数;根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。本发明解决了工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
技术领域
本发明涉及工业质检领域,具体而言,涉及一种基于机器学习的模型训练方法和装置。
背景技术
随着计算机技术的快速发展,深度学习成为了机器学习领域的热点。其中,机器学习在语音识别、图像识别等领域得到了广泛的推广。
当前深度学习广泛基于监督学习,需要大量的标注数据对模型进行训练,然而在实际的生产中,例如,工业质检领域,需要收集足够的标注样本,收集大量的标注样本不仅费时费力,而且还可能由于产能等多重因素的限制使得标注样本的收集比较困难。另一方面,在实际的生产中,大量存在没有标注的数据,例如在工业领域,工厂车间里每天有源源不断的工业产品在产出。另外,这些没有标注的数据也具有一定的价值,但现有的深度学习技术无法对没有标注的数据进行利用。
同时,图像识别在实际应用中通常具有尺度伸缩的需求,仍以工业质检为例,不同的客户对产品的品质要求不同,例如,面向低端市场的通常对产品的质量要求较低,而面向高端市场的通常对产品的质量要求较高,不同的客户需求反应在技术上则需要图像识别的结果具有伸缩可控性。
由上述内容可知,图像识别技术应用在工业检测场景存在标注样本数据量大,标注数据成本高的问题,还存在不同需求的检测场景中,检测尺度难以自由伸缩的问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种基于机器学习的模型训练方法和装置,以至少解决工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
根据本发明实施例的一个方面,提供了一种基于机器学习的模型训练方法,包括:从产品样本中获取标注数据和无标注数据;根据标注数据得到第一损失函数;根据无标注数据得到第二损失函数;根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
根据本发明实施例的另一方面,还提供了一种基于机器学习的模型训练装置,包括:第获取模块,用于从产品样本中获取标注数据和无标注数据;第一处理模块,用于根据标注数据得到第一损失函数;第二处理模块,用于根据无标注数据得到第二损失函数;训练模块,用于根据第一损失函数和第二损失函数对产品样本进行迭代训练,得到训练模型,其中,训练模型用于对产品的质量进行检测。
根据本发明实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行基于机器学习的模型训练方法。
根据本发明实施例的另一方面,还提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行基于机器学习的模型训练方法。
在本发明实施例中,采用无标注数据进行机器学习的模型训练的方式,在从产品样本中获取标注数据和无标注数据之后,通过标注数据得到第一损失函数,并根据无标注数据得到第二损失函数,根据第一损失函数和第二损失函数对产品样本进行迭代训练,从而得到用于对产品的质量进行检测的训练模型。
在上述过程中,由于无标注数据参与到了机器学习的模型的训练过程中,使得得到的训练模型的预测精度得到了提升。另外,由于采用了无标注数据对训练模型的训练,从而减少了标注数据的数据量,降低了标注数据的成本,减轻了获取标注数据的负担。
由此可见,本申请所提供的方案达到了降低标注数据的成本的目的,从而实现了工业检测中样本标注的成本的技术效果,进而解决了工业检测中需要标注样本数据量大,标注数据成本高的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于视睿(杭州)信息科技有限公司,未经视睿(杭州)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910141312.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种训练生成人脸检测模型的方法
- 下一篇:图像分类方法及装置、设备、存储介质





