[发明专利]智能模型的训练方法/系统、计算机可读存储介质及终端在审
申请号: | 201710561654.5 | 申请日: | 2017-07-11 |
公开(公告)号: | CN107392125A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 汪宏;邵蔚元;郑莹斌;叶浩 | 申请(专利权)人: | 中国科学院上海高等研究院;上海市信息技术研究中心 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N99/00 |
代理公司: | 上海光华专利事务所(普通合伙)31219 | 代理人: | 徐秋平 |
地址: | 201210 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 智能 模型 训练 方法 系统 计算机 可读 存储 介质 终端 | ||
技术领域
本发明属于人工智能技术领域,涉及一种训练方法和系统,特别是涉及一种智能模型的训练方法/系统、计算机可读存储介质及终端。
背景技术
人工智能领域的发展日新月异,特别是随着深度学习技术的广泛应用,其在物体检测、识别等领域取得了突破性的进展。区别于传统的人工设计的特征,深度学习技术通过输入大量的数据,让模型自身学习物体的特征表示,往往可以媲美甚至超越人类的识别精度。
一般的,一个完整的人工智能模型的学习流程包括准备数据集和模型训练两个步骤。准备数据集包括数据和对数据的标注,例如一个人脸识别的数据集应包括人脸图片和对每张图片的人物身份的标注信息。模型训练则是输入同时输入数据和标注信息,根据不同的学习任务来训练模型。目前大多数的模型学习流程是一个“静态”的学习过程。即一次性收集和标注数据,然后根据这些数据训练好模型,则学习过程结束。然而,该“静态”的学习过程在真实的应用环境中存在如下缺点:
1)开始模型训练需要等待所有数据收集和标注完毕。以深度学习技术为例,模型训练需要大量的数据,可以从上万张图片到几十万张图片不等,收集数据以及标注数据需要耗费大量的人力和物力,成本很高。
2)模型的能力在一次性学习中定型,而一次性收集的数据很难完全适应实际应用的场景,从而导致模型在实际应用中的表现与实验环境相比有较大差距。
因此,如何提供一种智能模型的训练方法/系统、计算机可读存储介质及终端,以解决现有技术中数据收集和标注成本过高、模型适应能力差等问题,实已成为本领域从业人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种智能模型的训练方法/系统、计算机可读存储介质及终端,用于解决现有技术中数据收集和标注成本过高、模型适应能力差的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种智能模型的训练方法,所述智能模型的训练方法包括以下步骤:对输入的第一数据集及与训练任务相关的标注信息进行初始模型训练,以获取一基准模型;添加与所述第一数据集中数据属性相同的新数据,合并于所述第一数据集中,形成第二数据集;测试第二数据集中的数据,对第二数据集中数据进行价值评估,以挑选出标注价值大于预设标注价值的数据,将挑选出的数据形成第三数据集;对第三数据集中未标注标注信息的数据进行标注,将标注有标注信息的数据合并于第三数据集中;基于合并后的第三数据集,对基准模型进行再训练,得到更新后的基准模型;将第三数据集定义为新的第一数据集,添加新数据,循环执行以上步骤,以进行迭代训练,直至迭代训练后的模型的精确度大于预设精确度。
于本发明的一实施例中,所述对输入的第一数据集及与训练任务相关的标注信息进行初始模型训练,以获取一基准模型的步骤指优化预先设置的和训练任务相关的损失函数,使该损失函数的函数值不断减少直到预设函数阈值。
于本发明的一实施例中,在形成所述第二数据集后,所述智能模型的训练方法还包括对所述第二数据集中的数据进行预处理;所述预处理包括对所述数据进行筛查、图像分辨率检测、图像模糊度检测、和/或图像平衡度调整。
于本发明的一实施例中,所述测试第二数据集中的数据的步骤包括对所述第二数据集中数据进行卷积、池化、及多分类处理。
于本发明的一实施例中,所述对所述第二数据集中数据进行价值评估,以挑选出标注价值大于预设标注价值的数据的步骤还包括通过预定义的、用于判断所述第二数据集中数据的标注价值的价值函数,挑选出标注价值大于预设标注价值的数据。
于本发明的一实施例中,所述针对于所挑选数据的标注信息是通过人工标注方式标注的信息。
本发明另一方面提供一种智能模型的训练系统,包括:初始训练模块,用于对输入的第一数据集及与训练任务相关的标注信息进行初始模型训练,以获取一基准模型;合并模块,用于添加与所述第一数据集中数据属性相同的新数据,合并于所述第一数据集中,形成第二数据集;处理模块,用于测试第二数据集中的数据,对第二数据集中数据进行价值评估,以挑选出标注价值大于预设标注价值的数据,将挑选出的数据形成第三数据集;对第三数据集中未标注标注信息的数据进行标注,将标注有标注信息的数据合并于第三数据集中;再训练模块,用于基于合并后的第三数据集,对基准模型进行再训练,得到更新后的基准模型;循环模块,用于将第三数据集定义为新的第一数据集,添加新数据,循环运行所述初始训练模块、合并模块、处理模块、及再训练模块,以进行迭代训练,直至迭代训练后的模型的精确度大于预设精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院上海高等研究院;上海市信息技术研究中心,未经中国科学院上海高等研究院;上海市信息技术研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710561654.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:情绪识别方法、装置、终端及存储介质
- 下一篇:一种自动识别身份的摄像系统