[发明专利]一种神经网络训练方法及其装置、计算机服务器有效
申请号: | 201810498650.1 | 申请日: | 2018-05-23 |
公开(公告)号: | CN108805258B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 黄泽昊;王乃岩 | 申请(专利权)人: | 北京图森智途科技有限公司 |
主分类号: | G06N3/02 | 分类号: | G06N3/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 101300 北京市顺*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 训练 方法 及其 装置 计算机 服务器 | ||
本发明公开一种神经网络训练方法及其装置、计算机服务器,以解决现有技术无法自动化训练神经网络的问题。方法包括:自动筛选神经网络处理失败的输入数据,得到待标注数据集;对所述待标注数据集进行标注,得到新的标注数据集;获取包含所述新的标注数据集的新增标注数据集,并将该新增标注数据集与前一周期用于训练所述神经网络的训练样本数据集的并集确定为本周期的训练样本数据集;基于本周期的训练样本数据集对所述神经网络进行迭代训练,得到本周期训练得到的神经网络。本发明技术方案能够实现自动化训练神经网络,以不断提高神经网络的准确性。
技术领域
本发明涉及深度学习领域,特别涉及一种神经网络训练方法、一种神经网络训练装置和一种计算机服务器。
背景技术
近几年来,深度神经网络在诸多领域中取得了巨大的成功,如计算机视觉、自然语言处理等。然而,为了将深度神经网络应用到实际应用当中,深度神经网络必须满足以下三个条件:1)符合实际应用速度需求;2)在大量的实际场景数据上进行训练;3)能够根据实际需求快速迭代更新。
当神经网络在实际投入使用时,研发人员发现神经网络处理不理想时,启动对该神经网络的重新训练,并手动获取用于重新训练该神经网络的样本数据集,基于该样本数据集对该神经网络进行重新训练。整个重新训练的过程均需要人工参与,如何能够实现神经网络的自动训练目前没有公开相关的技术方案。
发明内容
鉴于上述问题,本发明提供一种神经网络训练方法及其装置、计算机服务器,以实现自动化训练神经网络,以不断提高神经网络的准确性。
本发明实施例,第一方面,提供一种神经网络训练方法,该方法按照预置的时间周期执行以下步骤,包括:
自动筛选神经网络处理失败的输入数据,得到待标注数据集;
对所述待标注数据集进行标注,得到新的标注数据集;
获取包含所述新的标注数据集的新增标注数据集,并将该新增标注数据集与前一周期用于训练所述神经网络的训练样本数据集的并集确定为本周期的训练样本数据集;
基于本周期的训练样本数据集对所述神经网络进行迭代训练,得到本周期训练得到的神经网络。
本发明实施例,第二方面,提供一种神经网络训练装置,所述装置包括:
控制单元,用于按照预置的时间周期触发筛选单元、标注单元、获取单元和训练单元;
筛选单元,用于自动筛选神经网络处理失败的输入数据,得到待标注数据集;
标注单元,用于对所述待标注数据集进行标注,得到新的标注数据集;
获取单元,用于获取包含所述新的标注数据集的新增标注数据集,并将该新增标注数据集与前一周期用于训练所述神经网络的训练样本数据集的并集确定为本周期的训练样本数据集;
训练单元,用于基于本周期的训练样本数据集对所述神经网络进行迭代训练,得到本周期训练得到的神经网络。
本发明实施例,第三方面,还提供一种计算机服务器,该计算机服务器包括存储器,以及与所述存储器通信连接的一个或多个处理器;
所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行,以使所述一个或多个处理器实现第一方面提供的神经网络训练方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京图森智途科技有限公司,未经北京图森智途科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810498650.1/2.html,转载请声明来源钻瓜专利网。