[发明专利]用于训练感知算法的基于梯度方差的主动学习框架在审

专利信息
申请号: 202210119356.1 申请日: 2022-02-08
公开(公告)号: CN114943264A 公开(公告)日: 2022-08-26
发明(设计)人: A·帕尔恰米;加桑·阿尔雷吉卜;D·特梅尔;M·普拉布尚卡尔;权国庆 申请(专利权)人: 福特全球技术公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08;G06N20/00
代理公司: 北京连和连知识产权代理有限公司 11278 代理人: 刘小峰;杨帆
地址: 美国密歇根*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 训练 感知 算法 基于 梯度 方差 主动 学习 框架
【说明书】:

本公开提供了“用于训练感知算法的基于梯度方差的主动学习框架”。神经网络和学习算法可使用梯度的方差来提供对模型的启发式理解。梯度的方差可在主动学习技术中用于训练神经网络。技术包括接收具有矢量的数据集。可对数据集进行注释并且可计算损失。损失值可用于通过反向传播来更新神经网络。更新的数据集可用于计算额外损失。可将损失值添加到梯度池。可从梯度池的矢量计算梯度的方差。梯度的方差可用于更新神经网络。

技术领域

本公开总体上涉及神经网络和学习算法。

背景技术

神经网络可通过查询信息源(诸如用户或oracle)以用期望的输出注释和标记数据点来通过监督过程进行迭代学习。该学习过程被称为主动学习,并且是增量迭代过程,通过该过程,神经网络可更新其模型以获得新信息。

学习算法利用oracle的输入来学习和更新。然而,在存在大量数据的场景中,注释和标记未标记的数据集变得非常耗时且昂贵。举例来说,对于用于视觉和对象辨识的神经网络,接收到的数据量可证明对对象的每个未知实例进行注释是昂贵的。

神经网络可采用多种方法来查询来自oracle的输入。不确定性采样、委员会查询或方差缩减是当前使用的方法,但是在确定哪些数据集需要注释时,神经网络可能会取决于其初始训练数据而引入隐性偏差。

在标记和注释数据集时,oracle必须评估数据集的不同启动和权重,以针对给定输入给出正确的输出。在改进神经网络时,oracle必须评估影响数据集权重、启动和性能的输入。此外,对反向传播的数据进行注释和标记的效果可能致使神经网络在非意图或非预期方向上发生非预期移位。

本领域需要一种改进的主动学习训练方法。

发明内容

在实现主动学习以迭代地提高其准确性的神经网络中,利用来自接收到的数据集的梯度变化可减少对oracle筛选未标记数据和注释大量输入的需要。训练方法可采用来自用于训练神经网络的标记数据集的未标记数据的变化。找到跨数据集的多个矢量的变化为神经网络提供了缩小和识别较小数据集的启发式方法,oracle可通过该方法进行注释或查看。

在一些实施例中,描述了一种用于使用主动学习来训练模型的系统,所述系统具有传感器、一个或多个处理器和系统存储器。所述系统存储器可存储致使所述一个或多个处理器进行以下操作的指令:接收数据集;对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集的至少一部分进行注释。

在一些实施例中,描述了使用主动学习来训练模型的方法,所述方法具有以下步骤:接收数据集;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将多个损失值中的每个的对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集的至少一部分进行注释。在计算多个损失值时,损失值中的每个可表征数据集中的对象的分类与该对象的多个潜在分类中的一个之间的差异。

在一些实施例中,描述了具有指令的非暂时性计算机可读介质,所述指令在由一个或多个处理器执行时致使一个或多个处理器:接收数据集;基于机器学习模型对所述数据集中的对象进行分类;计算多个损失值;生成所述多个损失值中的每个的梯度;将对应梯度添加到梯度池;计算所述梯度池的方差;并且部分地基于所述梯度池的方差请求对所述数据集进行注释。在计算多个损失值时,损失值中的每个可表征数据集中的对象的分类与该对象的多个潜在分类中的一个之间的差异。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福特全球技术公司,未经福特全球技术公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210119356.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top