[发明专利]一种使用子内核搜索模块优化设备上神经网络模型的方法和装置在审
申请号: | 202180022464.0 | 申请日: | 2021-01-21 |
公开(公告)号: | CN115298671A | 公开(公告)日: | 2022-11-04 |
发明(设计)人: | 权成颜;金镕重;康凤男;诸泓模 | 申请(专利权)人: | 斯特拉德视觉公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 延美花;臧建明 |
地址: | 韩国庆*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 内核 搜索 模块 优化 设备 神经网络 模型 方法 装置 | ||
公开一种使用子内核搜索模块优化设备上神经网络模型的方法,其包括:学习装置(a)将具有能够使用安装有神经网络模型的边缘设备允许的最大计算能力执行目标任务的最大容量的大神经网络模型训练成针对输入的输入数据生成第1推理结果的状态下,使子内核搜索模块通过识别与学习数据对应的约束和状态向量来获得适合对所述学习数据执行目标任务的特定子内核的架构信息;(b)参考所述特定子内核的所述架构信息优化所述大神经网络模型,生成用于针对所述学习数据生成第2推理结果的特定小神经网络模型;以及(c)参考所述第1推理结果和所述第2推理结果训练所述子内核搜索模块。
技术领域
本发明涉及一种设备上神经网络模型(on-device neural network model)的优化方法和装置,更具体地涉及一种使用子内核搜索模块(Sub-Kernel Searching Module,SSM)优化设备上神经网络模型的方法以及使用其的学习装置和优化装置,其训练用于优化设备上神经网络模型的子内核搜索模块。
背景技术
由于各种因素,例如所输入的图像的亮度、抖动和噪声等,使用图像分类(Imageclassification)的设备可以难以识别所输入的图像的至少一部分。
因此,可以通过应用深度学习(deep learning)对各种图像进行持续学习来提高图像分类的准确度。
然而,为了提高图像分类的准确度,需要对神经网络模型(neural networkmodel)进行持续的优化(optimization),相应地,已经开发出各种用于有效更新神经网络模型的技术。
为此,在现有技术中,人们直接设计深度学习网络模型,但最近正在开发诸如神经架构搜索(Neural Architect Search,NAS)之类的方法,该方法通过人工智能神经网络直接设计应用于设备的神经网络模型。
作为一例,参见图1,现有的NAS通过使用循环神经网络(Recurrent NeuralNetwork,RNN)生成包括应用或将应用在设备上的神经网络模型的架构信息的配置字符串(configuration string)来设计子神经网络模型(child neural network model)。然后,使用验证集(validation set)测量子神经网络模型的性能,并作为结果获得的准确度(accuracy)R用作强化学习(reinforcement learning)的奖励(reward),以更新子神经网络模型的参数(parameter)。此外,还正在应用梯度下降优化(gradient descentoptimization)和进化搜索(evolutionary search)等技术来实现最佳网络性能。
并且,参考图2,作为另一种现有的神经网络优化技术,有诸如在线学习(onlinelearning)之类的方法。在这些在线学习中,在对现有的神经网络模型进行在线推理(inference)后,根据其结果使用对现有的神经网络模型进行更新或重新学习的过程。
如此,使用神经网络优化神经网络模型架构对如自动驾驶车辆、无人飞行器和机器人等的需要深度学习技术的行驶装置中安装的边缘设备(edge device)很有用,使用在边缘设备上执行特定功能的神经网络模型的现有方法具有以下问题。
首先,安装在边缘设备上的神经网络模型的模型容量(model capacity)有限,因为允许的运算量和参数数量都比较少。
并且,检测和识别图像所需的模型容量因多个图像的难度而异,但安装在边缘设备上的现有的神经网络模型对所有图像应用相同的运算量和参数,从而检测和识别能力的偏差随着多个像的难度而增加。
另外,由于安装在边缘设备上的神经网络模型在没有人工干预的情况下很难找到难样本(hard sample),因此通过学习难样本来提高神经网络模型的性能需要大量的人力和成本。
因此,需要一种能够解决所述问题的改进方案。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯特拉德视觉公司,未经斯特拉德视觉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180022464.0/2.html,转载请声明来源钻瓜专利网。