[发明专利]一种基于插件式模型的可重用、可扩展机器学习方法在审
申请号: | 202110422430.2 | 申请日: | 2021-04-20 |
公开(公告)号: | CN113111587A | 公开(公告)日: | 2021-07-13 |
发明(设计)人: | 王玉亭;陈亮;刘英杰;于文月;张俊青 | 申请(专利权)人: | 北京理工雷科电子信息技术有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N20/00;G06F111/08 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 田亚琪 |
地址: | 100081 北京市海淀区中关*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 插件 模型 重用 扩展 机器 学习方法 | ||
本发明公开了一种基于插件式模型的可重用、可扩展机器学习方法,以轻量级特征学习模型作为基本单元,构造可复用、插件化模型实现目标部件定位与属性分析,为描述部件特征与部件组成方式提供生成式语义描述框架所必需的语义内容,形成样本数据的时、空间概率分布,并作为目标模式匹配的重要依据,完成目标的智能分析、学习与精准、快速辨识任务,本发明方法可在有限的样本与计算资源条件下,精简模型自身复杂度,大幅提升数据样本的利用效率。
技术领域
本发明属于机器学习的技术领域,具体涉及一种基于插件式模型的可重用、可扩展机器学习方法。
背景技术
当前,很多成熟的“智能化”模型设计在本质上属于基于“大数据、小任务范式(bigdata for small task)”的范畴。数据在规律上的复杂性给通识化特定任务带来了巨大挑战:“噪声”干扰下的数据类间差异小易导致模式识别系统的虚警,而数据纷繁变化下的类内差异大则容易导致辨识失败。
于是,基于“大数据、小任务范式”的模型通常以海量数据来催生、塑造智能系统和模型。而现有的深度学习网络模型结构复杂庞大,参数繁多,模型的训练与实际运行计算开销巨大,依赖如FPGA、GPU等集群并行计算平台,因此有限的星上计算与存储资源势必会影响到模型运行效能。同时,以高容量、参数多为特点的模型必须需要基于大量样本训练进而防止过拟合现象,因此高价值训练样本的匮乏极易导致模型过拟合,丧失泛化能力。
发明内容
有鉴于此,本发明提供了一种基于插件式模型的可重用、可扩展机器学习方法,能够解决现有的“大数据、小任务范式(big data for small task)”的通识化特定任务。
实现本发明的技术方案如下:
一种基于插件式模型的可重用、可扩展机器学习方法,以轻量级特征学习模型作为基本单元,构造可复用、插件化模型实现目标部件定位与属性分析,为描述部件特征与部件组成方式提供生成式语义描述框架所必需的语义内容,形成样本数据的时、空间概率分布,并作为目标模式匹配的重要依据,完成目标的智能分析、学习与精准、快速辨识任务。
进一步地,具体包括以下步骤:
步骤一、设计基于模型复杂度控制的轻量级特征学习模型;
步骤二、提取样本复杂度控制的目标基础视觉概念;
步骤三、得到样本、模型复杂度协同控制的共性特征学习与生成模型。
进一步地,步骤一具体为:
步骤1.1对深度学习网络进行压缩、调优处理;
步骤1.2设计基于多层条件随机投影的特征学习网络。
进一步地,步骤1.1具体为:
首先分析嵌入式平台在资源方面对轻量级模型的需求,接着根据特征学习网络自身的结构特点,在初始权重随机的条件下,研究网络结构变换、压缩技术,最后在结构压缩的基础上,对网络中参数进行压缩、调优处理。
进一步地,步骤1.2具体为:
对特征数据进行随机投影,并通过投影后数据的标签信息寻找类内最优的投影方向,以此使得不同类别的数据投影方向差异最大,以此来达到区分不同类别的目的,通过VC维与隐层节点数量之间的关联,将VC维进行近似改进,使其成为凹函数,通过寻找最低点来找到最优的节点数,通过分析各个节点上参数权重的概率分布,寻找最优的节点参数进行网络训练,实现具有指向性的特征映射模型,增强非线性随机特征的类间可分性。
有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工雷科电子信息技术有限公司,未经北京理工雷科电子信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110422430.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:潜航器海底发电充电站
- 下一篇:游戏中的交互数据处理方法及装置