[发明专利]训练、验证以及监测人工智能和机器学习的模型在审

专利信息
申请号: 201811341072.7 申请日: 2018-11-12
公开(公告)号: CN109934341A 公开(公告)日: 2019-06-25
发明(设计)人: A·德奥;M·费尔南德斯;K·P·尔格;T·埃斯克里格;B·戈施;M·文卡塔·拉曼 申请(专利权)人: 埃森哲环球解决方案有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N20/00
代理公司: 北京市金杜律师事务所 11256 代理人: 酆迅
地址: 爱尔兰*** 国省代码: 爱尔兰;IE
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及训练、验证以及监测人工智能和机器学习的模型。设备标识针对模型的训练数据和评分数据,并且去除来自训练数据的偏差,来生成无偏差的训练数据。设备利用无偏差的训练数据来训练模型,以生成经训练的模型,并且利用评分数据来处理经训练的模型,以生成针对经训练的模型的分数。设备基于模型度量和分数,从经训练的模型中选择经训练的模型,并且利用该经训练的模型来处理训练样本,以生成第一结果,其中训练样本是基于无偏差的训练数据和生产数据而被创建的。设备利用经训练的模型来处理生产样本,以生成第二结果,其中生产样本是基于生产数据和训练样本而被创建的。设备基于第一结果和第二结果,提供用于在生产环境中使用的经训练的模型。
搜索关键词: 训练数据 训练样本 人工智能 机器学习 评分数据 设备利用 生产数据 样本 验证 设备标识 生产环境 训练模型 监测 度量 创建 去除 生产
【主权项】:
1.一种设备,包括:用于接收模型和针对所述模型的数据的装置,所述模型包括人工智能模型或机器学习模型;用于基于所述数据标识针对所述模型的训练数据和评分数据的装置;用于去除来自所述训练数据的偏差,来生成无偏差的训练数据的装置;用于利用所述无偏差的训练数据来训练所述模型,以生成多个经训练的模型的装置;用于利用所述评分数据来处理所述多个经训练的模型,以生成针对所述多个经训练的模型的分数的装置;用于基于模型度量和所述分数,从所述多个经训练的模型中评估并选择经训练的模型的装置;用于基于所述无偏差的训练数据以及与生产环境相关联的生产数据,创建针对所述经训练的模型的训练样本的装置,所述经训练的模型将在所述生产环境中被利用;用于基于所述生产数据和所述训练样本创建生产样本的装置;用于利用所述经训练的模型来处理所述训练样本和所述生产样本,以生成与所述训练样本相关联的第一结果和与所述生产样本相关联的第二结果的装置;用于基于所述第一结果和所述第二结果,验证用于在所述生产环境中使用的所述经训练的模型的装置;以及用于基于验证所述经训练的模型,提供将被用在所述生产环境中的所述经训练的模型的装置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于埃森哲环球解决方案有限公司,未经埃森哲环球解决方案有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811341072.7/,转载请声明来源钻瓜专利网。

同类专利
  • 一种深度神经网络多任务超参数优化方法及装置-201910541450.4
  • 骆剑平;陈娇 - 深圳大学
  • 2019-06-21 - 2019-11-12 - G06N3/08
  • 本发明公开了一种深度神经网络多任务超参数优化方法,首先对每个任务的数据训练集进行模型训练得出多任务学习网络模型,然后对未知区域的所有点进行预测,并对预测结果进行筛选候选点,最终对筛选出的候选点进行评估并将候选点以及候选点的目标函数值添加到数据训练集中再次建立模型、预测、筛选以及评估操作;以此类推,直到达到最大迭代次数,最终从数据训练集中选出目标函数值最大时对应的候选点,也即是多任务学习网络模型中每个任务的超参数组合。本发明通过将径向基神经网络模型替代高斯模型,并与多任务学习结合并应用到贝叶斯优化算法中实现超参数优化,大大降低了超参数优化的计算量。本发明还公开了一种电子设备及存储介质。
  • 一种复用深度神经网络模型训练模型的方法和系统-201910544437.4
  • 段凌宇;陈子谦;楼燚航;黄铁军 - 北京大学
  • 2019-06-21 - 2019-11-08 - G06N3/08
  • 本申请公开了一种复用深度神经网络模型训练模型的方法和系统。获取在其他数据集下训练好的深度神经网络模型作为复用模型;获取复用模型在给定任务数据集下的不同表层的信息特征并进行特征变换;获取待训练的深度神经网络模型在给定任务数据集下,针对数据集提取的信息特征,使用从复用模型提取的变换后的信息特征进行权重与尺度规约,并用于复用损失和待训练损失进行协同训练。本发明能够同时复用多个模型,且根据总损失使用反向传播训练和更新待训练模型,能够在数据集有无标签混合场景下以及在不同任务训练好的模型场景下,对模型进行较好的复用,提升复用模型的利用率以及模型复用的性能。
  • 一种蒸汽产耗量的动态预测方法-201910731785.2
  • 张琦;刘帅;张可牧 - 东北大学
  • 2019-08-08 - 2019-11-08 - G06N3/08
  • 本发明提供一种蒸汽产耗量的动态预测方法,其包括:将归一化集合分为训练数据集和测试数据集;将训练数据集输入长短期记忆神经网络预测模型进行训练形成训练结果数据;根据训练结果数据对预测模型中的参数进行更新;将测试数据集代预测模型中进行预测得到预测结果,选择误差最小的预测结果对应的优化的预测模型作为最优预测模型;利用最优预测模型预测待预测时间间隔的蒸汽产耗数据。综合考虑了设备工况不同对蒸汽产生和消耗的影响,建立了基于设备多工况运行的蒸汽产生量与消耗量动态预测方法来解决本发明所提到的复杂工况条件下的蒸汽预测问题,更准确地预测未来调度周期内各个设备的蒸汽产生量和各生产用户的蒸汽消耗量。
  • 数据处理方法和装置、及存储介质和电子装置-201910534815.0
  • 郑立颖;徐亮;阮晓雯 - 平安科技(深圳)有限公司
  • 2019-06-20 - 2019-11-05 - G06N3/08
  • 本发明提供了一种数据处理方法和装置、及存储介质和电子装置,其中,该方法包括:获取多个第一类训练样本,每个第一类训练样本包括一个n维独热向量与对应的第一类训练标签;利用多个第一类训练样本训练第一神经网络模型,得到第二神经网络模型,第一神经网络模型的第一层为嵌入层,嵌入层用于针对n维的向量输出m维的向量,n>m;将每个n维独热向量输入第二神经网络模型,并提取嵌入层对于每个n维独热向量的输出向量,建立并存储每个n维独热向量与对应的m维向量之间的对应关系。通过本发明,解决了相关技术中通过独热向量来标识不同对象导致机器学习的训练过程占用内存过多、训练速度较慢的技术问题。
  • 模型训练方法、装置、电子设备和计算机可读存储介质-201910713733.2
  • 陈宝林;吴志洋;龚秋棠;傅松林;张伟 - 厦门美图之家科技有限公司
  • 2019-08-02 - 2019-11-05 - G06N3/08
  • 本发明实施例提出一种模型训练方法、装置、电子设备和计算机可读存储介质,涉及数据处理技术领域。方法包括将训练好的浮点模型重构成量化网络和浮点网络,基于相同的输入数据,执行所述浮点网络前向推理并获取所述浮点网络的输出数据,执行所述量化网络前向推理并获取所述量化网络的输出数据。然后计算所述浮点网络的输出数据与所述量化网络的输出数据之间的损失,判断所述损失是否达到设定条件,若未达到所述设定条件,则基于所述损失对所述量化网络进行迭代训练,直至所述浮点网络的输出数据与迭代训练后的量化网络的输出数据的损失达到所述设定条件。从而实现对量化模型的便捷训练。
  • 模型特征筛选方法及装置、可读存储介质-201910590474.9
  • 赵劼铖;张俊 - 上海上湖信息技术有限公司
  • 2019-07-02 - 2019-10-29 - G06N3/08
  • 一种模型特征筛选方法及装置、可读存储介质,所述模型特征筛选方法包括:步骤1,采用第i组候选特征建立对应的第i个模型;i大于等于1;步骤2,对所述第i个模型进行模型解释,得到所述第i组候选特征中每一个特征对应的特征贡献;步骤3,根据所述每一个特征对应的特征贡献,对所述第i组候选特征进行筛选,排除不符合预设条件的特征,得到第i+1组候选特征;步骤4,将所述第i+1组候选特征作为所述第i组候选特征,重复执行步骤1至步骤3,直至所有所述不符合预设条件的特征被排除,得到目标特征。采用上述方案,可以准确筛选出有效的模型特征。
  • 基于进化神经网络的短波通信频率选择方法-201710408092.0
  • 朱晓明;彭地;周亚桥;王德丰 - 西安电子科技大学
  • 2017-06-02 - 2019-10-25 - G06N3/08
  • 本发明提出了一种基于进化神经网络的短波通信频率选择方法,用于解决现有短波通信频率选择方法中存在的选频速度和选频精度不能兼顾的技术问题。实现步骤为:用积累的探测数据构造训练样本集;设计进化神经网络频率质量预测模型;构造进化神经网络的解向量;用粒子群算法训练网络参数,得到最优进化神经网络频率质量预测模型;用最优进化神经网络频率质量预测模型选若干个频率作为探测频率进行信道探测,将探测分值最高的频率作为最佳工作频率。本发明利用进化神经网络频率质量预测模型预测出频率表中所有频率的通信质量,选择通信质量最高的若干频率作为探测频率,在保证选频精度的前提下,有效地提高了选频的速度。
  • 神经网络模型的训练、延时摄影视频的生成方法及设备-201810253848.3
  • 罗文寒;马林;刘威 - 腾讯科技(深圳)有限公司
  • 2018-03-26 - 2019-10-22 - G06N3/08
  • 本发明公开一种神经网络模型的训练、延时摄影视频的生成方法及设备。所述延时摄影视频的方法包括:获取原始图片;复制原始图片,生成包括第一预设数目张原始图片的原始图片集;将原始图片集输入至用于生成延时摄影视频的神经网络模型;通过神经网络模型重构第二预设数目张各原始图片的内容,输出包括第三预设数目帧图像的延时摄影视频;第二预设数目等于第一预设数目减1,第三预设数目小于或等于第一预设数目。本发明提供的技术方案,能够基于一张原始图片,通过用于生成延时摄影视频的神经网络模型输出预测的延时摄影视频,该原始图片可以由用户提供,从而方便用户很容易便能够制作延时摄影视频,能够有效提升用户体验。
  • 一种基于DQN的智能车多车道换道方法-201910574458.0
  • 胡江平;吕维;李咏章 - 电子科技大学
  • 2019-06-28 - 2019-10-22 - G06N3/08
  • 本发明公开了一种基于DQN的智能车多车道换道方法,通过原始传感器高维数据作为状态集合输入,以离散有限驾驶行为动作作为动作集合,考虑驾驶任务的需求,设计立即回报集合,再通过基于长短时记忆的深度神经网络的拟合,能充分考虑环境的不确定性,通过训练基于长短时记忆的深度神经网络完成智能车安全行为驾驶的策略性学习,最后使用训练所得的深度神经网络对无人驾驶进行决策。
  • 神经网络训练及图像处理方法、装置、设备和介质-201910606138.9
  • 俞海宝;温拓朴;孙建凯 - 上海商汤临港智能科技有限公司
  • 2019-07-05 - 2019-10-22 - G06N3/08
  • 本实施例公开了一种神经网络训练及图像处理方法、装置、电子设备和计算机存储介质,该神经网络训练方法包括:将第一神经网络中各组卷积层参数中的各个卷积层参数的参数值映射为该组卷积层参数的量化范围中的一个离散值,得到第二神经网络;利用第二神经网络对第一样本图像进行图像处理;根据第一样本图像的标注结果以及处理结果,调整第二神经网络的网络参数值;将网络参数值调整后的第二神经网络中各组卷积层参数中的各个卷积层参数的参数值映射为该组卷积层参数的量化范围中的一个离散值,得到参数量化后的神经网络。如此,在对神经网络进行训练的过程中,将每组卷积层参数量化到不同的量化范围内,减小量化过程中的量化损失。
  • 一种神经网络模型训练方法、装置、芯片和系统-201910503321.6
  • 张长征;白小龙;涂丹丹 - 华为技术有限公司
  • 2016-11-29 - 2019-10-18 - G06N3/08
  • 本发明实施例提供了一种模型训练方法。本发明实施例的每个工作模块包括并行运行的计算进程和通讯进程,计算进程根据上一次迭代的局部梯度和模型参数计算下一次训练模型的模型参数,通讯进程向服务器模块上推局部梯度以及下拉全局梯度。计算进程计算训练模型的下一次迭代的模型参数的过程不依赖于上一次迭代的全局梯度,从而使计算进程与通讯进程的时间窗口重叠,缩短了模型参数的训练时延。
  • 一种机器学习中快速标记训练数据的方法-201811579476.X
  • 王广;王雯;初晓玲;张格堃 - 梦多科技有限公司
  • 2018-12-24 - 2019-10-18 - G06N3/08
  • 本发明提供了一种机器学习中快速标记训练数据的方法,所述方法以下步骤:描出图像上目标物的关键部位轮廓,将目标物划分大区域;对每个关键部位进行关键位点的标记,得到标记数据;选择数据训练神经网络模型,将图像中的像素映射到3D模型的UV坐标系;将待标记图像中的点对应至3D模型中的大致区域后,根据3D模型中的多角度展示,人工调整至精确位置。本发明解决了训练数据快速标注的问题,节省了大量的时间,极大提升了训练和标注的精准度,同时,本发明也提供了一套度量准确性的方法,比直接人工标注训练至少提高了2倍的准确度。机器视觉领域为了物体的三维感知,需要积累大量的训练数据,本发明的技术方案对于训练提速有巨大工程意义。
  • 电动汽车在四驱模式下的能量管理及自主学习方法-201710425954.0
  • 张立平;周军;刘超刚;盛涛 - 河北御捷时代汽车有限公司
  • 2017-06-08 - 2019-10-18 - G06N3/08
  • 本发明公开了一种电动汽车在四驱模式下的能量管理及自主学习方法,在现有电动汽车的四驱能量管理系统中设定基于预期能量需求的自优化算法,使得能量管理系统能够基于一般化行驶需求预估下一个时间单元的大概率能量需求,并基于驾驶时长的累计和增加通过智能学习实现同等时间单元下的能量预估功能进化。本发明通过上述方法设定的能量管理预估参值独立且兼容于现有的能量管理系统,且具有自我学习的累积进化效果,所得预估参值对于整车的能量集约和节约化分配具有实际的预测意义和参考价值,为电动四驱汽车的能量管理提供了一个全新的技术方向。
  • 一种基于生成式对抗网络的对抗样本生成方法-201910459852.X
  • 贾西平;陈桂君;方刚;陈道鑫 - 广东技术师范大学
  • 2019-05-29 - 2019-10-15 - G06N3/08
  • 本发明公开了一种基于生成式对抗网络的对抗样本生成方法,包括生成器G、鉴别器D、空间变换模块ST和目标分类网络F,生成器G生成扰动,将扰动叠加到原样本中产生对抗样本,再根据鉴别器D和目标分类网络F的损失函数对生成器G进行训练,最后得到训练好的生成器G,利用训练好的生成器G为不同输入样本产生自适应的对抗样本。本发明利用生成式对抗网络,嵌入基于空间变换的增强模块,采用无监督方式进行对抗训练,提高攻击模型的泛化能力和鲁棒性,进而增强对抗样本的迁移性和鲁棒性。
  • 一种基于对抗样本训练的对抗攻击防御方法-201910505805.4
  • 王中元;曾诚;何政;傅佑铭 - 武汉大学
  • 2019-06-12 - 2019-10-15 - G06N3/08
  • 本发明针对深度学习网络的对抗攻击防御问题,公开了一种基于对抗样本训练的对抗攻击防御方法。首先,引入训练样本类别标签的先验分布,对标签进行平滑修正,使得网络在训练时不会过度相信训练样本是完全正确的;其次,在网络训练的过程中加入对抗样本,同时修改原有的损失函数,体现对抗样本对损失函数的贡献,从而使得网络对梯度攻击具有抵抗性;最后,对网络神经元进行随机失活处理,在一定程度上减少过拟合。本发明方法抑制了过拟合,增强了网络的泛化能力,从而提高了网络防御对抗性样本攻击的鲁棒性。
  • 一种人工智能算法的构件封装方法及系统-201910594212.X
  • 舒建;魏培阳;刘魁;曹亮 - 成都淞幸科技有限责任公司
  • 2019-07-03 - 2019-10-15 - G06N3/08
  • 本发明公开了一种人工智能算法的构件封装方法及系统,包括对若干个不同类型的神经网络算法所对应的数据样例进行数据预处理以获取所对应的第一构件参数并将第一构件参数封装为统一的接口参数后进行可视化展示;创建某一类型的数据集;模型配置过程;对所配置的模型进行模型训练;存储所述模型训练的训练结果,将模型文件的全路径作为参数进行传递,将已完成处理的预测数据传入构件中,最终得出训练模型的预测信息。对每一所生成的构建配置可视化界面所对应的xml文件;确定构件的封装标准,统一构件对外暴露的接口;将不同的训练算法封装为不同的构件模板。本发明能够将神经网络算法的代码封装为可视化构件的方法来降低神经网络的应用要求。
  • 基于机器学习的MOOC僵尸课程识别方法-201910620124.2
  • 董晨;张凡;江秋怡;郭文忠 - 福州大学
  • 2019-07-10 - 2019-10-15 - G06N3/08
  • 本发明涉及一种基于机器学习的MOOC僵尸课程识别方法,包括以下步骤:步骤S1:采集MOOC平台上若干样本课程;步骤S2:提取样本课程特征并添加标签,构造训练数据集;步骤S3:构建BP神经网络模型;步骤S4:根据训练数据集,初始化并训练BP神经网络模型,直到测试误差达到预设值或者到达预设最大训练次数,得到训练后的BP神经网络模型;步骤S4:将待测MOOC课程输入训练后的BP神经网络模型,判断是否为僵尸课程。本发明基于机器学习MOOC僵尸课程识别方法,具有高效,准确,低成本的特点,对推进MOOC建设有重大意义。
  • 用于云边缘的AI模型和数据伪装技术-201910151925.9
  • K·A·杜什;F·C·G·伯纳特;S·帕拉哈卡兰 - 英特尔公司
  • 2019-02-28 - 2019-10-11 - G06N3/08
  • 本文描述了用于云边缘的AI模型和数据伪装技术的系统和技术。在示例中,神经网络变换系统被适配成从客户端接收伪装输入数据,所述伪装输入数据是通过对原始输入数据应用第一编码变换而产生的。所述神经网络变换系统可以进一步被适配成将所述伪装输入数据用作神经网络模型的输入,所述神经网络模型是使用通过对训练数据应用所述第一编码变换创建的训练数据集来创建的。所述神经网络变换系统可以进一步被适配成接收来自所述神经网络模型的结果并将输出数据传输到所述客户端,所述输出数据基于所述结果。
  • 记忆减退型在线序列极限学习机-201910327301.8
  • 周昌军;邹全义 - 浙江师范大学
  • 2019-04-22 - 2019-10-11 - G06N3/08
  • 本发明涉及到机器学习中在线学习领域,引入自适应记忆因子和遗忘机制提出了一种新型的在线极限学习机。一般来说在流式数据更新过程中,新数据相比旧数据更能反映当前数据的特征,失效数据是无法体现当前数据的特征。因此更新模型时,新数据对模型的贡献较大;旧数据对模型的贡献较小;失效数据的贡献为零。通过引入遗忘机制淘汰失效数据。同时引入自适应记忆因子调节新、旧数据对模型的贡献,从而提高模型的预测精度。
  • 一种基于BP神经网络的水泥成品比表面积预测方法-201910619400.3
  • 郝晓辰;史鑫;李泽;赵彦涛 - 燕山大学
  • 2019-07-10 - 2019-10-11 - G06N3/08
  • 本发明公开了一种水泥成品比表面积预测方法,包括:获取水泥磨研磨系统待测试数据;水泥磨研磨系统待测试数据包括喂料量反馈、磨主机电流等八个工业流程参量数据作为输入数据和对应时刻的水泥成品比表面积作为输出数据;由比表实际测量工艺对原始数据做平均处理,即选取对应一个小时的变量数据取其平均值;经过归一化,通过BP神经网络对样本数据进行离线训练,根据系统实际运行每隔一段时间对稳态输入输出样本数据进行更新,重新训练该NN模型,满足实际需要。本发明实现了对水泥成品比表面积以及其变化趋势的准确预测,及时的为水泥研磨过程提供规划调度依据,且测量成本低。
  • 基于结构化贝叶斯后验概率估计的神经网络压缩方法-201910615130.9
  • 王琦;李学龙;郭年辉 - 西北工业大学
  • 2019-07-09 - 2019-10-08 - G06N3/08
  • 本发明公开了一种基于结构化贝叶斯后验概率估计的神经网络压缩方法,用于解决现有神经网络压缩方法存在非结构化压缩的技术问题。技术方案是通过重参数技巧在训练过程中对模型参数w引入方差可学习的高斯噪声,将神经网络从数值优化问题变换为概率推理问题,实现基于因果推理的贝叶斯参数估计。同时采用分组概率估计的约束方法,实现分组的参数不确定性估计,结合稀疏先验,实现结构化的分组参数压缩,更有利于模型的移动端部署。本发明从分组贝叶斯估计的角度实现了神经网络参数的稀疏学习,解决了现有神经网络压缩方法非结构化压缩的技术问题。
  • 一种提高基于霍尔效应磁编码器输出角度精度的方法-201910428367.6
  • 潘志文;黄姗姗;刘楠;尤肖虎 - 东南大学
  • 2019-05-22 - 2019-10-01 - G06N3/08
  • 本发明公开了一种提高基于霍尔效应磁编码器输出角度精度的方法,具体为:构造LM‑BP神经网络结构;通过PSO方法优化LM‑BP神经网络的初始权值和阈值:计算PSO粒子种群粒子维度、计算粒子的适应度值、更新粒子位置和速度、得到PSO优化后的LM‑BP神经网络的初始权值和阈值;进行PSO‑LM‑BP神经网络训练:初始化LM‑BP神经网络控制向量、计算输出层输出和理想输出信号的平方误差、更新控制向量、判断平方误差大小;PSO‑LM‑BP神经网络预测磁编码器输出角度。本发明通过PSO和LM相配合的方式来优化BP神经网络,为BP神经网络方法找到全局最优的初始权值和阈值,从而提高了磁编码器的原始输出角度的精度,减小了磁编码器的误差,大幅提高了磁编码器的输出角度精度。
  • 深度学习自主运行方法-201910463215.X
  • 何孝珍;周明振 - 合肥阿拉丁智能科技有限公司
  • 2019-05-30 - 2019-10-01 - G06N3/08
  • 一种深度学习自主运行方法。其步骤如下:获取原始语料文本;基础语义分割;命名实体识别和实体关系抽取;建立基础知识图谱;建立扩展知识图谱;设计训练模型和生成训练数据和测试数据集;生成预测模型。本发明可自动根据长文本信息中,形成知识库,同时由于长文本学习和应用程序是异步结构,学习过程并不影响应用程序运行,并可以针对不同行业形成各自独立的行业知识库,涉及到的行业有金融行业、保险行业、教育行业、医疗行业、法律行业、旅游行业、安保行业、客服行业。
  • 基于流形正则化和宽度网络的半监督宽度学习分类方法-201910572421.4
  • 赵慧敏;郑建杰;邓武;徐俊洁 - 中国民航大学
  • 2019-06-28 - 2019-09-27 - G06N3/08
  • 本发明涉及宽度学习系统技术领域,尤其涉及基于流形正则化和宽度网络的半监督宽度学习分类方法,包括以下步骤:S1:利用输入数据建立特征节点;S2:利用已建立的特征节点建立增强节点;S3:输出权重的求解,本发明通过将流形正则化框架引入BLS中,提出了半监督宽度学习系统(Semi‑supervised Broad Learning System,简称SS‑BLS),该方法通过流形正则化框架扩展了BLS,从而提升了BLS的适用性,SS‑BLS完全具有BLS的学习能力和计算效率,同时,该方法能够高效的完成不同复杂数据集下的半监督分类任务,各种数据集的实验结果表明SS‑BLS具有极强的适应性和较高的稳定性,此外,数据集的实验结果还证明所提出的方法与最先进的半监督方法相比具有竞争力。
  • 训练卷积神经网络的方法及装置、计算机设备和存储介质-201910578722.8
  • 张韵东;黎明;夏昌盛;李国新;昝劲文 - 广东中星微电子有限公司
  • 2019-06-28 - 2019-09-27 - G06N3/08
  • 本发明提供了一种训练卷积神经网络的方法及装置、计算机设备和存储介质,该方法包括在利用包含K个样品的训练集对卷积神经网络进行推理运算时,对卷积神经网络的每个卷积层的M个输出通道中的每个输出通道的特征图进行平均计算,得到K个M维特征向量;对K个M维特征向量进行主成分分析PCA操作以获得M个新的空间主轴和K个M维特征向量在新的空间主轴上的M个方差值;根据M个方差值,确定缩减后的每个卷积层的输出通道数;以及根据缩减后的每个卷积层的输出通道数设计缩减后的卷积神经网络,并对缩减后的卷积神经网络进行再训练以获得新的卷积神经网络,能够精确地确定出缩减后的每个卷积层的输出通道数,减少卷积神经网络的设计花销时间。
  • 参数学习方法、装置、终端设备及可读存储介质-201910583613.5
  • 袁操;陶杨;李雅琴 - 武汉轻工大学
  • 2019-06-28 - 2019-09-27 - G06N3/08
  • 本发明公开了一种参数学习方法、装置、终端设备及可读存储介质,包括:将多个样本数据按照类别划分第一数据集和第二数据集,将神经网络模型中的参数划分为第一参数和第二参数;通过第一数据集对神经网络模型中的第一参数进行训练,获得第一参数的权重值;从第一参数中选取部分参数,将第一参数中未被选取的参数作为剩余参数,并将选取的部分参数以及第二参数作为更新参数;通过第二数据集对神经网络模型中的更新参数进行训练,获取更新参数的权重值;比较第一参数的权重值与更新参数的权重值,根据比较结果对剩余参数进行训练;本发明通过重复学习已经学习过的内容的方式,减轻了神经网络在学习新的任务时遗忘原来的任务的问题。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top