[发明专利]神经网络模型迁移方法和系统、电子设备、程序和介质有效

申请号：	201711214166.3	申请日：	2017-11-28
公开（公告）号：	CN108229652B	公开（公告）日：	2021-05-04
发明（设计）人：	邵婧;闫俊杰	申请（专利权）人：	北京市商汤科技开发有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06K9/62
代理公司：	北京思源智汇知识产权代理有限公司 11657	代理人：	毛丽琴
地址：	100084 北京市海淀区中***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	神经网络模型迁移方法系统电子设备程序介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种神经网络模型迁移方法和系统、电子设备、程序和介质，其中，方法包括：分别向训练好的至少两个第一神经网络模型和一待训练的第二神经网络模型输入相同的待处理对象；其中，所述第二神经网络模型的大小小于每个所述第一神经网络模型的大小；基于所述至少两个第一神经网络模型对所述待处理对象的处理结果，共同训练所述第二神经网络模型，直至满足预设训练完成条件。本发明实施例实现了基于多个大神经网络模型对小神经网络模型的共同训练，可将多个大神经网络的性能迁移到小神经网络模型。

技术领域

本发明涉及人工智能技术，尤其是一种神经网络模型迁移方法和系统、电子设备、程序和介质。

背景技术

在当今的图像识别任务中的一个普遍共识是在样本数据足够、训练方法恰当、网络模型设计科学的条件下，所使用的网络模型越大、越复杂，往往能够得到越精确的识别结果。虽然网络模型越大、越复杂，识别结果越精确可靠，但是，由于体量庞大、计算复杂的问题，从而使得其在实际应用中会占用大量的存储和计算资源。

发明内容

本发明实施例提供一种用于进行神经网络模型迁移的技术方案。

根据本发明实施例的一个方面，提供一种神经网络模型迁移方法，包括：

分别向训练好的至少两个第一神经网络模型和一待训练的第二神经网络模型输入相同的待处理对象；其中，所述第二神经网络模型的大小小于每个所述第一神经网络模型的大小；

基于所述至少两个第一神经网络模型对所述待处理对象的处理结果，共同训练所述第二神经网络模型，直至满足预设训练完成条件。

可选地，在本发明上述各方法实施例中，所述第二神经网络模型的大小小于所述第一神经网络模型的大小，包括：

第二神经网络模型的参数量小于所述第一神经网络模型的参数量；和/或

第二神经网络模型的网络层数小于所述第一神经网络模型的网络层数。