[发明专利]一种使用选择性深度生成重放模块对深度神经网络模型执行可调连续学习的方法和装置在审
申请号: | 202180004129.8 | 申请日: | 2021-04-14 |
公开(公告)号: | CN114008638A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 夫硕焄;权成颜;金镕重;柳宇宙 | 申请(专利权)人: | 斯特拉德视觉公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06V10/40;G06V10/77;G06V10/771;G06V10/764;G06V10/82;G06K9/62 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 延美花;臧建明 |
地址: | 韩国庆*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 选择性 深度 生成 重放 模块 神经网络 模型 执行 可调 连续 学习 方法 装置 | ||
1.一种使用选择性深度生成重放模块对深度神经网络模型进行可调连续学习的方法,所述方法包括:
(a)当从整个数据库获得第1学习用数据且从作为所述整个数据库的子集的子数据库获得第2学习用数据时,学习装置执行或支持执行如下处理:将所述第1学习用数据和所述第2学习用数据输入到选择性深度生成重放模块使得所述选择性深度生成重放模块(i)通过位于所述选择性深度生成重放模块的分布分析器生成与所述第1学习用数据对应的第1学习用低维分布特征和与所述第2学习用数据对应的第2学习用低维分布特征,其中所述第1学习用低维分布特征的维度低于所述第1学习用数据的维度,所述第2学习用低维分布特征的维度低于所述第2学习用数据的维度,(ii)将从位于所述选择性深度生成重放模块的动态二进制生成器中生成的学习用二进制、从位于所述选择性深度生成重放模块的随机参数生成器中生成的学习用随机参数、和所述第2学习用低维分布特征输入到位于所述选择性深度生成重放模块的数据生成器,通过所述数据生成器根据所述学习用二进制和所述学习用随机参数生成与所述第2学习用低维分布特征对应的第3学习用数据,(iii)将所述第1学习用数据输入到位于所述选择性深度生成重放模块的求解器,通过所述求解器输出基于深度学习对所述第1学习用数据进行标注的学习用标注数据;
(b)所述学习装置执行或支持执行如下处理:将所述第1学习用数据、所述第2学习用数据、所述第1学习用低维分布特征、所述第2学习用低维分布特征、所述第3学习用数据和所述学习用二进制输入到判别器,使得所述判别器对应于所述学习用二进制输出第1学习用数据分数、第2学习用数据分数、第1分布特征分数、第2分布特征分数和第3学习用数据分数;以及
(c)所述学习装置执行或支持执行如下处理:(i)生成参考所述第2学习用数据分数、所述第2分布特征分数和所述第3学习用数据分数的第1判别损失、参考所述第1学习用数据分数、所述第1分布特征分数和所述第3学习用数据分数的第2判别损失、参考所述第2分布特征分数和所述第3学习用数据分数的第1生成损失、和参考所述第1分布特征分数、所述第2分布特征分数和所述第3学习用数据分数的第2生成损失以训练所述判别器、所述数据生成器和所述分布分析器,以使所述数据生成器生成在所述学习用二进制为第1二进制值时包括具有在基于所述第2学习用低维分布特征的均值和方差确定的各学习用数据阈值范围内的均值和方差中的至少一个的分布的特征的所述第3学习用数据,生成在所述学习用二进制为第2二进制值时包括具有在基于所述第2学习用低维分布特征的所述均值和所述方差确定的所述各学习用数据阈值范围之外的均值和方差中的至少一个的分布的特征的所述第3学习用数据,(ii)参考所述学习用标注数据和与之对应的真实数据进一步生成求解器损失,并使用所述求解器损失进一步训练所述求解器。
2.根据权利要求1所述的方法,其特征在于:
在所述(c)步骤中,所述学习装置执行或支持执行如下处理:参考所述学习用二进制值,(i)当所述学习用二进制为第1二进制值时,使用所述第1判别损失训练所述判别器和所述分布分析器,使用所述第1生成损失训练所述数据生成器和所述分布分析器,(ii)当所述学习用二进制为第2二进制值时,使用所述第2判别损失训练所述判别器和所述分布分析器,并使用第2生成损失训练所述数据生成器和所述分布分析器。
3.根据权利要求2所述的方法,其特征在于:
所述学习装置执行或支持执行如下处理:(i)当分别使用所述第1判别损失和所述第2判别损失来训练所述判别器和所述分布分析器时,在固定所述数据生成器的第1参数的状态下进行训练,(ii)当分别使用所述第1生成损失和所述第2生成损失来训练所述数据生成器和所述分布分析器时,在固定所述判别器的第2参数的状态下进行训练。
4.根据权利要求1所述的方法,其特征在于:
所述数据生成器包括至少一个编码层和至少一个解码层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于斯特拉德视觉公司,未经斯特拉德视觉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180004129.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通过横向流感应加热产品的设备
- 下一篇:基于镜面反射和漫反射的欺骗检测