|
钻瓜专利网为您找到相关结果 61个,建议您 升级VIP下载更多相关专利
- [发明专利]强化学习模型的训练方法及装置-CN202311168598.0在审
-
杜梦雪;暴宇健
-
深圳须弥云图空间科技有限公司
-
2023-09-12
-
2023-10-20
-
G06N3/092
- 本公开涉及计算机技术领域,提供了一种强化学习模型的训练方法及装置。该方法包括:获取使用设定强化学习算法对第一强化学习模型进行训练得到的第二强化学习模型;将相同的训练数据分别输入到第一强化学习模型和第二强化学习模型,对应得到第一输出数据组和第二输出数据组;根据训练数据、第一输出数据组、第二输出数据组和设定的总损失函数获取总损失函数值,其中,总损失函数的自蒸馏损失函数部分根据第一输出数据组和第二输出数据组的距离得到;根据总损失函数值调整第一强化学习模型,直到第一强化学习模型收敛,得到训练好的目标强化学习模型。本公开的技术方案可以提高强化学习模型在实际应用中的泛化能力和可复现性。
- 强化学习模型训练方法装置
- [发明专利]作文生成模型训练方法及装置-CN202310876691.0有效
-
王芳;暴宇健
-
深圳须弥云图空间科技有限公司
-
2023-07-18
-
2023-10-03
-
G06F18/214
- 本公开涉及机器学习技术领域,提供了一种作文生成模型训练方法及装置。该方法包括:获取第一训练数据集,基于第一训练数据集中的题目要求和该题目要求对应的作文,利用交叉熵损失函数对预训练语言模型进行训练;获取题目数据集,利用训练后的预训练语言模型为题目数据集中的题目要求多次生成对应的作文,根据题目数据集中的题目要求以及预训练语言模型生成的该题目要求对应的多篇作文构建第二训练数据集和第三训练数据集;基于第二训练数据集,利用三元组损失函数对题文距离衡量模型进行训练;基于第三训练数据集,利用策略梯度函数对训练后的预训练语言模型进行再训练,将再训练后的预训练语言模型作为作文生成模型。
- 作文生成模型训练方法装置
- [发明专利]模型旁路调优方法及装置-CN202310619452.7在审
-
暴宇健;汪骞
-
北京龙智数科科技服务有限公司
-
2023-05-29
-
2023-09-12
-
G06F16/35
- 本公开涉及机器学习技术领域,提供了一种模型旁路调优方法及装置。该方法包括:确定用于执行目标任务的大规模目标模型所对应的小规模目标模型,其中,小规模目标模型和大规模目标模型为目标模型的不同版本,小规模目标模型的模型规模小于大规模目标模型的模型规模;利用小规模目标模型和大规模目标模型构建双路目标模型,其中,小规模目标模型为双路目标模型的旁支网络,大规模目标模型为双路目标模型的主支网络;对双路目标模型进行训练:冻结双路目标模型中大规模目标模型的模型参数,对双路目标模型中小规模目标模型进行训练;利用训练后的双路目标模型执行目标任务。
- 模型旁路方法装置
- [发明专利]图像分类方法及装置-CN202310416399.0有效
-
王芳;暴宇健
-
深圳须弥云图空间科技有限公司
-
2023-04-19
-
2023-08-29
-
G06V10/764
- 本公开涉及计算机技术领域,提供了一种图像分类方法及装置。该方法包括:获取待分类图像;将待分类图像输入到预置的图像分类模型,采用图像分类模型对待分类图像进行分类,得到分类结果,其中,图像分类模型采用训练图片、初始分类模型、第一损失函数和第二损失函数训练得到,第一损失函数根据第一任务数据构建,第一任务数据为对进行随机掩码处理后的分片执行对比学习任务的任务数据,第二损失函数根据第二任务数据构建,第二任务数据为对进行随机掩码处理后的分片输入初始分类模型执行掩码图像还原任务的任务数据。本公开的技术方案可以提高图像分类模型的图像分类的精度。
- 图像分类方法装置
- [发明专利]模型旁路调优方法及装置-CN202310615673.7在审
-
暴宇健;汪骞;王灏
-
深圳须弥云图空间科技有限公司
-
2023-05-29
-
2023-08-22
-
G06N3/084
- 本公开涉及机器学习技术领域,提供了一种模型旁路调优方法及装置。该方法包括:构建目标模型的嵌入层和线性层各自对应的第一矩阵和第二矩阵;利用嵌入层对应的第一矩阵和第二矩阵构建嵌入层的第一旁路网络,利用线性层对应的第一矩阵和第二矩阵构建线性层的第二旁路网络;对构建第一旁路网络和第二旁路网络后的目标模型进行训练:冻结目标模型中除第一旁路网络和第二旁路网络之外的其它网络层的网络参数,对第一旁路网络和第二旁路网络进行训练;利用训练后的目标模型执行目标任务。采用上述技术手段,解决现有技术中,目标模型训练面临待调优参数量大和耗时长的问题。
- 模型旁路方法装置
|