[发明专利]模型训练方法、装置及存储介质有效
申请号: | 201910555812.5 | 申请日: | 2019-06-25 |
公开(公告)号: | CN110276404B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 黄超;荆彦青 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06V10/774 | 分类号: | G06V10/774 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 装置 存储 介质 | ||
本发明实施例公开了一种模型训练方法、装置及存储介质,属于计算机技术领域。该方法包括:获取多个第一样本数据;获取初始化的网络模型;根据多个第一样本数据对网络模型进行训练;获取多个第二样本数据;根据多个第二样本数据和多个第二样本数据对应的目标收益数值,对已根据多个第一样本数据训练完成的网络模型进行训练。本发明实施例提供了一种模型训练的方案,避免了由于录制得到的样本数据的数量有限而导致网络模型准确率不高的问题,提高了网络模型的准确率,基于该网络模型确定将在界面中执行的操作时不易出现错误,提高了网络模型的稳定性。
技术领域
本发明实施例涉及计算机技术领域,特别涉及一种模型训练方法、装置及存储介质。
背景技术
随着计算机技术的发展和终端的广泛普及,在应用测试、智能游戏等多种场景下,通常会基于网络模型,对终端显示的界面进行分析,预测当前界面下将要执行的操作。因此如何训练出准确的网络模型成为亟待解决的问题。
相关技术中提供了一种模型训练方法,通过录制终端的运行过程,得到多个样本数据,每个样本数据包括样本图像和目标操作,其中的样本图像为对终端显示的界面进行录制得到的图像,目标操作为在该界面中执行的操作。根据获取到的多个样本数据对网络模型进行训练,训练完成后基于该网络模型,即可根据任一界面的图像确定将在该界面中执行的操作。
但是,录制得到的样本数据的数量有限,根据数量有限的样本数据训练得到的网络模型准确率不高,基于该网络模型确定将在界面中执行的操作时容易出现错误。
发明内容
本发明实施例提供了一种模型训练方法、装置及存储介质,能够有效提高网络模型的准确率和稳定性。所述技术方案如下:
一方面,提供了一种模型训练方法,所述方法包括:
获取多个第一样本数据,所述第一样本数据通过录制终端的运行过程得到,所述第一样本数据包括第一样本图像和第一目标操作,所述第一样本图像为所述终端显示的界面的图像,所述第一目标操作为在所述界面中执行的操作;
获取初始化的网络模型,所述网络模型用于根据任一界面的图像获取多个参考操作对应的操作分值,所述参考操作对应的操作分值用于表示在所述界面中执行所述参考操作的概率;
根据所述多个第一样本数据对所述网络模型进行训练;
获取多个第二样本数据,所述第二样本数据通过监测所述终端的运行过程中得到,所述第二样本数据包括第二样本图像和第二目标操作;
根据所述多个第二样本数据和所述多个第二样本数据对应的目标收益数值,对已根据所述多个第一样本数据训练完成的所述网络模型进行训练,所述第二样本数据对应的目标收益数值通过采用参考收益函数,对所述第二样本数据中的第二样本图像和第二目标操作进行处理得到。
可选地,所述根据所述多个第一样本数据对所述网络模型进行训练,包括:
对于每个第一样本数据,将所述第一样本数据中的第一样本图像输入至所述网络模型,基于所述网络模型获取所述多个参考操作对应的操作分值;
将分值最大的参考操作确定为所述第一样本图像的第一预测操作;
根据所述第一预测操作与所述第一样本数据中的第一目标操作之间的误差,对所述网络模型的模型参数进行调整,以使调整后的所述网络模型根据所述第一样本图像确定的预测操作与所述第一目标操作之间的误差减小。
可选地,所述根据所述多个第二样本数据和所述多个第二样本数据对应的目标收益数值,对已根据所述多个第一样本数据训练完成的所述网络模型进行训练,包括:
对于每个第二样本数据,将所述第二样本数据中的第二样本图像输入至已根据所述多个第一样本数据训练完成的所述网络模型,基于所述网络模型获取所述多个参考操作对应的操作分值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910555812.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模型建立方法和装置
- 下一篇:用于输出信息的方法和装置