[发明专利]AI模型训练方法、模型使用方法、计算机设备及存储介质有效
| 申请号: | 202011188747.6 | 申请日: | 2020-10-30 |
| 公开(公告)号: | CN112016704B | 公开(公告)日: | 2021-02-26 |
| 发明(设计)人: | 周正;季兴;李宏亮;张正生;刘永升 | 申请(专利权)人: | 超参数科技(深圳)有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 深圳市力道知识产权代理事务所(普通合伙) 44507 | 代理人: | 张传义 |
| 地址: | 518000 广东省深圳市南山区粤海街道高新*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | ai 模型 训练 方法 使用方法 计算机 设备 存储 介质 | ||
本申请涉及人工智能领域,具体公开了一种AI模型训练方法、模型使用方法、计算机设备及存储介质,所述方法包括:获取多个样本生成模型,并根据多个所述样本生成模型进行对弈,得到第一对弈数据;获取第二对弈数据,并根据所述第二对弈数据和所述第一对弈数据对待训练模型进行训练,所述第二对弈数据为真实对弈数据;当所述待训练模型收敛时,将所述待训练模型作为待评测模型,与对比模型进行多次对弈,并得到对弈结果;当所述对弈结果达到预设指标时,确定所述待评测模型为AI模型,完成AI模型训练。提高训练出的强化学习模型的拟人性。
技术领域
本申请涉及人工智能领域,尤其涉及一种AI模型训练方法、模型使用方法、计算机设备及存储介质。
背景技术
随着人工智能(Artificial Intelligence,AI)技术的快速发展,在游戏娱乐领域,利用人工智能技术可以实现虚拟AI与真人之间的对局,且可以战胜顶级的职业选手。目前人工智能技术训练的AI模型出于预测准确率和竞技水平的考量,主要使用深度强化学习的方式训练强化学习模型。但由于强化学习模型只考量最终的输赢,导致训练出的强化学习模型较为生硬,导致训练的AI模型的用户体验较差。
发明内容
本申请提供了一种AI模型训练方法、模型使用方法、计算机设备及存储介质,以提高训练出的强化学习模型的拟人性。
第一方面,本申请提供了一种AI模型训练方法,所述方法包括:
获取多个样本生成模型,并根据多个所述样本生成模型进行对弈,得到第一对弈数据;获取第二对弈数据,并根据所述第二对弈数据和所述第一对弈数据对待训练模型进行训练,所述第二对弈数据为真实对弈数据;当所述待训练模型收敛时,将所述待训练模型作为待评测模型,与对比模型进行多次对弈,并得到对弈结果;当所述对弈结果达到预设指标时,确定所述待评测模型为AI模型,完成AI模型训练。
第二方面,本申请还提供了一种模型使用方法,所述方法包括:
获取当前对弈数据,并对所述当前对弈数据进行特征提取,得到当前类图像特征和当前向量特征;根据所述当前类图像特征和当前向量特征输入AI模型,得到预测的主策略标签和从策略标签,所述AI模型为根据权利要求1-8任一项所述的AI模型训练方法训练得到的模型;根据所述预测的主策略标签和从策略标签确定对应的预测动作,输出所述预测动作,以与真实用户进行对弈。
第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;所述存储器用于存储计算机程序;所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的AI模型训练方法以及模型使用方法。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的AI模型训练方法以及模型使用方法。
本申请公开了一种AI模型训练方法、模型使用方法、计算机设备及存储介质,通过获取多个样本生成模型,然后根据多个样本生成模型进行对弈,得到第一对弈数据;获取第二对弈数据,并根据第一对弈数据和第二对弈数据对待训练模型进行训练;当待训练模型收敛时,将待训练模型作为待评测模型,与对比模型进行多次对弈,得到对弈结果;最终当对弈结果达到预设指标时,确定待评测模型为AI模型,完成AI模型训练。在对待训练模型进行模型训练时,加入真实的第二对弈数据,以此来提高得到的待训练模型的拟人性。在得到待训练模型后对模型进行评测,进而确定最终的AI模型,保证了得到的AI模型的预测准确率和竞技水平。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超参数科技(深圳)有限公司,未经超参数科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011188747.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种去除重组表达抗体聚体和降解产物的方法
- 下一篇:图形显影情况的检测方法





