[发明专利]玩家的模仿方法、装置及可读存储介质在审
| 申请号: | 201910289265.0 | 申请日: | 2019-04-11 |
| 公开(公告)号: | CN110052031A | 公开(公告)日: | 2019-07-26 |
| 发明(设计)人: | 王蒙;陈赢峰;林磊;范长杰 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | A63F13/67 | 分类号: | A63F13/67;A63F13/79;A63F13/822;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 张子青;刘芳 |
| 地址: | 310052 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 游戏角色 模仿 机器学习算法 可读存储介质 人工智能逻辑 多样性 游戏 | ||
本发明提供的玩家的模仿方法、装置及可读存储介质,通过获取多个真实玩家的游戏角色数据;利用第一机器学习算法对各游戏角色数据进行处理,生成初始模仿模型;确定待模拟的目标玩家,基于第二机器学习算法和所述目标玩家的游戏角色数据对所述初始模仿模型进行训练,获得目标玩家的模仿模型,该目标玩家的模仿模型用于控制非玩家游戏角色,从而提高了非玩家游戏角色的人工智能逻辑的多样性,也使得基于该目标玩家的模仿模型所获得非玩家游戏角色能够模仿目标玩家的行为,有效提升了玩家对于游戏的体验。
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种玩家的模仿方法、装置及可读存储介质。
背景技术
游戏中的非玩家游戏角色(Non-Player Characte,简称NPC)的战斗策略是游戏的人工智能(Artificial Intelligence,简称AI)开发的一个很重要的组成部分。特别是针对一些可模仿玩家行为的NPC来说,其AI程度的高低直接影响着玩家对于游戏的体验。
现有的非玩家游戏角色的人工智能一般是由开发人员预先编译的,即开发人员基于自身经验编写人工智能逻辑,基于该人工智能逻辑开发的非玩家游戏角色将严格按照人工智能逻辑执行相应动作。
但是,上述方式获得的人工智能逻辑较为单一,执行该人工智能逻辑的非玩家游戏角色的行为也较为单一,其无法对于多样的真实玩家的行为进行有效模仿,直接影响着玩家对于游戏的体验。此外,现有的一些AI训练方法可能会丢失真实玩家的多样性。
发明内容
为了解决上述提及的问题,本发明提供了一种玩家的模仿方法、装置及可读存储介质。
一方面,本发明提供了一种玩家的模仿方法,包括:
获取多个真实玩家的游戏角色数据;
利用第一机器学习算法对各游戏角色数据进行处理,生成初始模仿模型;
确定待模拟的目标玩家,基于第二机器学习算法和所述目标玩家的游戏角色数据对所述初始模仿模型进行训练,获得目标玩家的模仿模型;
其中,所述目标玩家的模仿模型用于控制非玩家游戏角色。
可选的,所述游戏角色数据包括用于表示玩家的游戏角色状态的状态数据以及玩家在游戏角色处于该游戏角色状态下的行为数据;
所述利用第一机器学习算法对各游戏角色数据进行处理,生成初始模仿模型,包括:
利用监督学习算法对各游戏角色数据进行处理,生成初始模仿模型,以使在将各游戏角色数据的状态数据输入至所述初始模仿模型,所述初始模仿模型输出各游戏角色数据的状态数据相应的行为数据。
可选的,所述游戏角色数据包括游戏环境以及玩家在游戏环境下的行为数据;
所述利用第一机器学习算法对各游戏角色数据进行处理,生成初始模仿模型,包括:
利用强化学习算法对各游戏角色数据进行处理,生成初始模仿模型,以使在将各游戏角色数据的游戏环境输入至所述初始模仿模型,所述始模仿模型输出各游戏角色数据的游戏环境相应的行为数据。
可选的,所述基于第二机器学习算法和所述目标玩家的游戏角色数据对所述初始模仿模型进行训练,获得目标玩家的模仿模型,包括:
利用逆向强化学习算法,或,生成对抗模仿学习算法生成所述目标玩家的游戏角色数据的判别函数;
将所述判别函数作为强化学习算法中的奖励,以对初始模仿模型进行训练;
迭代生成判别函数和对所述初始模仿模型进行训练的步骤,直至训练后的初始模仿模型满足预设期望,获得目标玩家的模仿模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910289265.0/2.html,转载请声明来源钻瓜专利网。





