[发明专利]一种基于语音识别和人体姿态的人机交互式游戏引擎在审
申请号: | 201710379562.5 | 申请日: | 2017-05-25 |
公开(公告)号: | CN107424602A | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 张庆 | 申请(专利权)人: | 合肥泽诺信息科技有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/10;G06F3/01;A63F13/215;A63F13/21;A63F13/424;A63F13/52 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙)11390 | 代理人: | 胡剑辉 |
地址: | 230000 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 识别 人体 姿态 人机 交互式 游戏 引擎 | ||
技术领域
本发明属于语音识别技术领域,特别是涉及一种基于语音识别和人体姿态的人机交互式游戏引擎。
背景技术
互动式游戏引擎,就是在现有的游戏引擎中加入捕捉游戏镜头内运动体的动作以及声音这项功能。现有的游戏大多是采用键盘或操纵杆完成游戏操作,不仅会使玩家容易产生疲劳感,长时间的疲劳感又会造成玩家对游戏逐渐丧失趣味性,而且久坐玩游戏会导致玩家因缺乏锻炼而使身体健康状况下降。因此,本发明提供一种交互式游戏引擎,使玩家很方便的通过语音和人体姿态进行游戏娱乐,以达到身心娱乐的效果。
发明内容
本发明的目的在于提供一种基于语音识别和人体姿态的人机交互式游戏引擎,通过输入语音和获取人体姿态,提高了游戏玩家的操控便捷性和游戏的趣味性,解决了现有的游戏需要手动操作键盘或操纵杆进行游戏操作、趣味性较低、易导致疲劳、导致玩家普遍缺乏身体锻炼体质下降的问题。
为解决上述技术问题,本发明是通过以下技术方案实现的:
本发明为一种基于语音识别和人体姿态的人机交互式游戏引擎,包括3D场景加载模块、3D渲染模块、语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块;所述3D场景加载模块用于完成游戏静态场景的初始化并将初始化的游戏静态场景发送至3D渲染模块;所述语音输入模块用于输入语音信息并将其发送至语音预处理模块;所述语音预处理模块用于接收语音信息,然后完成对语音信息的预处理,并将预处理后的语音信息发送至端点检测模块;所述端点检测模块用于接收预处理后的语音信息、完成对语音信息的起止点的判断,并将判断后的语音信息输入到特征提取模块;所述特征提取模块用于接收端点检测模块判断后的语音信息、完成语音特征参数的提取,并将特征提取后的语音信息发送至模式匹配模块;所述模式匹配模块用于接收特征提取后的语音信息、完成对该语音信息与模板数据匹配距离的计算,并输出匹配的模板编号至3D渲染模块;所述3D渲染模块用于接收匹配模板编号和初始化的游戏静态场景,然后根据该模板编号加载人物场景的转移矩阵以及人物坐标数据。
进一步地,所述静态场景包括地面、树木、天空、人物的坐标、材质、皮肤、骨骼。
进一步地,所述语音信息的预处理包括对语音信息的预加重处理、加窗处理、分帧处理。
本发明具有以下有益效果:
本发明基于互动式游戏引擎开发游戏将会颠覆现有的游戏模式,游戏玩家不需要通过鼠标、键盘或游戏杆来操纵角色,而只要通过自己的肢体动作和声音,就可以驱动游戏中的角色做出符合玩家意愿的动作,并带动游戏情节向前发展,可以极大的增加游戏的趣味性,以及充分调动游戏玩家的积极性,互动式游戏引擎最重要的就是要使得计算机能够自动识别人的语音命令和动作,并以此来驱动游戏中模型做出相应的动作,大大提高了游戏游戏的娱乐性和宜人性;同时,在游戏玩家娱乐的同时还能放松身心、活动筋骨,达到有益身心健康的娱乐效果。
当然,实施本发明的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
图1为本发明的一种基于语音识别和人体姿态的人机交互式游戏引擎的工作流程图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1所示,本发明为一种基于语音识别和人体姿态的人机交互式游戏引擎,包括3D场景加载模块、3D渲染模块、语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块,其中3D场景加载模块与3D渲染模块相连,语音输入模块、语音预处理模块、端点检测模块、特征提取模块、模式匹配模块、3D渲染模块依次连接。
语音输入模块用于输入语音信息并将其发送至语音预处理模块。
语音预处理模块用于接收语音信息,然后完成对语音信息的预加重、加窗、分帧等预处理,并将预处理后的语音信息发送至端点检测模块。
端点检测模块用于接收预处理后的语音信息、完成对语音信息的起止点的判断,并将判断后的语音信息输入到特征提取模块。
特征提取模块用于接收端点检测模块判断后的语音信息、完成语音特征参数的提取,并将特征提取后的语音信息发送至模式匹配模块。
模式匹配模块用于接收特征提取后的语音信息、完成对该语音信息与模板数据匹配距离的计算,并输出匹配的模板编号至3D渲染模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥泽诺信息科技有限公司,未经合肥泽诺信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710379562.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:主动型效果音产生装置
- 下一篇:一种听力言语障碍残疾人的语音逆变器