[发明专利]一种虚拟人物语音与口型同步的建模与控制方法有效

申请号：	201810199537.3	申请日：	2018-03-12
公开（公告）号：	CN108447474B	公开（公告）日：	2020-10-16
发明（设计）人：	朱风云;陈博;张志平;庞在虎	申请（专利权）人：	北京灵伴未来科技有限公司
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/25;G10L13/02;G10L13/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100083 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种虚拟人物语音口型同步建模控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于语音合成领域的虚拟人物姿态控制，具体涉及一种虚拟人物语音与口型同步的建模与控制方法。目的是减少口型动画数据标注量，并获得准确、自然流畅并与声音同步的口型动作。该方法包括：产生待同步语音对应的音素序列；将音素序列转换为音素类别序列；将音素类别序列转换为静态口型配置序列；通过动态模型将在时间轴上排布的静态口型配置序列转换为动态变化的口型配置；将动态变化的口型配置渲染成虚拟人物头颈部的姿态形象，同步配合语音信号进行展示。该方法可以不依赖于口型动画数据，并利用语音学先验知识和动态模型实现高效自然的虚拟人物口型同步控制。

技术领域

本发明属于语音合成领域的虚拟人物姿态控制，具体涉及一种虚拟人物语音与口型同步的建模与控制方法。

背景技术

虚拟人物建模与渲染技术在动画、游戏和电影等行业得到广泛应用，并且使虚拟人物讲话时能够具有自然流畅并与声音同步的口型动作是提升用户体验的关键。

目前，给虚拟人物对口型是一项非常消耗时间和人力的工作，设计师需要根据音频的内容在时间轴上调整口型配置。一些基于机器学习的方法可以从大量口型动画中学习得到模型，并利用模型为其他输入语音产生口型。但这类方法依赖大量的口型动画作为训练数据，严重依赖数据量和标注工作。

因此，如何减少口型动画数据标注量，并获得准确、自然流畅并与声音同步的口型动作是目前亟需解决的问题。

发明内容

本发明提供一种虚拟人物语音与口型同步的建模与控制方法，无需口型动画数据标注量，并能够获得准确、自然流畅并与声音同步的口型动作。

一种口型建模方法，包括如下方法：

步骤一、将语音音素划分为不同的音素类别；

步骤二、为每个音素类别定义一个静态发音姿态；

步骤三、为每个静态发音姿态建立相应的虚拟人物渲染系统的一组静态口型配置。