[发明专利]一种唇动识别模型的构建方法及系统有效

申请号：	201710190523.0	申请日：	2017-03-27
公开（公告）号：	CN108664842B	公开（公告）日：	2020-12-18
发明（设计）人：	李颖豪	申请（专利权）人：	TCL科技集团股份有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/62
代理公司：	深圳中一联合知识产权代理有限公司 44414	代理人：	李艳丽
地址：	516006 广东省惠州市***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种识别模型构建方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种唇动识别模型的构建方法及系统，其中方法包括：通过构建读唇猜句游戏，通过所述读唇猜句游戏收集讲话视频的样本数据；根据预设建模策略对所述样本数据中讲话者的唇部动作进行建模分析，得到唇语识别模型，并建立唇语识别模型数据库。本发明实施例可以节省构建唇动识别模型所耗费的人力、财力和时间，并且提高了构建的唇动识别模型精确性和可读性。

技术领域

本发明属于计算机技术领域，尤其涉及一种唇动识别模型的构建方法及系统。

背景技术

对嘴型是指对讲词或讲话录音，替动态虚拟人制作相应的嘴部动作。人手制作动态虚拟人发音的嘴部动画是一项技术要求高而且很繁杂的工作。

现有的自动对嘴型的方法一般都是基于机器学习，机器学习本身需要大量的讲话视频和相应的讲词，训练数据的质和量会直接影响对嘴系统的优劣。

为了收集大量的讲话视频，现有的产品和研发都是使用现有的开发数据，例如新闻报道视频或者是使用者上传的视频，由于当中的视频都并非是为了读唇而制作，所以说话者都只是以自然的方式说话，其中的嘴部动作未必会清晰可读，利用这种数据所训练出来的唇动识别模型将会同样难以阅读。

相对地，为了收集高质素、清晰的视频，其中一个方法就是聘请专业人士到一个实验室环境去拍摄讲话，研究人员可以明确地要求讲者使用清晰可读的嘴型讲话，然而这种方式要收集到足够的视频就需要花费昂贵的金钱、大量的时间和人力。

发明内容

本发明实施例的目的在于提供一种唇动识别模型的构建方法及系统，旨在解决上述要收集到足够的视频需要花费昂贵的金钱、大量的时间和人力时间的问题。

本发明实施例是这样实现的，一种唇动识别模型的构建方法，包括：

构建读唇猜句游戏，通过所述读唇猜句游戏收集讲话视频的样本数据；

根据预设建模策略对所述样本数据中讲话者的唇部动作进行建模分析，得到唇语识别模型，并建立唇语识别模型数据库。