[发明专利]进行自动语音应答处理的方法、装置、设备及存储介质有效

申请号：	202010114987.5	申请日：	2020-02-25
公开（公告）号：	CN111327772B	公开（公告）日：	2021-09-17
发明（设计）人：	原俊;郭润增;黄家宇;吴志伟;张颖;耿志军	申请（专利权）人：	广州腾讯科技有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;H04M3/493;G10L15/24;G10L15/26;G10L17/22;G06F16/332;G06F16/335;G06F16/635;G06F16/64;G06F16/683;G06K9/00
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	祝亚男
地址：	510310 广东省广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	进行自动语音应答处理方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种进行自动语音应答处理的方法、装置、设备及存储介质，属于互联网技术领域。所述方法包括：获取用户的图像数据；基于所述图像数据和预先训练的用户属性状态分析模型，确定所述用户的属性状态信息；基于所述属性状态信息和预先训练的交互风格分析模型，确定对所述用户进行自动语音应答的目标交互风格信息；基于所述目标交互风格信息，进行自动语音应答处理。本申请通过获取用户的属性状态信息，确定对应的交互风格信息，再根据确定的交互风格信息与用户进行自动语音应答，从而，提高了自动语音应答的灵活性。

技术领域

本申请涉及互联网技术领域，特别涉及一种进行自动语音应答处理的方法、装置、设备及存储介质。

背景技术

随着人工智能的发展，现在越来越多的设备可实现与用户进行语音互动的功能，例如，智能机器人可以与用户进行对话沟通。

在现有技术中，各种设备可以通过语音识别技术识别用户的语音，然后根据预先训练的语音对话模型，确定与用户的对话内容，最后通过终端播放对话内容的音频，从而完成与用户的语音互动。

在实现本申请的过程中，发明人发现现有技术至少存在以下问题：终端与用户进行语音互动时，播放的音频对应的语音风格单一，与所有用户都是用相同的语音风格进行对话，进行自动语音应答的灵活性较差。

发明内容

本申请实施例提供了一种进行自动语音应答处理的方法、装置、设备及存储介质，能够增加终端与用户进行语音互动时，播放的音频对应的语音风格的多样性，所述技术方案如下：

一方面，提供了一种进行自动语音应答处理的方法，所述方法包括：

获取用户的图像数据；

基于所述图像数据和预先训练的用户属性状态分析模型，确定所述用户的属性状态信息；

基于所述属性状态信息和预先训练的交互风格分析模型，确定对所述用户进行自动语音应答的目标交互风格信息；