[发明专利]进行自动语音应答处理的方法、装置、设备及存储介质有效
| 申请号: | 202010114987.5 | 申请日: | 2020-02-25 |
| 公开(公告)号: | CN111327772B | 公开(公告)日: | 2021-09-17 |
| 发明(设计)人: | 原俊;郭润增;黄家宇;吴志伟;张颖;耿志军 | 申请(专利权)人: | 广州腾讯科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;H04M3/493;G10L15/24;G10L15/26;G10L17/22;G06F16/332;G06F16/335;G06F16/635;G06F16/64;G06F16/683;G06K9/00 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 510310 广东省广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 进行 自动 语音 应答 处理 方法 装置 设备 存储 介质 | ||
本申请公开了一种进行自动语音应答处理的方法、装置、设备及存储介质,属于互联网技术领域。所述方法包括:获取用户的图像数据;基于所述图像数据和预先训练的用户属性状态分析模型,确定所述用户的属性状态信息;基于所述属性状态信息和预先训练的交互风格分析模型,确定对所述用户进行自动语音应答的目标交互风格信息;基于所述目标交互风格信息,进行自动语音应答处理。本申请通过获取用户的属性状态信息,确定对应的交互风格信息,再根据确定的交互风格信息与用户进行自动语音应答,从而,提高了自动语音应答的灵活性。
技术领域
本申请涉及互联网技术领域,特别涉及一种进行自动语音应答处理的方法、装置、设备及存储介质。
背景技术
随着人工智能的发展,现在越来越多的设备可实现与用户进行语音互动的功能,例如,智能机器人可以与用户进行对话沟通。
在现有技术中,各种设备可以通过语音识别技术识别用户的语音,然后根据预先训练的语音对话模型,确定与用户的对话内容,最后通过终端播放对话内容的音频,从而完成与用户的语音互动。
在实现本申请的过程中,发明人发现现有技术至少存在以下问题:终端与用户进行语音互动时,播放的音频对应的语音风格单一,与所有用户都是用相同的语音风格进行对话,进行自动语音应答的灵活性较差。
发明内容
本申请实施例提供了一种进行自动语音应答处理的方法、装置、设备及存储介质,能够增加终端与用户进行语音互动时,播放的音频对应的语音风格的多样性,所述技术方案如下:
一方面,提供了一种进行自动语音应答处理的方法,所述方法包括:
获取用户的图像数据;
基于所述图像数据和预先训练的用户属性状态分析模型,确定所述用户的属性状态信息;
基于所述属性状态信息和预先训练的交互风格分析模型,确定对所述用户进行自动语音应答的目标交互风格信息;
基于所述目标交互风格信息,进行自动语音应答处理。
可选的,所述获取用户的图像数据之后,所述方法还包括:
对所述用户的图像数据进行人脸识别;
基于所述用户的图像数据,确定所述用户的账户,获取所述账户的历史操作信息;
所述基于所述属性状态信息和预先训练的交互风格分析模型,确定对所述用户进行自动语音应答的目标交互风格信息,包括:
基于所述属性状态信息、所述历史操作信息和预先训练的交互风格分析模型,确定对所述用户进行自动语音应答的目标交互风格信息。
可选的,所述目标交互风格信息包括目标语音风格信息;
所述基于所述目标语音风格信息,进行自动语音应答处理,包括:
获取用户语音音频;
对所述用户音频进行识别,生成对应的文字;
基于所述文字,以及预先训练的对话模型,确定目标交互文字;
基于语音合成算法,与所述目标语音风格信息对应的调节参数,将目标交互文字转化成与所述目标语音风格信息对应的目标应答语音音频;
播放所述目标应答语音音频。
可选的,所述目标交互风格信息还包括目标背景音乐风格信息;
所述方法还包括:
播放所述目标背景音乐风格信息对应的背景音乐。
可选的,所述目标交互风格信息还包括目标显示画面风格信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州腾讯科技有限公司,未经广州腾讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010114987.5/2.html,转载请声明来源钻瓜专利网。





