[发明专利]语音交互的方法、语音交互的装置和计算机可读存储介质在审

专利信息
申请号: 202211065134.2 申请日: 2022-09-01
公开(公告)号: CN115424606A 公开(公告)日: 2022-12-02
发明(设计)人: 林琦;谢园园;唐雄飞;李健;陈明;武卫东 申请(专利权)人: 北京捷通华声科技股份有限公司
主分类号: G10L15/00 分类号: G10L15/00;G10L15/26;G10L15/18;G10L15/16;G10L25/24
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 霍文娟
地址: 100193 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 交互 方法 装置 计算机 可读 存储 介质
【说明书】:

本申请提供了一种语音交互的方法、语音交互的装置和计算机可读存储介质。该方法包括:获取说话者的语音信息;对语音信息进行识别,确定语音信息对应的目标方言;至少根据语音信息,确定与说话者匹配的讲话风格;根据讲话风格和语音信息生成回复信息,并控制音频播报设备播放回复信息对应的语音,控制音频播报设备播放回复信息对应的语音是采用目标方言进行播报的。该方案中,对说话者的语音进行识别,可以生成符合说话者的方言特征的回复信息,这样可以使用说话者的方言与说话者进行交流,并且可以自动匹配合适的讲话风格,这样回答说话者的问题时候回复内容的相似度较低,是个性化的回复,改善了用户的体验效果。

技术领域

本申请涉及语音合成技术领域,具体而言,涉及一种语音交互的方法、语音交互的装置和计算机可读存储介质。

背景技术

我国地大物博,地区辽阔,现代汉语在不同地区有着语音、语法、习惯用语的众多差异。不同地区的人在使用对话助手系统时,大多需要使用普通话与对话助手进行交互,即使能使用方言与对话助手交流,对话助手也只是将方言转换成普通话后,经过自然语音理解,使用统一的标准话术回复,无法达到人与人之间亲切自然地沟通,在语义理解上,对话助手直接使用方言系统,这样会导致每个方言系统都需要单独训练方言模型,整个系统的扩展性较差,且播报音色大多数为普通话。因此,目前的对话助手中,由于无法使用方言与用户进行交流,回答用户的问题时回复内容的相似度较高,导致用户的体验效果较差。

发明内容

本申请的主要目的在于提供一种语音交互的方法、语音交互的装置和计算机可读存储介质,以解决现有技术中目前的对话助手中,由于无法使用方言与用户进行交流,回答用户的问题时回复内容的相似度较高,导致用户的体验效果较差的问题。

根据本发明实施例的一个方面,提供了一种语音交互的方法,包括:获取说话者的语音信息,所述语音信息是指所述说话者在说话的过程中发出的语音的信息;对所述语音信息进行识别,确定所述语音信息对应的目标方言;至少根据所述语音信息,确定与所述说话者匹配的讲话风格,所述讲话风格是指所述说话者的口语习惯的风格;根据所述讲话风格和所述语音信息生成回复信息,并控制音频播报设备播放所述回复信息对应的语音,其中,所述回复信息是对应所述说话者的所述语音信息的回复内容的信息,控制所述音频播报设备播放所述回复信息对应的语音是采用所述目标方言进行播报的。

可选地,对所述语音信息进行识别,确定所述语音信息对应的目标方言,包括:采集初始语音数据,根据所述初始语音数据构建方言库,所述初始语音数据包括多个地区的方言的语音数据,一个所述方言库包括一种方言的语音数据;对所述初始语音数据进行预处理,得到训练语音数据,所述预处理包括以下至少之一:分词处理、过滤非方言数据处理、去停用词处理;构建方言识别模型,其中,所述方言识别模型是使用多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括所述训练语音数据和所述训练语音数据对应的方言;将所述语音信息输入至所述方言识别模型中进行识别,得到识别结果,其中,所述识别结果是指所述语音信息对应的所述目标方言。

可选地,将所述语音信息输入至所述方言识别模型中进行识别,得到识别结果,包括:从多个所述方言中选取出与所述语音信息相似度大于或者等于相似度阈值的多个初始方言;从多个所述初始方言中选取出所述相似度最大的所述目标方言,得到目标识别结果。

可选地,至少根据所述语音信息,确定与所述说话者匹配的讲话风格,包括:获取预先输入的所述说话者的特征信息,所述特征信息包括以下至少之一:性别、年龄、职业、民族、地区、兴趣;根据所述说话者的所述特征信息构建用户画像;将所述说话者的所述语音信息转换为目标文本信息,所述目标文本信息是指目标语言的所述语音信息对应的文本信息;根据所述用户画像、所述目标文本信息和所述语音信息,确定与所述说话者匹配的所述讲话风格。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷通华声科技股份有限公司,未经北京捷通华声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211065134.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top