[发明专利]一种语音交互方法、系统、电子设备及存储介质在审
| 申请号: | 202210725106.2 | 申请日: | 2022-06-23 |
| 公开(公告)号: | CN115148205A | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 姚树杰;田绍伟;李子建;赵言;先永春;胡加明 | 申请(专利权)人: | 鼎富新动力(北京)智能科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G10L15/26 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
| 地址: | 100000 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 交互 方法 系统 电子设备 存储 介质 | ||
1.一种语音交互方法,其特征在于,包括:
获取在机器人播报过程中的用户语音流,并在获取用户语音流时,执行以下步骤:
根据用户语音流以及播报的播报状态,判断是否打断播报。
2.如权利要求1所述的方法,其特征在于,其中,所述播报的播报状态包括播报时长和播报进度;
所述根据用户语音流以及机器人播报状态,判断是否打断播报,包括:
判断播报时长和/或播报进度是否大于对应阈值:
若是,则不打断播报;
若否,则根据所述用户语音流识别出用户打断意图,并,根据所述用户打断意图,判断是否打断播报。
3.如权利要求1所述的方法,其特征在于,所述根据用户语音流以及机器人播报状态,判断是否打断播报,包括:
将用户语音流转换为对应的用户文本信息;以及
根据用户文本信息,确定用户打断意图;其中,所述用户打断意图包括内置打断意图、业务意图和非打断意图。
4.如权利要求3所述的方法,其特征在于,所述确定用户打断意图之后,还包括:
若确定用户打断意图为内置打断意图,则打断播报并进行用户引导;其中,所述用户引导包括提示并等待用户的进一步语音流;
若确定用户打断意图为业务意图,则根据所述业务意图对应的业务配置判断是否打断播报;以及
若确定用户打断意图为非打断意图,则不打断播报。
5.如权利要求4所述的方法,其特征在于,所述根据所述用户打断意图,判断是否打断播报,还包括:
若根据业务意图对应的业务配置,确定打断播报,则继续判断当前播报是否结束;
若当前播报未结束,则打断播报,并进行话题转移,开启新对话流。
6.如权利要求1所述的方法,其特征在于,还包括:
根据原对话流的节点配置信息,确定打断播报后的新对话流结束时,是否拉回原对话流并继续播报。
7.一种语音交互系统,其特征在于,包括:
VAD模块,用于获取用户语音流;
分析模块,用于根据用户语音流以及播报的播报状态,判断是否打断播报。
8.如权利要求7所述的系统,其特征在于,其中,所述播报的播报状态包括播报时长和播报进度;所述分析模块包括:
时长判断模块,用于判断播报时长是否大于时间阈值,若是,则不打断播报;
进度判断模块,用于在播报时长不大于时间阈值时,判断播报进度是否大于进度阈值:若是,则不打断播报;
ASR模块,用于在播报进度不大于进度阈值时,将用户语音流转换为对应的用户文本信息;
NLP模块,用于根据用户文本信息,确定用户打断意图;其中,所述用户打断意图包括内置打断意图、业务意图和非打断意图。
9.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器存储有所述处理器可执行的机器可读指令,所述机器可读指令被所述处理器执行时执行如权利要求1-6任一所述的方法。
10.一种计算机可读存储介质,其特征在于,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1-6任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富新动力(北京)智能科技有限公司,未经鼎富新动力(北京)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210725106.2/1.html,转载请声明来源钻瓜专利网。





