[发明专利]一种语音交互方法、系统、电子设备及存储介质在审
申请号: | 202210725106.2 | 申请日: | 2022-06-23 |
公开(公告)号: | CN115148205A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 姚树杰;田绍伟;李子建;赵言;先永春;胡加明 | 申请(专利权)人: | 鼎富新动力(北京)智能科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/18;G10L15/26 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
地址: | 100000 北京市朝阳区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 系统 电子设备 存储 介质 | ||
本申请提供一种语音交互方法、系统、电子设备及存储介质,在双工通信的基础上,在对话机器人播报过程中获取到用户语音流,根据用户语音流以及播报的播报状态,判断是否打断播报,使机器人在“说话”的过程中及时捕捉和理解用户的“输入”,理解到有意义的语义则暂停播报并针对最新输入进行答复或采取相应动作,在用户想要打断对话时能够打断对话机器人的当前播报,提高了客户在交流过程中的拟人化交流及个性化体验,提高了对话的灵活性。并且,相较于纯语义打断,结合了语义和播报状态综合判断是否需要打断的打断策略更具有可控性和灵活性,可配置性也更强。
技术领域
本申请涉及语音交互、人机对话技术领域,具体而言,涉及一种语音交互方法、系统、电子设备及存储介质。
背景技术
将语音、知识库与面向任务的多轮对话与问答的技术相结合的对话与问答系统已经越来越多的出现和应用于各领域,以解决客服、营销、咨询、提醒等各种业务问题。
现有技术中,当用户对智能对话机器人产生反感情绪或者用户认为智能对话机器人没有理解其所要表达的意思想要打断智能对话机器人时,智能对话机器人不知道应当如何处理,仍然继续与用户对话,这种不支持打断的对话略显机械、交互过程死板僵硬,对人不友好,不能做到“边说边听边思考”,无法满足对语音对话系统的高要求。
发明内容
本申请实施例的目的在于提供一种语音交互方法、系统、电子设备及存储介质,用以现有技术的智能对话机器人在用户想要打断对话时,智能对话机器人不知道应当如何处理,仍然继续与用户对话,这种不支持打断的对话略显机械、交互过程死板僵硬,对人不友好,不能做到“边说边听边思考”,无法满足对语音对话系统的高要求的技术问题。
本申请实施例提供的一种语音交互方法,包括:
获取在机器人播报过程中的用户语音流,并在获取用户语音流时,执行以下步骤:
根据用户语音流以及播报的播报状态,判断是否打断播报。
上述技术方案中,在双工通信的基础上,在对话机器人播报过程中获取到用户语音流,根据用户语音流以及播报的播报状态,判断是否打断播报,使机器人在“说话”的过程中及时捕捉和理解用户的“输入”,理解到有意义的语义则暂停播报并针对最新输入进行答复或采取相应动作,也就是说,机器人“说”的同时“倾听”用户有没有说话,同时思考是否要“被打断”,根据用户最新的说话内容进行应答,在用户想要打断对话时能够打断对话机器人的当前播报,提高了客户在交流过程中的拟人化交流及个性化体验,提高了对话的灵活性。并且,相较于纯语义打断,结合了语义和播报状态综合判断是否需要打断的打断策略更具有可控性和灵活性,可配置性也更强。
在一些可选的实施方式中,其中,播报的播报状态包括播报时长和播报进度;
根据用户语音流以及机器人播报状态,判断是否打断播报,包括:
判断播报时长和/或播报进度是否大于对应阈值:
若是,则不打断播报;
若否,则根据所述用户语音流识别出用户打断意图,并,根据所述用户打断意图,判断是否打断播报。
在一些可选的实施方式中,根据用户语音流以及机器人播报状态,判断是否打断播报,包括:
判断播报时长是否大于时间阈值;若是,则不打断播报;
若否,则继续判断播报进度是否大于进度阈值;若是,则不打断播报;
若否,则根据用户语音流识别出用户打断意图;
根据用户打断意图,判断是否打断播报。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富新动力(北京)智能科技有限公司,未经鼎富新动力(北京)智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210725106.2/2.html,转载请声明来源钻瓜专利网。