[发明专利]一种语音交互方法、装置、终端设备及存储介质有效
申请号: | 201910657258.1 | 申请日: | 2019-07-19 |
公开(公告)号: | CN112242143B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G10L17/22 | 分类号: | G10L17/22 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 交互 方法 装置 终端设备 存储 介质 | ||
本公开实施例公开了一种语音交互方法、装置、电子设备及存储介质,该方法包括:接收语音请求;对所述语音请求进行意图识别,得到目标意图和临时槽位;将与所述临时槽位同音的汉字进行显示,以供用户选择;将被选择的所述汉字确定为目标槽位;根据所述目标意图和所述目标槽位对所述语音请求进行响应。本公开实施例的技术方案,提高了语音交互的正确率和效率。
技术领域
本公开实施例涉及语音处理技术,尤其涉及一种语音交互方法、装置、终端设备及存储介质。
背景技术
人机交互是指人与计算机之间使用特定自然语言进行交互,完成信息交换的过程。随着人工智能技术的快速发展,人机交互的应用越来越广泛,例如,商业、家居、教育、科技和服务等领域中均涉及人机交互的应用。且人们对方便快捷、高效准确的智能服务的需求越来越强烈。
自然语言作为人类表达自己思想最方便、最常用的方式,已经逐渐成为智能服务领域主流的人机交互方式。然而,目前的智能语音识别系统对用户发出的基于单字的语音请求的识别准确率还较低,尤其对于同音不同字的单字语音请求甚至基本无法进行正确交互。例如,用户语音说出:“瞰”字怎么组词?此时语音识别系统无法获知用户说的“瞰”是哪个“瞰/看”,故无法与用户进行正确的交互。
发明内容
本公开实施例提供一种语音交互方法、装置、终端设备及存储介质,以提高语音交互的正确率和效率。
第一方面,本公开实施例提供了一种语音交互方法,该方法包括:接收语音请求;对所述语音请求进行意图识别,得到目标意图和临时槽位;将与所述临时槽位同音的汉字进行显示,以供用户选择;将被选择的所述汉字确定为目标槽位;根据所述目标意图和所述目标槽位对所述语音请求进行响应。
第二方面,本公开实施例还提供了一种语音交互装置,该装置包括:接收模块,用于接收语音请求;识别模块,用于对所述语音请求进行意图识别,得到目标意图和临时槽位;显示模块,用于将与所述临时槽位同音的汉字进行显示,以供用户选择;确定模块,用于将被选择的所述汉字确定为目标槽位;响应模块,用于根据所述目标意图和所述目标槽位对所述语音请求进行响应。
第三方面,本公开实施例还提供了一种设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例任一所述的语音交互方法。
第四方面,本公开实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例任一所述的语音交互方法。
本公开实施例的技术方案,通过接收语音请求;对所述语音请求进行意图识别,得到目标意图和临时槽位;将与所述临时槽位同音的汉字进行显示,以供用户选择;将被选择的所述汉字确定为目标槽位;根据所述目标意图和所述目标槽位对所述语音请求进行响应的技术手段,实现了提高语音交互正确率和效率的目的。
附图说明
结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
图1为本公开实施例一所提供的一种语音交互方法流程示意图;
图2为本公开实施例二所提供的一种语音交互方法流程示意图;
图3为本公开实施例三所提供的一种语音交互装置结构示意图;
图4为本公开实施例四所提供的一种电子设备结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910657258.1/2.html,转载请声明来源钻瓜专利网。