[发明专利]语音交互方法和装置有效
申请号: | 201711127100.0 | 申请日: | 2017-11-15 |
公开(公告)号: | CN107895578B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 曹玉树;杨锐;赵立峰;李俊 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司;上海小度技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F3/16 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 交互 方法 装置 | ||
本申请实施例公开了语音交互方法和装置。该方法的一具体实施方式包括:响应于接收到用户的语音输入信息,确定语音输入信息中是否包括预设的唤醒词;响应于确定出语音输入信息中包括唤醒词,解析语音输入信息得到解析结果;确定解析结果中是否包括可执行请求信息;响应于确定出解析结果中不包括可执行请求信息,执行询问操作,其中,询问操作用于确定用户的用户意图。该实施方式减少了用户的操作流程以及等待时间,使得语音交互更加方便快捷。
技术领域
本申请实施例涉及计算机技术领域,具体涉及语音处理技术领域,尤其涉及语音交互方法和装置。
背景技术
目前,语音交互方式作为一种新的交互方式应用到越来越多的终端应用中,例如,可以用语音控制手机拨打电话、发送短信;可以用语音在搜索应用中代替文字输入进行搜索;可以用语音控制导航、切换路线和选择停车场等等。语音交互技术将在人们生活的各个方面提供方便快捷的服务。
发明内容
本申请实施例提出了语音交互方法和装置。
第一方面,本申请实施例提供了一种语音交互方法,包括:响应于接收到用户的语音输入信息,确定语音输入信息中是否包括预设的唤醒词;响应于确定出语音输入信息中包括唤醒词,解析语音输入信息得到解析结果;确定解析结果中是否包括可执行请求信息;响应于确定出解析结果中不包括可执行请求信息,执行询问操作,其中,询问操作用于确定用户的用户意图。
在一些实施例中,可执行请求信息包括待执行的操作的操作信息;以及执行询问操作,包括:响应于解析结果中不包括操作信息,呈现用于询问待执行的操作的询问信息。
在一些实施例中,可执行请求信息包括待执行的操作所针对的对象的对象信息;以及执行询问操作,包括:响应于解析结果中不包括对象信息,呈现用于询问待执行的操作所针对的对象的询问信息。
在一些实施例中,可执行请求信息用于指示待执行的操作和待执行的操作所针对的对象;以及方法还包括:响应于确定出解析结果中包括可执行请求信息,针对对象执行待执行的操作。
在一些实施例中,该方法还包括:响应于检测到语音输入信息输入时的语音音量小于预设的音量阈值的持续时长达到预设持续时长阈值,确定停止接收用户的语音输入信息。
在一些实施例中,该方法还包括:响应于确定出语音输入信息中包括预设的语音输入终止命令词,确定停止接收用户的语音输入信息。
在一些实施例中,该方法还包括:响应于确定出用户输入语音输入信息的输入时长大于预设的输入时长阈值,确定停止接收用户的语音输入信息。
在一些实施例中,确定语音输入信息中是否包括预设的唤醒词,包括:提取语音输入信息中的声纹特征向量;将声纹特征向量与预先存储的目标用户的注册声纹向量进行匹配,并生成声纹特征向量与注册声纹向量之间的匹配度;响应于匹配度大于等于预设的匹配度阈值,确定语音输入信息中是否包括预设的唤醒词。
第二方面,本申请实施例提供了一种语音交互装置,包括:第一确定单元,配置用于响应于接收到用户的语音输入信息,确定语音输入信息中是否包括预设的唤醒词;解析单元,配置用于响应于确定出语音输入信息中包括唤醒词,解析语音输入信息得到解析结果;第二确定单元,配置用于确定解析结果中是否包括可执行请求信息;第一执行单元,配置用于响应于确定出解析结果中不包括可执行请求信息,执行询问操作,其中,询问操作用于确定用户的用户意图。
在一些实施例中,可执行请求信息包括待执行的操作的操作信息;以及执行单元进一步配置用于:响应于解析结果中不包括操作信息,呈现用于询问待执行的操作的询问信息。
在一些实施例中,可执行请求信息包括待执行的操作所针对的对象的对象信息;以及执行单元进一步配置用于:响应于解析结果中不包括对象信息,呈现用于询问待执行的操作所针对的对象的询问信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司;上海小度技术有限公司,未经百度在线网络技术(北京)有限公司;上海小度技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711127100.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:服务机器人的识别启动方法及装置
- 下一篇:一种图像与音频结合的方法及装置