[发明专利]语音处理装置、语音处理方法以及记录介质在审
申请号: | 201980038331.5 | 申请日: | 2019-05-15 |
公开(公告)号: | CN112262432A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 镰田智恵 | 申请(专利权)人: | 索尼公司 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G06F3/0487;G06F3/16;G10L15/10 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 装置 方法 以及 记录 介质 | ||
本发明提出一种能够改进与语音识别有关的可用性的语音处理装置、语音处理方法以及记录介质。语音处理装置(1)包括:声音收集单元(12),其收集语音并且将所收集的语音存储在语音存储单元(20)中;检测单元(13),其检测用于使与语音相对应的预定功能启动的时机;以及执行单元(14),如果通过检测单元(13)检测到时机,则基于在检测到时机的时间之前收集的语音来执行预定功能。
技术领域
本公开涉及一种语音处理装置、语音处理方法以及记录介质。具体地,本公开涉及一种用于从用户接收的话语的语音识别处理。
背景技术
随着智能手机和智能扬声器的广泛使用,已经广泛使用用于响应从用户接收的话语的语音识别技术。在这样的语音识别技术中,预先设置作为用于启动语音识别的触发的唤醒字,并且在确定用户发出唤醒字的情况下,启动语音识别。
作为与语音识别有关的技术,已知一种用于根据用户的动作动态地设置要发出的唤醒字以防止由于唤醒字的发出而损害用户体验的技术。
引用列表
专利文献
专利文献1:日本公开专利公报第2016-218852号
发明内容
技术问题
然而,上述常规技术存在改进的空间。例如,在使用唤醒字执行语音识别处理的情况下,用户在假设用户首先发出唤醒字的情况下向控制语音识别的设备讲话。因此,例如,在用户忘记说出唤醒字的同时输入特定话语的情况下,不启动语音识别,并且用户应该再次说出唤醒字和话语的内容。该事实导致用户浪费时间和精力,并且可用性可能劣化。
因此,本公开提供一种可以改进与语音识别有关的可用性的语音处理装置、语音处理方法以及记录介质。
问题的解决方案
为了解决上述问题,根据本公开的语音处理装置包括:声音收集单元,被配置为收集语音并且将所收集的语音存储在语音存储单元中;检测单元,被配置为检测用于启动与语音相对应的预定功能的触发;以及执行单元,被配置为在通过检测单元检测到触发的情况下基于在检测到触发之前收集的语音来控制预定功能的执行。
发明的有利效果
利用根据本公开的语音处理装置、语音处理方法以及记录介质,可以改进与语音识别有关的可用性。本文所述的效果不受限制,并且可以采用本文所述的任意效果。
附图说明
[图1]是示出根据本公开的第一实施方式的信息处理的概要的示图。
[图2]是示出根据本公开的第一实施方式的语音处理系统的配置示例的示图。
[图3]是示出根据本公开的第一实施方式的处理过程的流程图。
[图4]是示出根据本公开的第二实施方式的语音处理系统的配置示例的示图。
[图5]是示出根据本公开的第二实施方式的所提取的话语数据的示例的示图。
[图6]是示出根据本公开的第二实施方式的处理过程的流程图。
[图7]是示出根据本公开的第三实施方式的语音处理系统的配置示例的示图。
[图8]是示出根据本公开的第四实施方式的语音处理装置的配置示例的示图。
[图9]是示出实现智能扬声器的功能的计算机的示例的硬件配置图。
具体实施方式
以下基于附图详细描述本公开的实施方式。在以下实施方式中,以相同的参考数字表示相同的部分,并且将不重复多余的描述。
(1.第一实施方式)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980038331.5/2.html,转载请声明来源钻瓜专利网。