[发明专利]语音处理装置、语音处理方法和记录介质在审

申请号：	201980041484.5	申请日：	2019-05-27
公开（公告）号：	CN112313743A	公开（公告）日：	2021-02-02
发明（设计）人：	加岛浩三	申请（专利权）人：	索尼公司
主分类号：	G10L15/22	分类号：	G10L15/22;G06F3/01;G06F3/16;G10L15/10
代理公司：	北京康信知识产权代理有限责任公司 11240	代理人：	余刚
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音处理装置方法记录介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种语音处理装置，包括：接收单元(30)，被配置为接收与预定时间长度对应的语音以及与用于启动与该语音对应的预定功能的触发相关的信息，以及确定单元(51)，被配置为根据由接收单元(30)接收的与触发相关的信息，在与预定时间长度对应的语音中确定用于执行预定功能的语音。

技术领域

本公开涉及语音处理装置、语音处理方法和记录介质。具体地，本公开涉及用于从用户接收的话语的语音识别处理。

背景技术

随着智能电话和智能扬声器的广泛使用，用于响应从用户接收的话语的语音识别技术已被广泛使用。在这样的语音识别技术中，预先设置作为用于启动语音识别的触发的唤醒词，并且在确定用户说出唤醒词的情况下，启动语音识别。

作为与语音识别相关的技术，已知一种用于根据用户的运动来动态地设置要说出的唤醒词，以防止由于唤醒词的说出而削弱用户体验的技术。

现有技术文献

专利文献

专利文献1：日本专利申请公开第2016-218852号

发明内容

技术问题

然而，在上述传统技术中存在改进的空间。例如，在使用唤醒词执行语音识别处理的情况下，用户向基于用户首先说出唤醒词的假设来控制语音识别的设备讲话。因此，例如，在用户输入特定话语而忘记说出唤醒词的情况下，不启动语音识别，并且用户应当再次说出唤醒词和话语的内容。这使得用户浪费时间和精力，并且可用性可能恶化。

因此，本公开提供了一种可以提高与语音识别相关的可用性的语音处理装置、语音处理方法和记录介质。

问题解决方案

为了解决上述问题，一种语音处理装置，包括：接收单元，被配置为接收与预定时间长度对应的语音以及与用于启动与所述语音对应的预定功能的触发相关的信息；以及确定单元，被配置为根据由接收单元接收的与触发相关的信息，在与预定时间长度对应的语音中确定用于执行预定功能的语音。

本发明的有益效果

通过根据本公开的语音处理装置、语音处理方法和记录介质，可以提高与语音识别相关的可用性。本文所述的效果不是限制性的，并且可以使用本文所述的任何效果。

附图说明

图1是示出根据本公开的第一实施方式的信息处理的概要的示图。

图2是用于解释根据本公开的第一实施方式的话语提取处理的示图。

图3是示出根据本公开的第一实施方式的智能扬声器的配置示例的示图。

图4是示出根据本公开的第一实施方式的话语数据的示例的示图。

图5是示出根据本公开的第一实施方式的组合数据的示例的示图。

图6是示出根据本发明的第一实施方式的唤醒词数据的示例的示图。