[发明专利]语音处理装置、语音处理方法和记录介质在审
| 申请号: | 201980041484.5 | 申请日: | 2019-05-27 |
| 公开(公告)号: | CN112313743A | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | 加岛浩三 | 申请(专利权)人: | 索尼公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G06F3/01;G06F3/16;G10L15/10 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 余刚 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 处理 装置 方法 记录 介质 | ||
一种语音处理装置,包括:接收单元(30),被配置为接收与预定时间长度对应的语音以及与用于启动与该语音对应的预定功能的触发相关的信息,以及确定单元(51),被配置为根据由接收单元(30)接收的与触发相关的信息,在与预定时间长度对应的语音中确定用于执行预定功能的语音。
技术领域
本公开涉及语音处理装置、语音处理方法和记录介质。具体地,本公开涉及用于从用户接收的话语的语音识别处理。
背景技术
随着智能电话和智能扬声器的广泛使用,用于响应从用户接收的话语的语音识别技术已被广泛使用。在这样的语音识别技术中,预先设置作为用于启动语音识别的触发的唤醒词,并且在确定用户说出唤醒词的情况下,启动语音识别。
作为与语音识别相关的技术,已知一种用于根据用户的运动来动态地设置要说出的唤醒词,以防止由于唤醒词的说出而削弱用户体验的技术。
现有技术文献
专利文献
专利文献1:日本专利申请公开第2016-218852号
发明内容
技术问题
然而,在上述传统技术中存在改进的空间。例如,在使用唤醒词执行语音识别处理的情况下,用户向基于用户首先说出唤醒词的假设来控制语音识别的设备讲话。因此,例如,在用户输入特定话语而忘记说出唤醒词的情况下,不启动语音识别,并且用户应当再次说出唤醒词和话语的内容。这使得用户浪费时间和精力,并且可用性可能恶化。
因此,本公开提供了一种可以提高与语音识别相关的可用性的语音处理装置、语音处理方法和记录介质。
问题解决方案
为了解决上述问题,一种语音处理装置,包括:接收单元,被配置为接收与预定时间长度对应的语音以及与用于启动与所述语音对应的预定功能的触发相关的信息;以及确定单元,被配置为根据由接收单元接收的与触发相关的信息,在与预定时间长度对应的语音中确定用于执行预定功能的语音。
本发明的有益效果
通过根据本公开的语音处理装置、语音处理方法和记录介质,可以提高与语音识别相关的可用性。本文所述的效果不是限制性的,并且可以使用本文所述的任何效果。
附图说明
图1是示出根据本公开的第一实施方式的信息处理的概要的示图。
图2是用于解释根据本公开的第一实施方式的话语提取处理的示图。
图3是示出根据本公开的第一实施方式的智能扬声器的配置示例的示图。
图4是示出根据本公开的第一实施方式的话语数据的示例的示图。
图5是示出根据本公开的第一实施方式的组合数据的示例的示图。
图6是示出根据本发明的第一实施方式的唤醒词数据的示例的示图。
图7是示出根据本公开的第一实施方式的交互处理的示例的示图(1)。
图8是示出根据本公开的第一实施方式的交互处理的示例的示图(2)。
图9是示出根据本公开的第一实施方式的交互处理的示例的示图(3)。
图10是示出根据本公开的第一实施方式的交互处理的示例的示图(4)。
图11是示出根据本公开的第一实施方式的交互处理的示例的示图(5)。
图12是示出根据本公开的第一实施方式的处理过程的流程图(1)。
图13是示出根据本公开的第一实施方式的处理过程的流程图(2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司,未经索尼公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980041484.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于电能的存储单元、及其监控方法和车辆
- 下一篇:复合组合物





