[发明专利]信息处理装置、信息处理方法以及记录介质在审
申请号: | 201910149009.1 | 申请日: | 2019-02-28 |
公开(公告)号: | CN110808039A | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 渡辺奈夕子;笼岛岳彦;藤村浩司 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G06F40/247 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 11038 | 代理人: | 金春实 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 装置 方法 以及 记录 介质 | ||
提供一种信息处理装置、信息处理方法以及记录介质。实现声音识别提高。信息处理装置(10)具备检测部(12B)和声音识别部(12C)。检测部(12B)从声音信号(40)检测表示声音识别开始的触发。声音识别部(12C)使用与检测到的所述触发对应的带触发的声音识别词典(26B),对包含触发的触发音区间的后续的识别音区间进行声音识别。
技术领域
本发明的实施方式涉及信息处理装置、信息处理方法以及记录介质。
背景技术
识别用户发出的命令并进行设备的操作的声音识别装置被实用化。在这样的装置中,进行如下动作:在检测到表示基于特定的关键词的发声等的声音识别开始的触发时,进行之后发出的声音识别。
然而,以往,在进行了连续发话的情况下,有时无法进行在触发的检测以及触发之后发出的声音的声音识别。
现有技术文献
专利文献
专利文献1:日本特开2015-194766号公报
发明内容
本发明要解决的问题涉及能够实现声音识别的提高的信息处理装置、信息处理方法以及记录介质。
实施方式的信息处理装置具备检测部和声音识别部。检测部从声音信号检测表示声音识别开始的触发。声音识别部使用与检测到的所述触发对应的带触发的声音识别词典,对包含所述触发的触发音区间的后续的识别音区间进行声音识别。
附图说明
图1是信息处理装置的功能框图。
图2A是示出触发词典的数据结构的一个例子的示意图。
图2B是示出多个触发词典的数据结构的一个例子的示意图。
图3是触发检测和声音识别处理的一个例子的说明图。
图4A是单位区间的一个例子的说明图。
图4B是单位区间的一个例子的说明图。
图4C是单位区间的一个例子的说明图。
图5是声音识别处理的一个例子的说明图。
图6是示出声音识别处理的次序的一个例子的流程图。
图7A是现有技术的声音识别的说明图。
图7B是现有技术的声音识别的说明图。
图8A是声音识别的说明图。
图8B是声音识别的说明图。
图9是示出硬件结构例的框图。
(附图标记说明)
10:信息处理装置;12B:检测部;12C:声音识别部;12D:输出控制部;12E:受理部;26B:带触发的声音识别词典;26C:声音识别词典。
具体实施方式
以下,参照附图,详细地说明信息处理装置、信息处理方法以及记录介质。
图1为本实施方式的信息处理装置10的功能框图的一个例子。信息处理装置10对声音信号进行声音识别。
信息处理装置10具备控制部12、接收部15、输出部17、输入部22、声音存储部24以及存储部26。控制部12与接收部15、输出部17、输入部22、声音存储部24以及存储部26以能够交换数据、信号的方式连接。
接收部15受理声音信号。声音信号是表示声音的信号。声音信号由音信号的时间序列集合表示。音信号是表示在某个定时收集到的音的信号。即,声音信号由在各定时收集到的音信号的时间序列集合表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910149009.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:支撑组件及智能终端
- 下一篇:一种酒店智能问答推荐与决策支持分析方法及系统