[发明专利]语音识别系统以及方法在审
申请号: | 201510977841.2 | 申请日: | 2015-12-23 |
公开(公告)号: | CN106652999A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 徐智炫;李在英;李炳旭;安憬准 | 申请(专利权)人: | 三星SDS株式会社 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16;G10L15/26 |
代理公司: | 北京铭硕知识产权代理有限公司11286 | 代理人: | 李盛泉,孙昌浩 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 以及 方法 | ||
1.一种语音识别系统,其特征在于,包括:
语音输入部,接收学习用语音数据和包含表示所述学习用语音数据的字母信息的目标标签,并将所述学习用语音数据分割成设定大小的窗;
第一语音识别部,利用第一神经网络模型以及所述目标标签来学习被分割的所述窗的特征;
第二语音识别部,利用第二神经网络模型学习被抽取的所述特征的时间序列模式;
文本输出部,基于所述第一语音识别部以及所述第二语音识别部中的学习结果,将输入到所述语音输入部的目标语音数据转换成文本并输出。
2.如权利要求1所述的语音识别系统,其特征在于,
所述语音输入部将分割的所述窗中连续的两个以上的窗组合成一个组之后输入到所述第一语音识别部。
3.如权利要求2所述的语音识别系统,其特征在于,
所述语音输入部根据设定的跨距而使被分割的所述窗的个数减少之后输入到所述第一语音识别部。
4.如权利要求1所述的语音识别系统,其特征在于,
所述第一神经网络模型是卷积神经网络模型。
5.如权利要求4所述的语音识别系统,其特征在于,
所述第二神经网络模型是循环神经网络模型。
6.如权利要求5所述的语音识别系统,其特征在于,
所述第二语音识别部利用连续时序分类技术来学习针对所述目标标签的候补标签。
7.如权利要求6所述的语音识别系统,其特征在于,
所述第一语音识别部基于所述第一语音识别部中的学习结果抽取所述目标语音数据的特征;
所述第二语音识别部基于所述第二语音识别部中的学习结果抽取被抽取的所述目标语音数据的特征的时间序列模式,并从学习的所述目标标签或者所述候补标签中选取与被抽取的所述时间序列模式对应的标签。
8.如权利要求7所述的语音识别系统,其特征在于,
所述文本输出部将选取的所述标签转换成文本并输出。
9.如权利要求1所述的语音识别系统,其特征在于,还包括:
学习控制部,控制所述第一语音识别部以及所述第二语音识别部的学习率。
10.如权利要求9所述的语音识别系统,其特征在于,
所述学习控制部在所述第一语音识别部中的学习完成之前,使第一语音识别部以及所述第二语音识别部的学习率维持为相同,并且在第一语音识别部中的学习完成的情况下,将所述第一语音识别部的学习率控制为0。
11.一种语音识别方法,其特征在于,包括以下步骤:
在语音输入部中,接收学习用语音数据和包含表示所述学习用语音数据的字母信息的目标标签;
在所述语音输入部中,将所述学习用语音数据分割成设定大小的窗;
在第一语音识别部中,利用第一神经网络模型以及所述目标标签来学习被分割的所述窗的特征;
在第二语音识别部中,利用第二神经网络模型学习被抽取的所述特征的时间序列模式;以及
在文本输出部中,基于所述第一语音识别部以及所述第二语音识别部中的学习结果,将输入到所述语音输入部的目标语音数据转换成文本并输出。
12.如权利要求11所述的语音识别方法,其特征在于,
在将所述学习用语音数据分割成设定大小的窗的步骤以后,还包括以下步骤:
在所述语音输入部中,将分割的所述窗中连续的两个以上的窗组合成一个组之后输入到所述第一语音识别部。
13.如权利要求12所述的语音识别方法,其特征在于,
在输入到所述第一语音识别部的步骤中,根据设定的跨距而使被分割的所述窗的个数减少之后输入到所述第一语音识别部。
14.如权利要求11所述的语音识别方法,其特征在于,
所述第一神经网络模型是卷积神经网络模型。
15.如权利要求14所述的语音识别方法,其特征在于,
所述第二神经网络模型是循环神经网络模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星SDS株式会社,未经三星SDS株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510977841.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种音频合成的方法及终端
- 下一篇:一种基于语音信息的情感强度实验方法