[发明专利]语音识别系统和用于语音识别的方法有效

申请号：	201780090477.5	申请日：	2017-11-10
公开（公告）号：	CN110603583B	公开（公告）日：	2023-10-24
发明（设计）人：	堀贵明;渡部晋治;J·赫尔希	申请（专利权）人：	三菱电机株式会社
主分类号：	G10L15/32	分类号：	G10L15/32;G10L15/16
代理公司：	北京三友知识产权代理有限公司 11127	代理人：	刘久亮;黄纶伟
地址：	日本***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：	语音识别系统包括接收声音的输入装置、一个或更多个处理器、以及存储参数和程序模块的一个或更多个储存装置，所述程序模块包括一个或更多个处理器可执行的指令。指令包括：从由声音转换的音频波形数据中提取声学特征序列；使用具有编码器网络参数的编码器网络将声学特征序列编码为隐藏向量序列(HVS)；通过将HVS馈送到具有解码器网络参数的解码器网络来预测第一输出标签序列概率(OLSP)；由联结主义时间分类(CTC)模块使用CTC网络参数和来自编码器网络的所述(HVS)，来预测第二(OLSP)；以及使用标签序列搜索模块，通过将从解码器网络和CTC模块提供的第一(OLSP)和第二(OLSP)组合，来搜索具有最高序列概率的输出标签序列。
搜索关键词：	语音识别系统用于方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音识别系统，该语音识别系统包括：/n输入装置，该输入装置接收声音；/n一个或更多个处理器；以及/n一个或更多个储存装置，所述一个或更多个储存装置存储参数和程序模块，所述程序模块包含能够由所述一个或更多个处理器执行的指令，所述指令在被执行时使得所述一个或更多个处理器执行包括以下项的操作：/n使用声学特征提取模块从由声音转换的音频波形数据中提取声学特征序列；/n使用具有编码器网络参数的编码器网络将所述声学特征序列编码为隐藏向量序列；/n通过将所述隐藏向量序列馈送到具有解码器网络参数的解码器网络来预测第一输出标签序列概率；/n使用联结主义时间分类CTC网络参数和来自所述编码器网络的所述隐藏向量序列，由CTC模块来预测第二输出标签序列概率；以及/n使用标签序列搜索模块，通过将从所述解码器网络和所述CTC模块提供的所述第一输出标签序列概率和所述第二输出标签序列概率组合，来搜索具有最高序列概率的输出标签序列。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于三菱电机株式会社，未经三菱电机株式会社许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201780090477.5/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别系统和用于语音识别的方法有效

专利文献下载