[发明专利]语音识别系统在审
申请号: | 201910527672.0 | 申请日: | 2019-06-18 |
公开(公告)号: | CN112102817A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 张鹤;程德生;江永渡;蒋洵;王梨;万晶;江峰;李振;朱文;张羽;吕玲 | 申请(专利权)人: | 杭州中软安人网络通信股份有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L15/08 |
代理公司: | 北京兰亭信通知识产权代理有限公司 11667 | 代理人: | 赵永刚 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 | ||
1.一种语音识别系统,其特征在于,包括:
前端模块,用于对来自外部应用程序的音频信号输入进行处理以便输出特征流;
解码器模块,用于根据来自于所述前端模块的特征流和来自于语言专家模块的搜索图,输出结果对象的实例;
语言专家模块,用于为所述解码器模块提供所需的各种层次的知识组成的搜索图。
2.根据权利要求1所述的系统,其特征在于,所述解码器模块包括搜索管理模块,所述搜索管理模块用于对给定数量的特征流进行识别,返回结果对象的实例。
3.根据权利要求2所述的系统,其特征在于,所述搜索管理模块提供两种搜索管理:并行搜索管理和标记搜索管理,所述并行搜索管理在所述前端模块使用并行特征流时所使用,所述标记搜索管理在非并行特征流的情况下使用。
4.根据权利要求1所述的系统,其特征在于,所述语言专家模块包括声学模型子模块、语言模型子模块和字典子模块,所述声学模型子模块作为一个接口,所述语言模型子模块用于提供词级层次的语言结构信息,所述字典子模块用于提供语言模型中词的发音。
5.根据权利要求4所述的系统,其特征在于,所述语言模型子模块用于基于卷积神经网络的语言模型提供词级层次的语言结构信息。
6.根据权利要求5所述的系统,其特征在于,所述基于卷积神经网络的语言模型包括前馈神经网络语言模型和循环神经网络语言模型。
7.根据权利要求4所述的系统,其特征在于,所述语言模型子模块的实现包括语法规则的实现和统计语言模型的实现。
8.根据权利要求1所述的系统,其特征在于,所述解码器模块所需的各种层次的知识包括词级层次的知识、音素级层次的知识和子音素级层次的知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州中软安人网络通信股份有限公司,未经杭州中软安人网络通信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910527672.0/1.html,转载请声明来源钻瓜专利网。