[发明专利]语音识别方法及装置有效

申请号：	201510051345.4	申请日：	2015-01-30
公开（公告）号：	CN105989838B	公开（公告）日：	2019-09-06
发明（设计）人：	孙廷玮;林福辉	申请（专利权）人：	展讯通信（上海）有限公司
主分类号：	G10L15/14	分类号：	G10L15/14
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	潘彦君;骆苏华
地址：	201203 上海市浦东新区浦东***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	一种语音识别方法及装置，所述方法包括：将采集到的输入声音信号进行处理，得到输入声音数据；对所述输入声音数据进行几何重塑，得到降维后的所述输入声音数据的低维表征数据；采用所述输入声音数据的低维表征数据与预设的降维后的声音训练数据的低维表征数据，计算得出所述输入声音数据的VAD分值，所述声音训练数据的低维数据表征通过对所述声音训练数据进行几何重塑得到；当确定计算得出的VAD分值大于预设的分值阈值时，对所述声音数据进行语音识别。上述的方案可以节约语音识别的时间和计算资源。
搜索关键词：	语音识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种语音识别方法，其特征在于，包括：将采集到的输入声音信号进行处理，得到输入声音数据；对所述输入声音数据进行几何重塑，得到降维后的所述输入声音数据的低维表征数据；采用所述输入声音数据的低维表征数据与预设的降维后的声音训练数据的低维表征数据，计算得出所述输入声音数据的VAD分值，所述声音训练数据的低维数据表征通过对所述声音训练数据进行几何重塑得到；当确定计算得出的VAD分值大于预设的分值阈值时，对所述声音数据进行语音识别；其中，所述对所述声音数据进行几何重塑，得到所述声音数据的低维表征数据，包括：获取所述输入声音数据的MFCC，及其对应的MFCC频带数量的信息；将所获取的所述输入声音数据的MFCC划分成不同的时隙，并根据所得到的MFCC频带数量的信息，计算得出所述输入声音数据的对数似然比；采用计算得出的所述输入声音数据的对数似然比，构建所述输入声音数据的特征矩阵；构建所述输入声音数据的特征矩阵对应的相似矩阵；对所述输入声音数据的特征矩阵对应的相似矩阵进行拉普拉斯特征提取，得到拉普拉斯特征矩阵和特征值，将最小的预设个数的非零特征值对应的特征向量作为所述输入声音数据的低维表征数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于展讯通信（上海）有限公司，未经展讯通信（上海）有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510051345.4/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别方法及装置有效

专利文献下载