[发明专利]一种基于改进型动态时间规整语音识别算法的实现方法在审

专利信息
申请号: 201810065149.6 申请日: 2018-01-23
公开(公告)号: CN108320750A 公开(公告)日: 2018-07-24
发明(设计)人: 刘昊;吕修任;姚国良 申请(专利权)人: 东南大学—无锡集成电路技术研究所
主分类号: G10L15/28 分类号: G10L15/28
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 杨晓玲
地址: 214135 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 规整 语音识别算法 匹配路径 匹配过程 匹配距离 改进型 运算 平行四边形区域 对角线 平行四边形 相似度矩阵 边界条件 参考模板 测试模板 传统动态 范围限制 距离矩阵 路径匹配 模板匹配 内存使用 最终结果 单调性 路径点 时间帧 运算量 累加 算法 保存 成功
【说明书】:

发明公开了一种基于改进型动态时间规整语音识别算法的实现方法,包括:根据参考模板和测试模板选取匹配路径时满足边界条件、连续性和单调性约束的特点,将两者匹配路径的选取范围限制在相似度矩阵上靠近对角线周围的平行四边形区域内,因此无需计算平行四边形之外的路径点所对应的时间帧的匹配距离,并且不需要保存全部的帧匹配距离和累加距离矩阵。针对传统动态时间规整算法在匹配过程中匹配路径过多导致运算量过大的问题,本发明通过在路径匹配过程中进一步加入边界范围的约束,成功筛除一些与模板匹配最终结果无关的路径,大大减少了匹配过程中的不必要的运算以及内存使用,有效提高了动态时间规整语音识别算法的运算速度以及识别效率。

技术领域

本发明涉及一种基于改进型动态时间规整语音识别算法的实现方法,属于语音识别控制技术领域,可用于对计算量和内存使用比较敏感的嵌入式语音识别技术领域。

背景技术

随着人类社会的进步和科学技术的迅速发展,人们开始追求智能、便捷的家居环境,语音识别控制技术在智能家居中的运用变得尤其重要,它可以使得人们摆脱手动控制设备的烦恼,只通过语音就可以达到控制家电设备的目的,所以语音识别控制成为一个热门的研究方向。语音识别技术在PC(计算机)这种可用资源较多、运算能力强的设备上发展已较为成熟,其识别效果也已经很好,但是在硬件资源有限、运算能力相对较弱的嵌入式平台上仍然面临一些问题,选择合适的语音识别算法并进行优化改进以节省硬件使用、减少计算量已经成为必须考虑的问题。

其中,DTW(动态时间规整)算法是比较经典和成熟的语音识别算法,它利用动态规划(DP)的方法有效解决了语音信号特征参数的帧长度不等(在语音识别领域表现为人的语速变化导致的发音时间长短不一)的问题,即采用对输入语音信号进行伸长或缩短直到与标准模式的长度一致,从而计算两个语音序列之间的相似性(匹配度)。在基于中小词汇量的孤立词语音识别系统中,其识别率与隐马尔可夫模型(HMM)算法相差无几,而算法复杂度却低得多,所以DTW算法比较适合于较少词汇量的孤立词为主的语音命令控制。

DTW是一个典型的优化问题,它用满足一定条件的时间规整函数W(n)来描述测试模板和参考模板的时间对应关系,求解两模板匹配时累计距离最小所对应的规整函数。测试语音参数共有I帧矢量,而参考模板共有J帧矢量,I和J不等,寻找一个时间规整函数j=W(i),它将测试矢量的时间轴i非线性地映射到参考模板的时间轴j上,并使该函数满足:D(i,j)为第i帧测试矢量Q(i)和第j帧模板矢量C(j)之间的距离测度,最优时间规整情况下,所有矢量帧间的距离和∑D(i,j)最小。

给定测试语音序列为Q=[q1,q2,…,qi,…,qn](其中,n=N为测试语音序列的总帧数,qi为该语音序列中每一帧的特征值)以及参考语音序列为C=[c1,c2,…,cj,…,cm](其中,m=M为参考语音序列的总帧数,cj为该语音序列中每一帧的特征值),那么在n≠m的情况下(若n=m,可直接计算两个序列的距离),为对齐这两个语音序列,构造一个n×m的矩阵网络,该矩阵(i,j)处的元素为qi和cj两个点的距离d(qi,cj)(即序列Q的每一个点和序列C的每一个点之间的相似度,距离越小则相似度越高),一般采用欧氏距离,即d(qi,cj)=(qi-cj)2;该DP方法可以归结为寻找一条通过此矩阵网络中若干格点的路径,路径通过的格点(i,j)即为两个序列进行计算的对齐的点。我们把这条路径定义为warping path规整路径,并用W来表示,W的第k个元素定义为Wk=(i,j)k,也就是,W=w1,w2,…,wk,…,wK,且max{m,n+≤K≤m+n-1。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学—无锡集成电路技术研究所,未经东南大学—无锡集成电路技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810065149.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top