[发明专利]基于STO阵列和动态时间规划算法的语音识别方法在审
申请号: | 202210486890.6 | 申请日: | 2022-05-06 |
公开(公告)号: | CN114882876A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 崔凯;周铁军;李海 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G10L15/10 | 分类号: | G10L15/10;G10L25/87;G10L21/0208 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 sto 阵列 动态 时间 规划 算法 语音 识别 方法 | ||
1.基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:该方法具体包括以下步骤:
步骤1、收集待识别的语音信号,通过预处理滤除噪声后,进行端点检测,输出时域语音信号,对时域语音信号进行快速傅里叶变换后计算频域信号的功率谱;
步骤2、将步骤1得到的功率谱按照频率由低到高分成多个频段,再将每个频段下的频率幅度平均值放大相同倍数后作为极化电流值,输入由多个相同的STO组成的STO阵列中,在输出端得到对应的振荡频率;STO阵列中STO的个数大于功率谱被划分的频段数;
步骤3、STO阵列输出的振荡频率按功率谱的频段划分顺序排列,得到一个频率向量,计算该频率向量的差分参数,得到待识别语音信号的语音特征矢量{T(1),T(2),T(3),…,T(n),..,T(N)},作为检测模板;
步骤4、收集标签已知的语音信号,通过步骤1~3的方法处理后,将得到的每一条已知语音信号的语音特征矢量{R(1),R(2),R(3),…,R(m),..,R(M)}作为匹配模板,保存到匹配数据库中;
步骤5、将步骤3得到的检测模板与匹配数据库中保存的匹配模块输入改进的动态时间规划算法中,通过计算两个语音特征矢量间的欧式距离,将距离值最小的匹配模块的标签作为检测模板的识别结果,完成语音识别;所述改进的动态时间规划算法在距离计算的过程中,设定了动态距离的限制范围,当累积距离超出设定范围的终止计算,并将计算结果设置为无穷大。
2.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:步骤1中的预处理方法为对信号依次进行预加重、分帧和加窗。
3.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:组成STO阵列的STO能够进行稳定振荡,且磁矩不发生翻转。
4.如权利要求1或3所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:所述STO由上至下包括自由层、非磁性层和固定层,其中自由层的材料为CoFeB,直径为600nm,高度为12nm,磁矩密度为5nm;非磁性层的材料为Mgo,固定层的材料为CoFeB。
5.如权利要求1或3所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:输入STO阵列中的极化电流值大小处于STO驱动电流范围内。
6.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:频率向量中第n个频率的差分参数的计算方法为:
其中C为频率参数。
7.如权利要求1所述基于STO阵列和动态时间规划算法的语音识别方法,其特征在于:步骤5具体步骤如下:
s5.1、定义两个大小为N*K的累计距离矩阵D和匹配距离矩阵d,N和K分别为检测模板与匹配模板中的特征矢量个数;
s5.2、在动态规划下,依次计算检测模板中第n个特征矢量与其对应的匹配模板中第k个特征矢量之间的欧式距离,作为匹配距离d(n,k)记入匹配距离矩阵d中;所述动态规划为:计算(n,k)三个可能的前续特征矢量的累积距离D1、D2和D3;然后选择三个累积距离D1、D2和D3中的最小值与匹配距离d(n,k)相加后,作为(n,k)的累积距离并记入累计距离矩阵D;
s5.3、如果当前累计距离D(n,k)超过设定的范围,则结束计算,并输出结果D(N,K)=∞;否则一直完成所有特征矢量间的距离计算,并输出D(N,K)的实际计算结果;
s5.4、重复s5.1~s5.3,计算检测模板与每个匹配模板的距离,然后将距离最小的匹配模板对应的标签作为检测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210486890.6/1.html,转载请声明来源钻瓜专利网。