[发明专利]一种基于CSI数据的语音识别方法有效
申请号: | 201711465200.4 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108198558B | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 赵志为;闵革勇;陈烁炜;李维旺;高伟峰;舒畅 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G10L15/25 | 分类号: | G10L15/25;G10L15/06;G10L15/02;H04W24/08 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 田甜 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 csi 数据 语音 识别 方法 | ||
1.一种基于CSI数据的语音识别方法,其特征在于,包括以下步骤:
A、通过Wi-Fi设备获取目标用户说话时和静止时的CSI数据并提取目标用户说话时的特征CSI数据;
B、对提取的CSI数据进行多径消除;
C、将CSI数据转换回频域;
D、对CSI数据进行分段;
E、对分段数据进行训练,得到目标用户不同的唇部运动的特征数据;
F、将步骤E中得到的特征数据与特征库中的特征数据进行匹配和识别,实现对用户语音的识别;
其中,对CSI数据进行分段的具体方法为:
判断嘴唇振幅,根据嘴唇振幅幅值分别采用单阈值或双阈值判断语音起始点和结束点;根据起始点和结束点对数据进行分段;
所述起始点和结束点的判断方法具体为:
若嘴唇振幅大于阈值t1,则采用阈值t1判断语音起点和终点;若嘴唇振幅小于阈值t1,首先计算两个相邻时间窗的中值绝对偏差值,若两个相邻时间窗的中值绝对偏差值之间的差异超过阈值t2,再计算短时能量e,若短时能量e超过的平均能量值,则得到一个起始点或结束点;
所述阈值t1为目标用户说话时嘴唇运动振幅的平均值;所述阈值t2为目标用户说话数据的总体中值绝对偏差。
2.根据权利要求1所述的一种基于CSI数据的语音识别方法,其特征在于,步骤A具体的包括以下步骤:
A1、获取目标用户说话时和静止时的CSI数据;
A2、对嘴唇进行定位;
A3、删除背景噪音数据和无效的子载波的CSI数据。
3.根据权利要求2所述的一种基于CSI数据的语音识别方法,其特征在于,采用巴特沃斯低通滤波器和主成分分析方法删除背景噪音数据和无效的子载波的CSI数据。
4.根据权利要求1所述的一种基于CSI数据的语音识别方法,其特征在于,采用IFFT算法对CSI数据进行多径消除,采用FFT算法将CSI数据转换回频域。
5.根据权利要求1所述的一种基于CSI数据的语音识别方法,其特征在于,对数据进行训练的方法为:
使用离散小波变换来压缩提取的波形;
采用动态时间规整算法计算不同波形形状之间的差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711465200.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置