[发明专利]基于频谱形状的语音特征估计方法有效
申请号: | 201910341806.X | 申请日: | 2019-04-25 |
公开(公告)号: | CN110189765B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 邓小涛;张华军;王征华;倪杰 | 申请(专利权)人: | 武汉大晟极科技有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/51 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 王丹 |
地址: | 430223 湖北省武汉市东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于频谱形状的语音特征估计方法,对获取的未过滤的语音信号,将时序上连续的N个采样点集合成一个帧,将每一帧乘以帧窗口,语音信号被分为以帧窗口为单位的语音段;每个语音段的短期幅度谱表示为帧窗口的傅里叶变换按比例变换和平移变换的总和;利用每个语音段的短期幅度谱,计算语音距离;将滤波器组信道内的频率分量相关联的语音距离进行求和,并把每个语音距离根据频率分量按照整个滤波器组能量的贡献来加权,得到滤波后的语音距离;将所有语音段滤波后的语音距离,作为语音特征的表达。利用本方法估计的浊音特征和对噪声的先验知识,可以获得更高的识别精度。 | ||
搜索关键词: | 基于 频谱 形状 语音 特征 估计 方法 | ||
【主权项】:
1.一种基于频谱形状的语音特征估计方法,其特征在于:它包括以下步骤:S1、短期幅度谱计算:对获取的未过滤的语音信号,将时序上连续的N个采样点集合成一个观测单位,称为帧,再将每一帧乘以帧窗口,语音信号被分为以帧窗口为单位的语音段;每个语音段的短期幅度谱表示为帧窗口的傅里叶变换按比例变换和平移变换的总和;S2、语音距离计算:利用每个语音段的短期幅度谱,计算语音距离;给定频率指数附近的信号,短期幅度谱的形状与帧窗口的幅度谱形状之间的相似性,称为语音距离;S3、滤波器组通道计算:将滤波器组信道内的频率分量相关联的语音距离进行求和,并把每个语音距离根据频率分量按照整个滤波器组能量的贡献来加权,得到滤波后的语音距离;将所有语音段滤波后的语音距离,作为语音特征的表达。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大晟极科技有限公司,未经武汉大晟极科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910341806.X/,转载请声明来源钻瓜专利网。