[发明专利]语音信号处理方法、语音和声纹识别方法及其装置有效
| 申请号: | 201210173657.9 | 申请日: | 2012-05-30 |
| 公开(公告)号: | CN102723081A | 公开(公告)日: | 2012-10-10 |
| 发明(设计)人: | 林其光 | 申请(专利权)人: | 林其灿 |
| 主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L15/02;G10L21/02 |
| 代理公司: | 北京鸿元知识产权代理有限公司 11327 | 代理人: | 林锦辉 |
| 地址: | 214125 江苏省无锡市滨*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 声纹 识别 及其 装置 | ||
1.一种语音信号处理方法,包括:
对所获取的语音信号进行数字化;
将数字化后的语音信号加窗分帧为多个短时语音帧;
针对每个短时语音帧进行下述处理:
进行傅立叶变换,得到该短时语音帧的第一频谱信号;
基于所得到的第一频谱信号,导出至少一个作为该第一频谱信号的变型的衍生频谱信号;
对第一频谱信号和至少一个衍生频谱信号进行离散余弦变换,计算各自的倒谱系数向量;以及
基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出每个短时语音帧的倒谱系数向量,作为与该短时语音帧对应的前端特征向量。
2.如权利要求1所述的语音信号处理方法,其中,基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出与该短时语音帧对应的前端特征向量包括:
为所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量分配加权权重;以及
基于所分配的加权权重,对所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量进行加权求和,导出与该短时语音帧对应的前端特征向量,
其中,分配给各个倒谱系数向量的加权权重之和等于1。
3.如权利要求1或2所述的语音信号处理方法,其中,在基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出与该短时语音帧对应的前端特征向量之前或之后,所述方法还包括:
针对每个所计算出或导出的倒谱系数向量,
对于声纹识别不敏感的倒谱系数,对该倒谱系数进行均值归一化,并且利用均值归一化后的倒谱系数对该倒谱系数向量中的对应倒谱系数进行更新;以及
对于声纹识别敏感的倒谱系数,将该倒谱系数保持为原样不变。
4.如权利要求3所述的语音处理方法,其中,对倒谱系数进行均值归一化包括从该倒谱系数中减去针对所获得的语音信号的所有短时语音帧的倒谱系数均值,或者从该倒谱系数中减去前一短时语音帧的倒谱系数与预定系数a之积,其中a是0和1之间的小数。
5.如权利要求1所述的语音处理方法,其中,所述衍生频谱信号是使用频谱相减、频带限制和/或频带衰减方法对第一频谱信号进行处理后导出的。
6.一种语音信号处理装置,包括:
语音信号获取单元,用于获取用户的语音信号;
数字化单元,用于对所获取的语音信号进行数字化;
分帧单元,用于将数字化后的语音信号加窗分帧为多个短时语音帧;
傅立叶变换单元,用于针对每个短时语音帧进行傅立叶变换,得到该短时语音帧的第一频谱信号;
衍生频谱信号生成单元,用于基于所得到的每个短时语音帧的第一频谱信号,导出至少一个作为该第一频谱信号的变型的衍生频谱信号;
离散余弦变换单元,用于对每个短时语音帧的第一频谱信号和至少一个衍生频谱信号进行离散余弦变换,计算各自的倒谱系数向量;
前端特征向量导出单元,用于基于所计算出的每个短时语音帧的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出与该短时语音帧对应的倒谱系数向量,作为与该短时语音帧对应的前端特征向量。
7.如权利要求6所述的语音信号处理装置,其中,所述前端特征向量导出单元包括:
加权权重分配模块,用于为所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量分配加权权重;
求和模块,用于基于所分配的加权权重,对所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量进行加权求和,
其中,分配给各个倒谱系数向量的加权权重之和等于1。
8.如权利要求6或7所述的语音信号处理装置,还包括:
均值归一化单元,用于针对离散余弦变换单元计算出或者前端特征向量导出单元导出的每个倒谱系数向量,对于声纹识别不敏感的倒谱系数,对该倒谱系数进行均值归一化;以及
倒谱系数处理单元,用于针对每个所计算出或导出的倒谱系数向量,对于声纹识别敏感的倒谱系数,将该倒谱系数保持为原样不变,以及对于声道不敏感的倒谱系数,利用所述均值归一化单元输出的倒谱系数进行更新。
9.如权利要求6所述的语音处理装置,其中,所述衍生频谱信号生成单元被配置为使用频谱相减、频带限制和/或频带衰减方法对第一频谱信号进行处理而生成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于林其灿,未经林其灿许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210173657.9/1.html,转载请声明来源钻瓜专利网。





