[发明专利]基于仿生模式识别的极低速率语音编码方法无效
申请号: | 201110422308.1 | 申请日: | 2011-12-15 |
公开(公告)号: | CN102522091A | 公开(公告)日: | 2012-06-27 |
发明(设计)人: | 殷业;尹岩岩;殷建 | 申请(专利权)人: | 上海师范大学 |
主分类号: | G10L19/00 | 分类号: | G10L19/00 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 刘朵朵 |
地址: | 200234 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 仿生 模式识别 速率 语音 编码 方法 | ||
技术领域
本发明涉及一种语音编码方法,尤其涉及基于仿生模式识别的极低速率语音编码方法。
背景技术
根据语音编码速率可将语音编码划分为五类:高速率32Kb/s以上,中高速率16~32Kb/s,中速率4.8~16Kb/s(其中编码速率在16Kb/s以下的语音编码通常称为语音压缩编码),低速率为1.2~4.8Kb/s,极低速率语音编码是指其比特率低于1.2Kb/s一下。低速率语音编码和极低速率语音编码是现代语音编码技术研究和发展的一个重要方向,现有的极低速率语音编码系统所使用的算法种类繁多并呈现出交叉渗透的现象,主要归结为混合激励线性预测(MELP)、多带激励(MBE)、波形内插(WI)和正弦变换编码(STC)四种模型
虽然从信息论的观点来看,语音编码的信息速率下限是50b/s。但是,大量的研究结果证明,要将比特率降到400b/s以下,目前的低速率语音编码中所使用的基于线性预测(LP)分析合成的各种算法都难以满足要求,其提供的语音质量无法达到公众能够接受的程度。为了使语音编码的速率降到400b/s一下,逼近50b/s左右的下界,必需研究新的编码方法。
发明内容
本发明所要解决的技术问题是提供一种基于仿生模式识别的极低速率语音编码方法,解决现在低速率语音编码中所使用的基于LP分析合成的各种算法都无法将比特率降到400b/s以下的缺陷。
技术方案
一种基于仿生模式识别的极低速率语音编码方法,其特征在于:针对组成语音的基元,采用仿生模式识别后得到文本信息,把由所述文本信息组成的标准语音和实际说话语音进行“比较”运算后得到个体特征信息,然后再将识别出的语音基元文本信息和个体特征信息进行合并编码;所述仿生模式中,对于全部语音基元组成的集合,设为全体连续映射到特征空间中的“像”所组成的点形成的一个闭集,在特征空间中构筑一个能覆盖所述闭集的n维空间几何形体,采用仿生模式识别,即对语音的基元进行判断,判断其是否位于所述覆盖闭集的n维空间几何形体内。
所述仿生模式识别中在特征空间中构筑一个能覆盖闭集的n维空间几何形体为在特征空间中作一个超椭球面,采用仿生模式识别即判断语音的基元是否位于所述超椭球面内。
所述在特征空间中作一个超椭球面的具体步骤如下:
(1)首先在二维空间中,所述超椭球面为椭圆,假定二维空间有m个样本,它们可用XOY平面上的m个点(x1,y1)、(x2,y2)...(xm,ym)来表示,采用一次直线拟合法分别求出椭圆的两根轴的长度,即假设y与x之间近似为一线性关系y=kx+d,但是这m个点不可能位于同一直线上,利用计算值和真实值的误差趋进为0的极值原理求出参数,得到椭圆的两根轴的长度和方向角,进而得到椭圆的方程式如下:其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海师范大学,未经上海师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110422308.1/2.html,转载请声明来源钻瓜专利网。