[发明专利]基于仿生模式识别的极低速率语音编码方法无效

申请号：	201110422308.1	申请日：	2011-12-15
公开（公告）号：	CN102522091A	公开（公告）日：	2012-06-27
发明（设计）人：	殷业;尹岩岩;殷建	申请（专利权）人：	上海师范大学
主分类号：	G10L19/00	分类号：	G10L19/00
代理公司：	上海伯瑞杰知识产权代理有限公司 31227	代理人：	刘朵朵
地址：	200234 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于仿生模式识别速率语音编码方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种语音编码方法，尤其涉及基于仿生模式识别的极低速率语音编码方法。

背景技术

根据语音编码速率可将语音编码划分为五类：高速率32Kb/s以上，中高速率16～32Kb/s，中速率4.8～16Kb/s(其中编码速率在16Kb/s以下的语音编码通常称为语音压缩编码)，低速率为1.2～4.8Kb/s，极低速率语音编码是指其比特率低于1.2Kb/s一下。低速率语音编码和极低速率语音编码是现代语音编码技术研究和发展的一个重要方向，现有的极低速率语音编码系统所使用的算法种类繁多并呈现出交叉渗透的现象，主要归结为混合激励线性预测(MELP)、多带激励(MBE)、波形内插(WI)和正弦变换编码(STC)四种模型

虽然从信息论的观点来看，语音编码的信息速率下限是50b/s。但是，大量的研究结果证明，要将比特率降到400b/s以下，目前的低速率语音编码中所使用的基于线性预测(LP)分析合成的各种算法都难以满足要求，其提供的语音质量无法达到公众能够接受的程度。为了使语音编码的速率降到400b/s一下，逼近50b/s左右的下界，必需研究新的编码方法。

发明内容

本发明所要解决的技术问题是提供一种基于仿生模式识别的极低速率语音编码方法，解决现在低速率语音编码中所使用的基于LP分析合成的各种算法都无法将比特率降到400b/s以下的缺陷。

技术方案

一种基于仿生模式识别的极低速率语音编码方法，其特征在于：针对组成语音的基元，采用仿生模式识别后得到文本信息，把由所述文本信息组成的标准语音和实际说话语音进行“比较”运算后得到个体特征信息，然后再将识别出的语音基元文本信息和个体特征信息进行合并编码；所述仿生模式中，对于全部语音基元组成的集合，设为全体连续映射到特征空间中的“像”所组成的点形成的一个闭集，在特征空间中构筑一个能覆盖所述闭集的n维空间几何形体，采用仿生模式识别，即对语音的基元进行判断，判断其是否位于所述覆盖闭集的n维空间几何形体内。

所述仿生模式识别中在特征空间中构筑一个能覆盖闭集的n维空间几何形体为在特征空间中作一个超椭球面，采用仿生模式识别即判断语音的基元是否位于所述超椭球面内。

所述在特征空间中作一个超椭球面的具体步骤如下：

(1)首先在二维空间中，所述超椭球面为椭圆，假定二维空间有m个样本，它们可用XOY平面上的m个点(x₁，y₁)、(x₂，y₂)...(x_m，y_m)来表示，采用一次直线拟合法分别求出椭圆的两根轴的长度，即假设y与x之间近似为一线性关系y＝kx+d，但是这m个点不可能位于同一直线上，利用计算值和真实值的误差趋进为0的极值原理求出参数，得到椭圆的两根轴的长度和方向角，进而得到椭圆的方程式如下：其中：x′y′=cosα1cosα2cosβ1cosβ2xy,]]>x、y为样本点的位置值，a、b为椭圆的两个轴的长度，α₁、β₁分别表示a轴在XOY坐标系中的方向角，α₂、β₂为b轴对应的方向角，cosβ1=k(1+k2),]]>cosα2=k(1+k2),]]>cosβ2=-1(1+k2),]]>

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海师范大学，未经上海师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201110422308.1/2.html，转载请声明来源钻瓜专利网。

上一篇：一种绝缘材料及其用于辐射交联中电力电缆的用途
下一篇：具有定喘功能的中药组合物及其制备方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于仿生模式识别的极低速率语音编码方法无效

专利文献下载