[发明专利]用于提升语音丢帧补偿性能的混合多描述正弦编码器方法有效
申请号: | 201811342149.2 | 申请日: | 2018-11-13 |
公开(公告)号: | CN109616129B | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 林志斌;刘晓峻;狄敏 | 申请(专利权)人: | 南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司 |
主分类号: | G10L19/005 | 分类号: | G10L19/005;G10L19/07;G10L19/26 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 彭雄 |
地址: | 210019 江苏省南京市建*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于提升语音丢帧补偿性能的混合多描述正弦编码器方法,编码器框架结构由三个编码器组成,分别为多描述正弦编码器、参数编码器一和参数编码器二,其中多描述正弦编码器是核心编解码器,参数编码器一和参数编码器二为发送端丢包补偿用辅助编码器,引入两帧的信号延迟,增加了混合多描述正弦编码器的编解码器对网络丢包的鲁棒性。本发明通过牺牲相关冗余度提高人机交互通讯语音丢帧纠错能力,有效的提升人机交互数据丢失时的语音质量。 | ||
搜索关键词: | 用于 提升 语音 补偿 性能 混合 描述 正弦 编码器 方法 | ||
【主权项】:
1.一种用于提升语音丢帧补偿性能的混合多描述正弦编码器方法,其特征在于:编码器框架结构包括三个编码器,分别为多描述正弦编码器、参数编码器一和参数编码器二,其中多描述正弦编码器是核心编解码器,参数编码器一和参数编码器二为发送端丢包补偿用辅助编码器,引入两帧的信号延迟,增加了混合多描述正弦编码器的编解码器对网络丢包的鲁棒性;其中多描述正弦编码器为基于多描述框架的正弦编码器,多描述正弦编码器主要由两部分组成,其中一部分为线谱对参数冗余描述,另一部分为残差信号的匹配跟踪正弦建模模块及其交织多描述;采用线性预测求残差的方式进行混合多描述编码,其中线谱对参数量化采用感知加权分裂矢量量化方式进行,采用10阶全极点滤波器进行线性预测,转化成10个对应的LSF参数,采用分裂矢量量化方式将10维的矢量分裂成3个矢量,然后分别对这3个矢量进行矢量量化的分裂矢量量化;首先将10维LSP参数分别分组为LSF1={lsf(1),lsf(2),lsf(3)},LSF2={lsf(4),lsf(5),lsf(6)},和LSF3={lsf(7),lsf(8),lsf(9),lsf(10)};同时对LSF1码本以lsf(3)为基准进行由小到大排序,对LSF3码本以lsf(7)为基准进行由小到大排序;LSF1、LSF2和LSF3三个码本的大小分别为M1、M2和M3;先量化矢量LSF2,在量化LSF1之前,先找到LSF1码本中lsf(3)lsf(6)的码本序号Index3,仅在码本的序号Index1~M3场间搜索与LSF3最邻近的码字;对分裂量化得到的矢量进行冗余描述,复制一份描述到描述2,与匹配跟踪中的正弦描述传输分组至编码器描述2码流;在正弦模型中,每一帧语音信号用一组正弦信号之和来表示,因此,对于第i帧信号有
采用正弦字典对语音信号进行信号分解,在一个高度冗余的字典空间D中将输入信号s(n)分解成一组原子(atom)信号的线性组合,假定包含M个原子的字典为:D={gm};m=0,1,...,M‑1 (3)匹配跟踪的分解迭代过程如下:设置初始输入信号为当前残差信号,即令r0=s(n),在第k(k>=0)步迭代中,查找第k个原子索引mk,使该原子与当前残差信号rk的相关系数最大,此时对应的原子字典的频率就是建模频率,而此刻该正弦原子的幅度就是残差信号和原子的内积:
此时得到重构信号为:
其中K为迭代次数。对于正弦建模来说,可以采用如下的复指数原子组成的正弦字典:
此处字典空间是由复指数原子所刻画的,而实际中面临的通常是实信号,采用共轭子空间投影技术,在由字典原子及其复共轭所形成的子空间中计算相关系数,其结果也以共轭对的形式出现,这样第k步迭代得到的残差信号为:
此时合成信号为:
此为正弦合成的基本原理公式,ξk亦为复数;由匹配跟踪得到对应的一组幅度、频率和相位
其中K为提取的正弦数目,若K为偶数,将该组正弦建模参数按照幅度进行能量大小排列,对新排序的参数分组,其中分组一为
所对应的一组幅度频率和相位,分组二:
所对应的一组幅度频率和相位,在两个分组之间加入一定冗余,将分组一中的前几个能量大的信号加入分组二,分组二中的前几个能量大的信号加入分组一,保持两个分组描述能量的一致性,分组后的正弦多描述为:![]()
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司,未经南京南大电子智慧型服务机器人研究院有限公司;南京大学;江苏南大电子信息技术股份有限公司;马鞍山艾德声电子技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811342149.2/,转载请声明来源钻瓜专利网。