[发明专利]一种基于张量分解的多声道音频信号压缩方法有效

专利信息
申请号: 201210579570.1 申请日: 2012-12-27
公开(公告)号: CN102982805A 公开(公告)日: 2013-03-20
发明(设计)人: 王晶;谢湘;匡镜明 申请(专利权)人: 北京理工大学
主分类号: G10L19/008 分类号: G10L19/008
代理公司: 暂无信息 代理人: 暂无信息
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于张量分解的多声道音频信号压缩方法,属于音频信号处理技术领域,尤其是空间音频编解码技术领域。将每个声道的音频信号进行交叠分帧,并对每帧信号进行时频变换得到频域系数,将所有声道和所有帧序列的频域系数组合,建立三阶张量信号,并对其进行张量分解得到低秩核张量用于编码传输,解码端结合恢复的低秩核张量和事先训练的低秩投影矩阵进行张量信号重建,对重建后的张量信号再进行每个声道上反变换和交叠相加恢复多声道音频信号。本方法结合时频变换和张量分解对多声道音频信号进行分析和编解码,利用声道间和声道内的相关性去处冗余信息,能较大程度提高多声道音频信号的压缩效率。
搜索关键词: 一种 基于 张量 分解 多声道 音频 信号 压缩 方法
【主权项】:
一种基于张量分解的多声道音频信号压缩方法,其特征在于,包括以下步骤:步骤一:在编码端,对待处理的声道数目为R的多声道音频信号,首先将每个声道的音频信号采用汉明窗进行分帧,帧长为L,帧移为M,从而把每个声道的音频信号分成N帧,顺序排列后得到每个声道的帧序列;步骤二:对每个声道,对分帧后的每帧音频信号分别进行时频变换,每帧音频信号经过该时频变换后得到长度为S的频域系数;步骤三:对每个声道,将每一帧所对应的长度为S的频域系数作为矩阵的每一行,即将N帧音频信号的频域系数构成一个大小为N×S的系数矩阵;将所有R个声道的系数矩阵进行依次排列,构成大小为R×N×S的三阶张量信号X,所述的三阶分别称为:声道序列阶、帧序列阶、频域系数阶;步骤四:对步骤三构造的三阶张量信号X进行张量分解,即分解为:G×1U(1)×2U(2)×3U(3)    (1)其中U(1)、U(2)、U(3)彼此之间正交,分别代表张量信号在声道序列阶、帧序列阶、频域系数阶上进行投影的主分量,即,U(1)为该张量信号分解时在声道序列阶进行秩为O的低秩投影矩阵,矩阵大小为R×O,其中参数O应满足1≤O≤R;U(2)为该张量信号分解时在帧序列阶进行秩为P的低秩投影矩阵,大小为N×P,其中参数P应满足1≤P≤N;U(3)为张量信号分解时在频域系数阶进行的秩为Q的低秩投影矩阵,大小为S×Q,其中参数Q应满足1≤Q≤S;G为三阶低秩核张量,在声道序列阶、帧序列阶、频域系数阶上的维度分别是上述的O、P、Q,核张量G通过下式计算得到:G=X×1U(1)T×2U(2)T×3U(3)T    (2)符号T表示伪逆,×1、×2、×3分别表示张量第一阶、第二阶、第三阶的张量矩阵乘,张量矩阵乘定义如下:设有一个大小为I1×I2×…×IN的N阶张量H,一个大小为J×In的矩阵A,则张量的n阶矩阵乘H×nA的结果是一个大小为I1×I2×…×In‑1×J×In+1×…×IN的N阶张量,其中1≤n≤N;步骤五:对步骤四得到的三阶低秩核张量G进行降维获得一维序列,然后 对该一维序列进行量化编码,获得压缩后的比特流数据,用于传输或存储,而低秩投影矩阵U(1)、U(2)、U(3)不进行量化编码处理;步骤六:在解码端,对压缩后的比特流数据进行与步骤五中量化编码方法相应的解码和解量化,再进行与步骤五相应的升维处理,得到恢复后的低秩核张量G';结合预先训练得到的三个低秩投影矩阵U'(1)、U′(2)、U′(3),进行张量信号重构得到恢复后的三阶张量信号Y,重构表示为:Y=G′×1U'(1)×2U'(2)×3U'(3)    (4)其中张量信号Y在声道序列阶、帧序列阶、频域系数阶上的维度分别是R、N、S;步骤七:步骤六得到的R×N×S的三阶张量信号Y中包含R个声道的N个帧,其中每帧长度为S,从Y中抽取每个声道的N×S系数矩阵,对矩阵的每行的S个数据,分别进行与步骤二相应的时频反变换,得到恢复的每帧音频信号;步骤八:将步骤七得到的每个声道的每帧音频信号通过交叠相加恢复每个声道的音频信号,帧长为L,帧间交叠长度为M。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210579570.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top