[发明专利]一种适应于流媒体的音频对象编解码方法有效
申请号: | 201810154002.4 | 申请日: | 2018-02-22 |
公开(公告)号: | CN108417219B | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 胡瑞敏;武庭照;王晓晨;柯善发;陈玮 | 申请(专利权)人: | 武汉大学 |
主分类号: | G10L19/032 | 分类号: | G10L19/032;G10L19/02;H04L29/06 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了适应于流媒体的音频对象编解码方法,编码时,输入的多个音频对象信号首先经过预处理,得到多帧音频对象信号构成的数据块以及对应的包含所有对象的单声道混合信号;计算增益矩阵,提取ODLR参数矩阵;增益矩阵与参数矩阵经矩阵分解得到低维度的系数矩阵和基矩阵;最后将混合信号、系数矩阵、基矩阵合成码流;解码时首先分解码流,根据系数矩阵与基矩阵重建得到参数矩阵;然后根据参数矩阵和混合信号对音频对象信号进行重建。本方法支持以数据块的形式传输音频数据,可以适用于流媒体应用场景;并且提高了参数频域分辨率,并利用基于加权的矩阵分解的方法降低参数编码所需码率,可以同时保证低码率和高质量地重建音频对象信号。 | ||
搜索关键词: | 一种 适应 流媒体 音频 对象 解码 方法 | ||
【主权项】:
1.一种适用于流媒体的音频对象编码方法,其特征在于,用于同时处理多个音频对象,包括以下步骤:步骤A1,对输入的多音频对象信号经过预处理操作,得到多帧音频对象信号构成的数据块以及对应的包含所有对象的单声道混合信号;步骤A2,根据步骤A1得到的对象信号计算权值矩阵;步骤A3,根据步骤A1得到的对象信号以及单声道混合信号,按照子带计算对象信号与混合信号能量比参数ODLR,得到各对象的数据块相应的ODLR参数矩阵;步骤A4,根据步骤A2得到的权值矩阵,将步骤A3得到的ODLR参数矩阵分解为系数矩阵和基矩阵;步骤A5,对步骤A4得到的低维度的系数矩阵与基矩阵进行量化,得到矩阵量化码流;步骤A6,对步骤A1输出的单声道混合信号进行单声道编码,得到混合信号的码流;步骤A7,将步骤A5中获得的矩阵量化码流与步骤A6中获得的单声道混合信号的码流合成编码输出码流,传输到解码端。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810154002.4/,转载请声明来源钻瓜专利网。