[发明专利]能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备有效

专利信息
申请号: 201280063986.6 申请日: 2012-10-22
公开(公告)号: CN104025190A 公开(公告)日: 2014-09-03
发明(设计)人: 朱基岘;吴殷美 申请(专利权)人: 三星电子株式会社
主分类号: G10L19/032 分类号: G10L19/032
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 王艳娇;韩明星
地址: 韩国京畿*** 国省代码: 韩国;KR
权利要求书: 查看更多 说明书: 查看更多
摘要: 提供了一种无损编码方法,该无损编码方法包括:将量化系数的无损编码模式确定为无限范围无损编码模式和有限范围无损编码模式之一;在与无损编码模式确定的结果相对应的无限范围无损编码模式下对量化系数进行编码;在与无损编码模式确定的结果相对应的有限范围无损编码模式下对量化系数进行编码。
搜索关键词: 能量 无损 编码 方法 设备 音频 解码 以及
【主权项】:
一种无损编码方法,包括:将量化系数的无损编码模式确定为无限范围无损编码模式和有限范围无损编码模式之一;在与无损编码模式确定的结果相对应的无限范围无损编码模式下对量化系数进行编码;和在与无损编码模式确定的结果相对应的有限范围无损编码模式下对量化系数进行编码。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201280063986.6/,转载请声明来源钻瓜专利网。

同类专利
  • 语音声源方向估计方法及装置-201610656669.5
  • 谢宜昊 - 珠海全志科技股份有限公司
  • 2016-08-11 - 2019-09-06 - G10L19/032
  • 本发明提供一种语音声源方向估计方法及装置,该方法包括:声源获取步骤,获取麦克风阵列实时收集的音频数据;频带分解步骤,将每一个麦克风通道所收集的当前帧音频数据分解成预设数量的频带信号,将所有麦克风通道同一时刻的频带信号组成频带信号向量;频带估计步骤,对频带信号向量进行分析,获得当前帧音频数据相同时刻的频带信号向量的波达方向估计向量;数据关联步骤,根据波达方向估计向量进行数据关联,得到当前帧音频数据的最终备选方向估计向量;波达方向跟踪步骤,对最终备选方向估计向量在时域中进行平滑处理,并获得当前帧音频数据的语音声源波达方向。该装置为该方法提供应用模块。本发明可增强语音,且语音方向估计更加精确。
  • 基于单比特压缩感知的语音压缩方法-201510504880.0
  • 卿朝进;陈永强;张岷涛;胡书东;余杭薄;李成军 - 西华大学
  • 2015-08-17 - 2019-06-14 - G10L19/032
  • 本发明属于语言信号压缩领域,具体涉及一种基于单比特压缩感知的语音压缩方法。本发明的有益效果如下:1、语音信号的采样速率要求并不高,用于语音采样的AD并不是语音信号采样的瓶颈问题。其他需要利用压缩感知进行采样以降低AD采样速率的场景为高速采样场景,语音信号采样不属于高速采样,故可以不改变系统原有的采样器件与采样结构,只需要进行软件的修改,大大节约了系统改造的成本;2、目前流行的mp3技术,仅能压缩10余倍,而利用本发明的方法,可轻易地将语音压缩32倍以上,其音质也能达到近似于mp3标准音质。譬如电信领域的录音系统,需要存储海量的语音数据,如果利用本发明的压缩方法将会十分有利。
  • 带宽扩展编码和解码方法以及装置-201510591602.3
  • 闫建新;王磊 - 深圳广晟信源技术有限公司
  • 2015-09-16 - 2018-11-23 - G10L19/032
  • 本发明涉及一种带宽扩展编码和解码方法以及装置,组合了自适应多分辨率滤波和自适应时频栅格构造以及复数线性预测编码高频细节生成两个关键技术,可明显提高数字音频信号的高频部分编码效率和高频部分信号的声音质量,而数字音频信号的低频部分仍可采用传统的感觉音频编码(如DRA),从而实现了一种在低码率和中等码率下均具有较高主观声音质量的编码技术。另一方面,本发明是在当前DRA等高质量感觉编码算法基础上添加的增强工具,这样也可保证与传统的感觉编码DRA等算法向下兼容。基于本发明所实现的数字音频编解码器可用于卫星HDTV的伴音处理及高质量音频广播等领域。
  • 用于通过使用频谱模式有效合成正弦曲线和扫描的设备及方法-201380064128.8
  • 萨沙·迪施;本亚明·舒伯特;拉尔夫·热日尔;贝恩德·埃德勒;马丁·迪策尔 - 弗劳恩霍夫应用研究促进协会
  • 2013-09-20 - 2018-11-16 - G10L19/032
  • 提供了一种基于编码音频信号频谱生成音频输出信号的设备。该设备包括处理单元(115),其用于对编码音频信号频谱进行处理,以获得包括多个频谱系数的解码音频信号频谱,其中,每个频谱系数具有频谱值和在编码音频信号频谱内的频谱位置,其中,频谱系数根据其在编码音频信号频谱内的频谱位置被依次排序,使得频谱系数形成频谱系数序列。此外,该设备包括伪系数确定器(125),其用于确定解码音频信号频谱的一个或更多个伪系数,每个伪系数具有频谱值。此外,该设备包括替换单元(135),其用于用确定的频谱模式替换至少一个或更多个伪系数,以获得修改的音频信号频谱,其中,确定的频谱模式包括至少两个模式系数,其中,该至少两个模式系数中的每一个具有频谱值。此外,该设备包括频谱时间转换单元(145),其用于将修改的音频信号频谱转换至时域,以获得音频输出信号。
  • 一种基于压缩感知的音频信号采样和重建方法-201810210109.6
  • 贾晓立;戴俊宇;应忍冬;刘佩林 - 上海交通大学
  • 2018-03-14 - 2018-10-12 - G10L19/032
  • 本发明提出了一种基于压缩感知的音频信号采样和重建方法。该方法将音频信号MDCT系数的概率分布用伯努利‑高斯模型来表示;将系数的时频连续性用马尔可夫随机场来建模。MDCT系数通过非自适应线性投影获得远低于传统采样定理所需数据量的测量值。信号重建以Turbo消息传递框架迭代完成。首先利用近似消息传递(AMP)算法从各帧测量值得到原始系数估值,再将估值信息传递给信号的马尔可夫随机场模型并进行置信传播,两者交替执行直至相邻迭代中的系数估值之差低于阈值。该方案利用了AMP算法的高效性,挖掘了音频信号频域结构信息,频域采样的同时进行了数据压缩,重建信号具有较高的信噪比。
  • 基于深度神经网络的音频带宽扩展编码解码方法及装置-201510549716.1
  • 胡瑞敏;姜林;胡霞;王晓晨;张茂胜;涂卫平;李登实 - 武汉大学
  • 2015-08-31 - 2018-08-21 - G10L19/032
  • 本发明公开了一种基于深度神经网络的音频带宽扩展编码解码方法,装置包括编码单元与解码单元。编码单元包络预处理模块、高频参数提取模块、低频编码模块、码流生成模块;解码单元包括码流输入模块、高频参数解码模块、低频信号解码模块、自编码器参数预测模块、深度神经网络精细结构预测模块、高频信号重构模块、信号合成模块。本发明首先利用信号低频部分与高频部分存在的自相关性,使用深度神经网络预测的方法,预测高频部分的精细结构。再将精细结构与编码端得到高频部分的边信息相结合,重构出信号的高频部分。最后将信号高频部分与低频部分融合,得到最终的恢复信号。本发明相比传统方法在码率上大幅降低,且音质与传统方法相当。
  • 一种音频信号转视觉颜色信息的方法及系统-201410833247.1
  • 徐永键;陆许明;刘志敏;谭洪舟 - 中山大学花都产业科技研究院;中山大学
  • 2014-12-29 - 2018-04-06 - G10L19/032
  • 本发明提供一种音频信号转视觉颜色信息的方法及系统,方法包括S1对音频信号进行采样;S2计算音频信号的亮度V;S3计算音频信号的色相H和饱和度S;S4将亮度V、色相H和饱和度S进行RGB颜色格式转换;S5将S4中得到的RGB值进行颜色混合最终提取音频信号的颜色值。本发明通过将采集的音频信号量化处理,计算出其能量值来代表亮度,通过FFT处理来计算其代表的色相和饱和度,再将得到的亮度、色相和饱和度转换成RGB颜色格式,整个方法都是依据科学原理计算推演,过程都是一个的量化处理过程,没有人的主观意思的表达,科学严谨。
  • 一种ISF系数矢量量化的方法与装置-201410524836.1
  • 胡瑞敏;张茂胜;姚雪春;王晓晨;姜林;涂卫平;王松;杨乘 - 武汉大学深圳研究院
  • 2014-09-30 - 2017-11-24 - G10L19/032
  • 本发明涉及一种ISF系数矢量量化方法与装置,将训练好的多区域码表中的ISF系数转化为LPC系数,分别获取区域索引Choosen_cluster(i)、第一级矢量量化VQ的索引VQ(j)和第二级分裂矢量量化SVQ的索引SVQ[5]对待量化的ISF[16]系数进行量化,得到量化后的ISF_q[16],进一步得到当前帧量化后的LPC_q[16],将原始的LPC[16]系数通过功率谱计算公式得到对应的功率谱pf[128];将得到的当前帧量化后的LPC_q[16]系数和原始LPC[16]系数对应的功率谱pf[128]计算出当前区域对应的谱失真SD,并与上一个区域的谱失真进行比较,获取最小的谱失真SD,将最小谱失真对应的区域索引Choosen_cluster(i)和第一级矢量量化后的索引VQ(j)以及第二级分裂矢量量化后的索引SVQ[5]输出,完成ISF系数矢量量化。本发明仅使用42bit量化16阶ISF系数,相比AMR‑WB+的46bit,少了4bit。
  • 显示音频频谱的装置及方法-201610488417.6
  • 马子平 - 努比亚技术有限公司
  • 2016-06-29 - 2016-11-16 - G10L19/032
  • 本发明公开了一种显示音频频谱的装置及方法,其中,该装置包括:获取模块,用于按照预定时间间隔获取已录制的录音数据;确定模块,用于根据录音数据的输入比特率确定录音数据的幅值范围;确定多个预定采样时刻对应的幅值,以得到新的录音曲线;处理模块,用于通过三角函数对新的录音曲线进行平滑处理,以得到音频频谱;显示模块,用于将音频频谱显示在屏幕上。本发明对原始录音数据进行了二次采样,并对采样后的幅值曲线进行了平滑处理,处理后的音频频谱显示清晰,不会存在现有技术的音频频谱超出显示区域最大值的情况,利用三角函数对录音曲线进行处理后,使得到的音频频谱看起来更加直观和舒适,提高用户的视觉感受,解决了现有技术的问题。
  • 一种声音编解码装置及其方法-201210085183.2
  • 潘兴德;吴超刚;李靓 - 北京天籁传音数字技术有限公司
  • 2012-03-28 - 2013-10-23 - G10L19/032
  • 本发明涉及一种声音编解码装置及其方法,尤其涉及单声道声音编解码装置及其方法以及立体声声音的编解码装置及其方法。本发明通过将数字声音信号从时域映射到MDCT域,并将MDCT域上的低频谱和高频谱转换到MDFT域,结合针对MDCT域上的低频谱进行波形编码以及针对MDFT域上的低频谱和高频谱进行参数编码,最后将波形编码和参数编码的数据复用输出声音编码码流,降低了计算复杂度,在较低的码率下进一步提升了对音乐信号的编码质量。
  • 一种声音编解码装置及其方法-201210085257.2
  • 潘兴德;李靓;吴超刚 - 北京天籁传音数字技术有限公司
  • 2012-03-28 - 2013-10-23 - G10L19/032
  • 本发明涉及一种声音编解码装置及其方法。本发明通过将数字声音信号从时域映射到MDCT域,将MDCT域上的低、高频谱转换到MDFT域,对MDCT域上的低频谱进行波形编码,对MDFT域上的低、高频谱进行参数编码,其中,将低频谱的特定频段映射到高频谱的特定频段,在编码端对频谱映射前后的高频谱进行MDFT域边界预处理、在解码端对频谱映射后的高频谱进行MDFT边界预处理,并对参数解码后的高频谱进行MDFT域边界后处理,改善了因高频参数编码中的频带划分、低频谱至高频谱映射带来的问题,提高了频谱连续性和频带信号自然度、消除了谐波干涉噪声和因旁瓣泄露引起的混叠噪声,在较低的码率下进一步提高了高频参数编码的编码质量。
  • 一种语音数据的编码及解码方法-201310176701.6
  • 陶建华;刘斌;莫福源 - 中国科学院自动化研究所
  • 2013-05-14 - 2013-08-14 - G10L19/032
  • 本发明提供了一种语音数据的编码方法和解码方法。该编码方法包括:获取原始音频,通过端点检测剔除原始音频中的非语音数据,获得语音段数据;对每帧语音数据提取谱参数、基音周期等参数,并计算连续多帧语音数据的增益均值,通过矢量码本对谱参数进行矢量量化,对基音周期和增益均值进行非线性量化;对量化后的各种语音参数进行编码,生成语音数据包。该解码方法包括:对接收到的语音数据包进行解码,提取谱参数、基音周期、增益均值等参数,通过上述参数对激励参数和能量变化轨迹进行预测,最后通过声码器合成语音。本发明可以在极低编码速率的情况下,保持较高的语音音质。
  • 音频编码装置-201210326726.5
  • 真野龙二 - 瑞萨电子株式会社
  • 2012-09-06 - 2013-04-10 - G10L19/032
  • 本发明涉及音频编码装置。一种能够有效进行编码处理的音频编码装置包括:存储单元,存储音频数据;数据获取控制器,从存储单元获取音频数据;变换单元,处理从数据获取单元输出的音频数据信号以用于频率变换;和谐泛音产生/合成单元,基于在变换单元的输出波之中的第一输出波来产生谐波,并且合成谐波和在变换单元的输出波之中的第二输出波,第二输出波在频率方面比第一输出波高;以及编码器,使来自和谐泛音产生/合成单元的输出经受编码处理。
  • 编码方法、解码方法、编码装置、解码装置、程序及记录介质-201180031632.9
  • 福井胜宏;佐佐木茂明;日和崎佑介;小山翔一;堤公孝 - 日本电信电话株式会社
  • 2011-07-04 - 2013-03-06 - G10L19/032
  • 将多个样本进行矢量量化,求得矢量量化索引和量化值,从被分配用于与矢量量化索引对应的码的比特数减去与矢量量化索引对应的码所使用的比特数,将得到的数以下的比特数按照基于听觉特性的规定的优先顺序分配给分别由多个样本位置构成且被赋予了基于听觉特性的优先顺序的多个样本位置集合中的1个以上的样本位置集合,对于被分配了比特数的样本位置集合的每个,输出表示使属于该样本位置集合的样本的值、与将属于该样本位置集合的样本的量化值和与每个样本的位置对应的系数相乘的值之间的误差的有关属于该样本位置集合的全部样本位置之和最小的系数的组的索引信息。
  • 一种在解码端细化窄带声码器参数的方法-201210423131.1
  • 李晔;马晓凤;樊燕红;姜竞赛;郝秋赟 - 山东省计算中心
  • 2012-10-30 - 2013-01-30 - G10L19/032
  • 本发明公开了一种在解码端细化窄带声码器参数的方法,基于激励参数与声道参数间的相关性,在解码端对各参数进行更加精细的重构,提高其量化精度,进一步提高合成语音的质量。更具体地,对基于混合激励线性预测模型的窄带低速率语音编码中的编解码参数采用了基于不同参数间映射细化的方法。原有的技术对各编解码参数采用独立矢量量化。本发明考虑到了激励参数和声道参数之间的相关性,采用非线性映射的方法,对反量化的各编解码参数进行细化,因此提高了各参数的量化效率,改善了合成语音的质量。本方法可以提高合成语音的自然度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top