[发明专利]调整播放速度的方法有效

专利信息
申请号: 201210038338.7 申请日: 2012-02-20
公开(公告)号: CN103258552A 公开(公告)日: 2013-08-21
发明(设计)人: 陈亘志;陈昭宇 申请(专利权)人: 扬智科技股份有限公司
主分类号: G11B20/12 分类号: G11B20/12;G11B19/20
代理公司: 北京三友知识产权代理有限公司 11127 代理人: 李鹤松
地址: 中国台*** 国省代码: 中国台湾;71
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 调整 播放 速度 方法
【说明书】:

技术领域

本发明关于一种媒体处理方法及其装置,尤指一种调整媒体播放速度的方法及其装置。

背景技术

使用者利用多媒体播放平台聆听如MP3/WMA/AAC(MPEG-1 Audio Layer 3/Windows MediaAudio/Advanced Audio Coding)等音频压缩档时,可能加速播放速度寻找所希望聆听的片段,或者放慢播放速度仔细聆听某片段的细节(expansion)。为了播放品质不因为播放速度改变而大幅失真,时长调整方法(Time Scale Modification,TSM)为业界广泛地采用。传统时域上时长调整方法,如重叠相加法(Overlap Add,OLA)或同步重叠相加法(Synchronized OLA),主要是将输入音频信号分成许多片段信号,重叠在时间上邻近的两个片段信号,并将重叠的区域作淡出淡入的加权处理。然而,这样的时长调整方法需要大量的寄存器寄存片段信号。

此外,现有时长调整方法也有利用短时傅立叶转换(Short-Time Discrete Fourier Transform,ST-DFT)将输入音频信号从时域转到频域上作分析,但是在分析后再转回到时域时,会遇到相位失真的问题。

美国专利公开号20050010397揭示一利用短时傅立叶转换的时长调整方法,其主要根据人类听觉感知频率响应的变动,选择音频数据的特定频谱带(Spectral Band),这些频谱带根据关于人类听觉感知模型的Bark量度,使用于相位锁定。每一个频谱带皆标示出一频谱波峰(Spectral Peak)。频谱波峰及靠近或远离频谱波峰的频谱线进行不同的相位处理,也因此于后续音频数据必须转回时域而进行信号窗重建(Reconstruction)时,容易造成相位失真,影响播放品质。

发明内容

因此,本发明主要提供一种不需要大量的寄存器的调整播放速度的方法及其装置。

本发明揭露一种调整播放速度的方法,包括有:一听觉感知解码装置接收一音频数据;该听觉感知解码装置进行该音频数据的一第一音频框的频率分析;取得关于该频率分析的一第一频域分析数据;接收一速度调整信号;于该速度调整信号指示加快该音频数据的播放速度时,根据该第一频域分析数据,判断是否舍弃该第一音频框;于该速度调整信号指示放慢该音频数据的播放速度时,根据该第一频域分析数据,判断是否复制该第一音频框;于该第一音频框被判断为可以舍弃时,该听觉感知解码装置舍弃该第一音频框的至少一部分数据;以及于该第一音频框被判断为可以复制时,该听觉感知解码装置复制该第一音频框的至少一部分数据。

本发明另揭露一种调整播放速度的方法,包括有:一听觉感知解码装置接收一音频数据,该音频数据包括多个音频框;该听觉感知解码装置进行该多个音频框的频率分析;接收一速度调整信号;于该速度调整信号指示加快该音频数据的播放速度至(N/(N-M))倍时,对该多个音频框中的N个连续音频框的每一音频框执行用来判断所处理的音频框是否可以舍弃的一调整判断程序,其中N、M为正整数;于通过该调整判断程序,判断该N个连续音频框中有M个音频框可以舍弃时,该听觉感知解码装置舍弃该M个音频框的至少一部分数据;于该速度调整信号指示放慢该音频数据的播放速度至(N/(N+M))倍时,对该多个音频框中的N个连续音频框的每一音频框执行用来判断所处理的音频框是否可以复制的一调整判断程序;以及于通过该调整判断程序,判断该N个连续音频框中有M个音频框可以复制时,该听觉感知解码装置复制该M个音频框的至少一部分数据。其中,该调整判断程序包括:取得对应于所处理的一第一音频框、关于该频率分析的一第一频域分析数据;于该速度调整信号指示加快该音频数据的播放速度时,根据该第一频域分析数据,判断是否舍弃该第一音频框的至少一部分数据;以及于该速度调整信号指示放慢该音频数据的播放速度时,根据该第一频域分析数据,判断是否复制该第一音频框的至少一部分数据。

本发明另揭露一种加速播放速度的方法,包括有一听觉感知解码装置接收一音频数据;该听觉感知解码装置进行该音频数据的一第一音频框的频率分析;取得关于该频率分析的一第一频域分析数据;接收一加速调整信号;根据该第一频域分析数据,判断是否舍弃该第一音频框;以及于该第一音频框被判断为可以舍弃时,该听觉感知解码装置根据该加速调整信号所指示的一播放速度,舍弃该第一音频框的至少一部分数据。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬智科技股份有限公司,未经扬智科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210038338.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top