[发明专利]一种基于音频特征的数字音频延展方法有效

专利信息
申请号: 201110177195.3 申请日: 2011-06-28
公开(公告)号: CN102855883A 公开(公告)日: 2013-01-02
发明(设计)人: 王朝坤;王建民;汪浩;刘璋 申请(专利权)人: 清华大学
主分类号: G10L21/04 分类号: G10L21/04
代理公司: 北京润泽恒知识产权代理有限公司 11319 代理人: 苏培华
地址: 100084*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于音频特征的数字音频延展方法,在数字音频时域延展前,根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段,保证插入操作后音频片段之间自然衔接。在插入操作后,通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展,重复进行至达到延展要求,最大限度地降低音频延展对于音频质量的影响,保证整首乐曲在延展后的播放效果,由于乐曲在被延展后听觉效果与原乐曲接近,没有破坏乐曲的欣赏性。
搜索关键词: 一种 基于 音频 特征 数字音频 延展 方法
【主权项】:
一种基于音频特征的数字音频延展方法,其特征在于,所述方法包括:将原始数字音频文件按照预设标准进行分段,得到以段落为单位记录乐曲信息的数据;根据段落间的相似性对段落分类;选取合适的连续段落插入原乐曲,使其达到用户需求时长的80%到120%;对于插入后的乐曲,选取抗性符合预设需求的段落,对该段落进行长度的时域修改,并重复该步骤,直到达到用户需求时长。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110177195.3/,转载请声明来源钻瓜专利网。

同类专利
  • 子带处理单元以及生成合成子带信号的方法-201410461177.1
  • 拉尔斯·维尔默斯 - 杜比国际公司
  • 2011-01-05 - 2017-09-01 - G10L21/04
  • 本文档涉及子带处理单元以及生成合成子带信号的方法。子带处理单元包括块提取器、非线性帧处理单元以及重叠及相加单元。块提取器被配置为重复地根据多个复值分析样本得出L个输入样本的帧,其中块提取器被配置为根据反映所述输入音频信号的瞬间声学性质的控制数据来设置帧长度L;以及在得出L个输入样本的接下来的帧之前对多个复值分析样本应用p个样本的块跳跃大小由此生成输入样本的一系列帧。非线性帧处理单元被配置为根据输入样本的帧确定经处理样本的帧。重叠及相加单元被配置为通过将经处理样本的一系列帧的样本进行重叠及相加来确定合成子带信号,其中分析子带信号与关于输入音频信号被时间拉伸和/或频率换位的信号的频带相关联。
  • 子带处理单元以及生成合成子带信号的方法-201410461154.0
  • 拉尔斯·维尔默斯 - 杜比国际公司
  • 2011-01-05 - 2017-05-31 - G10L21/04
  • 本文档涉及子带处理单元以及生成合成子带信号的方法。子带处理单元包括第一块提取器、第二块提取器、非线性帧处理单元和重叠及相加单元。第一块提取器被配置为重复地根据多个第一分析样本得出L个第一输入样本的帧;帧长度L大于1;以及在得出L个第一输入样本的接下来的帧之前,对多个第一分析样本应用p个样本的块跳跃大小;由此生成L个第一输入样本的一系列帧。第二块提取器被配置为通过对多个第二分析样本应用块跳跃大小p来得出第二输入样本的一系列帧;其中,每个第二输入样本对应于第一输入样本的帧。
  • 语音信号复原装置以及语音信号复原方法-201180073679.1
  • 细谷耕佑;古田训;山浦正 - 三菱电机株式会社
  • 2011-12-27 - 2014-05-28 - G10L21/04
  • 音源生成部(101)根据未进行噪声抑制处理的窄频带语音信号生成包括所复原的频带的微细构造的音源信号。另一方面,噪声抑制部(102)对窄频带语音信号进行噪声抑制,谱包络推测部(103)推测所复原的频带的谱包络。信号合成部(104)合成音源信号和谱包络来生成虚拟语音信号,带通滤波器部(105)使所复原的频带的虚拟语音信号通过,信号加法部(106)对窄频带语音信号相加所复原的频带的虚拟语音信号而生成宽频带的语音复原信号。
  • 改进的谐波转置-201310475634.8
  • 佩尔·埃克斯特兰德;拉尔斯·法尔克·维尔默斯 - 杜比国际公司
  • 2010-03-12 - 2014-02-05 - G10L21/04
  • 本发明涉及在时间上和/或频率上对信号进行转置,尤其涉及音频信号的编码。更具体地,本发明涉及包括频域谐波转置器的高频重建(HFR)方法。描述了用于使用转置因子T从输入信号生成转置的输出信号的方法和系统。该系统包括:长度La的分析窗,其提取输入信号的帧;以及M阶的分析变换单元,其将样本变换成M个复数系数。M是转置因子T的函数。该系统还包括:非线性处理单元,其通过使用转置因子T来改变复数系数的相位;M阶的合成变换单元,其将改变的系数变换成M个改变的样本;以及长度Ls的合成窗,其生成输出信号的帧。
  • 一种基于音频特征的数字音频延展方法-201110177195.3
  • 王朝坤;王建民;汪浩;刘璋 - 清华大学
  • 2011-06-28 - 2013-01-02 - G10L21/04
  • 本发明提供了一种基于音频特征的数字音频延展方法,在数字音频时域延展前,根据乐曲段落的相似性在乐曲中选择合适的位置插入音频片段,保证插入操作后音频片段之间自然衔接。在插入操作后,通过计算音频片段的延展抗性找出最优的可延展片段进行适度延展,重复进行至达到延展要求,最大限度地降低音频延展对于音频质量的影响,保证整首乐曲在延展后的播放效果,由于乐曲在被延展后听觉效果与原乐曲接近,没有破坏乐曲的欣赏性。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top