[发明专利]基于语音功率谱的低速率语音编码方法无效
申请号: | 201210119567.1 | 申请日: | 2012-04-20 |
公开(公告)号: | CN102664021A | 公开(公告)日: | 2012-09-12 |
发明(设计)人: | 汤一彬;张德国;李枭雄;单鸣雷;朱昌平;韩庆邦;高远;殷澄 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L19/12 | 分类号: | G10L19/12 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 213022 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于语音功率谱的低速率语音编码方法,具体涉及到基于字典学习的信号稀疏表示和重构的语音处理技术。它采用以语音功率谱为主要输出参数的高效语音模型为低速率语音编码的模型,在发送端,语音信号经处理后输出语音功率谱,随后该参数通过稀疏理论进行压缩,最终转换成比特流,实现无线传输。采用接收端的字典学习方法,为低速率语音通信得以实现提供保障,并利用前帧合成语音的各种信息进行最大化的字典学习;采用基于能量的稀疏系数与字典原子的匹配,构造测量矩阵使得匹配的正确性得以提高,实现在接收端语音功率谱的最优恢复。 | ||
搜索关键词: | 基于 语音 功率 速率 编码 方法 | ||
【主权项】:
一种基于语音功率谱的低速率语音编码方法,其特征是,包含以下步骤:(1)发送端编码的步骤:语音信号通过语音模型输出参数,输出的参数经过数据处理,产生稀疏系数,并转换成比特流;(2)接收端解码的步骤:对接收到的参数进行数据处理,恢复相关参数,并通过基于语音功率谱的语音合成模型获得最终的合成语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210119567.1/,转载请声明来源钻瓜专利网。
- 上一篇:用于调节机动车的车轮的外倾和/或前束的装置
- 下一篇:亲水性包衣
- 同类专利
- 处理音频信号的方法和装置-201180015619.4
- 丁奎赫;金大焕;李昌宪;金洛榕;田惠晶;李炳锡;姜仁圭 - LG电子株式会社
- 2011-03-23 - 2012-12-05 - G10L19/12
- 本发明涉及用于处理音频信号的方法,包括以下步骤:执行音频信号的当前帧的频谱分析,以确定指示当前帧对应于包括第一频带和第二频带的多个频带中的哪一个的带宽信息;基于该带宽信息来确定关于与当前帧对应的阶数(order)的信息;执行当前帧的线性预测分析,以生成第一阶数的第一组线性预测变换系数;对第一组线性预测系数执行向量量化以生成第一组索引;执行当前帧的线性预测分析,以根据关于阶数的信息来生成第二阶数的第二组线性预测变换系数;以及当生成了第二组线性预测系数时,通过使用第一组索引和第二组线性预测变换系数,对第二组差执行向量量化。
- 基于残差信号频谱重构的声码器-201210253946.X
- 陶建华;温正棋 - 中国科学院自动化研究所
- 2012-07-20 - 2012-10-24 - G10L19/12
- 本发明提供了一种基于残差信号频谱重构的声码器,包括:参数提取模块,用于接收待分析的语音数据、计算基频参数和频谱参数;逆滤波模块,用于根据频谱参数设计逆滤波器对语音数据逆滤波,获得残差信号;周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成周期激励信号;非周期信号支路,与逆滤波模块相连接,用于根据基频参数和逆滤波后的残差信号,生成非周期激励信号;以及参数语音合成器模块,与周期信号支路和非周期信号支路相连接,用于根据周期频谱参数、周期激励信号和非周期激励信号,调用语音合成器合成语音。本发明对逆滤波后的残差信号进行建模,使激励信号具有较高的准确性,提高了合成语音的音质。
- 基于语音功率谱的低速率语音编码方法-201210119567.1
- 汤一彬;张德国;李枭雄;单鸣雷;朱昌平;韩庆邦;高远;殷澄 - 河海大学常州校区
- 2012-04-20 - 2012-09-12 - G10L19/12
- 本发明公开了一种基于语音功率谱的低速率语音编码方法,具体涉及到基于字典学习的信号稀疏表示和重构的语音处理技术。它采用以语音功率谱为主要输出参数的高效语音模型为低速率语音编码的模型,在发送端,语音信号经处理后输出语音功率谱,随后该参数通过稀疏理论进行压缩,最终转换成比特流,实现无线传输。采用接收端的字典学习方法,为低速率语音通信得以实现提供保障,并利用前帧合成语音的各种信息进行最大化的字典学习;采用基于能量的稀疏系数与字典原子的匹配,构造测量矩阵使得匹配的正确性得以提高,实现在接收端语音功率谱的最优恢复。
- 一种相邻高低速率编码模式间切换的变速率音频编码方法-201110180050.9
- 王晶;杨果;孟凯;赵胜辉 - 北京理工大学
- 2011-06-29 - 2011-11-23 - G10L19/12
- 本发明涉及一种相邻高低速率编码模式间切换的变速率音频编码方法,属于音频编码领域,特别是适合用于多速率的音频编码器。其技术特点是首先对每帧音频信号在高速率下进行编解码,将该速率下各种编码模式的编码输入信号和解码输出信号通过感知加权滤波器后计算平均分段信噪比,并选出使感知加权平均分段信噪比最大的编码模式,然后在临近高速率的低编码速率下选出使编码输入信号和解码输出信号的感知加权平均分段信噪比最大的编码模式,最后分别对于高、低速率下选出来的编码模式,计算编码输入信号和解码输出信号平均分段信噪比,如果低速率编码模式下的平均分段信噪比相比高速率编码模式下的偏大,则切换到低速率编码模式,反之则切换到高速率编码模式。本发明的方法对每帧音频信号根据输出信号相对输入信号的失真大小,在相邻的高低编码速率下的各编码模式间切换,从而在保持良好编码质量的同时,降低音频信号的平均编码速率,从而提高多速率音频编码器的编码效率。
- 对音频/语音信号进行编码和解码的方法和设备-200980135987.5
- 吴殷美;金重会;成昊相;金美英;朱基岘 - 三星电子株式会社
- 2009-07-14 - 2011-08-10 - G10L19/12
- 提供了一种对音频/语音信号进行编码和解码的方法和设备。输入的音频信号或语音信号可被变换为高频率分辨率信号和高时间分辨率信号中的至少一个。可通过确定合适的分辨率来对信号进行编码,可对编码的信号进行解码,从而,可处理音频信号、语音信号以及音频信号和语音信号的混合信号。
- 降噪装置及包括降噪装置的声音编码装置-201110065940.5
- 安永和敏;森井利幸;渡边泰助;江原宏幸 - 松下电器产业株式会社
- 1997-11-06 - 2011-07-20 - G10L19/12
- 本发明揭示一种降噪装置及包括降噪装置的声音编码装置。将以往的CELP型声音编码/解码装置的噪声矢量读出单元和噪声码本,分别置换为根据输入振种的值输出不同矢量序列的振荡器和存储多个振种(产生振荡器振荡的“种子”)的振种存储单元。由此,不必将固定矢量原样地存储在固定码本(ROM)中,能大幅度地减小存储器容量。
- 用于在超帧中量化和逆量化线性预测系数滤波器的设备和方法-200980126739.4
- 菲利普.古尔奈;布鲁诺.贝塞特;雷德万.萨拉米 - 沃伊斯亚吉公司
- 2009-07-10 - 2011-07-06 - G10L19/12
- 用于在包括一序列帧的超帧中对在该序列的帧期间计算出的LPC滤波器进行量化的设备和方法。LPC滤波器量化设备和方法包含:绝对量化器,其用于使用绝对量化来首先量化一个LPC滤波器;以及其他LPC滤波器的至少一个量化器,其使用从由绝对量化和相对于LPC滤波器当中至少一个先前量化的滤波器的差分量化所组成的组中选择出的量化模式。对于逆量化,至少接收首先量化的LPC滤波器;并且逆量化器使用绝对逆量化来对首先量化的LPC滤波器进行逆量化。如果接收到了除了首先量化的LPC滤波器以外的任何量化的LPC滤波器,则逆量化器使用绝对逆量化和相对于至少一个先前接收到的量化的LPC滤波器的差分逆量化之一来对该量化的LPC滤波器进行逆量化。
- 用于低位速率应用的对过渡语音帧的译码-200980123138.8
- 阿洛科·K·古普塔;沙拉什·曼朱纳什;阿南塔帕德马纳卜汉·坎达达伊 - 高通股份有限公司
- 2009-06-19 - 2011-05-18 - G10L19/12
- 本发明揭示用于过渡语音帧的低位速率译码的系统、方法和设备。
- 通信设备-201010294871.0
- 纳拜瑞简·塞亚爵 - 美国博通公司
- 2010-09-28 - 2011-04-27 - G10L19/12
- 本发明涉及一种通信设备,包括存储器、输入接口、处理模块以及发送器。处理模块从输入接口接收数字信号,其中所述数字信号包括需要的数字信号成分和不需要的数字信号成分。该处理模块根据不需要的数字信号成分识别多个码书中的一个。然后,该处理模块根据需要的数字信号成分从多个码书中的该个码书中识别码书入口,以产生选定的码书入口。接下来,该处理模块根据选定的码书入口产生编码信号,其中该编码信号包括需要的数字信号成分的基本未衰减表示和不需要的数字信号成分的基本衰减表示。发送器根据信令协议将编码信号转换为外传信号并将其发送。
- 转码方法、装置和通信设备-200910009647.X
- 鲍长春;徐昊;唐繁荣;胡翔宇 - 北京工业大学;华为技术有限公司
- 2009-01-21 - 2010-07-21 - G10L19/12
- 本发明提供一种转码方法、装置和通信设备。该方法包括:接收发送端输入的比特流;确定接收端使用非连续性传输属性、以及所述输入的比特流的帧类型;根据确定的结果采用相应的处理方式对所述输入的比特流进行转码。本发明实施例根据接收端使用非连续性传输DTX属性、以及输入比特流的帧类型的情况对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。
- 一种音频编码方法和音频编码器-200810181909.6
- 马鸿飞;柳巍;李倩;宋少鹏;许丽净 - 华为技术有限公司;西安电子科技大学
- 2008-11-24 - 2010-06-16 - G10L19/12
- 本发明公开了一种音频编码方法和音频编码器方法。本发明实施例还提供相应的音频编码器。本发明技术方案由于利用线性预测LP和卷曲线性预测WLP的频率分辨特性非常接近人类听觉特性中的临界频带和掩蔽特性的特点,建立心理声学模型,获取到掩蔽门限,根据获取的掩蔽门限对音频信号进行编码,降低了建立心理声学模型的复杂度,易于实现,降低了心理声学模型在硬件实现的成本,降低了硬件的功率消耗。
- 编码方法、编码器、解码方法及解码器-200810126938.2
- 鲍长春;辛杰 - 北京工业大学;华为技术有限公司
- 2008-06-18 - 2009-12-23 - G10L19/12
- 本发明实施例提供一种清音或过渡音模式下的编码方法,包括:获得去均值后的无偏矢量;对所述去均值后的无偏矢量进行矢量分裂,得到多个分裂子矢量;对所述多个分裂子矢量进行矢量量化,得到一组码字索引值。本发明还提供清音或过渡音模式下的编码器、解码方法、解码器、矢量量化系统、浊音或一般音模式下的编码方法、编码器、解码方法、解码器、矢量量化系统和矢量量化方法、装置。
- 语音解码中噪音增强后处理的方法和装置-200810028014.9
- 胡瑞敏;程苗;杨玉红;方圆;张勇 - 华为技术有限公司;武汉大学
- 2008-05-12 - 2009-11-18 - G10L19/12
- 本发明实施例公开了一种语音解码中噪音增强后处理方法,根据语音帧的谱包络和长时平均谱包络获得噪音因子;判断所述噪音因子大于预设的门限值;根据所述噪音因子和所述语音帧的自适应码本增益对所述语音帧的固定码矢的能量进行平滑;根据平滑后的固定码矢的能量获得平滑后的固定码矢。本发明还公开了一种噪音增强后处理装置。采用本发明,可以降低语音解码中噪音增强后处理的计算复杂度。
- 编解码端的固定码本激励的搜索方法及装置-200810105615.5
- 胡瑞敏;张勇;周成;高戈;张德军 - 华为技术有限公司
- 2008-04-30 - 2009-11-04 - G10L19/12
- 一种编解码端的固定码本激励的搜索方法及装置,其包括:在编码端,获得当前输入子帧固定码本激励搜索的目标信号;对所述目标信号进行格型矢量量化处理,根据处理结果确定搜索获得的固定码本激励。在解码端,接收编码码流,获取编码码流中的固定码本索引;并根据所述的固定码本激励索引确定对应的固定码本激励,且所述的固定码本激励为经过格型矢量量化处理获得的固定码本激励。本发明实施例中,由于其使用格型矢量量化的处理方式获得固定码本激励,因而,可以有效减少对存储空间的占用,降低基于固定码本激励搜索的编解码过程的实现复杂度,并可以较好地提升语音信息的音质效果。
- 一种转码方法和装置-200810105691.6
- 鲍长春;徐昊;唐繁荣;胡翔宇 - 北京工业大学;华为技术有限公司
- 2008-04-30 - 2009-11-04 - G10L19/12
- 本发明实施例提供了一种转码方法和装置。所述方法包括:获取源端码流中的当前子帧的自适应码书增益gp和固定码书增益的比例因子γgc;根据缩放因子α,对所述γgc进行处理得到α×γgc;根据目标端的量化规则,对所述α×γgc和gp进行量化,实现转码。所述装置包括:获取模块、缩放模块和量化模块。本发明通过引入缩放因子对固定码书增益比例因子γgc进行缩放后,采用新的量化准则在目标编码器的增益码表中进行搜索,完成增益参数的转码,从而有效地降低增益参数转码的计算复杂度,提高转码语音的质量。
- 一种自适应多速率窄带编码方法及编码器-200810036834.2
- 向为 - 向为
- 2008-04-30 - 2009-11-04 - G10L19/12
- 本发明提出一种采用新的自适应多速率编码器和编码方法,其话音激活检测较针对编码帧对应的合成数字话音,并且根据话音激活检测结果和不连续发送的发送类型确定编码速率从而压缩了语音传送速率,所述的改变重新对自适应多速率编码器和编码方法作了总体上的更新,即,编码器根据发送帧的类型确定其激励信号使译码器合成的声音信号能准确地反映原始声音的听觉效果。本发明可直接应用于第三代移动通信系统——通用移动通信系统的话音编码技术中。
- 一种自适应多速率宽带编码方法及编码器-200810036835.7
- 向为 - 向为
- 2008-04-30 - 2009-11-04 - G10L19/12
- 本发明提出一种采用新的自适应多速率编码器和编码方法,其话音激活检测较针对编码帧对应的合成数字话音,并且根据话音激活检测结果和不连续发送的发送类型确定编码速率从而压缩了语音传送速率,所述的改变重新对自适应多速率编码器和编码方法作了总体上的更新,即,编码器根据发送帧的类型确定其激励信号使译码器合成的声音信号能准确地反映原始声音的听觉效果。本发明可直接应用于第三代移动通信系统——通用移动通信系统的话音编码技术中。
- 用于编码和解码宽带语音信号的方法、装置和系统-200780044020.7
- 李寅诚;金钟学;郑奎赫;徐商源 - 三星电子株式会社;忠北大学校产学协力团
- 2007-11-16 - 2009-09-23 - G10L19/12
- 提供一种用于编码或解码宽带语音信号的方法、装置和系统。该方法包括:从宽带语音信号中提取线性预测系数(LPC);输出线性预测(LP)残留信号;音调-搜索LP残留信号的谱;提取LP残留信号的谱幅度和相位,其与阻尼因子对应;从所提取的谱幅度和相位当中获取其中将LP残留信号的功率值最小化的第一谱幅度和第一相位;量化第一谱幅度和第一相位;以及解码宽带语音信号。该装置包括:线性预测系数(LPC)分析器;LPC逆滤波器;音调搜索单元;正弦分析器;以及相位和谱幅度量化器。该系统包括:宽带语音编码装置;以及宽带语音解码装置。
- 语音信号处理方法及装置-200810026779.9
- 胡瑞敏;杨玉红;程苗;方圆;张勇 - 华为技术有限公司;武汉大学
- 2008-03-13 - 2009-09-16 - G10L19/12
- 本发明实施例公开了一种语音信号处理方法,包括对第一自适应码矢进行低通滤波处理,得到第二自适应码矢,并根据第一自适应码矢的第一能量值及第二自适应码矢的第二能量值,获得能量缩放因子,采用所述能量缩放因子对所述第二自适应码矢进行能量缩放,得到第三自适应码矢,并将固定码矢及第三自适应码矢合成第一激励信号。本发明实施例还公开了一种语音信号处理装置。采用本发明实施例,直接对自适应码矢进行低通滤波从而达到基音增强的效果且所达到的基音增强的效果较好,并且利用能量缩放因子对处理得到的激励信号进行了能量平滑,提高主观听觉效果。
- 一种增益量化方法及装置-200810006804.7
- 张涛;张海;李欣;贺家琳;张德军;陈龙吟 - 华为技术有限公司;天津大学
- 2008-01-31 - 2009-08-05 - G10L19/12
- 本发明涉及编码技术,公开了一种增益量化方法及装置,其中增益量化方法包括:计算一帧信号中一个子帧的固定码书增益;对所述固定码书增益进行量化,获得所述一个子帧的固定码书增益的量化值;使用所述固定码书增益的量化值和所述信号的其余子帧的固定码书增益,计算所述其余子帧的固定码书增益的预测系数;对所述其余子帧的固定码书增益的预测系数进行量化。使用本发明实施例提供的技术方案,可以不对估计能量值进行量化,节省量化比特。
- 搜索固定码本的方法和设备以及使用搜索固定码本的方法和设备对语音信号编码/解码的方法和设备-200780019039.6
- 李康殷;吴殷美;成昊相;孙昌用;朱基岘;金重会 - 三星电子株式会社
- 2007-05-22 - 2009-06-10 - G10L19/12
- 提供一种用于使用码激励线性预测(CELP)算法将语音信号编码和解码的方法和设备。为了基于CELP降低比特率,而不降低增强层的性能,将核心层的固定码本和增强层的固定码本中的每个分成多个空间。搜索除了与核心层的固定码本的多个空间当中确定的最低失真空间相应的空间以外的增强层的固定码本的空间。
- 矢量量化方法及矢量量化器-200710166471.X
- 李立雄;张德军;张亮;郎玥;吴文海;王庭红 - 华为技术有限公司
- 2007-11-13 - 2009-05-20 - G10L19/12
- 本发明涉及编码技术,公开了矢量量化方法和矢量量化器,其中矢量量化方法包括:获取待量化矢量,对待量化矢量进行N级量化,获得N级量化后的残差矢量,其中N为正整数;按照待量化矢量进行N级量化时获得的各级码书的索引号中的部分或全部,从预置的至少两个调整量组合中选取一个调整量组合;根据选取的所述调整量组合获得与所述待量化矢量对应的索引号。使用本发明实施例提供的技术方案,可以减少编码所需的编码空间。
- G.729标准中线谱对系数转换及量化的方法-200810162157.9
- 陈科明;戴一奇;洪爱金;马琪;潘剑侠 - 杭州电子科技大学;杭州初灵信息技术有限公司
- 2008-11-27 - 2009-04-15 - G10L19/12
- 本发明涉及G.729标准中线谱对系数转换及量化的方法。传统方法运算复杂、影响语音处理效率。本发明中转换方法是:首先将码书中的64个点分成10个区,10个线谱对系数qi分别与10个区相对应,然后将10个区中的最大值点与10个qi比较,将找到的10个与对应的10个qi最匹配的点通过计算得到10个LSF系数ωi。量化方法是:首先将原有码书中的所有10维的码字转换成5维的码字,然后将10个LSF系数所构成的矢量转化为5维的目标矢量,计算码书中的各个码字与目标矢量之间的平方误差,得到最后的量化结果。本发明在算法复杂度上降低了许多。同时得到的语音音质与用传统方法得到的音质基本一样,且比用传统方法得到的音质要佳。
- 一种变速率的声码器及其编码方法-200810210215.0
- 向为 - 向为
- 2008-08-09 - 2009-03-18 - G10L19/12
- 本发明提出一种新的变速率码激励线性预测编码器和编码方法,其话音激活检测针对编码帧对应的合成数字话音,并且保持编码方和译码方采用一致的激励信号,根据合成数字话音帧的话音激活检测结果确定编码速率从而提高了检测的效率和压缩了语音传送速率,所述的改变对变速率码激励线性预测编码器和编码方法作了总体上的更新,即,编码器根据发送帧的类型确定其激励信号使译码器合成的声音信号能准确地反映原始声音的听觉效果。
- 专利分类