[发明专利]编码和解码语音与音频统合信号的方法在审
申请号: | 201310487746.5 | 申请日: | 2009-07-14 |
公开(公告)号: | CN103531203A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 李泰辰;白承权;金珉第;张大永;徐廷一;姜京玉;洪镇佑;朴浩综;朴荣喆 | 申请(专利权)人: | 韩国电子通信研究院;光云大学校产学协力团 |
主分类号: | G10L19/20 | 分类号: | G10L19/20;G10L19/008 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王怀章 |
地址: | 韩国*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 解码 语音 音频 统合 信号 方法 | ||
1.一种用于统合地编码语音信号和音频信号的编码方法,所述编码方法包括:
分析输入信号的特征;
当所述输入信号是立体声信号时,将所述输入信号降混频为单声道信号,并从所述输入信号中提取立体声声音图像信息;
扩展所述输入信号的频带;
针对频带扩展的输出信号来转换采样率;
当所述输入信号是语音特征信号时,使用语音编码模块将输入信号进行编码;
当所述输入信号是音频特征信号时,使用音频编码模块将输入信号进行编码;和
使用语音信号编码的输出信号和音频信号编码的输出信号,来生成比特流。
2.如权利要求1所述的编码方法,其中,所述分析输入信号的特征的步骤包括:使用输入信号的过零率ZCR、相关性、帧单位的能量中的至少一个来分析输入信号。
3.如权利要求1所述的编码方法,其中,所述立体声声音图像信息包括:左声道与右声道间的相关性和左声道与右声道间的级别差异中的至少一个。
4.如权利要求1所述的编码方法,其中,所述扩展所述输入信号的频带的步骤包括:在采样率的转换之前将输入信号扩展至高频带信号。
5.如权利要求1所述的编码方法,其中,所述针对频带扩展的输出信号来转换采样率的步骤包括:将输入信号的采样率转换为语音信号编码或音频信号编码所要求的采样率。
6.如权利要求1所述的编码方法,其中,所述针对频带扩展的输出信号来转换采样率的步骤包括:
将输入信号降采样1/2;和
将1/2降采样的输出信号降采样1/2。
7.如权利要求6所述的编码方法,其中,当所述音频编码模块是基于高级音频编码AAC的编码模块时,执行1/2降采样。
8.如权利要求6所述的编码方法,其中,当所述语音编码模块是基于自适应多速率宽带加AMR-WB+的编码模块时,执行1/2降采样的输出信号的1/2降采样。
9.如权利要求1所述的编码方法,其中,所述使用语音编码模块将输入信号进行编码的步骤包括:使用基于代码激励线性预测CELP的语音编码模块将输入信号进行编码。
10.如权利要求1所述的编码方法,其中,所述使用音频编码模块将输入信号进行编码的步骤包括:使用基于时间/频率的音频编码模块将输入信号进行编码。
11.如权利要求1所述的编码方法,其中,所述使用语音信号编码的输出信号和音频信号编码的输出信号,来生成比特流的步骤包括:当输入信号在语音特征信号和音频特征信号之间变化时,在比特流中存储与用于帧单位改变的补偿相关的信息。
12.如权利要求11所述的编码方法,其中,所述用于帧单位改变的补偿相关的信息包括:时间/频率转换体系与时间/频率转换大小中的至少一个。
13.一种用于统合地解码语音信号和音频信号的解码方法,所述解码方法包括:
分析输入比特流信号;
当所述比特流信号与语音特征信号相关时,使用语音解码模块将比特流信号进行解码;
当所述比特流信号与音频特征信号相关时,使用音频解码模块将比特流信号进行解码;
当语音特征信号与音频特征信号之间的转换被执行时,补偿输入比特流信号;
转换比特流信号的采样率;
使用解码的低频带信号生成高频带信号;和
使用立体声扩展参数生成立体声信号。
14.如权利要求13所述的解码方法,其中,所述转换比特流信号的采样率的步骤包括:将在核心频带中被转换并被使用的采样率,重新转换为之前的采样率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩国电子通信研究院;光云大学校产学协力团,未经韩国电子通信研究院;光云大学校产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310487746.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含胡麻添加剂的汽油
- 下一篇:一种棉杆生物质真空热解液化制备生物油的工艺