[发明专利]语音通信方法和设备、操作抖动缓冲器的方法和设备有效

专利信息
申请号: 201210080132.0 申请日: 2012-03-23
公开(公告)号: CN103325385B 公开(公告)日: 2018-01-26
发明(设计)人: 格伦·N·迪金森;孙学京;布朗东·科斯塔 申请(专利权)人: 杜比实验室特许公司
主分类号: G10L25/78 分类号: G10L25/78
代理公司: 北京集佳知识产权代理有限公司11227 代理人: 杜诚,李春晖
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 通信 方法 设备 操作 抖动 缓冲器
【说明书】:

技术领域

发明总体上涉及语音通信。更具体地,本发明的实施例涉及语音通信中的基于语音活动检测(VAD)的音频数据的传输以及抖动缓冲器管理。

背景技术

VAD是一种在判决人声的存在与否的语音处理中使用的技术。VAD可以用在语音通信应用中,以在音频会话的非语音部分期间停用某些处理。例如,VAD可以避免在通过因特网协议传送语音的应用中的静默分组的不必要的编码/传输,以节省开销和网络带宽。VAD是不同语音通信系统如音频会议、回波消除、语音识别、语音编码和免提通话技术的组成部分。

在典型的联网环境中,存在某种与接收的分组在从一个末端发送到另一末端时的出现和定时有关的不确定性。对于被传输的数据是间接或者不是实时的应用,这可以通过使用如下技术来克服,其中,监控传输并且通过重新传输数据和/或提供合适的传输延迟来纠正传输以克服任何网络故障。对于各方彼此实时交互的应用,如在语音通信中,这种方法是不可行的,因为通信延迟可能表示效用和感知品质的显著下降。

传统的解决这个问题的方法是:引入足以给某些等级的网络抖动提供弹性(resilence)的抖动缓冲器或者排队缓冲器,而不需要确保用于语音流的所有数据分组都到达。在某些方法中,这种抖动缓冲器的长度被设置成能够通过使用统计信息或历史信息来给某个等级提供回弹力,以提供允许及时接收某个百分比的分组以用于处理、发送或解码和使用的缓冲和延迟。

这种抖动缓冲器给整个通信路径中引入了不必要的延迟。已经提出了很多方法来管理品质与延迟之间的这种平衡和折衷,以及改善编码、解码或处理,以减小丢失数据分组对于输出语音流的影响。

发明内容

描述了语音通信方法和设备、操作抖动缓冲器的方法和设备。顺序获得音频块。音频块中的每个音频块包括一个或更多个音频帧。对音频块进行语音活动检测。响应于针对音频块中的当前音频块做出发声起始的判决,取得所获得的音频块的序列的子序列。子序列包括紧临在所述当前音频块之前的多个音频块。子序列具有预定长度。针对子序列中的每个音频块做出了非语音的判决。将当前音频块和子序列中的音频块发送给接收方。子序列中的音频块被标识为再处理的音频块,以向所述接收方通知这些音频块与所述当前音频块不同并且被再处理为包括语音。响应于针对当前音频块做出非语音的判决,缓冲存储当前音频块。

下面,参照附图来详细描述本发明的其他特征和优点以及本发明各种实施例的结构和操作。应当注意,本发明不限于本文中所描述的具体实施例。本文中给出的这些实施例仅用于说明。基于本文中包含的教示,其他实施例对于相关领域的技术人员而言也是清楚的。

附图说明

在附图的各图中,以示例性和非限制性的方式对本发明进行阐释,在附图中,类似的附图标记指代类似的元素,其中:

图1A是示意性地示出了本发明实施例可以应用于其中的示例语音通信系统的图;

图1B是示意性地示出了本发明实施例可以应用于其中的另外的示例语音通信系统的图;

图2是示出了根据本发明实施例的用于基于VAD来进行语音通信的示例设备的框图;

图3A是示出了对音频块的示例序列进行VAD的示例场景的图;

图3B是示意性地示出了在图3A所示的场景下发送方与接收方之间的音频块传输的示例过程的图;

图4是示出了根据本发明实施例的基于VAD来进行语音通信的示例方法的流程图;

图5是示出了根据本发明实施例的用于在语音通信中操作一个或更多个抖动缓冲器的示例设备的框图;

图6是示出了根据本发明实施例的在语音通信中操作一个或更多个抖动缓冲器的示例方法的流程图;

图7是示出了根据本发明实施例的用于在语音通信中操作一个或更多个抖动缓冲器的示例设备的框图;

图8是示出了根据本发明实施例的在语音通信中操作一个或更多个抖动缓冲器的示例方法的流程图;

图9A是示出了对音频块的示例序列进行VAD的示例场景的图;

图9B是示意性地示出了发送方与接收方之间的音频块传输的示例过程的图;以及

图10是示出了用于实施本发明实施例的示例性系统的框图。

具体实施例

下面通过参考附图来描述本发明实施例。应注意,为清楚起见,在附图和描述中省略了哪些本领域技术人员已知而对于理解本发明并非必需的组件和过程的陈述和描述。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210080132.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top