[发明专利]具有语音检测周期持续时间补偿的音频传送方法和设备有效
申请号: | 201780052227.2 | 申请日: | 2017-08-25 |
公开(公告)号: | CN109644192B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 柯皑瑞;乔纳斯·埃里克·林德伯格;瑟奇·拉切贝尔;亨里克·伦丁 | 申请(专利权)人: | 谷歌有限责任公司 |
主分类号: | G10L21/043 | 分类号: | G10L21/043;G10L25/87 |
代理公司: | 上海华诚知识产权代理有限公司 31300 | 代理人: | 肖华 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 语音 检测 周期 持续时间 补偿 音频 传送 方法 设备 | ||
1.一种计算机实现的方法,其特征在于,包括:
由第一计算设备,使用由所述第一计算设备的麦克风捕捉的音频数据,来获得用于与第二计算设备进行音频通信会话的音频输入信号;
由所述第一计算设备分析所述音频输入信号,以检测与所述第一计算设备相关联的第一用户的语音输入;
由所述第一计算设备确定从所述音频输入信号被获得直到所述分析已经完成的检测周期持续时间;
从所述第一计算设备向所述第二计算设备传送(i)在所述语音输入开始时开始的所述音频输入信号的部分和(ii)所述检测周期持续时间,其中所述音频输入信号的所述部分和所述检测周期持续时间的接收使得所述第二计算设备加速所述音频输入信号的所述部分的重放,以补偿所述检测周期持续时间;
由所述第一计算设备分析所述音频输入信号,以检测所述第一用户的所述语音输入的结束;以及
在与检测到的所述第一用户的所述语音输入的所述结束相对应的点,终止从所述第一计算设备向所述第二计算设备传送所述音频输入信号的所述部分。
2.根据权利要求1所述的计算机实现的方法,其特征在于,还包括由所述第一计算设备对所述音频输入信号的所述部分进行编码以获得一组音频包,其中所述传送包括向所述第二计算设备传送(i)所述一组音频包和(ii)所述检测周期持续时间。
3.根据权利要求2所述的计算机实现的方法,其特征在于,所述一组音频包和所述检测周期持续时间的接收使得所述第二计算设备:
对所述一组音频包进行解码以获得音频输出信号;
移除与一个或多个音调周期相对应的所述音频输出信号的冗余部分,以获得修改的音频输出信号,其中所述修改的音频输出信号具有比所述音频输出信号更短的长度;以及
由所述第二计算设备的扬声器输出所述修改的音频输出信号。
4.根据权利要求3所述的计算机实现的方法,其特征在于,所述一个或多个移除的音调周期的数量与所述检测周期持续时间相对应。
5.根据权利要求3或4所述的计算机实现的方法,其特征在于,具有小于15毫秒的长度的多个音调周期被移除。
6.根据权利要求3所述的计算机实现的方法,其特征在于,所述一组音频包和所述检测周期持续时间的接收使得所述第二计算设备通过以下方式来移除所述音频输出信号的所述冗余部分:
将所述音频输出信号与其自身互相关以获得自相关信号;以及
检测超过阈值的所述自相关信号的一个或多个峰值,所述阈值指示所述音频输出信号的所述一个或多个音调周期。
7.根据权利要求6所述的计算机实现的方法,其特征在于,所述阈值是在0.9至0.3的范围中。
8.根据权利要求1所述的计算机实现的方法,其特征在于,分析所述音频输入信号以检测所述语音输入包括将语音活动检测(VAD)技术应用到所述音频输入信号,所述VAD技术具有与所述检测周期持续时间相对应的进取性或准确度。
9.根据权利要求8所述的计算机实现的方法,其特征在于,将所述VAD技术应用到所述音频输入信号包括,在所述音频输入信号内区分所述第一用户的所述语音输入与第二用户的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌有限责任公司,未经谷歌有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780052227.2/1.html,转载请声明来源钻瓜专利网。