[发明专利]语音回退方法及其装置在审
申请号: | 202011349230.0 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112309427A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 张旭;张晨;李楠;郑羲光 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/21;G10L25/78 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘超;张军 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 方法 及其 装置 | ||
1.一种语音回退方法,其特征在于,所述方法包括:
在音频播放过程中,确定并记录每个音频帧的类型;
当用户暂停后再次播放音频或者用户有回退操作需求时,基于当前音频帧的类型执行音频回退操作。
2.根据权利要求1所述的方法,其特征在于,基于当前音频帧的类型执行音频回退操作的步骤包括:
在当前音频帧为非语音帧的情况下,不执行音频回退操作;
在当前音频帧为语音帧的情况下,确定音频回退点并将音频退回至所述音频回退点。
3.根据权利要求1或2所述的方法,其特征在于,确定每个音频帧的类型的步骤包括:使用语音检测模型来确定每个音频帧的类型,其中,语音检测模型由神经网络训练而成。
4.根据权利要求3所述的方法,其特征在于,所述语音检测模型包括第一语音检测模型,第一语音检测模型的输入是音频信号的幅度,第一语音检测模型的输出是音频信号的音频类型,
其中,确定音频回退点的步骤包括:将距离当前音频帧向前最近的非语音帧作为所述音频回退点。
5.根据权利要求3所述的方法,其特征在于,所述语音检测模型包括第二语音检测模型,第二语音检测模型的输入是音频信号的幅度,第二语音检测模型的输出是音频信号的音频类型和语音帧距离向前最近的语音起始帧的时间差,
其中,确定音频回退点的步骤包括:根据所述时间差确定距离当前音频帧向前最近的语音起始帧作为所述音频回退点。
6.根据权利要求3所述的方法,其特征在于,确定音频回退点的步骤包括:
基于由语音检测模型的预测结果和由语音活动检测方法的检测结果来确定所述音频回退点,
其中,在第一语音检测模型的情况下,确定音频回退点的步骤包括:
利用语音活动检测方法来确定每个音频帧的类型,
如果由语音检测模型的预测结果与由语音活动检测方法的检测结果一致,则将由语音活动检测方法确定的距离当前音频帧向前最近的非语音帧作为所述音频回退点;
如果由语音检测模型的预测结果与由语音活动检测方法的检测结果不一致,则将由语音检测模型确定的距离当前音频帧向前最近的非语音帧作为所述音频回退点,
其中,在第二语音检测模型的情况下,确定音频回退点的步骤包括:
利用语音活动检测方法来确定每个音频帧的类型,
如果由语音检测模型的预测结果与由语音活动检测方法的检测结果一致,则将从与当前音频帧向前距离所述时间差的帧开始再向前至最近的由语音活动检测方法确定的非语音帧作为所述音频回退点;
如果由语音检测模型的预测结果与由语音活动检测方法的检测结果不一致,则将与当前音频帧向前距离所述时间差的帧作为所述音频回退点。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将当前音频帧和所述音频回退点之间的时间差与预设回退时间进行比较;
在所述时间差大于所述预设回退时间的情况下,将音频回退所述预设回退时间。
8.一种语音回退装置,其特征在于,所述装置包括:
数据获取模块,被配置为获取音频;
数据处理模块,被配置为:
在音频播放过程中,确定并记录每个音频帧的类型;
当用户暂停后再次播放音频或者用户有回退操作需求时,基于当前音频帧的类型执行音频回退操作。
9.一种电子设备,其特征在于,包括:
至少一个处理器;
至少一个存储计算机可执行指令的存储器,
其中,所述计算机可执行指令在被所述至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到7中的任一权利要求所述的语音回退方法。
10.一种存储指令的计算机可读存储介质,其特征在于,当所述指令被至少一个处理器运行时,促使所述至少一个处理器执行如权利要求1到7中的任一权利要求所述的语音回退方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011349230.0/1.html,转载请声明来源钻瓜专利网。