[发明专利]语音回退方法及其装置在审
申请号: | 202011349230.0 | 申请日: | 2020-11-26 |
公开(公告)号: | CN112309427A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 张旭;张晨;李楠;郑羲光 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G10L25/30 | 分类号: | G10L25/30;G10L25/21;G10L25/78 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 刘超;张军 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 方法 及其 装置 | ||
本公开提供了一种语音回退方法及其装置,所述方法可包括:在音频播放过程中,确定并记录每个音频帧的类型;当用户暂停后再次播放音频或者用户有回退操作需求时,基于当前音频帧的类型执行音频回退操作。
技术领域
本公开涉及音频技术领域,尤其涉及一种语音回退方法及其装置。
背景技术
随着各类音频软件(诸如听书或听歌软件)的普及,音频回退作为一种客户需求被越来越多地提及。音频回退是指当利用某一电子设备进行音频播放时,当暂停播放后再次播放时会重新播放刚播放过的音频内容,或者会向前回退一段时间来重新播放刚播放过的这段时间的音频内容,此过程称为音频回退。传统的音频回退一般是暂停再次播放时无音频回退操作或直接手动进行音频播放条的控制,以进行回退操作。
发明内容
本公开提供一种语音回退方法及其装置,以至少解决现有技术中音频回退操作麻烦且音频回退不准确的问题,极大程度上保证了音频信息的完整性、满足了客户的需求并且便于客户的操作。
根据本公开实施例的第一方面,提供一种语音回退方法,所述方法可包括:在音频播放过程中,确定并记录每个音频帧的类型;当用户暂停后再次播放音频或者用户有回退操作需求时,基于当前音频帧的类型执行音频回退操作。
可选地,基于当前音频帧的类型执行音频回退操作的步骤可包括:在当前音频帧为非语音帧的情况下,不执行音频回退操作;在当前音频帧为语音帧的情况下,确定音频回退点并将音频退回至所述音频回退点。
可选地,确定每个音频帧的类型的步骤可包括:使用语音检测模型来确定每个音频帧的类型,其中,语音检测模型由神经网络训练而成。
可选地,所述语音检测模型可包括第一语音检测模型,第一语音检测模型的输入是音频信号的幅度,第一语音检测模型的输出是音频信号的音频类型。
可选地,确定音频回退点的步骤可包括:将距离当前音频帧向前最近的非语音帧作为所述音频回退点。
可选地,所述语音检测模型可包括第二语音检测模型,第二语音检测模型的输入是音频信号的幅度,第二语音检测模型的输出是音频信号的音频类型和语音帧距离向前最近的语音起始帧的时间差。
可选地,确定音频回退点的步骤可包括:根据所述时间差确定距离当前音频帧向前最近的语音起始帧作为所述音频回退点。
可选地,确定音频回退点的步骤可包括:基于由语音检测模型的预测结果和由语音活动检测方法的检测结果来确定所述音频回退点。
可选地,在第一语音检测模型的情况下,确定音频回退点的步骤可包括:利用语音活动检测方法来确定每个音频帧的类型,如果由语音检测模型的预测结果与由语音活动检测方法的检测结果一致,则将由语音活动检测方法确定的距离当前音频帧向前最近的非语音帧作为所述音频回退点;如果由语音检测模型的预测结果与由语音活动检测方法的检测结果不一致,则将由语音检测模型确定的距离当前音频帧向前最近的非语音帧作为所述音频回退点。
可选地,在第二语音检测模型的情况下,确定音频回退点的步骤可包括:利用语音活动检测方法来确定每个音频帧的类型,如果由语音检测模型的预测结果与由语音活动检测方法的检测结果一致,则将从与当前音频帧向前距离所述时间差的帧开始再向前至最近的由语音活动检测方法确定的非语音帧作为所述音频回退点;如果由语音检测模型的预测结果与由语音活动检测方法的检测结果不一致,则将与当前音频帧向前距离所述时间差的帧作为所述音频回退点。
可选地,所述方法还可包括:在当前音频帧为非语音帧的情况下,如果用户执行音频回退操作,则将音频回退至上一句的语音开始位置。
可选地,所述方法还可包括:将当前音频帧和所述音频回退点之间的时间差与预设回退时间进行比较;在所述时间差大于所述预设回退时间的情况下,将音频回退所述预设回退时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011349230.0/2.html,转载请声明来源钻瓜专利网。