[发明专利]尾点检测方法、装置、设备和存储介质在审
| 申请号: | 202111480838.1 | 申请日: | 2021-12-06 |
| 公开(公告)号: | CN114203204A | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 杜春明;王永乐;赵立峰;王丹;程强;徐木水;李鹏伟 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L25/63;G10L15/22;G10L15/00 |
| 代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孔凡红 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检测 方法 装置 设备 存储 介质 | ||
1.一种尾点检测方法,包括:
获取目标音频;
识别所述目标音频的句式类型;
根据所述句式类型,确定检测等待时长;
根据所述检测等待时长,确定尾点检测结果。
2.根据权利要求1所述的方法,其中,所述根据所述句式类型,确定检测等待时长,包括:
将所述句式类型与预设句式库进行匹配,得到检测类型;其中,所述检测类型包括延时型、常规型和减时型中的至少一种;
根据所述检测类型,确定所述检测等待时长。
3.根据权利要求2所述的方法,若所述检测类型为延时型,则所述根据所述检测类型,确定所述检测等待时长,包括:
确定所述目标音频的环境数据;
根据所述环境数据和/或所述目标音频发起方的语速特征,确定时长调整数据;
根据所述时长调整数据和所述延时型对应基准等待时长,确定所述检测等待时长。
4.根据权利要求3所述的方法,其中,所述环境数据包括语言环境数据和/或录制环境数据。
5.根据权利要求4所述的方法,其中,所述确定所述目标音频的语音环境数据,包括:
分别确定所述目标音频中音频内容的语言类别和所述目标音频对应的情绪类别;
根据所述语言类别和/或情绪类别,生成所述语言环境数据。
6.根据权利要求4所述的方法,其中,所述确定所述目标音频的录制环境数据,包括:
识别所述目标音频所处录制环境中的噪声类别;
识别所述目标音频对应录制区域是否处于熟悉路段;
识别所述目标音频对应录制时刻是否处于熟悉时段;
根据噪声类别、路段识别结果和时段识别结果中的至少一种,生成所述录制环境数据。
7.根据权利要求2-6中任一项所述的方法,还包括:
获取历史音频对应语音指令的响应失败频次;
根据所述响应失败频次,调整所述预设句式库中所述语音指令对应句式类型的检测类型。
8.一种尾点检测装置,包括:
音频获取模块,用于获取目标音频;
句式类型识别模块,用于识别所述目标音频的句式类型;
等待时长确定模块,用于根据所述句式类型,确定检测等待时长;
检测结果确定模块,用于根据所述检测等待时长,确定尾点检测结果。
9.根据权利要求8所述的装置,其中,所述等待时长确定模块,包括:
匹配单元,用于将所述句式类型与预设句式库进行匹配,得到检测类型;其中,所述检测类型包括延时型、常规型和减时型中的至少一种;
等待时长确定单元,用于根据所述检测类型,确定所述检测等待时长。
10.根据权利要求9所述的装置,其中,若所述检测类型为延时型,则所述等待时长确定单元,包括:
环境数据确定子单元,用于确定所述目标音频的环境数据;
时长调整子单元,用于根据所述环境数据和/或所述目标音频发起方的语速特征,确定时长调整数据;
等待时长确定子单元,用于根据所述时长调整数据和所述延时型对应基准等待时长,确定所述检测等待时长。
11.根据权利要求10所述的装置,其中,所述环境数据包括语言环境数据和/或录制环境数据。
12.根据权利要求11所述的装置,其中,所述装置包括语音数据确定子单元,所述语音数据确定子单元,包括:
类别确定从单元,用于分别确定所述目标音频中音频内容的语言类别和所述目标音频对应的情绪类别;
语音数据生成从单元,用于根据所述语言类别和/或情绪类别,生成所述语言环境数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111480838.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示面板及显示装置
- 下一篇:一种高可靠多功能镀膜玻璃及其制备方法与应用





