[发明专利]音频标注方法、装置、设备及存储介质在审
| 申请号: | 202111302698.9 | 申请日: | 2021-11-04 |
| 公开(公告)号: | CN114093392A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 刘巍;王新宇;刘露平;车婷婷 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/22;G10L21/0208;G10L15/26 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 标注 方法 装置 设备 存储 介质 | ||
1.一种音频标注方法,包括:
通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳;
获取所述目标音频片段中,位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容;以及
将所述音频内容、所述起始点时间戳、以及所述结束点时间戳,作为与所述目标音频片段关联的音频标注数据。
2.根据权利要求1所述的方法,其中:
响应于确定所述目标音频片段为在安静场景下进行录制而获得的音频片段,通过所述端点检测模型,标注所述目标音频片段的所述起始点时间戳和所述结束点时间戳。
3.根据权利要求1或2所述的方法,还包括:在通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳之前,
针对在非安静场景下进行录制而获得的原始音频片段,先进行噪声去除,以获得对应的目标音频片段,
其中,在基于所述原始音频片段获得所述对应的目标音频片段后,再针对所述对应的目标音频片段,通过所述端点检测模型,标注对应的起始点时间戳和对应的结束点时间戳。
4.根据权利要求1至3中任一项所述的方法,其中,获取所述目标音频片段中,位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容,包括:
响应于确定针对所述目标音频片段存在预先设定的音频内容参考答案,获取所述音频内容参考答案;以及
将获取的所述音频内容参考答案作为位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容。
5.根据权利要求4所述的方法,其中:
响应于确定针对所述目标音频片段存在预先设定的音频内容参考答案,先确定所述目标音频片段中位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容与所述音频内容参考答案一致,再获取所述音频内容参考答案。
6.根据权利要求1至3中任一项所述的方法,其中,获取所述目标音频片段中,位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容,包括:
响应于确定针对所述目标音频片段不存在预先设定的音频内容参考答案,利用语音识别模型,获取所述目标音频片段中位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容。
7.根据权利要求1所述的方法,还包括:在通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳之前,
先对原始音频片段进行噪声去除,以获得对应的目标音频片段;
再针对该目标音频片段,通过所述端点检测模型,标注对应的起始点时间戳和对应的结束点时间戳。
8.一种音频标注装置,包括:
时间戳标注模块,用于通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳;
内容获取模块,用于获取所述目标音频片段中,位于所述起始点时间戳和所述结束点时间戳之间的音频片段所表达的音频内容;以及
音频标注模块,用于将所述音频内容、所述起始点时间戳、以及所述结束点时间戳,作为与所述目标音频片段关联的音频标注数据。
9.根据权利要求8所述的装置,其中:
所述时间戳标注模块,还用于在确定所述目标音频片段为在安静场景下进行录制而获得的音频片段的情况下,通过所述端点检测模型,标注所述目标音频片段的所述起始点时间戳和所述结束点时间戳。
10.根据权利要求8或9所述的装置,还包括:
第一噪声去除模块,用于针对在非安静场景下进行录制而获得的原始音频片段,进行噪声去除,以获得对应的目标音频片段;
其中,所述时间戳标注模块还用于针对由所述第一噪声去除模块通过噪声去除获得的目标音频片段,通过所述端点检测模型,标注对应的起始点时间戳和对应的结束点时间戳。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111302698.9/1.html,转载请声明来源钻瓜专利网。





