[发明专利]音频标注方法、装置、设备及存储介质在审
| 申请号: | 202111302698.9 | 申请日: | 2021-11-04 |
| 公开(公告)号: | CN114093392A | 公开(公告)日: | 2022-02-25 |
| 发明(设计)人: | 刘巍;王新宇;刘露平;车婷婷 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L25/87 | 分类号: | G10L25/87;G10L15/22;G10L21/0208;G10L15/26 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吕朝蕙 |
| 地址: | 100085 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频 标注 方法 装置 设备 存储 介质 | ||
本公开提供了一种音频标注方法、装置、电子设备、存储介质及计算机程序产品,涉及人工智能技术领域,尤其涉及深度学习、云计算、语音技术、NLP等领域,可应用于音频自动标注等场景。具体实现方案为:通过端点检测模型,标记目标音频片段的起始点时间戳和结束点时间戳;获取目标音频片段中,位于起始点时间戳和结束点时间戳之间的音频片段所表达的音频内容;以及将音频内容、起始点时间戳、以及结束点时间戳,作为与目标音频片段关联的音频标注数据。
技术领域
涉及人工智能技术领域,尤其涉及深度学习、云计算、语音技术、NLP等领域,可应用于音频自动标注等场景。
背景技术
目前,智能终端普遍具有语音交互功能。为了保障智能终端在不同场景下具有较好的语音交互效果,针对每个语音交互功能,通常都需要进行多场景下的语音交互测试。而想要轻松应对众多语音交互功能在多场景下的语音交互测试任务,则需要实现高效的音频数据标注来支撑。
发明内容
本公开提供了一种能够提高音频标注效率且同时能够降低人工成本的音频标注方法、装置、设备、存储介质以及计算机程序产品。
根据本公开的一方面,提供了一种音频标注方法,包括:通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳;获取目标音频片段中,位于起始点时间戳和结束点时间戳之间的音频片段所表达的音频内容;以及将音频内容、起始点时间戳、以及结束点时间戳,作为与目标音频片段关联的音频标注数据。
根据本公开的另一方面,提供了一种音频标注装置,包括:时间戳标注模块,用于通过端点检测模型,标注目标音频片段的起始点时间戳和结束点时间戳;内容获取模块,用于获取目标音频片段中,位于起始点时间戳和结束点时间戳之间的音频片段所表达的音频内容;以及音频标注模块,用于将音频内容、起始点时间戳、以及结束点时间戳,作为与目标音频片段关联的音频标注数据。
根据本公开的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开实施例的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行根据本公开实施例的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现根据本公开实施例的方法。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1示例性示出了适于本公开实施例的系统架构;
图2示例性示出了根据本公开实施例的音频标注方法的流程图;
图3示例性示出了根据本公开实施例的音频标注的原理图;
图4示例性示出了根据本公开另一实施例的音频标注方法的流程图;
图5示例性示出了根据本公开实施例的音频标注装置的框图;
图6示例性示出了用来实现本公开实施例的音频标注方法和装置的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111302698.9/2.html,转载请声明来源钻瓜专利网。





