[发明专利]音频数据标注的方法及其系统在审

申请号：	201611247230.3	申请日：	2016-12-29
公开（公告）号：	CN108257614A	公开（公告）日：	2018-07-06
发明（设计）人：	晁卫	申请（专利权）人：	北京酷我科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/24;G10L25/12;G10L25/30;G10L25/45
代理公司：	北京亿腾知识产权代理事务所 11309	代理人：	陈霁
地址：	100084 北京市海淀区农大***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频数据标注音频片段分类标签训练模型准确率自动化分析
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种音频数据标注的方法及其系统，该方法包括：接收待标注的音频数据；获取待标注的音频数据的音频片段，采用预训练的至少一个训练模型对音频片段进行分析，确定音频片段的分类标签；为音频片段对应的所述待标注的音频数据标注分类标签。实现了音频数据的自动化标注，提高了音频数据标注的准确率。

技术领域

本发明涉及音频分析和处理技术领域，尤其设计一种音频数据标注的方法及其系统。

背景技术

随着声音采集技术和互联网技术的快速发展，每天都会产生大量的音频数据(例如歌曲)上传到网络，音频数据的风格分类可以帮助用户快速寻找到喜欢的音频数据，但传统的音频数据分类，即对音频数据进行情感标注需要人工筛选，并进行标注，需要大量的人力和时间，且会因为个人的主观因素导致音频数据分类结果具有很差差异，导致音频数据标注的准确性低。

发明内容

本发明提供一种音频数据标注的方法及其系统，通过提取音频数据中的部分音频数据的特征向量，完成了音频数据的自动化标注，提到了音频数据标注的准确性。

第一方面，本发明实施例提供一种音频数据标注的方法，该方法包括：

接收待标注的音频数据；

获取待标注的音频数据的音频片段，采用预训练的至少一个训练模型对音频片段进行分析，确定音频片段的分类标签；

为音频片段对应的待标注的音频数据标注分类标签。

通过获取待标注音频数据的音频片段，并经训练模型对音频片段进行分析，并为音频片段对应的待标注的音频数据进行分类标签的标注，实现了音频数据的自动化标注，提高了音频数据标注的准确率。

可选地，在一个设计方案中，在采用预训练的至少一个训练模型对音频片段进行分析之前，方法还包括：

按照至少一个分类标签获取每个分类标签对应的多个待训练音频数据；

获取每个分类标签对应的多个待训练的音频数据的音频片段，并提取音频片段的特征向量；

对至少一个分类标签对应的多个音频片段的特征向量进行训练，得到至少一个分类标签对应的至少一个训练模型。

可选地，在一个设计方案中，提取音频片段的特征向量，包括：