[发明专利]音频数据标注的方法及其系统在审
申请号: | 201611247230.3 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108257614A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 晁卫 | 申请(专利权)人: | 北京酷我科技有限公司 |
主分类号: | G10L25/51 | 分类号: | G10L25/51;G10L25/24;G10L25/12;G10L25/30;G10L25/45 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100084 北京市海淀区农大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频数据 标注 音频片段 分类标签 训练模型 准确率 自动化 分析 | ||
本发明提供一种音频数据标注的方法及其系统,该方法包括:接收待标注的音频数据;获取待标注的音频数据的音频片段,采用预训练的至少一个训练模型对音频片段进行分析,确定音频片段的分类标签;为音频片段对应的所述待标注的音频数据标注分类标签。实现了音频数据的自动化标注,提高了音频数据标注的准确率。
技术领域
本发明涉及音频分析和处理技术领域,尤其设计一种音频数据标注的方法及其系统。
背景技术
随着声音采集技术和互联网技术的快速发展,每天都会产生大量的音频数据(例如歌曲)上传到网络,音频数据的风格分类可以帮助用户快速寻找到喜欢的音频数据,但传统的音频数据分类,即对音频数据进行情感标注需要人工筛选,并进行标注,需要大量的人力和时间,且会因为个人的主观因素导致音频数据分类结果具有很差差异,导致音频数据标注的准确性低。
发明内容
本发明提供一种音频数据标注的方法及其系统,通过提取音频数据中的部分音频数据的特征向量,完成了音频数据的自动化标注,提到了音频数据标注的准确性。
第一方面,本发明实施例提供一种音频数据标注的方法,该方法包括:
接收待标注的音频数据;
获取待标注的音频数据的音频片段,采用预训练的至少一个训练模型对音频片段进行分析,确定音频片段的分类标签;
为音频片段对应的待标注的音频数据标注分类标签。
通过获取待标注音频数据的音频片段,并经训练模型对音频片段进行分析,并为音频片段对应的待标注的音频数据进行分类标签的标注,实现了音频数据的自动化标注,提高了音频数据标注的准确率。
可选地,在一个设计方案中,在采用预训练的至少一个训练模型对音频片段进行分析之前,方法还包括:
按照至少一个分类标签获取每个分类标签对应的多个待训练音频数据;
获取每个分类标签对应的多个待训练的音频数据的音频片段,并提取音频片段的特征向量;
对至少一个分类标签对应的多个音频片段的特征向量进行训练,得到至少一个分类标签对应的至少一个训练模型。
可选地,在一个设计方案中,提取音频片段的特征向量,包括:
采用梅尔频率倒谱系数MFCC和感性线性预测PLP提取音频片段的特征向量。
可选地,在一个设计方案中,在提取音频片段的特征向量之前,该方法还包括:
对音频片段进行汉明窗处理。
可选地,在一个设计方案中,对至少一个分类标签对应的多个音频片段的特征向量进行训练,包括:
采用卷积神经网络CNN对至少一个分类标签对应的多个音频片段的特征向量进行训练。
第二方面,本发明实施例提供一种系统,系统包括:
接收单元,用于接收待标注的音频数据;
处理单元,用于获取待标注的音频数据的音频片段,采用预训练的至少一个训练模型对音频片段进行分析,确定音频片段的分类标签;
处理单元,还用于为音频片段对应的待标注的音频数据标注分类标签。
通过获取待标注音频数据的音频片段,并经训练模型对音频片段进行分析,并为音频片段对应的待标注的音频数据进行分类标签的标注,实现了音频数据的自动化标注,提高了音频数据标注的准确率。
可选地,在一个设计方案中,系统还包括训练单元;
处理单元,还用于按照至少一个分类标签获取每个分类标签对应的多个待训练音频数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611247230.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:修正音频内容音高偏差的方法及装置
- 下一篇:一种用户语言评估方法及系统