[发明专利]音频识别方法和装置在审

专利信息
申请号: 202110694791.2 申请日: 2021-06-22
公开(公告)号: CN113421552A 公开(公告)日: 2021-09-21
发明(设计)人: 桑海岩;邓慧;刘文;廉士国 申请(专利权)人: 中国联合网络通信集团有限公司;联通大数据有限公司
主分类号: G10L15/02 分类号: G10L15/02;G10L15/04;G10L15/06;G10L15/16
代理公司: 北京同立钧成知识产权代理有限公司 11205 代理人: 张娜;臧建明
地址: 100033 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 音频 识别 方法 装置
【说明书】:

发明实施例提供一种音频识别方法和装置,该方法包括:将待识别音频信息切分成预设数量个音频片段;提取音频片段的声学特征;将声学特征输入到预先训练的音频识别模型,得到每个音频片段对应的音频类别,音频识别模型包括深度特征学习层和分类层;深度特征学习层的参数通过第一训练数据训练的,第一训练数据为标注有第一音频类别标签的音频片段,第一音频类别是根据预设音频库存储中的音频数据确定的,分类层的参数是通过第二训练数据进行训练的,第二训练数据为标注有第二音频类型标签的音频片段,第二音频类型是根据用户自定义音频数据确定的,当用户想要增加新类别的音频识别功能时,只需重新训练分类层的参数即可,提高了音频识别效率。

技术领域

本发明实施例涉及音频处理技术领域,尤其涉及一种音频识别方法和装置。

背景技术

互联网技术的发展给人们带来了很大的便利,用户可以通过互联网查询需要的信息,也可以通过互联网分享信息,比如文字资源、图片资源、视频资源以及音频资源等。但是随着互联网用户数量的激增,网络中也出现了大量来源不明的视频信息、音频信息和直播音频等不符合网络健康规范的信息。为了净化网络环境,技术人员需要对互联网中的众多音频信息进行审核、分类,以将不符合网络健康规范的音频信息识别出来。

相关技术中,识别音频信息是否符合规范的方法是提取音频的声学特征,采用神经网络分类的方法神经网络可以通过非线性建模进行分类,通过大量的训练数据(包括不合规的音频数据和相应的不合规类型标签)对神经网络模型训练,将待检测未知音频经过训练好的神经网络模型得到映射分类结果,判断未知音频是否合规。

但是,现有采用非线性建模得到的神经网络模型虽然能对音频进行分类判断其是否合规,但是这一类的模型对分类的训练数据量要求很大,每增加一个新的音频类别,都需要增加大量的经过标注新类别的训练数据,且需要重新训练模型。比如,当用户想要增加少量的且未知类别的音频数据的识别功能时,还需要收集大量的相关音频数据作为训练数据来重新训练整个模型,需要消耗大量的人力和时间成本,降低了音频识别效率。

发明内容

本发明实施例提供一种音频识别方法和装置,以解决现有技术中要增加少量的且未知类别的音频数据的识别功能时,还需要收集大量的相关音频数据作为训练数据来重新训练整个模型,消耗大量的人力和时间成本,降低音频识别效率的问题。

本发明实施例的第一方面提供一种音频识别方法,包括:

获取待识别音频信息;

将所述待识别音频信息切分成预设数量个音频片段;

提取所述音频片段的声学特征;

将提取到的声学特征输入到预先训练得到的音频识别模型中,得到所述音频识别模型输出的每个音频片段对应的音频类别,所述音频识别模型包括深度特征学习层和分类层;

其中,所述深度特征学习层的参数是通过第一训练数据训练得到的,所述第一训练数据为标注有第一音频类别标签的音频片段,所述第一音频类别是根据预设音频库存储中的音频数据确定的;

所述分类层的参数是通过第二训练数据进行训练得到的,所述第二训练数据为标注有第二音频类型标签的音频片段,所述第二音频类型是根据用户自定义音频数据确定的。

可选的,所述音频库中包括第一预设数量类不符合网络规范的音频数据,所述方法还包括:

提取所述音频库中的音频数据;

将所述音频数据在时域上进行切分,得到多个音频片段;

对每个音频片段标注音频类别标签,得到所述第一训练数据。

可选的,所述方法还包括:

接收用户输入的自定义音频数据;

将所述自定义音频数据进行切分,得到多个自定义音频片段;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司;联通大数据有限公司,未经中国联合网络通信集团有限公司;联通大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110694791.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top