[发明专利]音频识别方法、装置及数据处理设备有效

申请号：	201911072080.0	申请日：	2019-11-05
公开（公告）号：	CN110782920B	公开（公告）日：	2021-09-21
发明（设计）人：	张文伟;王启腾	申请（专利权）人：	广州虎牙科技有限公司
主分类号：	G10L25/51	分类号：	G10L25/51;G10L25/30;G10L25/24;G10L25/45
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	张欣欣
地址：	511400 广东省广州市番禺***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频识别方法装置数据处理设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请一种音频识别方法、装置及数据处理设备，方法包括：获取待识别音频，将待识别音频拆分为多个音频片段；针对每个音频片段，获取音频片段的特征；将音频片段的特征输入训练好的分类模型进行分类识别，获得该音频片段是否为疑似特定音频片段的分类结果；将多个音频片段的分类结果输入长短期记忆网络LSTM网络进行处理，获得待识别音频是否为特定音频的识别结果。相较于现有技术中对整个音频进行整体识别的方式，本实施例提供的方案可以更为准确的识别待识别音频中占比很小的特定音频内容。

技术领域

本申请涉及数据处理技术领域，具体而言，涉及一种音频识别方法、装置及数据处理设备。

背景技术

音频识别是一种根据识别音频中特定信息的技术，对于基于音频内容的报警、违规音频判别等具有重要意义。

在一些音频识别方法中，通常是对音频进行整体分析，检测音频中存在的特定内容。但是当音频中特定内容在整个音频中所占时间很短时，采用音频整体分析会造成特定音频内容的特征不够显著，导致特定音频内容的识别率低，不能准确判断特定能的存在性。

发明内容

为了克服现有技术中的上述不足，本申请的目的在于提供一种音频识别方法，所述方法包括：

获取待识别音频，将所述待识别音频拆分为多个音频片段；

针对每个所述音频片段，获取所述音频片段的特征；

将所述音频片段的特征输入训练好的分类模型进行分类识别，获得该音频片段是否为疑似特定音频片段的分类结果；

将多个所述音频片段的分类结果输入长短期记忆网络LSTM网络进行处理，获得所述待识别音频是否为特定音频的识别结果。

在一种可能的实施方式中，所述针对每个所述音频片段，获取所述音频片段的特征，包括：