[发明专利]音频识别方法及装置、存储介质及电子设备有效

申请号：	201711486757.6	申请日：	2017-12-29
公开（公告）号：	CN108198573B	公开（公告）日：	2021-04-30
发明（设计）人：	黄瑛;胡明清;王涛;杨琛	申请（专利权）人：	北京奇艺世纪科技有限公司
主分类号：	G10L25/48	分类号：	G10L25/48;G06F16/683
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	李伟;王宝筠
地址：	100080 北京市海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音频识别方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供了一种音频识别方法，包括：依据预设的第一选取规则，在待识别音频中选取目标音频样本；按第一音频指纹提取密度，在所述目标音频样本中提取多个音频指纹；将提取的所述多个音频指纹与预建立的音频指纹库中的指纹进行匹配；当未匹配成功时，在所述待识别音频中，重新选取新的目标音频样本，直至匹配成功，以实现对待识别音频的识别。本发明提供的识别方法中，首先选取一段音频作为目标音频样本，从所述目标音频样本中提取音频指纹，与预先建立的音频指纹库中的指纹进行匹配，在未匹配成功时，在待识别音频中重新选一段音频作为新的目标音频样本，直至完成对所述待识别音频的识别，提升了对待识别音频的识别率。

技术领域

本发明涉及音频识别技术领域，特别涉及一种音频识别方法及装置、存储介质及电子设备。

背景技术

近年来，音频影像设备的应用越来越多的出现人们的生活中。人们在应用音乐播放设备听音乐，或者应用影像设备换看影片的过程中，需要观看歌词或字幕。因此，音频识别技术的在各个领域中的应用越来越广泛。

现有的音频识别技术一般采用音频指纹识别的技术，技术人员经过研发发现，现有的音频识别过程中，例如歌曲识别，同一首歌，可能会有多个不同版本，不同版本之间局部存在音频不一致的现象。比如现场版音频中会存在大量观众的欢呼声或者人说话的声音，因此在识别过程中提取的指纹频段如果存在音乐以外的声音，会降低音频的识别率。

发明内容

本发明所要解决的技术问题是提供一种音频识别方法，在音频识别过程采用多次采集音频样本进行识别的方式，以提升音频的识别率。

本发明还提供一种音频识别装置，用以保证上述方法在实际中的实现及应用。

一种音频识别方法，包括：

依据预设的第一选取规则，在待识别音频中选取目标音频样本；

按第一音频指纹提取密度，在所述目标音频样本中提取多个音频指纹；

将提取的所述多个音频指纹与预建立的音频指纹库中的指纹进行匹配；所述预建立的音频指纹库按第二音频指纹提取密度进行音频指纹的提取，所述第一音频指纹提取密度小于所述第二音频指纹提取密度；

当未匹配成功时，在所述待识别音频中，重新选取新的目标音频样本，直至匹配成功，以实现对待识别音频的识别。

上述的方法，可选的，所述依据预设的选取规则，在待识别音频中选取目标音频样本，包括：

确定第一时间长度；

在所述待识别音频中随机选取时长为所述第一时间长度的音频作为目标音频样本。

上述的方法，可选的，所述依据预设的选取规则，在待识别音频中选取目标音频样本包括：