[发明专利]一种音频片段的检测方法及相关设备在审
申请号: | 201911399043.0 | 申请日: | 2019-12-26 |
公开(公告)号: | CN111159464A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 缪畅宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/683;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 熊永强;杜维 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 片段 检测 方法 相关 设备 | ||
本发明实施例公开了一种音频片段的检测方法,包括:接收对目标音频文件的音频片段检测请求,所述音频片段检测请求携带目标类别标识;将所述目标音频文件的音频特征和所述目标类别标识的类别向量输入至训练后的音频片段提取模型;其中,所述训练后的音频片段提取模型包括训练后的分类模型和训练后的回归模型;根据所述训练后的分类模型,对所述目标音频文件的音频特征进行检测,以判断所述目标音频文件对应的所有音频类别中是否存在所述类别向量对应的音频类别;若存在,则根据训练后的回归模型确定所述目标音频文件中所述类别向量对应的音频片段的起止信息。采用本发明,可以在音频文件中准确检测出目标类别标识的音频片段。
技术领域
本发明涉及计算机技术领域,尤其涉及一种音频片段的检测方法及相关设备。
背景技术
随着科学技术的发展,音频片段的检测技术得到快速发展,人们对于检测并获得一个音频文件中某一类别的音频片段的要求越来越高。通常来说,音频文件的组成很多样,从音频的音色组成来看,可以有打击乐、键盘乐、人声等,从音频的流程来看,可以有副歌、间奏、前奏等,从音频的人声声部来看,可以有男高音、女低音、男中音等。而现目前的技术中,对于一个训练模型,只能检测出音频文件中的一种类别的音频片段,不能用一个训练模型检测出音频文件中任意一种类别的音频片段,例如只能检测出男高音、女低音或男中音,不能检测出副歌、间奏或前奏,因此,如何用一个训练模型检测出音频文件中任意一种类别的音频片段是当前的研究热点。
发明内容
本发明实施例所要解决的技术问题在于,提供一种音频片段的检测方法,可以在音频文件中准确检测出目标类别标识的音频片段。
一方面,本发明实施例提供了一种音频片段的检测方法,包括:
接收对目标音频文件的音频片段检测请求,所述音频片段检测请求携带目标类别标识;
将所述音频文件的音频特征和所述目标类别标识的类别向量输入至训练后的音频片段提取模型,得到所述音频文件中所述类别向量对应的音频片段的起止信息;
根据所述起止信息确定所述音频片段。
另一方面,本发明实施例提供了一种音频片段的检测装置,包括:
接收单元,用于接收对目标音频文件的音频片段检测请求,所述音频片段检测请求携带目标类别标识;
处理单元,将所述目标音频文件的音频特征和所述目标类别标识的类别向量输入至训练后的音频片段提取模型;其中,所述训练后的音频片段提取模型包括训练后的分类模型和训练后的回归模型;
所述处理单元,还用于根据所述训练后的分类模型,对所述目标音频文件的音频特征进行检测,以判断所述目标音频文件对应的所有音频类别中是否存在所述类别向量对应的音频类别;
所述处理单元,还用于若所述目标音频文件对应的所有音频类别中存在所述类别向量对应的音频类别,则根据训练后的回归模型确定所述目标音频文件中所述类别向量对应的音频片段的起止信息;
所述处理单元,还用于根据所述起止信息确定所述音频片段。
相应的,本发明实施例提供了一种终端,包括:所述终端包括:存储器,所述存储器包括计算机可读指令;与所述存储器相连的处理器,所述处理器用于执行所述计算机可读指令,从而使得所述设备执行上述涉及的音频片段的检测方法。
相应的,本发明实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有程序指令,所述程序指令被处理器执行时,实现上述涉及的音频片段的检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911399043.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于指纹身份认证的体测系统
- 下一篇:一种3D打印用海水海砂混凝土材料