[发明专利]一种音频检测方法、装置、设备及计算机可读存储介质在审

专利信息
申请号: 201811333212.6 申请日: 2018-11-09
公开(公告)号: CN109376264A 公开(公告)日: 2019-02-22
发明(设计)人: 王泽龙 申请(专利权)人: 广州势必可赢网络科技有限公司
主分类号: G06F16/60 分类号: G06F16/60;G06F16/63;G06F21/60
代理公司: 深圳市深佳知识产权代理事务所(普通合伙) 44285 代理人: 王仲凯
地址: 510000 广东省广州市黄埔*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种音频检测方法、装置、设备及计算机可读存储介质,其中,该方法包括:获取包括预设量训练样本及每个所述训练样本的样本标签的训练样本集,所述训练样本包括对应样本标签分别为拼接音频及原始音频的音频样本;利用所述训练样本集训练预先创建的卷积神经网络,得到音频识别模型;获取未知其样本标签的音频样本为待测样本,将所述待测样本输入至所述音频识别模型,得到所述音频识别模型输出的所述待测样本为拼接音频或原始音频的识别结果。本申请中基于卷积神经网络实现音频检测,不仅通过实验证明这种音频检测方式具有较高的准确性,且对于训练样本及待测样本均没有特殊要求,泛化性较好。
搜索关键词: 待测样本 训练样本 音频检测 音频识别 计算机可读存储介质 样本 卷积神经网络 训练样本集 音频样本 原始音频 标签 拼接 预先创建 泛化性 预设量 输出 申请
【主权项】:
1.一种音频检测方法,其特征在于,包括:获取包括预设量训练样本及每个所述训练样本的样本标签的训练样本集,所述训练样本包括对应样本标签分别为拼接音频及原始音频的音频样本;利用所述训练样本集训练预先创建的卷积神经网络,得到音频识别模型;获取未知其样本标签的音频样本为待测样本,将所述待测样本输入至所述音频识别模型,得到所述音频识别模型输出的所述待测样本为拼接音频或原始音频的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州势必可赢网络科技有限公司,未经广州势必可赢网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811333212.6/,转载请声明来源钻瓜专利网。

同类专利
  • 一种歌曲类型吻合度探测平台-201810885645.6
  • 包仁妹 - 上海倍增智能科技有限公司
  • 2018-08-06 - 2019-10-18 - G06F16/60
  • 本发明涉及一种歌曲类型吻合度探测平台,包括:类型获取设备,与所述数据缓冲设备连接,用于读取即将播放的影片数据的片头曲歌名;无线通信接口,与远端的歌曲服务器连接,所述歌曲服务器存储了歌名数据库,所述歌名数据库保存了歌曲名称与歌曲类型的对应关系;歌名映射设备,分别与所述类型获取设备和所述无线通信接口连接,用于接收即将播放的影片数据的片头曲歌名,并从所述歌名数据库中搜索出与即将播放的影片数据的片头曲歌名对应的歌曲类型,以作为目标歌曲类型输出;歌名鉴定设备,用于确定目标歌曲类型对应的动感程度,当动感程度与目标争斗级别不对应时,发出歌曲配置失败命令。
  • 信息查询方法和装置-201510612268.5
  • 陈晓昕 - 百度在线网络技术(北京)有限公司
  • 2015-09-23 - 2019-09-03 - G06F16/60
  • 本发明提出一种信息查询方法和装置,该信息查询方法包括:向用户展示当前页面;根据用户操作调起用于采集语音的预设模块,并采用所述预设模块采集用户语音输入的要查询的信息;从所述当前页面跳转到提供所述要查询的信息的页面。该方法能够降低用户操作成本,提升用户体验。
  • 一种智能音箱的封套获取方法和装置-201610523090.1
  • 任超 - OPPO广东移动通信有限公司
  • 2016-07-04 - 2019-08-09 - G06F16/60
  • 本发明提供了一种智能音箱的封套获取方法,包括:获取所述智能音箱中存储的音源文件对应的第一URL数据;在缓存的封套与URL数据的对应关系表中,查找是否包括所述第一URL数据;如果在缓存的封套与URL数据的对应关系表中,包括所述第一URL数据,则智能终端将所述第一URL数据对应的封套与所述音源文件匹配。本发明可以避免对于文件夹封套的重复获取,有利于节省通信资源。
  • 一种近场语料采集方法及装置-201910156714.4
  • 丁伟;曾敏;谢世波 - 深圳市伟文无线通讯技术有限公司
  • 2019-03-01 - 2019-06-18 - G06F16/60
  • 本发明涉及语音识别技术领域,公开了一种近场语料采集方法及装置,该方法包括:获取采集任务;通过语音程序采集所述采集任务所需的语音;将所述语音上传至服务器,并将所述语音转化为预设格式的语料文件;通过微信等语音程序,能够迅速采集大量语料,并自动转化为预定格式的语料文件,进而便于自动审核,提高了语料采集时间和质量,提高了语料采集效率。
  • 音乐筛选方法-201910018189.X
  • 黄俊颕 - 昆山快乐岛运动电子科技有限公司
  • 2019-01-09 - 2019-03-26 - G06F16/60
  • 本发明一种音乐筛选方法,步骤如下:S1)接收启动讯号,并且根据启动讯号进行静态筛选模式或动态筛选模式;S2)侦测人体活动状态并生成相应的生理讯号;S3)根据生理讯号建立用户身心状态模型;S4)载入用户身心状态模型,以生成相对应的歌曲特征参数;S5)根据歌曲特征参数,自音乐资料库中选取与当次的歌曲特征参数相匹配的一或以上的播选音乐档案。
  • 一种音频检测方法、装置、设备及计算机可读存储介质-201811333212.6
  • 王泽龙 - 广州势必可赢网络科技有限公司
  • 2018-11-09 - 2019-02-22 - G06F16/60
  • 本发明公开了一种音频检测方法、装置、设备及计算机可读存储介质,其中,该方法包括:获取包括预设量训练样本及每个所述训练样本的样本标签的训练样本集,所述训练样本包括对应样本标签分别为拼接音频及原始音频的音频样本;利用所述训练样本集训练预先创建的卷积神经网络,得到音频识别模型;获取未知其样本标签的音频样本为待测样本,将所述待测样本输入至所述音频识别模型,得到所述音频识别模型输出的所述待测样本为拼接音频或原始音频的识别结果。本申请中基于卷积神经网络实现音频检测,不仅通过实验证明这种音频检测方式具有较高的准确性,且对于训练样本及待测样本均没有特殊要求,泛化性较好。
  • 一种作曲模型的建立方法、系统、设备和存储介质-201810894765.2
  • 张爽;王义文;王健宗;肖京 - 平安科技(深圳)有限公司
  • 2018-08-08 - 2019-01-11 - G06F16/60
  • 本发明公开了一种作曲模型的建立方法、系统、计算机设备和存储介质,其中所述方法包括:获取MIDI格式的音乐数据集,并将所述MIDI格式的音乐数据集转换为钢琴键轴;对格式转换后的钢琴键轴进行数据清理;采用生成式对抗网络建立干扰音轨模型和作曲音轨模型,并结合所述干扰音轨模型和作曲音轨模型建立混合音轨模型;将生成器分为时间结构生成器Gtemp和音乐小节生成器Gbar,通过所述时间结构生成器Gtemp和所述音乐小节生成器Gbar构建音乐小节之间的时序相关性形成时间模型;组合所述混合音轨模型和时间模型,以形成多音轨交响乐作曲模型。上述作曲方法满足了人们对音乐变化多样化的要求而且自然。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top