[发明专利]音频数据处理方法及装置、计算设备有效

申请号：	201711407629.8	申请日：	2017-12-22
公开（公告）号：	CN108010538B	公开（公告）日：	2021-08-24
发明（设计）人：	董健;韩玉刚;颜水成	申请（专利权）人：	北京奇虎科技有限公司
主分类号：	G10L21/10	分类号：	G10L21/10;G10L25/30;G06N3/08;G06N3/04
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	胡海国
地址：	100088 北京市西城区新***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种音频数据处理方法及装置、计算设备，其方法包括：将音频数据转化为动态图像数据；对动态图像数据包含的多帧语谱图进行分组处理；获取一帧语谱图；判断帧语谱图是否为任一分组的第1帧语谱图；若是，将帧语谱图输入神经网络，得到处理后的帧语谱图；若否，将帧语谱图输入神经网络，运算至神经网络的第i层卷积层得到第i层卷积层的运算结果后，获取帧语谱图所属分组的第1帧语谱图输入至神经网络中得到的第j层反卷积层的运算结果，将第i层卷积层的运算结果与第j层反卷积层的运算结果进行图像融合，得到处理后的帧语谱图；重复执行上述步骤直至完成对动态图像数据中所有帧语谱图的处理；将处理后的动态图像数据转化为音频数据。
搜索关键词：	音频数据处理方法装置计算设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种音频数据处理方法，其包括：将音频数据转化为动态图像数据；其中，所述动态图像数据由多帧语谱图组成；对所述动态图像数据所包含的多帧语谱图进行分组处理；获取分组处理后所述动态图像数据中的一帧语谱图；判断所述帧语谱图是否为任一分组的第1帧语谱图；若是，则将所述帧语谱图输入至经训练得到的神经网络中，经过该神经网络全部卷积层和反卷积层的运算后，得到处理后的帧语谱图；若否，则将所述帧语谱图输入至经训练得到的神经网络中，在运算至所述神经网络的第i层卷积层得到第i层卷积层的运算结果后，获取所述帧语谱图所属分组的第1帧语谱图输入至所述神经网络中得到的第j层反卷积层的运算结果，直接将所述第i层卷积层的运算结果与所述第j层反卷积层的运算结果进行图像融合，得到处理后的帧语谱图；其中，i和j为自然数；重复执行上述步骤直至完成对动态图像数据中所有帧语谱图的处理；将所述处理后的动态图像数据转化为音频数据。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司，未经北京奇虎科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711407629.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音频数据处理方法及装置、计算设备有效

专利文献下载