[发明专利]音频处理方法、装置、设备及存储介质在审
申请号: | 202210950962.8 | 申请日: | 2022-08-09 |
公开(公告)号: | CN115497497A | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 陶松;方伟;王子源;吕斌 | 申请(专利权)人: | 深圳市酷开网络科技股份有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0316 |
代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 聂磊 |
地址: | 518000 广东省深圳市前海深港合作*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 处理 方法 装置 设备 存储 介质 | ||
本申请涉及一种音频处理方法、装置、设备及存储介质。所述方法包括:利用音频硬件抽象层获取原始音频,调节原始音频的增益参数得到调节音频,将调节音频发送至语音应用,控制语音应用采集调节音频,并将调节音频拆分成对应的多路音频,将多路音频传输至集成在语音应用中的语音算法,以供语音算法对多路音频进行处理。本申请在不修改安卓开发源代码的情况下,在应用层获取到音频,且语音应用得到的音频可以适配更多的语音算法,将调节音频拆分成对应的多路音频传输至集成在语音应用中的语音算法,使得语音算法可以对多路音频进行处理,语音算法集成在语音应用中,方便语音算法的更新,同时也降低应用端和系统之间的耦合性。
技术领域
本申请涉及计算机技术领域,尤其涉及一种音频处理方法、装置、设备及存储介质。
背景技术
目前,现有的智能语音场景中,安卓原生仅支持单声道或者双声道录音,而大多数语音算法支持4、6或8路的音频,不同的语音算法对音频的增益需求也不同,导致不改变系统代码的情况下语音算法可能无法正常处理音频,且由于语音算法的大多是集成在安卓系统底层,导致语音算法迭代的代价大,若语音算法的不能快速迭代,可能无法满足音频音频处理需求。
发明内容
鉴于以上内容,本申请提供一种音频处理方法、装置、设备及存储介质,其目的在于解决上述技术问题。
第一方面,本申请提供一种音频处理方法,该方法包括:
利用音频硬件抽象层获取原始音频;
调节所述原始音频的增益参数得到调节音频,将所述调节音频发送至语音应用;
控制所述语音应用采集所述调节音频,并将所述调节音频拆分成对应的多路音频;
将所述多路音频传输至集成在所述语音应用中的语音算法,以供所述语音算法对所述多路音频进行处理。
优选地,在将所述调节音频发送至语音应用之前,所述方法还包括:
将所述调节音频合并为1路音频或2路音频。
优选地,所述控制所述语音应用采集所述调节音频,包括:
控制语音应用通过AudioRecord接口采集所述调节音频。
优选地,所述将所述调节音频拆分成对应的多路音频,包括:
将所述调节音频拆分成对应的4路音频;或
将所述调节音频拆分成对应的6路音频;或
将所述调节音频拆分成对应的8路音频。
优选地,所述所述将所述调节音频拆分成对应的六路音频,包括:
将所述调节音频拆分成对应的8路音频,删除最后2路音频,取前6路音频。
优选地,所述方法还包括:
当接收到更新所述语音应用的指令时,控制所述语音应用中的语音算法执行更新操作。
优选地,所述语音算法包括:语音识别算法、语音检测算法及语音唤醒算法中的一种或多种。
第二方面,本申请提供一种音频处理装置,该音频处理装置包括:
获取模块:用于利用音频硬件抽象层获取原始音频;
调节模块:用于调节所述原始音频的增益参数得到调节音频,将所述调节音频发送至语音应用;
拆分模块:用于控制所述语音应用采集所述调节音频,并将所述调节音频拆分成对应的多路音频;
处理模块:用于将所述多路音频传输至集成在所述语音应用中的语音算法,以供所述语音算法对所述多路音频进行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市酷开网络科技股份有限公司,未经深圳市酷开网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210950962.8/2.html,转载请声明来源钻瓜专利网。