[发明专利]音频信号处理的方法、装置、存储介质及电子设备有效
申请号: | 202110666359.2 | 申请日: | 2021-06-16 |
公开(公告)号: | CN113362864B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 范嘉骏 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
主分类号: | G11B20/10 | 分类号: | G11B20/10 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 贺晓蕾 |
地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 信号 处理 方法 装置 存储 介质 电子设备 | ||
1.一种音频信号处理方法,其特征在于,所述方法包括:
获取至少一个声源发出的待处理音频信号和所述待处理音频信号对应的预设衰减模型,所述预设衰减模型表征所述待处理音频信号在传播过程中声音强度的衰减情况;
针对每个所述声源,获取该声源发出的待处理音频信号对应的预设音频分割参数;
根据所述预设音频分割参数确定至少两个距离区间,所述距离区间为所述待处理音频信号的声音传播路径中任意两个相邻位置点之间的距离对应的区间;
针对每个距离区间,以所述距离区间为积分域对所述预设衰减模型进行黎曼积分,得到所述距离区间对应的面积;
根据所述面积和所述距离区间确定所述距离区间对应的矩形区域的高度,并将所述高度作为所述距离区间对应的音频信号的声音强度;
将每个所述距离区间对应的声音强度按照距离该声源由近到远的顺序进行拼接,得到该声源发出的待处理音频信号对应的特征向量;
对所述特征向量中的向量元素进行倒序排序;
在倒序排序后的特征向量中添加该声源的标识信息,得到该声源发出的待处理音频信号对应的目标特征向量;
将每个所述声源对应的所述目标特征向量进行合并后,输入目标AI模型,得到所述目标AI模型对应的目标输出结果。
2.根据权利要求1所述的方法,其特征在于,所述预设音频分割参数包括预设分割精度和两个预设距离边界点,所述根据所述预设音频分割参数确定至少两个距离区间包括:
以两个所述预设距离边界点中距离声源位置较近的点作为起点,以两个所述预设距离边界点中距离声源位置较远的点作为终点,将所述声音传播路径中所述起点和所述终点之间的声音传播路径按照所述预设分割精度进行等间隔划分,得到至少两个所述距离区间。
3.根据权利要求1所述的方法,其特征在于,所述预设音频分割参数包括多个预设距离分割点,所述根据所述预设音频分割参数确定至少两个距离区间包括:
针对多个所述预设距离分割点中的每相邻两个预设距离分割点,将该相邻两个预设距离分割点作为所述距离区间的区间端点,对所述声音传播路径进行分割,得到至少两个所述距离区间。
4.根据权利要求1所述的方法,其特征在于,所述目标AI模型包括待训练的第一AI模型;所述将每个所述声源对应的所述特征向量进行合并后,输入目标人工智能AI模型,得到所述目标AI模型对应的目标输出结果包括:
将每个所述声源对应的所述特征向量进行合并后,输入所述第一AI模型;
根据合并后的所述特征向量对所述第一AI模型进行模型训练,以便得到具备听力能力的目标模型。
5.根据权利要求1所述的方法,其特征在于,所述目标AI模型包括根据重构的音频信号特征向量预先训练好的第二AI模型;所述将每个所述声源对应的所述特征向量进行合并后,输入目标人工智能AI模型,得到所述目标AI模型对应的目标输出结果包括:
将每个所述声源对应的所述特征向量进行合并后,作为所述第二AI模型的输入,以便通过所述第二AI模型输出目标控制指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110666359.2/1.html,转载请声明来源钻瓜专利网。