[发明专利]音频重音识别方法、装置、设备和介质在审
申请号: | 202011172637.0 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112259088A | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 郑亚军 | 申请(专利权)人: | 瑞声新能源发展(常州)有限公司科教城分公司;瑞声光电科技(常州)有限公司 |
主分类号: | G10L15/18 | 分类号: | G10L15/18;G10L25/27 |
代理公司: | 深圳中细软知识产权代理有限公司 44528 | 代理人: | 田丽丽 |
地址: | 213167 江苏省常州市武进*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 重音 识别 方法 装置 设备 介质 | ||
本发明公开了一种音频重音识别方法,该方法包括:获取原始音频信号;获取目标高斯窗函数,根据目标高斯窗函数对原始音频信号进行处理,得到原始音频信号对应的能量变化曲线;获取目标滑动窗,根据目标滑动窗确定能量变化曲线中的重音时刻,将在重音时刻的原始音频信号标示为音频重音。本发明充分考虑音频信号在时间上的相关性,相较于传统算法,后续重音识别的结果更为准确。同时本发明排除了音频局部强度波动过大对整体音频识别造成的影响,因此也更具科学性及实用性。此外,还提出了音频重音识别装置、设备和存储介质。
技术领域
本发明涉及音频处理技术领域,尤其是涉及音频重音识别方法、装置、设备和介质。
背景技术
不管是日常的说话交流、音乐影音、还是语音通话,都可以通过录音将声音保存为一段或多段音频信号。音频信号作为可保存的数据,是信息传播的重要媒介。重音是音乐中强度较大的音,在声音的冲击上最为突出,是构成音乐节奏的主要因素,通过对音乐中的重音进行识别,可以判断出音乐节奏的快慢。此外重音常常会包含一定的主观情绪或者重点信息,通过对音频中的重音进行识别,可因分辨出音频中的主观情绪和重点信息。因此可以说,对于音频重音进行分析识别可以更加充分的了解该段音频信号所要表达的含义。
发明内容
基于此,有必要针对上述问题,提供可准确识别的音频重音识别方法、装置、设备和介质。
一种音频重音识别的方法,所述方法包括:
获取原始音频信号;
获取目标高斯窗函数,根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线;
获取目标滑动窗,根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,将在所述重音时刻的所述原始音频信号标示为音频重音。
在其中一个实施例中,所述根据所述目标高斯窗函数对所述原始音频信号进行处理,得到所述原始音频信号对应的能量变化曲线,包括:
根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线;
对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线。
在其中一个实施例中,所述根据所述目标高斯函数对所述原始音频信号进行加权计算,得到所述原始音频信号对应的能量曲线,包括:
根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号;其中,所述目标时刻为所述原始音频信号中的任意一个时刻;
将所述截断音频信号与所述目标高斯窗函数进行加权计算,获取所述原始音频信号在所述目标时刻的目标能量值,根据在每一目标时刻的所述目标能量值得到所述原始音频信号对应的能量曲线。
在其中一个实施例中,所述根据所述目标高斯窗函数确定所述原始音频信号在目标时刻的截断音频信号,包括:
以所述目标时刻为所述目标高斯窗函数对应的高斯窗口的中间时刻,在所述原始音频信号上添加高斯窗口;
将所述高斯窗口内的音频信号作为在所述目标时刻的截断音频信号。
在其中一个实施例中,所述对所述能量曲线进行数值转换处理,得到所述原始音频信号对应的能量变化曲线,包括:
对所述能量曲线进行取对数处理,获取所述原始音频信号对应的对数函数;
对所述对数函数进行二次求导处理,获取所述原始音频信号对应的能量变化曲线。
在其中一个实施例中,所述根据所述目标滑动窗确定所述能量变化曲线中的重音时刻,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瑞声新能源发展(常州)有限公司科教城分公司;瑞声光电科技(常州)有限公司,未经瑞声新能源发展(常州)有限公司科教城分公司;瑞声光电科技(常州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011172637.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种创业培训管理系统
- 下一篇:一种电热综合能源系统可行域构建方法