[发明专利]一种两路实时广播音频延时和相似度的计算方法在审
申请号: | 201910592528.5 | 申请日: | 2019-07-03 |
公开(公告)号: | CN110310661A | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 龙华;邵玉斌;杜庆治;唐传林 | 申请(专利权)人: | 云南康木信科技有限责任公司 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L25/24;G10L25/51;H04H20/33 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 李晓亚 |
地址: | 650000 云南省昆明市经*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 矩阵 音频采样数据 两路 相似度 广播音频 混合信号 实时广播 音频延时 延时 实时音频处理 相似度结果 幅度计算 位置计算 噪声干扰 流数据 容错性 向后 叠加 延迟 | ||
本发明涉及一种两路实时广播音频延时和相似度的计算方法,属于实时音频处理技术领域。获取长度为X秒的两路实时的广播音频流数据由音频采样数据矩阵向后延迟m秒得到音频采样数据矩阵再将音频采样数据矩阵与音频采样数据矩阵按照指定规则叠加得到混合信号的音频采样数据计算混合信号的功率倒谱,将功率倒谱矩阵中前k个数据置为0,由功率倒谱矩阵中的前一半的最高峰的位置计算出两路音频之间的延时,由找出的最高峰的幅度计算出两路音频之间的相似度百分比。本发明计算速度较快且具有较高的容错性,当广播音频受到噪声干扰时也能使得延时结果和相似度结果更为准确。
技术领域
本发明涉及一种两路实时广播音频延时和相似度的计算方法,属于实时音频处理技术领域。
背景技术
在广播发射台中,广播音频的输入信号通常来自于卫星传送,该信号经过发射机调制以中波或短波频率发射,为了保证在发射过程中被传送的音频信号不被篡改或污染,需要对发射机的被调信号和电台发射信号的接收解调结果进行比对。目前这一工作过程大多都是人工完成的,即把发射信号通过收音机接收,通过耳朵听来辨别。广播发射台常有多路音频输入信号需要发射,所以人工音频监播的工作量很大,无法达到实时监播的要求。
然而,同一套节目的音频信号一般都是由不同的传输链路传入的。广播音频信号经过不同链路(卫星、光纤、微波、网络、调制、解调)传输后,它们到达节目监测点的时间是存在时间延迟的。而在两路音频信号非同步的状态下进行音频比对监测不能得到准确的相似度结果。因此估计两路音频信号之间的延时从而使其同步是音频比对监测的前提和条件,同步的结果会极大影响音频比对结果的准确度。
通常,传统的音频相似度计算方法先提取音频的特征参数,再比较特征参数的差异而得出两路音频的相似度,这种方法只能针对普通音频,不适用于广播音频,其原因主要有如下三个方面:第一方面,若两路实时音频之间存在延时,则该方法得到的相似度结果就低。第二方面,在比对容错性上,众多音频特征皆以准确描述音频为目标,追求高的内容辨识度,故音频的细微变化,均能反应在特征上。这样,如果音频受到噪声干扰,或经过一些常规滤波器处理,如带通滤波器,再将处理后的音频与原音频进行比较,传统相似度计算方法往往判断两音频不相似甚至完全不同,而噪声干扰、滤波处理等在广播中是很常见的。如在广播音频监测中,我们需要将播出的音频与接收到的音频进行相似度计算,而接收到的音频常常含有噪声;又如为了达到更好的播出主观收听效果,在广播发射前,通常使用音频均衡器来对播出音频的频谱进行调节。这些处理,使得被处理音频相对于原音频发生了较大的变化。在这种情况下,传统的相似度计算方法往往不能适用,因为广播音频比对需要判定播出的音频内容本身是否相同,而非听觉效果上是否一致,即某音频即使在受到一定噪声干扰、滤波器处理、均衡器调节等处理后,算法仍应该判定该音频与其原音频是相似的。第三方面,在相似度的计算效率上,提取音频特征参数来计算两路实时音频相似度的方法计算复杂度相对较高,所需的时间相对较长,不利于实时处理。
发明内容
本发明要解决的技术问题是针对背景技术中所提到的现存问题,不再采用传统的音频特征参数提取的方式来计算两路实时音频相似度,而是提供一种两路实时广播音频延时和相似度的计算方法。
本发明的技术方案是:一种两路实时广播音频延时和相似度的计算方法,获取长度为X秒的两路实时的广播音频流数据由音频采样数据矩阵向后延迟m秒得到音频采样数据矩阵再将音频采样数据矩阵与音频采样数据矩阵按照指定规则叠加得到混合信号的音频采样数据计算混合信号的功率倒谱,将功率倒谱矩阵中前k个数据置为0,由功率倒谱矩阵中的前一半的最高峰的位置计算出两路音频之间的延时,由找出的最高峰的幅度计算出两路音频之间的相似度百分比。
具体步骤为:
Step1:获取长度为X秒的两路实时的广播音频流数据矩阵对第一路音频信号和第二路音频信号,分别定时采集X秒钟的音频,对两段音频按照指定的采样频率f进行采样,得到两组音频采样数据矩阵每个矩阵中有N个采样点数据,即
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南康木信科技有限责任公司,未经云南康木信科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910592528.5/2.html,转载请声明来源钻瓜专利网。