[发明专利]基于内容的音频比对系统在审
申请号: | 201710833520.4 | 申请日: | 2017-09-15 |
公开(公告)号: | CN107749300A | 公开(公告)日: | 2018-03-02 |
发明(设计)人: | 姜克建;陈武 | 申请(专利权)人: | 苏州市福川科技有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L25/18;G10L25/24;G10L25/60;G10L25/81;H04H20/14 |
代理公司: | 北京华仲龙腾专利代理事务所(普通合伙)11548 | 代理人: | 李静 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 内容 音频 系统 | ||
技术领域
本发明涉及广播服务系统,具体为基于内容的音频比对系统,属于广播校正领域。
背景技术
由于无线电的广泛使用以及人们对于大功率发射机和高灵敏度电子管接收机技能的熟练掌握,使广播逐渐变成了现实。1919年,苏联制造了一台大功率发射机,并于1920年在莫斯科开始试验性广播。1920年6月15日,马可尼公司在英国举办了一个以梅尔芭太太主演的“无线电--电话”音乐会,远至巴黎、意大利、挪威,甚至在希腊都能清晰的收听到。这就是广播事业的开始。1920年11月2日,美国在康拉德的指导下,威斯汀豪斯公司广播站KDKA开始广播,首次播送的节目是哈丁-科克斯总统选举,在当时,这事曾轰动一时。1920年12月22日,德国的柯尼武斯特豪森广播电台首次播送了器乐演奏音乐会。1922年11月14日,伦敦ZLO广播站正式开始在英国广播每日节目,该站在1927年改为英国广播有限公司,即BBC。1922年法国埃菲尔铁塔也正式开始播音。1927年止,美国国内已拥有737个广播站。
这一时期,广播站如雨后春笋在各国中相继涌现。当时,在欧洲广播已被视为一个庞大的通信工具。以后,全世界的广播事业不断发展,现已逐步形成全球性的广播网。
在广播的发展历程中,广播的播出安全一直是个重点课题,现有技术是通过对终端播出声音与现场实时声音进行人工比对,来保证播出安全的,但人工比对容易出现误差,而且容易因为操作人员的疏忽造成播出事故。目前还没有一种可以通过内容进行比对的基于内容的音频比对系统。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于内容的音频比对系统。
本发明通过以下技术方案来实现上述目的,基于内容的音频比对系统,包括以下步骤:信号输入、预处理、音频比对、参数输出,其特征在于在信号输入步骤主要包括参考音频输入、比对音频输入,所述参考音频输入主要通过播出现场进行采集后直接转换成声音信号作为现场音频源,所述比对音频输入主要通过广播收集终端对无线信号进行采集后再转换成声音信号作为广播音频源;在预处理步骤包括过零率检测以及延时量计算;在音频比对步骤,对音频源通过滑动时间窗口进行分析比对,分析比对过程中,主要通过过门限统计、短时能量分析、误差信号分析、谱特征分析、倒谱特征分析、人耳听觉特征加权进行分析比对;在参数输出步骤,对分析比对结果进行直观输出。所述参数输出步骤主要输出预处理步骤计算出的延时量、现场音频源与广播音频源的相似度判决值。所述参数输出步骤同时输出相位监测值、停播监测、杂音监测、单音监测。所述预处理步骤中的延时量计算结果直接通过参数输出步骤输出。
本发明所述基于内容的音频比对系统大量借鉴了语音识别技术,采用基于样本的音频内容对比算法技术,对同源音频进行比较,可行性高,同时,AoIP技术的应用令广播链路上高质量信号的采集更为简单易行,直接为对比技术提供了更丰富可行的对比特征,而且采用数字信号处理技术,容易实现播出信号质量的全面监控,可行保证了播出安全,杜绝了播出事故。
附图说明
附图中,图1是本发明的流程框图。
具体实施方式
下面结合具体实施例对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
以快速跳变型、慢速纯音乐、男生说话声、女生说话声为例采用本发明所述基于内容的音频比对系统进行音频比对,其中快速跳变型音频主要有鼓声、吉他、电吉他、钢琴、古筝类打击乐器或弹拨乐器,慢速纯音乐主要有小提琴、大提琴类乐器。采用音频长度3821S的男女声歌曲、音频长度3415S的轻音乐、音频长度3765S的音乐会现场录音、音频长度3567S的新闻联播节目作为实验资料,在帧长(短时平稳长度):20ms,帧移:10ms,搜索深度:30s,对比片段长度(滑动窗):5s,搜索步长:10ms,监测间隔:1s,计算音频带宽:5kHz,双声道音频打分结果取二者平均,特征:MFCC(14)+DeltaMFCC(14) ,粗搜索精度:10ms,精搜索精度:1ms的条件下,进行音频比对,延迟估计精度如下表所示。
表1延迟估计精度:
不同信噪比条件下系统每小时报警(连续三次比对超出门限)次数如下:
表2不同信噪比条件下系统每小时报警平均次数
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州市福川科技有限公司,未经苏州市福川科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710833520.4/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法