[发明专利]一种用于音频内容识别的同步方法有效
| 申请号: | 200810243580.1 | 申请日: | 2008-12-23 |
| 公开(公告)号: | CN101763848A | 公开(公告)日: | 2010-06-30 |
| 发明(设计)人: | 王宏宇;杨光;严荣荣;曹辉 | 申请(专利权)人: | 王宏宇 |
| 主分类号: | G10H1/00 | 分类号: | G10H1/00;G10H1/36;G10L15/00;G10L15/20;G10L15/02 |
| 代理公司: | 南京知识律师事务所 32207 | 代理人: | 樊文红 |
| 地址: | 210018 江苏省南京市*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 音频 内容 识别 同步 方法 | ||
技术领域
本发明涉及数字信号处理、音频信号处理及软件技术,具体地说涉及一种用于音频 信息内容识别的同步方法。
背景技术
随着计算机网络和现代通信技术的发展,多媒体信息的容量得到了飞速的增加。 多媒体信息已经成了人们日常生活中不可或缺的一部分。
音频在多媒体信息中占有相当大的比例,因此对音频信息的识别也就有了实际的意 义。
在特征维数存储空间有限的条件下,得到两个音频后,为了识别两个音频信息是 否相同,对接下来的信息进行提取特征。为了使有公共部分的音乐片段,能够提取出共 有的音乐片段的特征,以作度量,就需要对两个音频同步,即假如两个是大致相同的音 频内容的话,但是由于起始时间上不是完全一致,为了提取信息特征时采用相同的成分, 就需要先对两段音频同步,使二者有共同的参考点或参考点组,即对相似的,但长度大 小又不同的音频,找到共有的音频段去处理。它们之间应该有同步点使二音频对应起来。 同步点一般在特征突变位置时,比较好标记。
在此之前,已有数种提取节拍的尝试。在中华人民共和国国家知识产权局的公开 专利200610108649.0中公开了拍子提取及检测设备和方法、音乐同步显示设备和方法, 其利用检测输入音乐信号的声谱图中,功率谱的急剧变化来提取拍子,计算自相关来推 算节拍值。公开专利200480008226.0中公开了一种拍子分析装置和拍子分析方法,其 根据从分析数据提取来的声音信号的电平信息,以规定的单位时间区间的帧作为处理单 元,检测出在规定电平以上的峰值位置,并求该帧区间中的各峰值位置之间的间隔,将 发生频度高的峰值间隔决定为拍子。
上述专利中的节奏提取,主要为了获得音乐的拍子,得到整段音乐的节拍,主要 针对的是音乐信号。
发明内容
本发明的目的在于克服现有技术的不足,提供一种为了识别两个音频信息的异同, 将两个音频同步的方法。该方法既适用于音乐信息的识别中,又适用于语音信息的识别。
实现本发明目的技术方案是:一种用于音频内容识别的同步方法,该方法包括下列
步骤:
步骤1提取两个音频信号的频域或时域的特征点;
步骤2将两个音频的特征点分别组成特征点组;
步骤3对两个特征点组进行匹配,找到匹配点,将二者在匹配点上开始同步。
音频文件的识别中存在两种不同情况,其中之一是两个不同的音频文件的同步问 题,毫无疑问,两个完全不同的音频文件,无论如何都不可能达到同步,但是我们也可 以认为,他们任何时候都是同步的,只是同步后的内容不同,因此,本发明中的特征点 组匹配后得到的匹配点就可以作为其同步点,只是后续的特征提取所得到的特征不同而 已。另一种情况是两个基本相同的文件的同步问题,可以认为有公共部分的两个文件, 其一定可以找到相同的点,这个点之后的同样大小的部分则可以认为是这两个音频文件 所共有的部分。这样一来,有共有部分的音频文件就可以看作是同步了,同步点之后的 就可以认为是相同的内容了。
本发明中的特征点组通过提取频域或时域特征点进行组合的方式来实现,可以用于 音乐信息和语音信息的识别中的同步。
作为本发明的进一步改进,所述步骤1中,采用以帧为单位,计算归一化能量差的 方式提取特征点。
作为本发明的进一步改进,所述步骤2中,选取帧间能量差最大的若干点组成特征 点组。
作为本发明的进一步改进,所述步骤3中,可由特征点组之间的时间差做参考同步 特征,即如果音频a中参考点之间的时间差和b中参考点之间的时间差相同或者在允许 的误差范围内,则可以认为a中某个参考点和b中某个参考点构成了a和b的同步点。
本发明中,所述提取两个音频信号的频域特征点步骤中,具体包括以下步骤:
将音频段以帧为单位转化到频域,经过梳状滤波器组滤波,并进行归一化;
选取帧间能量差最大的特征点组成特征点组。对于和某个滤波器中心频率有共鸣或 相近的地方,信号将有较大的增幅导致能量激增。
本发明中,所述步骤1中,具体包括以下步骤:
将音频以帧为单位进行处理,计算各帧能量,计算能量差,并归一化;
选取较大的能量差的点组成特征点组。由于音频信号在时域中是缓慢变化的信号。 但是在节奏突变处,将有明显的跳动,导致前后两帧能量有较大的反差,这些点可形成 特征点组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王宏宇,未经王宏宇许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810243580.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种移动硬盘及移动硬盘盒
- 下一篇:一种建筑用轻质夹心板
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





