[发明专利]声音处理装置、方法、程序及集成电路有效
申请号: | 201280007609.0 | 申请日: | 2012-11-08 |
公开(公告)号: | CN103380457A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | 小沼知浩;上野山努 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L25/57 | 分类号: | G10L25/57;G10L15/10;G10L25/24;G10L25/81 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军;蒋巍 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 装置 方法 程序 集成电路 | ||
技术领域
本发明涉及从音频信号中检测特征性区间的技术。
背景技术
在数字摄像机等动态图像摄影设备中,要求能够从用户拍摄的AV内容中去除不需要的区间而仅抽取有兴趣的区间(下面称为“兴趣区间”)的功能。
因此,过去提出了这样的装置(参照专利文献1):从AV内容的音频信号中检测人的声音频带的频率,并抽取声音持续达一定时间以上的区间作为兴趣区间。根据该装置,能够利用对音频信号进行频率分析来监视持续时间这种比较简单的方法抽取兴趣区间。
另外,还提出了这样的方法(参照专利文献2):使用用于对“拍手”、“喝彩”等判别音频信号的概率模型,按照每个单位区间判别音频信号,并抽取作为同一判别对象的单位区间持续达固定数量以上的区间作为兴趣区间。
在上述专利文献1和专利文献2记载的方法中,通过评价声音特征(音频信号中的频率等的特征)的持续性来检测兴趣区间。
现有技术文献
专利文献
专利文献1:日本特开2007-004973号公报
专利文献2:日本特开2004-258659号公报
发明概要
发明要解决的问题
可是,在用户期望的兴趣区间中存在包含突发性声音(例如赛跑开始时的鸣枪声音等)的区间。这种兴趣区间的特定的声音特征不一定持续出现,因而过去的评价声音特征的持续性的方法有可能不能检测出来。
发明内容
本发明正是鉴于上述问题而提出的,其目的在于提供一种声音处理装置,与声音特征的持续性无关,从音频信号中检测包含突发性声音的特征性区间。
用于解决问题的手段
为了解决上述问题,本发明的声音处理装置的特征在于,该声音处理装置具有:特征生成单元,按照每个单位区间生成表现声音信号的单位区间的特征的区间特征;变化值计算单元,按照所述声音信号的每个单位区间,将该单位区间作为基点区间,使用所述基点区间附近的多个单位区间的所述区间特征,计算将所述声音信号的特征在所述基点区间中的时间变化进行定量化得到的特征变化值;以及区间判定单元,根据所述特征变化值与阈值的比较结果,判定所述基点区间是否是包含所述声音信号的特征的变化点的特征单位区间。
发明效果
根据本发明的声音处理装置,通过按照每个单位区间将音频信号的特征的时间变化进行定量化,并将定量化得到的值与阈值进行比较,判定单位区间是否是特征性单位区间(特征单位区间)。即,本发明的声音处理装置通过评价声音特征的时间变化,能够与声音特征的持续性无关地从音频信号中检测特征性区间。
附图说明
图1是表示声音处理装置的特征单位区间检测及兴趣区间抽取的概况的图。
图2是表示特征量向量的计算方法的图。
图3是表示特征量向量的一例的图。
图4是表示锚定模型的一例的图。
图5是表示两个第1单位区间中的似然度向量的示例的图。
图6是表示第1单位区间与第2单位区间的关系的图。
图7是表示频次向量的一例的图。
图8是表示具有声音处理装置的影像编辑装置的功能结构例的块图。
图9是表示声音处理装置的功能结构例的块图。
图10是表示特征单位区间检测部的功能结构例的块图。
图11是表示在计算特征变化值时使用的时间窗的一例的图。
图12是表示特征单位区间候选的一例的图。
图13是表示在计算基准向量时使用的基准区间的一例的图。
图14是使用向量空间的概念表示基准向量、频次向量和阈值的图。
图15是表示动作转换区间中的基准区间的一例的图。
图16是表示兴趣区间的时间轴反方向的区间扩展处理的图。
图17是表示锚定模型生成装置的功能结构例的块图。
图18是表示初始代表控制向量生成装置的功能结构例的块图。
图19是表示特征单位区间检测处理的流程图。
图20是表示区间扩展基准指标计算处理的流程图。
图21是表示兴趣区间抽取处理的流程图。
图22是表示影像编辑系统的结构例的块图。
图23是表示影像编辑系统的客户端的结构例的块图。
图24是表示影像编辑系统的服务器的结构例的块图。
具体实施方式
<实施方式>
<1.>概要
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280007609.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:整机连体式吹膜机
- 下一篇:一种易于拆卸的推板导柱结构