[发明专利]声音处理装置、方法、程序及集成电路有效
申请号: | 201280007609.0 | 申请日: | 2012-11-08 |
公开(公告)号: | CN103380457A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | 小沼知浩;上野山努 | 申请(专利权)人: | 松下电器产业株式会社 |
主分类号: | G10L25/57 | 分类号: | G10L25/57;G10L15/10;G10L25/24;G10L25/81 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 徐殿军;蒋巍 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 处理 装置 方法 程序 集成电路 | ||
1.一种声音处理装置,其特征在于,该声音处理装置具有:
特征生成单元,按照每个单位区间生成表现声音信号的单位区间的特征的区间特征;
变化值计算单元,按照所述声音信号的每个单位区间,将该单位区间作为基点区间,使用所述基点区间附近的多个单位区间的所述区间特征,计算将所述声音信号的特征在所述基点区间中的时间变化进行定量化得到的特征变化值;以及
区间判定单元,根据所述特征变化值与阈值的比较结果,判定所述基点区间是否是包含所述声音信号的特征的变化点的特征单位区间。
2.根据权利要求1所述的声音处理装置,其特征在于,所述变化值计算单元使用所述基点区间的所述区间特征、与在所述基点区间附近而不是所述基点区间的单位区间的所述区间特征的相似度,计算所述特征变化值。
3.根据权利要求2所述的声音处理装置,其特征在于,将所述阈值设为第1阈值,
所述变化值计算单元使用所述基点区间的所述区间特征与所述基点区间后续的单位区间的所述区间特征的相似度,计算所述特征变化值,
所述区间判定单元根据所述基点区间的特征变化值与所述第1阈值的比较结果,判定所述基点区间是否是特征单位区间候选,并且还根据所述特征单位区间候选中的所述特征变化值的变化速度与第2阈值的比较结果,判定所述特征单位区间候选是否是所述特征单位区间。
4.根据权利要求1所述的声音处理装置,其特征在于,所述区间特征是对表现所述声音信号的单位区间的特征的向量的各成分的强弱进行了强调后的向量。
5.根据权利要求1所述的声音处理装置,其特征在于,所述声音处理装置还具有预先存储代表特征的代表特征存储单元,该代表特征被作为用于将所述声音信号的各个单位区间判定为所述特征单位区间的基准,
所述区间判定单元具有候选判定单元,该候选判定单元根据所述特征变化值与所述阈值的比较结果,判定所述基点区间是否是特征单位区间候选,
在所述特征单位区间候选附近的单位区间的区间特征与所述代表特征相似的情况下,将所述特征单位区间候选判定为所述特征单位区间。
6.根据权利要求5所述的声音处理装置,其特征在于,在所述特征单位区间候选前方的单位区间的区间特征与所述代表特征相似的情况下、或者在所述特征单位区间候选后方的单位区间的区间特征与所述代表特征相似的情况下,所述区间判定单元将所述特征单位区间候选判定为所述特征单位区间。
7.根据权利要求5所述的声音处理装置,其特征在于,所述声音处理装置还具有:
用户信息取得部,取得用户对所述特征单位区间的评价;以及
代表特征更新单元,根据所述评价使用所述特征单位区间附近的所述区间特征计算新的代表特征,将计算出的代表特征存储在所述代表特征存储单元中。
8.根据权利要求1所述的声音处理装置,其特征在于,所述声音处理装置还具有取得单元,该取得单元取得作为用于将所述声音信号的各个单位区间判定为所述特征单位区间的基准的外部信息,
所述区间判定单元具有候选判定单元,该候选判定单元根据所述特征变化值与所述阈值的比较结果,判定所述基点区间是否是特征单位区间候选,
所述区间判定单元根据所述外部信息判定所述特征单位区间候选是否是所述特征单位区间。
9.根据权利要求8所述的声音处理装置,其特征在于,所述外部信息是指能够在与所述声音信号对应的AV内容中判定摄入了特定人物的区间的人脸聚类信息,
所述区间判定单元将根据所述人脸聚类信息被判定为摄入了所述特定人物的特征单位区间候选判定为所述特征单位区间。
10.根据权利要求1所述的声音处理装置,其特征在于,所述声音处理装置还具有:
基准特征计算单元,使用由所述特征单位区间附近的规定数量的连续的单位区间构成的基准区间的各个区间特征,计算基准特征;以及
兴趣区间抽取单元,在所述特征单位区间附近抽取由所述区间特征与所述基准特征相似的多个连续的单位区间构成的兴趣区间。
11.根据权利要求10所述的声音处理装置,其特征在于,所述基准区间是由包括所述特征单位区间在内的规定数量的连续的单位区间构成的区间,
所述兴趣区间抽取单元抽取包括所述基准区间的所述兴趣区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280007609.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:整机连体式吹膜机
- 下一篇:一种易于拆卸的推板导柱结构