[发明专利]音频编辑系统和音频编辑方法有效
| 申请号: | 201010614165.X | 申请日: | 2010-12-24 |
| 公开(公告)号: | CN102543080A | 公开(公告)日: | 2012-07-04 |
| 发明(设计)人: | 卢鲤;赵庆卫;颜永红;刘昆;吴伟国 | 申请(专利权)人: | 索尼公司;中国科学院声学研究所 |
| 主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/02;G10L15/06 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 黄小临 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 音频编辑 系统 方法 | ||
1.一种音频编辑系统,包括:
读取装置,将音频流读取到所述音频编辑系统中;
初始切分装置,将由所述读取装置读取的音频流初始切分为多个不同的片段;
音频聚类装置,基于层次聚类的算法,对由所述初始切分装置初始切分的多个片段进行有监督聚类,将属于同一性质的片段聚成一个类别;
重新切分装置,利用所述音频聚类装置聚类的结果,训练得到每个类别相应的隐马尔科夫模型,并对所述音频流进行维特比对齐切分,得到按类别切分后的音频流。
2.如权利要求1所述的音频编辑系统,其中,
所述初始切分装置包括:
音频特征提取装置,用于从前向后顺序地对所述音频流进行加窗,并提取窗内音频信号的特征信息;以及
距离测算分段器,用于通过从前向后顺序的分别对来自所述音频特征提取装置的所述特征信息进行加滑动窗,计算相邻窗内的音频距离,从而按音频流音频性质转折点将音频流切分为多个段落。
3.如权利要求2所述的音频编辑系统,其中,
将小于1s的片段平均分给上下两个相邻的段落。
4.如权利要求1所述的音频编辑系统,其中,
还包括音频有效性判别器,用于对在所述初始切分装置中得到的多个片段分别判别其是否为有效音频,并删除被判断为无效音频的片段,
所述音频聚类装置对所述音频有效性判别器进行删除后剩余的片段进行所述有监督聚类。
5.如权利要求4所述的音频编辑系统,其中,
所述无效音频为空白音频或噪声音频。
6.如权利要求1所述的音频编辑系统,其中,
还包括重新聚类装置,对所述重新切分装置切分后的所述音频流进行无监督聚类。
7.一种音频编辑系统,包括:
读取装置,将多个声道的音频流读取到所述音频编辑系统中;
多个初始切分装置,分别将由所述读取装置读取的来自多个声道的音频流初始切分为多个不同的段落;
多声道融合装置,对所述多个初始切分装置的切分点进行综合,并从每两个相邻的切分点之间选择最优的声道的音频流,从而得到多个初始切分片段,并且将得到的所述多个初始切分片段融合形成统一音频数据文件;
音频聚类装置,基于层次聚类的算法,对所述多个初始切分片段进行有监督聚类,将属于同一性质的初始切分片段聚成一个类别;
重新切分装置,利用所述音频聚类装置聚类的结果,训练得到每个类别相应的隐马尔科夫模型,并对所述统一音频文件进行维特比对齐切分,得到按类别切分后的音频流。
8.如权利要求7所述的音频编辑系统,其中,
所述多个初始切分装置的每个包括:
音频特征提取装置,用于从前向后顺序地对所述音频流进行加窗,并提取窗内音频信号的特征信息;以及
距离测算分段器,用于通过从前向后顺序的分别对来自所述音频特征提取装置的所述特征信息进行加滑动窗,计算相邻窗内的音频距离,从而按音频流音频性质转折点将音频流切分为多个段落。
9.如权利要求8所述的音频编辑系统,其中,
将小于1s的片段平均分给上下两个相邻的段落。
10.如权利要求7所述的音频编辑系统,其中,
还包括音频有效性判别器,用于对在所述多声道融合装置中得到的所述多个初始切分片段分别判别其是否为有效音频,并删除被判断为无效音频的初始切分片段,
所述音频聚类装置对所述音频有效性判别器进行删除后剩余的初始切分片段进行所述有监督聚类。
11.如权利要求10所述的音频编辑系统,其中,
所述无效音频为空白音频或噪声音频。
12.如权利要求7所述的音频编辑系统,其中,
还包括重新聚类装置,对所述重新切分装置切分后的所述音频流进行无监督聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼公司;中国科学院声学研究所,未经索尼公司;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010614165.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种圆规
- 下一篇:一种基于多槽硅基纳米线波导的全光逻辑门器件





