[发明专利]一种人声提取方法、系统以及人声音频播放方法及装置有效
申请号: | 201310108032.9 | 申请日: | 2013-03-29 |
公开(公告)号: | CN104078051B | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 佘海波;王进军;刘书昌;张欣 | 申请(专利权)人: | 南京中兴软件有限责任公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/51;G10L25/78 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 田红娟;龙洪 |
地址: | 210012 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种人声提取方法、系统以及人声音频播放方法及装置,其中,所述方法包括:从原声音信号开始处提取人声和背景声共同出现的声音信号作为样本;从样本中检测出主音高;以主音高为参照频率,将原声音信号除样本之外的声音部分中属于同一声源的声音的基音频率与参照频率进行比较确定该声源是否属于人声。本发明可简便地从混合音频中提取人声。 | ||
搜索关键词: | 一种 人声 提取 方法 系统 以及 音频 播放 装置 | ||
【主权项】:
1.一种人声提取方法,其特征在于,所述方法包括:从原声音信号开始处提取人声和背景声共同出现的声音信号作为样本;从所述样本中检测出主音高;以所述主音高为参照频率,将所述原声音信号除所述样本之外的声音部分中属于同一声源的声音的基音频率与所述参照频率进行比较确定该声源是否属于人声;其中,以所述主音高为参照频率,将所述原声音信号除所述样本之外的声音部分中属于同一声源的声音的基音频率与所述参照频率进行比较确定该声源是否属于人声,包括:将所述原声音信号除所述样本之外的声音部分分成多帧;将每一帧声音信号经过Gammatone滤波器得到多个时频单元,合并相邻的属于同一声源的时频单元作为一个片段;如果一个片段内,超过一半以上的时频单元的基音频率与所述参照频率相等,则该片段为人声片段。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中兴软件有限责任公司,未经南京中兴软件有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310108032.9/,转载请声明来源钻瓜专利网。