[发明专利]一种基于说话人分割的会议主持人语音提取方法有效

专利信息
申请号: 201310479266.4 申请日: 2013-10-14
公开(公告)号: CN103559882A 公开(公告)日: 2014-02-05
发明(设计)人: 李艳雄;金海;贺前华 申请(专利权)人: 华南理工大学
主分类号: G10L17/02 分类号: G10L17/02
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 蔡茂略
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 说话 分割 会议主持人 语音 提取 方法
【说明书】:

技术领域

发明涉及语音信号处理和模式识别技术,尤其涉及一种基于说话人分割的会议主持人语音提取方法。

背景技术

会议主持人是指在多人会话的会议中,使会议进程有序进行的说话人。在经常召开的讨论会、新闻发布会、演讲等会议中,一般都有一个会议主持人。主持人往往是整个会议的第一个发言人,他组织并引导与会者有序地参与会议议程的讨论。从会议主持人的发言中,可以得到该会议的主题、与会人员人数及身份、主要议程、会议决议等重要信息。这些信息是人们在浏览分析会议语音时最希望获取的。因此,快速有效地提取出会议主持人的语音,对于会议语音的快速浏览、主题提取、说话人检索等应用都具有非常重要的意义。目前的会议主持人语音提取方法流程如下:先对会议语音进行说话人分割,再对分割结果进行说话人聚类得到各个说话人语音,最后进行说话人角色分析得到会议主持人语音。目前的方法在说话人分割之后还需要进行说话人聚类和说话人角色分析才能得到会议主持人语音。因此,目前的方法存在步骤多、计算量大的缺点,难以实现快速的会议主持人语音提取。

发明内容

本发明的目的在于克服现有技术存在的缺点与不足,提供一种基于说话人分割的会议主持人语音提取方法,该方法能快速有效地提取出会议主持人的语音。

本发明的目的通过以下技术方案实现:一种基于说话人分割的会议主持人语音提取方法,包括如下步骤:

S1、读入记录有会议语音的音频文件;

S2、说话人分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,将音频文件分成多个语音段,所述语音段的个数等于改变点个数加1;

S3、语音段距离比较:将说话人分割之后的第一个语音段作为会议主持人的语音,并比较该语音段与其他语音段的距离,将距离小于门限的语音段也判为会议主持人语音,从而得到会议主持人的所有语音段。

进一步地,所述S2说话人分割:检测上述会议语音中的说话人改变点,将相邻两个改变点之间的语音样点作为一个语音段,将音频文件分成多个语音段,具体为:

S2.1、利用门限判决的语音检测算法从上述音频文件中找出静音段和语音段;

S2.2、将上述语音段按时间顺序拼接成一个长语音段,并从长语音段中提取音频特征;

S2.3、利用上述提取的音频特征,根据贝叶斯信息准则,判断长语音段中相邻数据窗之间的相似度来检测说话人改变点;

S2.4、依次把相邻两个改变点之间的语音样点作为一个语音段,从而将音频文件分割成多个语音段,且每个语音段包含一个说话人。

进一步地,所述S2.1利用门限判决的语音检测算法从上述音频文件中找出静音段和语音段,具体包括如下步骤:

S2.1.1、对读入的会议语音进行分帧,并计算每帧语音的能量,得到会议语音的能量特征矢量;

S2.1.2、计算每帧语音的能量门限;

S2.1.3、将每帧语音的能量与能量门限比较,低于能量门限的帧为静音帧,否则为语音帧,将静音帧按时间顺序拼接成一个静音段,将语音帧按时间顺序拼接成一个语音段。

进一步地,所述S3中比较第一个语音段X1与其他语音段Xi(i≥2)之间的距离,将距离小于门限的语音段也判为会议主持人语音,包括如下步骤:

S3.1、将第一个语音段X1与其他语音段Xi都分为语音帧,再从每帧语音中提取梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficients,MFCCs)及其一阶差分(Delta-MFCCs)的音频特征,各个语音段的特征构成一个特征矩阵,语音段X1的特征矩阵为F1,Xi的特征矩阵为Fi(i≥2);

S3.2、计算语音段X1与Xi之间的BIC距离,BIC距离计算公式如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310479266.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top