[发明专利]节目制作中的说话人声音自动跟踪变调系统和方法有效

专利信息
申请号: 200510022095.8 申请日: 2005-11-18
公开(公告)号: CN1967657A 公开(公告)日: 2007-05-23
发明(设计)人: 欧阳睿章;潘巧海;龚俊杰 申请(专利权)人: 成都索贝数码科技股份有限公司
主分类号: G10L17/00 分类号: G10L17/00;G10L15/00;G10L15/28;G10L19/00;G06F3/16
代理公司: 成都立信专利事务所有限公司 代理人: 冯忠亮
地址: 610041四川省成都市*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明节目制作中的说话人声音自动跟踪变调系统和方法,包括:声音采集单元(11),采集指定说话人的声音片断和待处理声音;声学模型设立单元(12),从采集的指定说话人声音片断求解最佳参数作为声学模型;声音过滤分割单元(13),将待处理声音过滤分割成说话音和非说话音;声音存贮单元(14),存贮声学模型、非说话音和非指定说话人声音;声音特征矢量提取单元(15),从说话音中提取声音特征矢量;说话音相似匹配过滤单元(16),将说话音的声音特征矢量与存储器中的声学模型的声音特征矢量比较。声音变调单元(17),将指定说话人声音变调;声音拼接单元(18),将变调后的说话人声音与未变调的其它声音按声音在时间上的先后顺序拼接成处理后的声音。
搜索关键词: 节目 制作 中的 说话 人声 自动 跟踪 变调 系统 方法
【主权项】:
1、节目制作中的说话人声音自动跟踪变调系统,包括:声音采集单元(11),采集指定说话人的声音片断和待处理声音;声学模型设立单元(12),从采集的指定说话人声音片断提取声音特征矢量并求解最佳参数作为声学模型;声音过滤分割单元(13),将待处理声音过滤分割成说话音和非说话音;声音存贮单元(14),存贮声学模型、非说话音和非指定说话人声音;声音特征矢量提取单元(15),从说话音中提取声音特征矢量;说话音相似匹配过滤单元(16),将说话音的声音特征矢量与存储器中的声学模型的声音特征矢量比较,匹配的则过滤出为指定说话人声音,不匹配的非指定说话人声音存储待后合成;声音变调单元(17),将指定说话人声音变调;声音拼接单元(18),将变调后的说话人声音与未变调的其它声音按声音在时间上的先后顺序拼接成处理后的声音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都索贝数码科技股份有限公司,未经成都索贝数码科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200510022095.8/,转载请声明来源钻瓜专利网。

同类专利
  • 家电设备语音控制方法-201210314209.6
  • 金启明;赵仕才;范晓波;杨芳 - 四川长虹电器股份有限公司
  • 2012-08-30 - 2012-12-26 - G10L17/00
  • 本发明涉及控制技术。本发明解决了现有家电设备语音控制方法中无法区分使用人员的问题,提供了一种家电设备语音控制方法,其技术方案可概括为:首先在语音控制的家电设备上建立使用者声纹特征库及使用者声纹特征库管理界面,然后存储至少一个使用者的声纹特征于使用者声纹特征库,在使用时,家电设备开始监听语音输入,若接收到语音信息则根据接收到的语音信息判断其中是否包含控制指令,若不是则不进行处理,若是则根据接收到的语音信息判断其中的控制指令发出者声纹是否与使用者声纹特征库中的某个使用者的声纹特征相符,若不是则不进行处理,若是则根据该控制指令执行相应的操作。本发明的有益效果是,方便用户,适用于家电设备语音控制。
  • 一种声纹识别方法-201210295572.8
  • 申富饶;唐泽林;赵金熙;程佳 - 南京大学
  • 2012-08-17 - 2012-12-12 - G10L17/00
  • 本发明公开了一种声纹识别方法,包括以下步骤:步骤1,对训练语音集内每个说话人的分段语音数据预处理,形成预处理后对应每个说话人的一组样本集合;步骤2,对所有样本集合中每一个样本进行提取梅尔倒谱系数;步骤3,逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数,对该样本集合训练高斯混合模型;步骤4,将步骤3中未被选取训练过的样本,与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型,利用所有优化后的高斯混合模型优化模型库;步骤5,输入并识别测试语音数据,利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型,将测试语音数据加入到该说话人对应的样本集合中。
  • 说话人估计方法和说话人估计设备-201110145601.8
  • 鲁耀杰;尹悦燕;郑继川 - 株式会社理光
  • 2011-06-01 - 2012-12-05 - G10L17/00
  • 本发明实施例提供一种说话人估计方法,包括:分类器建立步骤,建立用于将输入的语音数据转换为关于各个类别的语音帧集合的分类器;建模及加权步骤,利用所述分类器处理已知说话人的样本语音数据,关于各个类别分别建立说话人模型,并对各个类别分别设定权重;以及估计步骤,利用所述分类器处理未知说话人的测试语音数据,根据各个类别的说话人模型及权重,来估计该测试语音数据的说话人。本发明实施例还相应地提供一种说话人估计设备。