[发明专利]语音状况数据生成装置、语音状况可视化装置、语音状况数据编辑装置、语音数据再现装置以及语音通信系统有效

专利信息
申请号: 200780019260.1 申请日: 2007-05-21
公开(公告)号: CN101454827A 公开(公告)日: 2009-06-10
发明(设计)人: 畑纪行 申请(专利权)人: 雅马哈株式会社
主分类号: G10L17/00 分类号: G10L17/00;H04M3/56;H04R1/40;H04R3/00
代理公司: 北京天昊联合知识产权代理有限公司 代理人: 陈 源;张天舒
地址: 日本*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种语音状况数据生成装置,用于在用户使用从声源采集来并按时间记录下来的语音数据时很方便地向用户提供数据。控制单元(1)的方向/说话者识别部分(3)观测从语音通信数据获取的方向数据中的变化,并且如果表示单方向的方向数据或表示多个方向的方向数据在预定时期内不变化,则在说话者识别数据中设置单方向数据和与多个方向的组合相关的组合方向数据。如果预定时期内发生了任何变化,方向/说话者识别部分(3)则从说话者语音DB(53)中读取语音特征值数据Sc,通过把语音特征值数据Sc与由语音数据分析部分(2)所分析出来的语音特征值进行比较来识别出说话者,并且在识别出说话者时在说话者识别数据中设置说话者姓名数据,在未识别出说话者时在说话者识别数据中设置方向未检出数据。语音状况数据生成部分(4)根据说话者识别数据随着时间的变化来生成语音状况数据。
搜索关键词: 语音 状况 数据 生成 装置 可视化 编辑 再现 以及 通信 系统
【主权项】:
1. 一种语音状况数据生成装置,包括:数据获取装置,用于按时序获取语音数据和方向数据,该方向数据表示语音数据到来的方向;说话者语音特征数据库,存储了各个说话者的语音特征值;方向/说话者识别装置,用于在所获取的方向数据表示单方向并且在预定时期内保持不变时在说话者识别数据中设置作为单方向数据的方向数据,所述方向/说话者识别装置用于在所获取的方向数据表示多个方向的同一组合并且在预定时期内保持不变时在说话者识别数据中设置作为组合方向数据的方向数据,所述方向/说话者识别装置用于在该说话者识别数据既不是单方向数据也不是组合方向数据时,从语音数据中提取语音特征值并将所提取的语音特征值与说话者语音特征数据库中所存储的语音特征值进行比较从而执行说话者识别,并且,如果识别出说话者,所述方向/说话者识别装置则在该说话者识别数据中设置与所识别出来的说话者相对应的说话者姓名数据,如果未识别出说话者,所述方向/说话者识别装置则在该说话者识别数据中设置方向未检出数据;语音状况数据生成装置,用于通过分析与说话者识别数据相关的确定结果的时间分布来生成语音状况数据;以及存储装置,用于存储语音数据以及语音状况数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200780019260.1/,转载请声明来源钻瓜专利网。

同类专利
  • 家电设备语音控制方法-201210314209.6
  • 金启明;赵仕才;范晓波;杨芳 - 四川长虹电器股份有限公司
  • 2012-08-30 - 2012-12-26 - G10L17/00
  • 本发明涉及控制技术。本发明解决了现有家电设备语音控制方法中无法区分使用人员的问题,提供了一种家电设备语音控制方法,其技术方案可概括为:首先在语音控制的家电设备上建立使用者声纹特征库及使用者声纹特征库管理界面,然后存储至少一个使用者的声纹特征于使用者声纹特征库,在使用时,家电设备开始监听语音输入,若接收到语音信息则根据接收到的语音信息判断其中是否包含控制指令,若不是则不进行处理,若是则根据接收到的语音信息判断其中的控制指令发出者声纹是否与使用者声纹特征库中的某个使用者的声纹特征相符,若不是则不进行处理,若是则根据该控制指令执行相应的操作。本发明的有益效果是,方便用户,适用于家电设备语音控制。
  • 一种声纹识别方法-201210295572.8
  • 申富饶;唐泽林;赵金熙;程佳 - 南京大学
  • 2012-08-17 - 2012-12-12 - G10L17/00
  • 本发明公开了一种声纹识别方法,包括以下步骤:步骤1,对训练语音集内每个说话人的分段语音数据预处理,形成预处理后对应每个说话人的一组样本集合;步骤2,对所有样本集合中每一个样本进行提取梅尔倒谱系数;步骤3,逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数,对该样本集合训练高斯混合模型;步骤4,将步骤3中未被选取训练过的样本,与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型,利用所有优化后的高斯混合模型优化模型库;步骤5,输入并识别测试语音数据,利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型,将测试语音数据加入到该说话人对应的样本集合中。
  • 说话人估计方法和说话人估计设备-201110145601.8
  • 鲁耀杰;尹悦燕;郑继川 - 株式会社理光
  • 2011-06-01 - 2012-12-05 - G10L17/00
  • 本发明实施例提供一种说话人估计方法,包括:分类器建立步骤,建立用于将输入的语音数据转换为关于各个类别的语音帧集合的分类器;建模及加权步骤,利用所述分类器处理已知说话人的样本语音数据,关于各个类别分别建立说话人模型,并对各个类别分别设定权重;以及估计步骤,利用所述分类器处理未知说话人的测试语音数据,根据各个类别的说话人模型及权重,来估计该测试语音数据的说话人。本发明实施例还相应地提供一种说话人估计设备。