[发明专利]一种MP3压缩域音频分割方法无效

申请号：	200710171802.9	申请日：	2007-12-06
公开（公告）号：	CN101221762A	公开（公告）日：	2008-07-16
发明（设计）人：	余小清;万旺根;常辽豫;谭海英	申请（专利权）人：	上海大学
主分类号：	G10L17/00	分类号：	G10L17/00;G10L19/00;H03M7/30;G06F17/30
代理公司：	上海上大专利事务所	代理人：	何文欣
地址：	200444***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种MP3压缩域音频分割方法。本方法先从MP3压缩音频数据中提取特征参数，再将音频信息进行静音分割，对非静音语音分割，在语音段中用统计判决模型进行说话人改变检测，最后由说话人改变点的得到分割结果。实验结果，采用本发明得分割方法比传统分割方法，在其准确率、召回率和综合性能均有显著提高。
搜索关键词：	一种 mp3 压缩音频分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种MP3压缩域音频分割方法，其特征在于：首先从MPEG1标准声音第三层压缩技术MP3文件中得到体现原始音频频域特性的数据，其次对这些数据计算能量和频域特征参数，然后使用这些参数去除静音部分并检测出语音；最后在语音片段间检测话者的改变，由此得到最终分割结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海大学，未经上海大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710171802.9/，转载请声明来源钻瓜专利网。

家电设备语音控制方法-201210314209.6
发明人：金启明;赵仕才;范晓波;杨芳 -专利权人：四川长虹电器股份有限公司
申请日： 2012-08-30 - 公布日： 2012-12-26 - 主分类号： G10L17/00
摘要：本发明涉及控制技术。本发明解决了现有家电设备语音控制方法中无法区分使用人员的问题，提供了一种家电设备语音控制方法，其技术方案可概括为：首先在语音控制的家电设备上建立使用者声纹特征库及使用者声纹特征库管理界面，然后存储至少一个使用者的声纹特征于使用者声纹特征库，在使用时，家电设备开始监听语音输入，若接收到语音信息则根据接收到的语音信息判断其中是否包含控制指令，若不是则不进行处理，若是则根据接收到的语音信息判断其中的控制指令发出者声纹是否与使用者声纹特征库中的某个使用者的声纹特征相符，若不是则不进行处理，若是则根据该控制指令执行相应的操作。本发明的有益效果是，方便用户，适用于家电设备语音控制。

一种声纹识别方法-201210295572.8
发明人：申富饶;唐泽林;赵金熙;程佳 -专利权人：南京大学
申请日： 2012-08-17 - 公布日： 2012-12-12 - 主分类号： G10L17/00
摘要：本发明公开了一种声纹识别方法，包括以下步骤：步骤1，对训练语音集内每个说话人的分段语音数据预处理，形成预处理后对应每个说话人的一组样本集合；步骤2，对所有样本集合中每一个样本进行提取梅尔倒谱系数；步骤3，逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数，对该样本集合训练高斯混合模型；步骤4，将步骤3中未被选取训练过的样本，与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型，利用所有优化后的高斯混合模型优化模型库；步骤5，输入并识别测试语音数据，利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型，将测试语音数据加入到该说话人对应的样本集合中。

说话人估计方法和说话人估计设备-201110145601.8
发明人：鲁耀杰;尹悦燕;郑继川 -专利权人：株式会社理光
申请日： 2011-06-01 - 公布日： 2012-12-05 - 主分类号： G10L17/00
摘要：本发明实施例提供一种说话人估计方法，包括：分类器建立步骤，建立用于将输入的语音数据转换为关于各个类别的语音帧集合的分类器；建模及加权步骤，利用所述分类器处理已知说话人的样本语音数据，关于各个类别分别建立说话人模型，并对各个类别分别设定权重；以及估计步骤，利用所述分类器处理未知说话人的测试语音数据，根据各个类别的说话人模型及权重，来估计该测试语音数据的说话人。本发明实施例还相应地提供一种说话人估计设备。

专利文献下载