[发明专利]一种MP3压缩域音频分割方法无效

专利信息
申请号: 200710171802.9 申请日: 2007-12-06
公开(公告)号: CN101221762A 公开(公告)日: 2008-07-16
发明(设计)人: 余小清;万旺根;常辽豫;谭海英 申请(专利权)人: 上海大学
主分类号: G10L17/00 分类号: G10L17/00;G10L19/00;H03M7/30;G06F17/30
代理公司: 上海上大专利事务所 代理人: 何文欣
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种MP3压缩域音频分割方法。本方法先从MP3压缩音频数据中提取特征参数,再将音频信息进行静音分割,对非静音语音分割,在语音段中用统计判决模型进行说话人改变检测,最后由说话人改变点的得到分割结果。实验结果,采用本发明得分割方法比传统分割方法,在其准确率、召回率和综合性能均有显著提高。
搜索关键词: 一种 mp3 压缩 音频 分割 方法
【主权项】:
1.一种MP3压缩域音频分割方法,其特征在于:首先从MPEG1标准声音第三层压缩技术MP3文件中得到体现原始音频频域特性的数据,其次对这些数据计算能量和频域特征参数,然后使用这些参数去除静音部分并检测出语音;最后在语音片段间检测话者的改变,由此得到最终分割结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200710171802.9/,转载请声明来源钻瓜专利网。

同类专利
  • 家电设备语音控制方法-201210314209.6
  • 金启明;赵仕才;范晓波;杨芳 - 四川长虹电器股份有限公司
  • 2012-08-30 - 2012-12-26 - G10L17/00
  • 本发明涉及控制技术。本发明解决了现有家电设备语音控制方法中无法区分使用人员的问题,提供了一种家电设备语音控制方法,其技术方案可概括为:首先在语音控制的家电设备上建立使用者声纹特征库及使用者声纹特征库管理界面,然后存储至少一个使用者的声纹特征于使用者声纹特征库,在使用时,家电设备开始监听语音输入,若接收到语音信息则根据接收到的语音信息判断其中是否包含控制指令,若不是则不进行处理,若是则根据接收到的语音信息判断其中的控制指令发出者声纹是否与使用者声纹特征库中的某个使用者的声纹特征相符,若不是则不进行处理,若是则根据该控制指令执行相应的操作。本发明的有益效果是,方便用户,适用于家电设备语音控制。
  • 一种声纹识别方法-201210295572.8
  • 申富饶;唐泽林;赵金熙;程佳 - 南京大学
  • 2012-08-17 - 2012-12-12 - G10L17/00
  • 本发明公开了一种声纹识别方法,包括以下步骤:步骤1,对训练语音集内每个说话人的分段语音数据预处理,形成预处理后对应每个说话人的一组样本集合;步骤2,对所有样本集合中每一个样本进行提取梅尔倒谱系数;步骤3,逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数,对该样本集合训练高斯混合模型;步骤4,将步骤3中未被选取训练过的样本,与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型,利用所有优化后的高斯混合模型优化模型库;步骤5,输入并识别测试语音数据,利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型,将测试语音数据加入到该说话人对应的样本集合中。
  • 说话人估计方法和说话人估计设备-201110145601.8
  • 鲁耀杰;尹悦燕;郑继川 - 株式会社理光
  • 2011-06-01 - 2012-12-05 - G10L17/00
  • 本发明实施例提供一种说话人估计方法,包括:分类器建立步骤,建立用于将输入的语音数据转换为关于各个类别的语音帧集合的分类器;建模及加权步骤,利用所述分类器处理已知说话人的样本语音数据,关于各个类别分别建立说话人模型,并对各个类别分别设定权重;以及估计步骤,利用所述分类器处理未知说话人的测试语音数据,根据各个类别的说话人模型及权重,来估计该测试语音数据的说话人。本发明实施例还相应地提供一种说话人估计设备。
  • 一种在VoiceXML 2.0中支持声纹验证的方式-201110133168.6
  • 张国顺 - 上海先先信息科技有限公司
  • 2011-05-20 - 2012-11-21 - G10L17/00
  • 本发明涉及一种在VoiceXML 2.0中支持声纹验证的方式,包括以下步骤:利用标签的type属性,扩展内置语法类型(builtin type);VoiceXML解释器实现根据指定的内置类型,提供声纹注册、声纹验证功能;声纹注册、声纹验证结果通过该字段的影子变量(Shadow Variables)返回。采用本技术方案,利用VoiceXML 2.0已有语法结构优雅地实现声纹验证功能,比VoiceXML 2.0本身提供的扩展机制语法上更简洁。
    • 结合声门激励和声道调制信息的汉语语音情感提取及建模方法-201210211283.5
    • 毛峡;陈立江 - 北京航空航天大学
    • 2011-09-30 - 2012-10-24 - G10L17/00
    • 本发明一种结合声门激励和声道调制信息的汉语语音情感提取及建模方法,该汉语声门激励信息的提取方法为:制定电声门图情感语音数据库规范;收集电声门图情感语音数据;电声门图情感语音主观评测,即由至少十名评测者对电声门图情感语音进行评测。结合声门激励和声道调制信息的汉语情感建模方法为:首先根据电声门图提取声门激励信息;其次根据电声门图和语音信号的关系提取语音信号中的声道调制信息;最后,利用所有备选特征的Fisher比率为每种情感选择合适的情感特征,并训练一对多支持向量机模型。本发明通过电声门图信号提取声门激励信息,将语音信号中的声门激励信息和声道调制信息分离,更准确的反映语音中的情感信息。
    • 一种基于语音的认证方法及装置-201210171368.5
    • 马旭;唐虹刚 - 百度在线网络技术(北京)有限公司
    • 2012-05-29 - 2012-10-17 - G10L17/00
    • 本发明公开了一种基于语音的认证方法及装置。一种基于语音的认证方法包括:生成文本认证信息;将所述文本认证信息显示给待认证用户并提示用户回应;接收用户回应的语音信息,对所述语音信息进行声纹认证及语音识别,根据识别结果确定用户是否通过认证。本发明实施例所提供的技术方案,将声纹认证技术和语音识别技术相结合,一方面,通过声纹认证来确定用户的身份,另一方面,利用即时生成的认证信息让用户回应,再通过语音识别判断用户的回应语音信息内容是否与所生成的认证内容相符,从而可以有效地避免录音欺骗,解决单一的声纹识别技术所存在的安全隐患。
    • 语音信号处理方法、语音和声纹识别方法及其装置-201210173657.9
    • 林其光 - 林其灿
    • 2012-05-30 - 2012-10-10 - G10L17/00
    • 本发明提出了一种语音信号处理方法,包括:对所获取的语音信号进行数字化、加窗分帧和傅立叶变换后得到第一频谱信号;基于第一频谱信号导出至少一个作为该第一频谱信号的变型的衍生频谱信号;对第一频谱信号和至少一个衍生频谱信号进行离散余弦变换,计算各自的倒谱系数向量;以及基于所计算出的第一频谱信号和至少一个衍生频谱信号的倒谱系数向量,导出每个短时语音帧的倒谱系数向量,作为与该短时语音帧对应的前端特征向量。
    • 一种基于声纹和语音的防录音假冒身份识别方法及系统-201210172697.1
    • 成波 - 北京正鹰科技有限责任公司
    • 2012-05-30 - 2012-10-03 - G10L17/00
    • 本发明公开了一种基于声纹和语音的防录音假冒身份识别方法,包括如下步骤:根据用户读取带用户ID的固定文本的语音建立用户的声纹模型和语音模型,并保存该带用户ID的固定文本和声纹模型及语音模型;提示文本生成;在待识别人读出提示文本时,采集待识别人的语音;对采集的待识别人语音与保存的用户声纹模型进行识别,并根据保存的语音模型对待识别人语音进行识别,如果声纹识别和语音识别都成功,则接受待识别人身份,否则不接受。本发明采取带用户ID的固定文本加随机文本的方式,可以在保障识别性能的前提下,大大减少声纹建模和声纹验证所要求的语音长度,方便用户使用。
    • 基于声道调制信号MFCC的汉语语音情感点识别方法-201210076307.0
    • 毛峡;魏鹏飞 - 北京航空航天大学
    • 2012-03-21 - 2012-09-05 - G10L17/00
    • 本发明提出了一种可以提高情感点平均识别率的方法,该方法为:制定电声门图情感数据和语音数据库规范;收集电声门图情感数据和语音数据;对收集的数据进行主观评测,选出其中一套数据子集作为研究对象。对数据子集中的电声门图信号和语音信号进行预处理,并提取语音信号中的短时特征及相应的统计特征和MEL倒谱系数SMFCC;再将电声门图信号和语音信号进行快速傅里叶变换后相除,计算相除后得到的声道信息的MEL倒谱系数TMFCC。分别用不同的特征组合进行实验,求解说话人相关和说话人无关时28个情感点在不同特征组合下的平均识别率。实验结果表明采用TMFCC特征组合可以提高情感点平均识别率。
    • 说话者验证-201210055759.0
    • Z·张;M·刘 - 微软公司
    • 2007-02-13 - 2012-08-22 - G10L17/00
    • 说话者验证通过确定测试发言和存储的训练发言的相似性得分来执行。计算相似性得分涉及确定一组函数之和,其中每个函数包括混合成分的先验概率与适应均值和背景均值间差值之积。适应均值是基于背景均值和测试发言形成的。由该说话者提供的用于验证的语音内容可以是独立于文本(即,他们想说的任何内容)或者依赖于文本(即,用于训练的特定短语)。
    • 对声音模式加了标签的联系人-201080046312.6
    • K·萨姆 - 索尼爱立信移动通讯有限公司
    • 2010-09-14 - 2012-07-11 - G10L17/00
    • 一种将声音模式与联系人记录相关联和/或使用移动电话(10)来识别讲话者的方法和系统。移动设备(10)可以包括声音识别应用,其用于从音频数据提取声音模式,并且将该声音模式与联系人记录相关联,该联系人记录包括例如人的姓名的身份信息。设备(10)还可用来识别讲话者。设备(10)获取讲话者的音频数据;声音识别应用从音频数据中提取声音模式,并且将声音模式和与存储在联系人目录中的联系人记录相关联的声音模式进行比较。声音识别应用识别具有和来自音频数据的声音模式相匹配的声音模式的联系人记录,并且驱动该设备(10)来显示具有匹配声音模式的联系人记录的身份信息。
    • 在线声纹认证系统及其实现方法-201010613010.4
    • 许东星;黄伟;李轶杰;李霄寒;蔡洪斌;张峰 - 盛乐信息技术(上海)有限公司
    • 2010-12-29 - 2012-07-04 - G10L17/00
    • 本发明公开了一种在线声纹认证系统及其实现方法,该在线声纹认证系统,包括:用户录音模块、在线声纹认证服务器;其实现方法,包括步骤:1)通过在线声纹认证服务器将产生的密码内容提供给用户;2)利用用户录音模块录制用户语音,并将该语音提供给语音识别模块;3)通过语音识别模块对用户提供的语音内容与密码内容进行模式匹配分析;4)通过音频指纹识别模块,判定用户提供的语音的音频指纹是否为合法语音;5)通过声纹识别模块检验用户提供的语音与注册用户建立的声纹模型匹配程度,若程度达到设定值,则认为是真实用户登录,接受用户的此次登录。本发明实现了简单、易用、高效的在线身份认证。
    • 一种有序序列相似性对比方法的声纹识别应用-201110443922.6
    • 吴丽丽;王守觉 - 中国科学院苏州纳米技术与纳米仿生研究所
    • 2011-12-27 - 2012-06-27 - G10L17/00
    • 本发明涉及一种有序序列相似性对比方法的声纹识别应用,该声纹识别的过程包括语音特征空间建立,子空间划分,训练语句特征提取,测试语句特征提取及声纹序列比对识别。特别地,该声纹序列比对识别采用有序序列相似性对比方法得到,包括步骤:1)将序列转化为特征数组;2)比较两个数组的列数;3)对两数组进行标号匹配;4)计算各标号对相似性贡献大小;5)计算整体相似性。采用本发明方法计算两条有序序列的相似性,充分利用了序列的排列顺序信息,具有计算量小,节省存储资源等优点,克服了基于概率统计的建模方法存在的问题,适合于系统资源有限的嵌入式系统使用。
    • 说话人识别方法、装置和系统-201010572201.0
    • 王磊;鲁耀杰;史达飞;尹悦燕;郑继川 - 株式会社理光
    • 2010-12-03 - 2012-06-06 - G10L17/00
    • 本申请提供一种使用帧选择和自适应高斯混合模型选择的说话人识别方法,包括步骤:a.从输入语音文件中抽取语音帧的声学特征;b.利用抽取的声学特征通过使用语音检测技术过滤掉不包含人类语音的帧;c.对于步骤b得到的帧,进行帧选择以利用说话人语音帧的声学特征,选择对不同说话人区分度高的帧,并过滤掉区分度低的帧;d.利用步骤c中保留的帧的声学特征,选择对不同说话人区分度高的高斯混合模型,并过滤掉区分度低的高斯混合模型;e.计算步骤c中保留的帧与步骤d保留的每个说话人的高斯混合模型的最大似然得分,并根据每个说话人的高斯混合模型最大似然得分来产生说话人识别结果。由于进行了帧选择和模型选择,减少了说话人识别的计算量。
    • 一种大规模声纹认证方法及其系统-201010555485.2
    • 李轶杰;黄伟;许东星 - 盛乐信息技术(上海)有限公司
    • 2010-11-23 - 2012-05-30 - G10L17/00
    • 本发明公开了一种大规模声纹认证方法,主要包括语音信号预处理、声学特征参数提取、低维声纹码生成以及确认判决等步骤。本发明还公开了一种实现上述方法的大规模声纹认证系统。该认证方法及其系统不仅具有较高的认证效率,而且需要的模型存储空间较少。认证时,将全部待处理语音转化为低维声纹码,通过在低维空间进行简单的计算,并将计算得分与系统门限进行比较,实现声纹码的认证,如此,不仅可提高认证的效率,还可节约模型存储的空间。
    • 基于SOPC的声纹身份验证系统及其方法-201010561566.3
    • 王小可;王明;郭新国;刘杨 - 深圳市丰泰瑞达实业有限公司
    • 2010-11-26 - 2012-05-30 - G10L17/00
    • 本发明提供了一种基于SOPC的声纹身份验证系统,包括RFID电子标签、RFID阅读器、声音输入单元、准入控制单元及可编程芯片系统(SOPC)。可编程芯片系统(SOPC)与RFID阅读器、声音输入单元及准入控制单元均相连,可编程芯片系统(SOPC)识别用户的标识号码及声纹特征,并控制准入控制单元。本发明基于SOPC的声纹身份验证系统通过可编程芯片系统(SOPC)识别用户的标识号码及声纹特征,判断用户是否为合法用户并对应控制准入控制单元,增强了身份验证的安全性。本发明还提供了一种基于SOPC的声纹身份验证方法。
    • 用户识别系统中语音管理用户的装置及方法-200980158871.3
    • 盛永祥;邢益涛 - 深圳市永盛世纪指纹技术有限公司
    • 2009-04-30 - 2012-05-30 - G10L17/00
    • 本发明提供一种语音管理用户的装置,其包括:语音接收模块、语音识别模块、存储模块、控制模块以及用户识别模块。语音接收模块用于接收输入的语音信息。语音识别模块用于识别语音信息,以产生识别结果。存储模块用于存储用户信息。控制模块用于在存储的用户信息中查找与识别结果匹配的用户信息。用户识别模块用于识别使用者身份,控制模块根据用户识别模块的识别结果来授权对匹配的用户信息进行操作。使用本发明的语音管理用户的装置及方法可以快速、准确及简便地对用户信息进行操作,极大地节省了时间和精力,方便使用者的操作。
    • 提高声纹识别安全性的声纹认证系统及其实现方法-201010280751.5
    • 许东星;黄伟;李霄寒 - 盛乐信息技术(上海)有限公司
    • 2010-09-14 - 2012-04-04 - G10L17/00
    • 本发明公开了一种提高声纹识别安全性的声纹认证系统,包括:密码建立模块、语音识别模块和声纹识别模块;密码建立模块与服务器相连,服务器产生随机密码或用户设定固定密码;语音识别模块用于对用户提供的语音内容与密码内容进行模式匹配,若相符,进入声纹识别模块;声纹识别模块分为注册单元和测试单元,在注册单元建立说话人模型;测试单元包括语音有效性检测模块和声纹认证确认判决模块,在测试单元首先要求用户将密码读2遍以上,对其进行语音有效性检测,若为用户自然产生的有效数据,则调用说话人模型,分析测试时提供的语音特征,进行确认判决,接受或拒绝。此外,本发明还公开上述系统的实现方法。本发明可有效提高声纹识别的安全性。
    • 一种利用简单算术进行汉语声纹验证的方式-201110165091.0
    • 张国顺 - 上海先先信息科技有限公司
    • 2011-06-17 - 2012-02-22 - G10L17/00
    • 本发明涉及一种利用简单的算术进行汉语声纹验证的方式,包括以下步骤:在进行声纹注册时,要求用户说零到九,并从算术运算符号加、减、乘、除中随机说一个,最后说等于;在进行声纹验证时,要求用户跟读随机生成的简单算术题,进行声纹验证。采用本技术方案,与文本相关的随机模式(Text-Prompted)相比,在声纹注册时加入了数学运算符号,增加了用户在进行声纹验证时跟读的内容与字符串,提高了汉语声纹验证的准确率;并且用户跟读的是简单算术题,数字与数字间有明确的关联,可以方便用户记忆,从而可改善声纹验证的用户体验。
    • 一种基于PSM变调的语音识别及其还原方法及其装置-201110183006.3
    • 王泳;黄继武 - 中山大学
    • 2011-07-01 - 2012-02-15 - G10L17/00
    • 本发明公开一种基于PSM变调的语音识别及其还原方法及其装置,利用语音的基频特性估计变调后伸缩系数,并对美频率倒谱系数提取算法进行了改进,即利用线性插值伸缩将估计的变调系数整合到美频率倒谱系数提取算法中,使其能近似计算出变调语音在变调前的美频率倒谱系数。最后利用时间动态规整作为匹配方法,计算语音之间的相似度。同时,还能利用该估计的伸缩系数将变调后的语音还原为原语音。
    • 一种便携终端的安全语音通讯装置-201120237713.1
    • 张凯 - 龙旗科技(上海)有限公司
    • 2011-07-07 - 2012-02-08 - G10L17/00
    • 本实用新型公开了一种便携终端的安全语音通讯装置,包括:声纹库、语音通话录音模块、现场录音模块、其他语音采集模块、声纹数据模块,所述的声纹库连接声纹数据模块;语音通话录音模块、现场录音模块、其他语音采集模块声音样本传输到声纹数据模块。本实用新型结构简单,通过分析和匹配声纹库来确认通讯的安全性,为用户提供更为专业、准确和人性化的通讯安全保证。
    • 字符内容提示的声纹识别方法-201010221624.8
    • 黄伟;蔡洪滨;李轶杰 - 盛乐信息技术(上海)有限公司
    • 2010-07-08 - 2012-01-11 - G10L17/00
    • 本发明公开了一种字符内容提示的声纹识别方法,包括以下步骤:步骤一、通过随机种子产生一个长度为N的随机字符串,N为≥2的正整数;步骤二、每次显示一个字符,检测是否已完成单个字符的录音,如果已完成单个字符的录音再弹出下一个字符,直至最后一个字符被录音;步骤三、完成整个字符串的录音后,进行声纹验证。本发明通过实时的静音检测算法,采取一种冒泡式的字符串提示,使得连续字符串可视为一串孤立的字符,解决了字符连读对语音识别和声纹认证的性能影响。
    • 终端机、语音辨识系统及其语音辨识方法-201110237569.6
    • 游银泉;黄英雄 - 鸿富锦精密工业(深圳)有限公司;鸿海精密工业股份有限公司
    • 2011-08-18 - 2012-01-04 - G10L17/00
    • 本发明涉及一种终端机、一种语音辨识系统及其语音辨识方法。每当终端机验证一用户语音成功后,该信息服务器接收处理该验证成功的用户语音及得到该验证成功的用户语音的源目标参数值,该源目标参数值作为终端机下一次验证用户语音的参考,从而终端机在验证语音时是以上一次验证成功的语音作为参考来判断当前用户是否为合法用户,而不需要比对语音内容,不需要记忆密码,因一用户两次挨着的验证语音的辨识度是最接近的,故还避免了因为用户处于感冒或声音嘶哑等状态发出的语音辨识失误的情况发生。
    • 一种基于语音识别的呼叫中心用户识别方法-201010207832.2
    • 施丽艳 - 上海博路信息技术有限公司
    • 2010-06-23 - 2011-12-28 - G10L17/00
    • 本发明公开了一种基于语音识别的呼叫中心用户识别方法,包含呼叫中心,声纹识别模块,业务逻辑模块、样本数据库模块、移动通信模块。本发明将通过用户接入到呼叫中心之后,在系统菜单引导下口述指定的文本信息或者与人工对话,系统在获取到用户语音样本后在样本数据库进行比对,通过声纹的生理特征信息查询和比对到对应的样本后即可通过用户的身份认证或者方便话务员识别到该用户,用户第一次使用时需要注册语音样本信息,通过声音识别的模式,用户无需记忆用户名称、密码等信息,也提高了用户名密码关键信息泄露造成的安全问题,同时也便于呼叫中心识别用户身份,有利于提高用户的业务使用体验。
    • 基于声纹的身份认证系统及方法-201010180001.0
    • 许东星;黄伟 - 盛乐信息技术(上海)有限公司
    • 2010-05-20 - 2011-11-23 - G10L17/00
    • 本发明公开了一种基于声纹的身份认证系统,包括控制器、存储器、语音识别模块、声纹识别模块;存储器存储有多个用户的固定密码;声纹识别模块建立有多个用户的声纹模型,声纹模型包括用户的固定密码声纹模型和数字符号声纹模型;当接收到用户的登录指令时,控制器输出一随机数字符号字串到显示器,如果语音识别模块识别出的语音内容的一部分同固定密码相同,另一部分同随机数字符号字串相同,则声纹识别模块对其进行声纹识别,固定密码声纹固定密码声纹模型匹配,并且随机数字符号字串中各符号声纹同数字符号声纹模型匹配,则控制器输出身份认证通过信号。本发明还公开了一种基于声纹的身份认证方法。本发明安全性强并能减少用户的密码记忆负担。
    • 声音识别系统-200980150365.X
    • 克里斯托夫·J·米切尔 - 音频分析有限公司
    • 2009-11-26 - 2011-11-16 - G10L17/00
    • 我们描述了一种数字声音识别系统,该系统包括:用于存储马尔柯夫模型的非易失性存储器;储存处理器控制代码的存储程序存储器;声音数据输入单元;与所述声音数据输入单元、所述工作存储器以及所述存储程序存储器耦合用于执行所述处理器控制代码的处理器,并且其中所述处理器控制代码包括代码以:由所述声音数据输入单元输入用于第一个欲识别声音的第一样本声音数据,所述第一样本声音数据限定第一样本频域数据,所述第一样本频域数据限定所述第一样本在多个频率范围中的能量;由所述第一样本频域数据产生用于所述第一样本声音的至少第一马尔柯夫模型的第一组平均值以及方差值;在所述非易失性存储器中存储所述第一马尔柯夫模型;输入限定干扰频域数据的干扰声音数据;使用所述干扰频域数据调整所述第一马尔柯夫模型的所述平均值及方差值;输入限定第三声音频域数据的第三声音数据;确定所述第三声音频域数据适合至少所述第一马尔柯夫模型的概率;以及根据所述概率输出声音识别数据。
    • 一种减少文本无关说话人识别系统误识率的方法-201110233341.X
    • 韩纪庆;王秋雯 - 哈尔滨工业大学
    • 2011-08-15 - 2011-11-09 - G10L17/00
    • 一种减少文本无关说话人识别系统误识率的方法,它涉及一种减少说话人识别系统误识率的方法。本发明解决了现有的文本无关说话人识别系统在开集测试中误识率增大的问题。本方法:利用基准说话人识别系统得到闭集中已知说话人的识别阈值,将闭集中说话人分成男女两组,再将每组用阈值分段的形式把男女两组都再分为多个小组,再找到每个小组的中心分布;在基准说话人识别系统的前端加入粗筛选模块,判定测试语音的性别之后,将待测语音与同性别的小组的中心分布比较,得到待测语音的概率阈值;再用该概率阈值的语音帧进行识别。本方法的识别正确率比原系统提高2%~3%,本方法可用于文本无关说话人识别系统。
    • 一种汉语随机提示声纹验证的有效方式-201110125644.X
    • 张国顺 - 上海先先信息科技有限公司
    • 2011-05-16 - 2011-10-19 - G10L17/00
    • 本发明涉及一种汉语随机提示声纹验证的有效方式,包括以下步骤:使用一台文本相关随机提示声纹密码验证系统,该文本相关随机提示声纹密码验证系统,包括一声纹注册系统、一随机式密码产生器及一声纹验证系统;声纹注册时请用户说零到九及相关分割词;用户说完后声纹注册系统建立以及存储该用户的声纹资料;声纹验证时,随机式密码产生器挑选一个有效日期、时间、金额或门牌号,请用户跟读;声纹验证系统收录该用户跟读的声纹信息,并与限定最小的相似机率作比较,高则通过,低则不许通过。采用本技术方案,声纹验证时用户说的内容长,声纹验证的准确率高;由于有了年、月、日等分隔词,长的随机数字串被有机地分隔为三个短数,便于用户记忆。
    专利分类
    ×

    专利文献下载

    说明:

    1、专利原文基于中国国家知识产权局专利说明书;

    2、支持发明专利 、实用新型专利、外观设计专利(升级中);

    3、专利数据每周两次同步更新,支持Adobe PDF格式;

    4、内容包括专利技术的结构示意图流程工艺图技术构造图

    5、已全新升级为极速版,下载速度显著提升!欢迎使用!

    请您登陆后,进行下载,点击【登陆】 【注册】

    tel code back_top