[发明专利]一种活动语音端点的侦测方法无效

专利信息
申请号: 200710306523.9 申请日: 2007-12-28
公开(公告)号: CN101226741A 公开(公告)日: 2008-07-23
发明(设计)人: 廖崇伯;陈淮琰 申请(专利权)人: 无敌科技(西安)有限公司
主分类号: G10L15/04 分类号: G10L15/04;G10L15/00;G10L11/02
代理公司: 西安智邦专利商标代理有限公司 代理人: 商宇科
地址: 710075陕西省*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种活动语音端点的侦测方法,该方法包括以下步骤:1)接收连续语音,并从此连续语音中获取音框;2)计算步骤1)中获取的音框的能量,并根据这些能量取得能量门限值;3)分别计算步骤1)中获取的音框的越零率,并根据这些越零率取得越零率门限值;4)使用线性回归演绎法,并以步骤2)中获取的能量及步骤3)中获取的越零率作为线性回归演绎法的输入参数,用来判断每一音框是否为活动语音或非活动语音;5)根据能量门限值及越零率门限值,自步骤4)中的活动语音及非活动语音中取得活动语音起点及活动语音终点。本发明提高了活动语音起点及活动语音终点的判断准确率,以及提高语音辨识的正确率。
搜索关键词: 一种 活动 语音 端点 侦测 方法
【主权项】:
1.一种活动语音端点的侦测方法,其特征在于,该方法包括以下步骤:1)、接收连续语音,并从此连续语音中获取音框;2)、计算步骤1)中获取的音框的能量,并根据这些能量取得能量门限值;3)、分别计算步骤1)中获取的音框的越零率,并根据这些越零率取得越零率门限值;4)、使用线性回归演绎法,并以步骤2)中获取的能量及步骤3)中获取的越零率作为线性回归演绎法的输入参数,用来判断每一音框是否为活动语音或非活动语音;5)、根据能量门限值及越零率门限值,自步骤4)中的活动语音及非活动语音中取得活动语音起点及活动语音终点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200710306523.9/,转载请声明来源钻瓜专利网。

同类专利
  • 音频处理方法和音频处理设备-201110049298.1
  • 鲁耀杰;尹悦燕;郑继川 - 株式会社理光
  • 2011-03-01 - 2012-09-05 - G10L15/04
  • 提供一种音频处理方法和设备,该方法包括以下步骤:a)根据音频物理特性将音频初始地分段为一个或多个片段;对于所述一个或多个片段中的每个片段:b)在该片段中的多个时间点的每个处,提取一种或多种音频特征作为音频特征向量;c)针对所述多个时间点的每个,通过所述音频特征向量来计算该时间点的贝叶斯信息准则值;d)通过各个时间点的贝叶斯信息准则值中的最大值所对应的时间点,将该片段划分为第一部分和第二部分;以及e)通过第一部分和第二部分中的由各个时间点的贝叶斯信息准则值构成的相对于时间点的两个曲线的分布,来判断该最大值所对应的时间点是否是说话人改变点。
  • 语音信号区间估计装置与语音信号区间估计方法及其程序与记录介质-201080032747.5
  • 藤本雅清;中谷智广 - 日本电信电话株式会社
  • 2010-07-15 - 2012-05-23 - G10L15/04
  • 提高语音信号区间估计装置的处理效率与估计精度。声音信号分析单元以包含语音信号与噪声信号的声音数字信号作为输入,针对该声音数字信号的每个帧,利用无声GMM与去噪语音GMM生成适合噪声环境的非语音GMM与语音GMM,并从各GMM中仅计算必要的正态分布的输出概率。然后,语音/非语音状态概率比计算单元利用该输出概率,算出基于语音状态/非语音状态的状态转移模型的语音/非语音状态概率比,语音信号区间估计单元根据语音/非语音状态概率比,判定该帧的声音信号是语音状态还是非语音状态,从而仅输出语音状态的声音信号。
  • 拼接语音检测系统及方法-201010511170.8
  • 张峰;蔡洪斌;黄伟 - 盛乐信息技术(上海)有限公司
  • 2010-10-19 - 2012-05-16 - G10L15/04
  • 本发明公开了一种拼接语音检测系统,包括发音信息采集模块、用户历史语音数据库、语音比较模块;发音信息采集模块,用于采集用户的语音的发音信息,并将所采集的用户的语音的发音信息存储到所述用户历史语音数据库;语音比较模块,用于将采集的用户的语音的发音信息同用户历史语音数据库所存储的用户的语音的发音信息进行比较,输出拼接语音识别信号。本发明还公开了一种拼接语音检测方法。本发明能准确地检测出拼接的语音。
  • 拼接语音检测系统及方法-201010511144.5
  • 张峰;黄伟 - 盛乐信息技术(上海)有限公司
  • 2010-10-19 - 2012-05-16 - G10L15/04
  • 本发明公开了一种拼接语音检测系统,包括用户登录模块、语音比较模块;用户登录模块当接收到用户登录请求信息后,输出一段文本给用户,所述一段文本中包含N个相同的字符,2≤N;语音比较模块对用户发出的语音进行检测比较,输出拼接语音识别信号;如果检测到用户发出的语音中有发音相同的片段,输出的拼接语音识别信号为是,否则为否。本发明还公开了一种拼接语音检测方法。本发明能准确地检测出拼接的语音。
  • 音频信号的分类识别方法及装置-201010512505.8
  • 金剑;刘贵忠;顿玉洁;杜正中 - 华为技术有限公司
  • 2010-10-11 - 2012-05-09 - G10L15/04
  • 本申请实施例公开了一种音频信号的分类识别方法及装置,所述方法包括:获取一帧音频信号,对所述一帧音频信号进行预处理;通过预处理的结果对所述一帧音频信号之前的音频片段进行更新,生成包含所述一帧音频信号的当前音频片段;从所述当前音频片段中提取分类特征低短时能量比LSTER和跳跃能量比JSTER;根据所述分类特征识别所述一帧音频信号的类型,得到初始分类结果。本申请实施例中每次对一帧音频信号进行识别,由于音频信号的长度远远小于音频片段,因此延时性能极大提高,提高了音频处理的实时性能;通过LSTER和JSTER两个分类特征对音频信号进行识别,增加了音频信号识别的准确性,降低了音频信号识别的复杂度。
  • 用于语音分段的方法和设备-200680056814.0
  • R·杜;Y·陶;D·祝 - 英特尔公司
  • 2006-12-27 - 2009-10-28 - G10L15/04
  • 描述了用于语音分段的机器可读介质、方法、设备和系统。在一些实施例中,可确定模糊规则以区分语音段和非语音段。模糊规则的前件可包括输入变量和输入变量隶属关系。模糊规则的后件可包括输出变量和输出变量隶属关系。可从段提取输入变量的实例。可训练与输入变量隶属关系关联的输入变量隶属函数以及与输出变量隶属关系关联的输出变量隶属函数。可运算输入变量的实例、输入变量隶属函数、输出变量和输出变量隶属函数,以确定段是语音段还是非语音段。
  • 一种应用于语音识别系统的端点检测方法-200810107116.X
  • 高建清;胡国平;胡郁;刘庆峰;王仁华 - 安徽科大讯飞信息科技股份有限公司
  • 2008-07-17 - 2008-11-19 - G10L15/04
  • 本发明涉及一种应用于语音识别系统的端点检测方法,采用能量双门限算法与模型分类器判决相结合的方式,即检测—验证策略进行语音信号端点检测。在检测阶段,采用能量双门限算法进行能量初判;在验证阶段,先采用段过零率判决,然后再使用模型分类器进一步的验证,检测—验证策略的步骤包括:模型训练、能量初判、过零率判决、模型分类器判决、判断语音结束点和确认语音片段。本发明能高效准确的检测出语音的端点位置,同时,该方法较容易实现在线化,可以应用于语音识别实时系统。
  • 声音判别系统、声音判别方法以及声音判别用程序-200680038851.9
  • 寺尾真 - 日本电气株式会社
  • 2006-10-10 - 2008-10-22 - G10L15/04
  • 本发明提供即使是在时间上的局部分析中取得了接近声音的特征量这样的杂音也能正确地判别为非声音的声音判别系统。该声音判别系统具有:特征量提取单元(421),其分析由声学信号输入单元(410)输入的声学信号并提取特征量的时间系列;子词边界得分计算单元(424),其参照在声音模型存储单元(431)中存储的声音的声学模型来计算子词边界得分的时间系列;时间规律性分析单元(422),其分析子词边界得分的时间规律性;以及声音判别单元(423),其使用子词边界得分的时间规律性来判断输入声学信号是声音还是非声音。
  • 一种活动语音端点的侦测方法-200710306523.9
  • 廖崇伯;陈淮琰 - 无敌科技(西安)有限公司
  • 2007-12-28 - 2008-07-23 - G10L15/04
  • 本发明涉及一种活动语音端点的侦测方法,该方法包括以下步骤:1)接收连续语音,并从此连续语音中获取音框;2)计算步骤1)中获取的音框的能量,并根据这些能量取得能量门限值;3)分别计算步骤1)中获取的音框的越零率,并根据这些越零率取得越零率门限值;4)使用线性回归演绎法,并以步骤2)中获取的能量及步骤3)中获取的越零率作为线性回归演绎法的输入参数,用来判断每一音框是否为活动语音或非活动语音;5)根据能量门限值及越零率门限值,自步骤4)中的活动语音及非活动语音中取得活动语音起点及活动语音终点。本发明提高了活动语音起点及活动语音终点的判断准确率,以及提高语音辨识的正确率。
  • 一种孤立词语音端点检测的方法及系统-200710179342.4
  • 邓昊 - 北京中星微电子有限公司
  • 2007-12-12 - 2008-06-25 - G10L15/04
  • 本发明公开了一种孤立词语音端点检测的方法,包括步骤:在接收的语音信号帧中确定孤立词起点;对确定出的孤立词起点之后接收的语音信号帧,同步进行特征参数的计算和孤立词终点的检测。本发明还公开了一种孤立词语音端点检测的装置。本发明实现了在计算语音信号帧特征参数的同时,进行孤立词终点的检测,因此无需缓存大量语音数据,有利于实时实现。
  • 语音识别系统及语音处理系统-200610006952.X
  • 鹫尾信之;原田将治 - 富士通株式会社
  • 2006-01-26 - 2007-02-28 - G10L15/04
  • 本发明提供一种语音识别系统及语音处理系统,其中,在用户进行自我修正发音的情况下,如同人们之间的对话一样,可输入并正确识别自我修正发音。所述系统包括:信号处理单元,用于将讲话语音数据转换为特征;语音区段检测单元,用于检测讲话语音数据中的语音区段;优先级确定单元,用于根据预定的优先级标准,从由语音区段检测单元检测的语音区段中选择要给予优先级的语音区段;以及解码器,用于利用由优先级确定单元所选择的语音区段的特征以及声学模型,计算与识别词汇的匹配度。优先级确定单元从由下标准构成的组中所选择的至少一个标准作为预定的优先级标准:语音区段的长度,语音区段的功率或信噪比,以及语音区段的时间顺序。
  • 在无线通信系统中用于终止接收的方法和装置-200480021999.2
  • 斯蒂芬·R·卡尔塞罗 - 摩托罗拉公司
  • 2004-07-20 - 2006-09-06 - G10L15/04
  • 接收机前端(302),接收包括在语音信道上的预设符号模式的已知停止波形(114),该停止波形在传输结束时发送。处理器(304),连接到接收机前端,响应于检测停止波形而终止(512)语音信道的接收。处理器计算(504)从所接收信号导出的多个特征,包括载波信噪比、在停止波形的所有符号上的最大归一化符号相关能量、以及多个小的和多个大的归一化符号能量值。处理器通过比较多个特征和相应多个预设阀值,检测(506)停止波形。
  • 一种应用于语音识别系统的语音端点检测方法-200410090802.2
  • 潘接林;国雁萌;韩疆;刘晓星;颜永红 - 中国科学院声学研究所;北京中科信利技术有限公司
  • 2004-11-12 - 2006-05-17 - G10L15/04
  • 本发明涉及一种应用于语音识别系统的语音端点检测方法,包括如下步骤:1)对输入的语音数据进行分帧处理;2)对语音数据以帧为单位进行FFT运算,根据前N帧语音将整个语音频谱划分为信噪比高低不同的子带,计算出各子带的噪声门限;3)根据各子带的噪声门限对语音端点进行初步判别;4)根据共振峰值对语音端点进行精确判定。与现有技术相比,本发明的优点是:能够适用于各种不同自然环境的语音端点检测;能够适用于噪声较大时的语音端点检测;采用逐帧判别,且计算量小,可实际应用于各种实时语音识别系统中。
  • 基于滑动窗口的端点检测方法、装置和语音识别系统-200410083807.2
  • 余洪涌;赵庆卫 - 中国科学院声学研究所;北京中科信利通信技术有限公司;北京中科信利技术有限公司
  • 2004-10-18 - 2006-04-26 - G10L15/04
  • 本发明提供一种端点检测方法和装置,用于检测具有背景噪音的输入语音信号的语音端点,所述方法包括下列步骤:对输入语音信号施加一个窗口,取一定的帧数目作为窗口大小;确定输入语音信号中的背景噪音开始点并且计算背景噪音能量;计算当前帧的声音能量并且进而计算窗口能量;比较窗口的总声音能量是否大于背景噪音能量和语音开始点信噪比的乘积;如果不是,则窗口向下一帧滑动,并且返回计算当前帧声音能量步骤;如果是,则判断当前帧为语音开始点。本发明的端点检测方法提高端点检测的准确性,改善鲁棒性和提高语音识别系统的总体识别率。本发明的端点检测方法和装置通常应用在语音识别系统中。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top