[发明专利]用于信号内容检测的概率网络无效

专利信息
申请号: 02818839.X 申请日: 2002-09-05
公开(公告)号: CN1559067A 公开(公告)日: 2004-12-29
发明(设计)人: 穆拉特·埃伦;马克西姆·利哈乔夫 申请(专利权)人: 英特尔公司
主分类号: G10L11/02 分类号: G10L11/02
代理公司: 北京东方亿思专利代理有限责任公司 代理人: 王怡
地址: 美国加利*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种方法和装置,其使用概率网络来估计概率值并将这些概率值组合为总的概率值,每个概率值代表至少部分信号表示了内容的概率,这些内容比如话音活动。本发明可通过使用一些概率估计结果并抛弃其他概率估计结果,而使自身与特定系统和/或信号特征符合。
搜索关键词: 用于 信号 内容 检测 概率 网络
【主权项】:
1.一种方法,包括:估计至少部分信号表示了内容的概率值;以及将每个概率值组合为总的概率值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/02818839.X/,转载请声明来源钻瓜专利网。

同类专利
  • 用于语音编码器的方法和语音活动检测器-201080057984.7
  • 马丁·绍尔斯戴德 - 瑞典爱立信有限公司
  • 2010-10-18 - 2012-11-28 - G10L11/02
  • 本发明的实施例涉及初级语音活动检测器及其方法。通过使用实施例的方法,可以确定输入信号的帧是否包括语音。这是通过以下步骤实现的:接收输入信号的帧;确定接收帧的第一信噪比SNR;将所确定的第一SNR与自适应阈值比较;以及基于所述比较,检测接收帧是否包括语音。所述自适应阈值至少基于噪声电平的总噪声能量、第二SNR的估计、以及不同帧间的能量变化。
  • 基于多个话音活动检测器的话音活动检测-201080064720.4
  • 太元·李 - 高通股份有限公司
  • 2010-12-14 - 2012-11-07 - G10L11/02
  • 一种话音活动检测VAD系统包含第一话音活动检测器、第二话音活动检测器和控制逻辑。所述第一话音活动检测器包含于装置中,且产生第一VAD信号。所述第二话音活动检测器位于所述装置外部,且产生第二VAD信号。所述控制逻辑将所述第一和第二VAD信号组合成VAD输出信号。可基于所述VAD输出信号检测话音活动。可将所述第二VAD信号表示为包含于含有数字化音频的包中的旗标。可经由无线链路将所述包从所述位于外部的VAD发射到所述装置。
  • 用于话音活动检测的方法和设备-201080029467.9
  • 阿里斯·塔勒布;王喆;许剑峰;苗磊 - 华为技术有限公司
  • 2010-12-24 - 2012-10-17 - G10L11/02
  • 本发明提供一种话音活动检测设备(1),其包括:信号条件分析单元(3),其分析输入信号的至少一个信号参数,以检测所述输入信号的信号条件SC;至少两个话音活动检测单元(4-i),其包括不同的话音检测特性,其中每一话音活动检测单元(4-i)单独执行对所述输入信号的话音活动检测,以提供话音活动检测决策VADD;以及决策组合单元(5),其根据所述所检测到的信号条件SC而组合由所述话音活动检测单元(4-i)提供的所述话音活动检测决策VADD,以提供组合的话音活动检测决策cVADD。
  • 基于运动的语音活动检测-201210051770.X
  • R·K-S·关 - 微软公司
  • 2012-03-01 - 2012-10-03 - G10L11/02
  • 本发明涉及基于运动的语音活动检测。在常规的系统中,单独地基于诸如零交叉或能级的音频流的特性或特征来计算语音检测系统的输入。本发明涉及基于各种输入来判定接收音频流的系统是否应处于语音或非语音这两种状态之一的判定规则。除音频流以外,判定规则可结合基于运动的流作为判定规则的输入。权利要求书针对接收数据流,确定与数据流相关联的至少一个非音频元素是否指示该数据流包括语音,并且,响应于确定与数据流相关联的至少一个非音频元素指示该数据流包括语音,对与该数据流相关联的至少一个音频元素执行语音到文本转换。
  • 用于检测语音段的方法-201080050560.8
  • 卡洛斯·加西亚马丁内斯;海伦卡·杜先斯巴罗贝斯;毛里西奥·赛德拉维申斯;大卫·卡德纳斯桑切斯 - 西班牙电信公司
  • 2010-10-07 - 2012-09-19 - G10L11/02
  • 本发明涉及一种用于检测数字音频输入信号中的噪音段和语音段的方法,所述输入信号被分为多个帧,本方法包括:第一阶段(10),其中,如果帧与之前N个帧的平均能量值不大于第一能量阈值,则进行将所述帧并分类成噪音的第一分类,N>1;第二阶段(20),其中,针对在第一阶段中没有被分类成噪音的每个帧,基于结合至少第一标准、第二标准和第三标准来判定将所述帧分类为噪音还是分类为语音,第一标准是关于帧与声学的噪音模型和语音模型的频谱相似性,第二标准是关于对帧的能量的分析,而第三标准是关于持续时间,包括:使用状态机,用于根据对声学相似性大于第一声学阈值的确定数目的连续帧的累加来检测段的开始,以及用于检测所述段的结束;第三阶段(30),其中,使用关于持续时间的标准来审查在第二阶段中进行的将信号帧分类成语音或分类成噪音的分类。
  • 一种音频文件音质识别方法及其系统-201210006916.9
  • 谭健文;谢振宇 - 广州酷狗计算机科技有限公司
  • 2012-01-11 - 2012-07-11 - G10L11/02
  • 本发明提供一种音频文件音质识别方法及其系统,通过所述将音频文件划分为多个音频片段,将每个音频片段转换到频域,通过每个音频片段的频域对应的能量值计算所述音频文件的平均截断频率。所述平均截断频率反映了音频在高频的丢失或压缩程度,平均截断频率越高,说明音频在高音部分的丢失或压缩程度不高,因此是高音质,否则为低音质。建立基准截断频率对计算获得音频文件的平均截断频率比较,就可以根据比较结果快速准确地判断所述音频文件的音质高低。运算简单,除了对数据实施傅里叶变换转换到频域之外,其余的都是简单的比较和求平均值;适用性高,并对于低码率源转高码率的音频有很好的辨识效果。
  • 用于语音活动检测的检测器和方法-201080047231.8
  • 马丁·绍尔斯戴德 - 瑞典爱立信有限公司
  • 2010-10-18 - 2012-07-11 - G10L11/02
  • 本发明的实施例涉及语音活动检测器及其方法。所述语音活动检测器被配置为在接收到的输入信号中检测语音活动,所述语音活动检测器包括:输入部,被配置为接收来自所述VAD的初级语音检测器的指示初级VAD判决的信号以及来自至少一个外部VAD的指示来自所述至少一个外部VAD的语音活动判决的至少一个信号;处理器,被配置为将接收到的信号中指示的语音活动判决进行组合,以产生修改后的初级VAD判决;以及输出部,被配置为将修改后的初级VAD判决发送至所述VAD的尾响添加单元。
  • 一种检测语音端点的方法及系统-201110451112.5
  • 宋辉 - 北京百度网讯科技有限公司
  • 2011-12-29 - 2012-06-27 - G10L11/02
  • 本发明提供了一种检测语音端点的方法及系统,涉及计算机技术领域,用以解决现有语音端点检测技术的性能较差的问题。方法包括:A1、按照第一方向顺序,搜索输入的音频段中的各帧,若当前帧的特征值大于等于当前门限值,则利用当前帧的特征值更新当前门限值;A2、若连续N帧的特征值均小于当前门限值,则判定检测到所述音频段的语音第二端点并终止第一方向搜索过程,所述N为预设帧数;A3、按照第二方向顺序,从所述语音第二端点开始搜索,利用所述连续N帧的特征值检测所述音频段的语音第一端点。系统包括:第一正向搜索与门限自适应单元、终点位置检测单元、反向搜索与起点位置检测单元。本发明适用于一切语音搜索环境。
  • 用于音频信号分类的方法和装置-200980161483.0
  • J·V·T·劳哈拉 - 诺基亚公司
  • 2009-08-04 - 2012-06-13 - G10L11/02
  • 一种装置,其包括至少一个处理器和包括计算机程序代码的至少一个存储器,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一同使得该装置至少执行:确定音频信号的信号识别值;确定所述音频信号的至少一个噪声水平值;将所述信号识别值与信号识别阈值比较,并且将所述至少一个噪声水平值中的每个与相关联的噪声水平阈值比较;以及取决于所述比较来识别所述音频信号。
  • 声音处理装置及声音处理方法-201110387197.5
  • 山边孝朗 - JVC建伍株式会社
  • 2011-11-29 - 2012-05-30 - G10L11/02
  • 本发明提供声音处理装置及声音处理方法,识别输入信号中的噪声成分和声音成分,声音处理装置(110)具有:帧化部(120),以预先确定的帧单位截取输入信号,生成帧化输入信号;频谱生成部(122),将帧化输入信号从时间区域变换为频率区域,生成集中了每个频率的频谱的频谱图;峰值检测部(124),从频谱图检测出具有峰值的峰值频谱,生成集中了峰值频谱的峰值图形;泛音判断部(126),在峰值图形中,判断成为基音和泛音的关系的泛音构造,即泛音频谱。
  • 录音结束点检测方法及系统-201010526335.9
  • 魏思;胡国平;胡郁;刘庆峰 - 安徽科大讯飞信息科技股份有限公司
  • 2010-10-29 - 2012-05-16 - G10L11/02
  • 本发明公开了一种录音结束点自动检测方法,包括:获取录音文本,确定该录音文本的文本结束点声学模型;从录音数据中的录音开始帧开始,依次获取每一帧录音数据;确定获取到的当前帧录音数据的解码最优路径的特征声学模型;判断当前帧录音数据的解码最优路径的特征声学模型与所述结束点声学模型相同时,将静音持续时间阈值更新为第二时间阈值,所述第二时间阈值小于第一时间阈值。还提供一种录音结束点检测系统,该方法及系统能够提高对于录音结束点的识别效率。
  • 低复杂度听觉事件边界检测-201080018685.2
  • G·N·迪金斯 - 杜比实验室特许公司
  • 2010-04-12 - 2012-04-11 - G10L11/02
  • 一种听觉事件边界检测器在没有抗混叠滤波器的情况下使用输入数字音频信号的下采样,产生了具有混叠的较窄带宽中间信号。指示事件边界的此中间信号的频谱改变可通过使用自适应滤波器来追踪该中间信号的采样的线性预测模型而被检测到。滤波器误差的幅度或功率的改变对应于输入音频信号的频谱的改变。该自适应滤波器以与听觉事件的持续时间一致的速率收敛,因而滤波器误差幅度或功率的改变指示事件边界。与对于音频信号的全带宽使用时间至频率变换的方法相比,该检测器的复杂度小得多。
  • 电话内容信号鉴别-200880132621.8
  • A·J·马科宁 - 爱立信电话股份有限公司
  • 2008-10-30 - 2011-12-07 - G10L11/02
  • 描述了一种用于将电话内容信号鉴别为第一类别或第二类别的方法。该方法包括:用于从电话内容信号获得包括一个或多个带信号的带信号集合的滤波过程,每个带信号与相应频带相关联,所述带信号的至少一个是与电话内容信号的全频带的子带相关联的子带信号(n)。而且,提供确定过程用于确定所述带信号集合的每个带信号(n)的带信号变化值(LLn)和带信号强度值(TLn)。最后,鉴别过程鉴别电话内容信号是属于第一类别还是属于第二类别。鉴别过程包括:用于评估所述子带信号(n)的带信号变化值(LLn)和所述带信号强度值(TLn)的关系的无条件步骤和有条件步骤之一或二者。
  • 语音信号处理-200980150675.1
  • S.斯里尼瓦桑;A.V.潘达里彭德 - 皇家飞利浦电子股份有限公司
  • 2009-12-10 - 2011-11-23 - G10L11/02
  • 一种语音信号处理系统,包括用于提供表示讲话者的声学语音信号的第一信号的音频处理器(103)。EMG处理器(109)提供表示与声学语音信号同时被捕获的讲话者的肌电信号的第二信号。语音处理器(105)被布置成响应于第二信号处理第一信号以生成修改的语音信号。所述处理例如可以是波束形成、噪声补偿、或者语音编码。可以实现特别地在声学噪声环境中的改进的语音处理。
  • 声音判别系统、声音判别方法以及声音判别用程序-201110157383.X
  • 寺尾真 - 日本电气株式会社
  • 2006-10-10 - 2011-10-19 - G10L11/02
  • 本发明提供即使是在时间上的局部分析中取得了接近声音的特征量这样的杂音也能正确地判别为非声音的声音判别系统。该声音判别系统具有:特征量提取单元(421),其分析由声学信号输入单元(410)输入的声学信号并提取特征量的时间系列;子词边界得分计算单元(424),其参照在声音模型存储单元(431)中存储的声音的声学模型来计算子词边界得分的时间系列;时间规律性分析单元(422),其分析子词边界得分的时间规律性;以及声音判别单元(423),其使用子词边界得分的时间规律性来判断输入声学信号是声音还是非声音。
  • 语音侦测方法-201010139851.6
  • 林颖聪;丁永祯;金判燮 - 创杰科技股份有限公司
  • 2010-03-23 - 2011-09-28 - G10L11/02
  • 本发明揭露一种语音侦测方法,此语音侦测方法包括以下步骤:由第一收音装置取样第一信号,并由第二收音装置取样第二信号,其中第一收音装置比第二收音装置较靠近一语音信号源;计算第一信号在一区间内所对应的第一能量,计算第二信号在区间内所对应的第二能量,并根据第一能量与第二能量计算第一比值;转换第一比值为第二比值;设定临界值;根据第二比值与临界值的大小,判断语音信号源是否被侦测。根据本发明所提出的语音侦测方法,可以在使用者发出语音信号时,准确地侦测此语音信号。
  • 复杂背景噪声中的语音激活检测方法-201110093186.6
  • 梁峰;张凡;曹军勤;杨勇 - 西安烽火电子科技有限责任公司
  • 2011-04-14 - 2011-09-21 - G10L11/02
  • 本发明公开了一种复杂背景噪声中的语音激活检测方法,依次包括以下步骤:1)首先对数据进行TEO运算;2)对输入数据x(n)进行预加重;3)带通滤波;4)分帧加窗处理;5)计算每帧的自相关及其标准方差的开方值;6)计算初始阶段20帧的Stati及其均值mean(Stati)和标准方差std(Stati),将std(Stati)与预置门限比较,判断有无语音;7)计算后续数据;8)计算连续FrameN帧的Stati,根据其均值mean(Stati)和标准方差std(Stati),进行二次判决;9)考虑语音间隔及持续时间Speechmin=100~200ms,Silencemin=500~1000ms,在Statusfinal=0条件下,当出现连续Ns(该值与FrameN相关)个atatus=1时,判断语音出现;在Statusfinal=1条件下,当出现连续NE(该值同样与FrameN相关)个Status=0时,判断语音结束,最终判断语音的真正端点。
  • 一种语音识别的端点检测方法-201110071269.5
  • 沈勇;陈磊敏;周杰 - 同济大学
  • 2011-03-23 - 2011-08-10 - G10L11/02
  • 一种语音识别的端点检测方法,其包括:采集背景噪声和含噪语音信号;分析背景噪声和含噪语音信号的特性;提取背景噪声线性预测模型的参数或者其LPC(linear predictive coding)即线性预测编码系数,作为背景噪声线性预测模板;确定含噪语音信号的端点。即将每帧含噪语音的线性预测系数和背景噪声模板的参数对比,并处理为特征值。当此特征值的变化超过设定值时,即作为检测到语音端点的标志还可以根据背景噪声的变化,即修正背景噪声线性预测模型将它作为背景噪声模板。本发明能够很好实现带背景噪声环境下,对人们说话语音信号的端点检测。
  • 有效话音检测装置-201020600841.3
  • 付俊秀;唐永伦;王生平;王明鹏;奉鸣;谢亮 - 绵阳灵通电讯设备有限公司
  • 2010-11-11 - 2011-05-25 - G10L11/02
  • 一种有效话音检测装置,其特征在于该装置的构成包括:四线接口PTT转换器,与四线接口PTT转换器连接的A/D转换器,与A/D转换器连接的数字信号处理器DSP,与数字信号处理器DSP连接的D/A转换器,以及连接于四线接口PTT转换器与数字信号处理器DSP之间的控制电路。将本装置接入指挥调度机,借助指挥调度机接入的各类通讯网设备和交换功能,实现与指挥调度机用户、PSTN用户、专网电话、GSM手机、CDMA手机、卫星电话等进行远距离的双向呼叫、通话。突破了无线电台只能与同频电台在有限距离内通信的传统方式,为各种异构网络用户上传信息、下达指挥命令提供了便捷的通讯手段。
  • 多麦克风语音活动检测器-200980125256.2
  • 俞容山 - 杜比实验室特许公司
  • 2009-06-25 - 2011-05-25 - G10L11/02
  • 提供了一种双麦克风语音活动检测器系统。语音活动检测器系统估计每个麦克风处的信号水平和噪声水平。诸如信号的附近声音在两个麦克风之间的水平差大于诸如噪声的更远距离声音的水平差。因此,语音活动检测器检测附近声音的存在。
  • 一种实现通信系统中背景噪声的跟踪的方法和装置-200910205300.2
  • 王喆 - 华为技术有限公司
  • 2009-10-15 - 2011-05-04 - G10L11/02
  • 本发明公开了一种实现通信系统中背景噪声的跟踪的方法和装置,属于通信领域。所述方法包括:根据输入的音频信号,计算当前帧的信噪比;若当前帧的信噪比不大于门限1,则累加帧计数器,并计算当前帧的音调特征以及信号稳定性特征;当帧计数器累加至时间窗口长度时,则根据计算得到的时间窗口各帧的音调特征值和信号稳定性特征值,判断出时间窗口中含有噪声区间的可能性大小,并进而提取时间窗口的噪声特征。通过连续的在一定长度的时间窗口中分析背景噪声的存在性,可以快速的检测或跟踪变化频繁且剧烈的背景噪声。同时,通过对音调特征,频谱峰值位置稳定性和最大峰谷比位置稳定性的检测显著的降低了发生在音乐信号的背景噪声误跟踪现象。
  • 语音激活检测方法与装置、编码器-200910207311.4
  • 王喆;张清 - 华为技术有限公司
  • 2009-10-15 - 2011-05-04 - G10L11/02
  • 本发明实施例公开了一种语音激活检测方法与装置、编码器,其中,语音激活检测方法包括:输入信号为背景噪声时,获取所述背景噪声的波动特征值,该波动特征值用于表示所述背景噪声的波动大小;根据所述波动特征值,对语音激活检测VAD的判决准则相关参数进行自适应调整;利用自适应调整后的判决准则相关参数,对所述输入信号进行VAD判决。本发明实施例可以自适应于背景噪声的波动性进行VAD判决,从而提高VAD判决性能,节省有限的信道带宽资源,实现信道带宽的高效利用。
  • 语音激活检测方法、装置和电子设备-200910206840.2
  • 王喆 - 华为技术有限公司
  • 2009-10-15 - 2011-05-04 - G10L11/02
  • 本发明实施例公开了语音激活检测方法、装置和电子设备。其中的方法包括:从音频帧中获取时域分类参数和频域分类参数,获取所述时域分类参数与时域分类参数在历史背景噪声帧中的长时滑动平均值之间的第一距离,获取所述频域分类参数与频域分类参数在历史背景噪声帧中的长时滑动平均值之间的第二距离,根据所述第一距离和第二距离以及基于所述第一距离和第二距离的判决多项式组判决所述音频帧为前景语音帧还是为背景噪声帧,所述判决多项式组中的至少一个系数为变量,所述变量随语音激活检测工作方式或输入信号特征而变化。上述技术方案可使判决准则具有自适应调节能力,从而提高了语音激活检测的性能。
  • 一种判断移动终端通话接通后有无通话语音的方法-201010519678.2
  • 鲁银根 - 深圳桑菲消费通信有限公司
  • 2010-10-22 - 2011-02-16 - G10L11/02
  • 本发明涉及一种判断移动终端通话接通后有无通话语音的方法,所述的方法包括以下步骤:S1、移动终端通话接通,系统开始录音和计时;S2、取通话语音的波形数据,暂存于移动终端内存中;S3、过滤噪声;S4、如果取得静音的波形数据,则为双方无通话,从通话起计时达到M分钟时,则启动提示模块;否则,则结束判断,返回正常流程。实施本发明可及时中断误拨或错误的通话,避免浪费电能和话费,方便用户的使用。
  • 多麦克风声音活动检测器-200880104664.5
  • 王松;萨米尔·库马尔·古普塔;埃迪·L·T·乔伊 - 高通股份有限公司
  • 2008-09-26 - 2010-07-28 - G10L11/02
  • 使用多麦克风的声音活动检测可基于语音参考麦克风及噪声参考麦克风中的每一者处的能量之间的关系。可确定从所述语音参考麦克风及所述噪声参考麦克风中的每一者输出的能量。可确定语音与噪声能量比率,且将其与预定声音活动阈值进行比较。在另一实施例中,确定语音及噪声参考信号的自相关的绝对值,且确定基于自相关值的比率。超过所述预定阈值的比率可指示存在声音信号。可使用加权平均值或通过离散帧大小确定语音及噪声能量或自相关。
  • 改进的话音活动性检测器-200880016775.0
  • 马丁·泽尔施泰特 - LM爱立信电话有限公司
  • 2008-04-18 - 2010-03-24 - G10L11/02
  • 本发明涉及话音活动性检测器(VAD)(20;30),该话音活动性检测器包括至少第一主要话音检测器(23;33a)。所述话音活动性检测器(20;30)被设置成,基于至少第一主要话音检测器(23;33a)生成的主要语音判定“vad_prim_A”来输出表示输入信号中存在语音的语音判定“vag_flag”。所述话音活动性检测器(20;30)还包括短期活动性检测器(26;36),并且所述话音活动性检测器(20;30)还被设置成,基于所述短期活动性检测器(26;36)根据第一主要话音检测器(23;33a)所生成的主要语音判定“vad_prim_A”而生成的短期主要活动性信号“vad_act_prim_A”来生成表示所述输入信号中存在音乐的音乐判定“vad_music”。所述短期主要活动性信号“vad_act_prim_A”与输入信号中音乐的存在率成比例。本发明还涉及通信系统中的包括这种VAD的节点,例如,终端。
  • 一种语音检测方法-200810041965.X
  • 黄鹤云;林福辉 - 展讯通信(上海)有限公司
  • 2008-08-22 - 2010-02-24 - G10L11/02
  • 一种语音检测方法,在传统的语音传感器的附近设置一个视频传感器,在语音传感器接收到信号特征的同时,视频传感器接收视频信号特征,并通过训练过程得到视频数据和语音/非语音数据之间的联系,再通过应用过程,根据输入的视频信号计算输入的信号特征是否为语音信号。本发明语音检测方法可很大程度避免检测器不能正确检测语音和非语音信号,使语音检测的正确率大大提高。
  • 娱乐音频中的语音增强-200880009929.3
  • H·米施 - 杜比实验室特许公司
  • 2008-02-20 - 2010-02-10 - G10L11/02
  • 本发明涉及音频信号处理。更具体地,本发明涉及增强例如电视音频的娱乐音频以提高诸如对话或叙述音频的语音的清晰度和可懂度。本发明涉及方法、执行所述方法的设备、以及用于使得计算机执行所述方法的在计算机可读介质中存储的软件。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top