[发明专利]语音检测方法在审

专利信息
申请号: 202210319615.5 申请日: 2022-03-29
公开(公告)号: CN116935900A 公开(公告)日: 2023-10-24
发明(设计)人: 杨锐廷;时林伟;王义圆;邓祥;彭少敏 申请(专利权)人: 哈曼国际工业有限公司
主分类号: G10L25/84 分类号: G10L25/84;G10L25/93;G10L25/18;G10L25/21;H04R3/04
代理公司: 北京市柳沈律师事务所 11105 代理人: 高巍
地址: 美国康*** 国省代码: 暂无信息
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 本公开提供一种使用入耳音频传感器检测语音的方法,包括对入耳音频传感器采集的输入信号的每一帧执行以下处理:基于当前帧的输入信号的至少一个特征,来计算计数改变值,其中所述至少一个特征包括估计信噪比、谱质心、谱通量、谱通量差值、谱平坦度、能量分布和邻帧之间的频谱相关性中的至少一个;将计算的计数改变值与前一帧的先前计数值相加,获得当前计数值;将获得的当前计数值与计数阈值进行比较;并且基于比较结果和特征属性来判断所述当前帧的输入信号的类别,其中所述类别包括噪声、浊音或清音。
搜索关键词: 语音 检测 方法
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司,未经哈曼国际工业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202210319615.5/,转载请声明来源钻瓜专利网。

同类专利
  • 语音检测方法-202210319615.5
  • 杨锐廷;时林伟;王义圆;邓祥;彭少敏 - 哈曼国际工业有限公司
  • 2022-03-29 - 2023-10-24 - G10L25/84
  • 本公开提供一种使用入耳音频传感器检测语音的方法,包括对入耳音频传感器采集的输入信号的每一帧执行以下处理:基于当前帧的输入信号的至少一个特征,来计算计数改变值,其中所述至少一个特征包括估计信噪比、谱质心、谱通量、谱通量差值、谱平坦度、能量分布和邻帧之间的频谱相关性中的至少一个;将计算的计数改变值与前一帧的先前计数值相加,获得当前计数值;将获得的当前计数值与计数阈值进行比较;并且基于比较结果和特征属性来判断所述当前帧的输入信号的类别,其中所述类别包括噪声、浊音或清音。
  • 语音信号检测方法、装置及计算机可读存储介质-202210310374.8
  • 容韦聪 - 安克创新科技股份有限公司
  • 2022-03-28 - 2023-10-10 - G10L25/84
  • 本申请公开了一种语音信号检测方法、装置及计算机可读存储介质,该方法包括先对待处理信号进行第一处理得到第一特征,并根据第一特征确定第一概率值;接着对待处理信号进行第二处理得到第二特征,并根据第二特征确定第二概率值;再对待处理信号的第一概率值以及第二概率值进行处理,得到待处理信号的目标概率值,并根据待处理信号的目标概率值判断待处理信号是否为语音信号。本申请通过对待处理信号进行两种不同的计算方式分别得到两个概率值,再结合该两个概率值得到最终的目标概率值,以使该目标概率值可同时兼具准确性以及低时延性,进而可使根据目标概率值确定的最终结果更具有效性。
  • 强噪声环境下的语音检测方法-202311076367.7
  • 李春霞 - 长春市鸣玺科技有限公司
  • 2023-08-25 - 2023-09-19 - G10L25/84
  • 本发明提出强噪声环境下的语音检测方法,包括:获取强噪声环境中的语音数据并对其预处理,进行滑动窗口分段,通过傅里叶变换将原始语音信号转换为频谱表示,输入到卷积神经网络CNN中提取有意义的语音特征数据;引入双向长短期记忆渐进式学习模型来估计语料层面的渐进式比率掩码后,估计的渐进式比率掩码被纳入最小值控制递归平均法程序中构建语音检测模型,通过改进优化算法计算损失对模型进行参数优化;根据用户反馈和模型性能,持续对语音检测模型进行优化和微调;使其能够自适应地调整降噪与语音失真之间的权衡,实现对各种噪声环境的适应性优化;通过利用PRMs所提供的信息,模型可以更为准确地估计噪声,进一步提升了语音检测的效果。
  • 一种实时语音活动的检测方法、装置和电子设备-202310169414.6
  • 梁民;付永强 - 全时云商务服务股份有限公司
  • 2023-02-27 - 2023-09-15 - G10L25/84
  • 本申请实施例公开了一种实时语音活动的检测方法、装置和电子设备,其方法包括:获取低信噪比环境和/或非平稳背景噪声环境下的数字信号所对应的当前帧的短时幅度谱改进型自相关函数积累统计量;根据当前帧的短时幅度谱改进型自相关函数积累统计量和预设更新模型计算对应的当前帧的语音活动检测判决参数;以及将当前帧的短时幅度谱改进型自相关函数积累统计量、当前帧的语音活动检测判决参数和当前帧的前一帧的语音活动检测判决结果指示信号均输入至预设判决决策模型中,输出当前帧的语音活动检测判决结果指示信号,以通过当前帧的判决指示信号指示当前低信噪比环境和/或非平稳背景噪声环境下是否有语音信号。
  • 语音信号筛选方法、装置、音频设备和系统-202010183804.5
  • 肖全之;闫玉凤;黄荣均;程子胜 - 珠海市杰理科技股份有限公司
  • 2020-03-16 - 2023-09-12 - G10L25/84
  • 本发明公开了一种语音信号筛选方法、装置、音频设备和系统,其中,所述方法包括:在时域上获取连续的若干帧原始音频信号,原始音频信号包含噪声信号和语音信号;将若干帧原始音频信号分别变换为频域中的若干帧对数谱信号;确定若干帧对数谱信号中满足峰值条件的频点得到峰值频点;统计每一帧对数谱信号中满足峰值条件的峰值频点的数目;将具有超过预设数目峰值频点的对数谱信号帧对应的原始音频信号帧确定为语音信号帧,语音信号帧为包含了语音信号的帧。能够减小噪声的影响,减小了误排除具有语音信号的音频信号帧的误排率,提高了筛选的准确性,也就是,有效、准确地筛选具有语音信号的音频信号帧。
  • 一种基于多脉冲相干累加的信标信号高增益检测方法-202011259718.4
  • 方世良;姚帅;方衍;安文威 - 南京世海声学科技有限公司
  • 2020-11-12 - 2023-09-05 - G10L25/84
  • 本发明公开一种基于多脉冲相干累加的信标信号高增益检测方法,该方法包括如下步骤:第一步:获取待处理采样数据序列;第二步:设置滑动窗的窗长和步进;第三步:设置滑动窗起始位置索引;第四步:对待处理的采样数据序列进行叠加得到叠加信号;第五步:对叠加信号做匹配滤波得到匹配结果;第六步:利用匹配结果计算匹配度并进行检测判决。通过对多脉冲信号进行相干叠加处理,使得信号波形相加,幅度倍增,而噪声部分仅是能量相加,可获得较高的处理增益,同时定义了匹配度来衡量拷贝信号与叠加信号的匹配程度,该方法可以提高信标信号的检测概率,降低虚警概率。
  • 一种声控通讯处理方法、耳机、存储介质及计算机-202310897008.1
  • 黄昱田;朱孟;邓旭东;秦美平;曾利群;王智坤 - 江西红声技术有限公司
  • 2023-07-21 - 2023-08-22 - G10L25/84
  • 本发明提供一种声控通讯处理方法、耳机、存储介质及计算机,应用于第一通讯设备,所述方法包括:自主接收外界环境声音信号;对所述外界环境声音信号进行分离处理得出语音信号和噪音信号;将所述语音信号进行分段处理以得到多个语音信号节段,并对各个所述语音信号节段加窗分帧处理;计算经加窗分帧处理后所述语音信号节段的平均幅值,判断所述平均幅值是否大于或等于预设的声控阈值;若是,则将所述语音信号发送至第二通讯设备,所述第二通讯设备与所述第一通讯设备通过局域网通讯。解决了现有技术中采用的通讯方式操作繁琐的技术问题。
  • 声音区间检测装置、声音区间检测方法以及记录介质-201910195826.0
  • 富田宽基 - 卡西欧计算机株式会社
  • 2019-03-15 - 2023-07-25 - G10L25/84
  • 本发明涉及声音区间检测装置、声音区间检测方法以及记录介质。声音区间检测装置具备:处理器;以及存储器,构成为通过执行该存储器中存储的命令,使得上述处理器执行以下的处理:从靶声音信号检测包括特定声音信号的特定声音区间,上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态,通过从上述靶声音信号至少除去检测出的上述特定声音区间,来从该靶声音信号检测包括语音信号的语音区间,上述语音信号表示由说话人发出的语音。
  • 一种语音检测方法、装置、电子设备及存储介质-202010321831.4
  • 徐波 - 广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司
  • 2020-04-22 - 2023-06-16 - G10L25/84
  • 本发明公开了一种语音检测方法、装置、电子设备及存储介质,其中方法包括:分别按照第一帧长和第二帧长对待测音频进行分帧处理,获得第一音频帧序列和第二音频帧序列;其中,第一帧长小于第二帧长;按照预设的特征提取算法,提取待测音频的音频特征;其中,音频特征包括多分辨率声学特征,多分辨率声学特征根据第一音频帧序列和第二音频帧序列中各个音频帧的耳蜗图特征生成;将音频特征输入预先建立的基于深度神经网络的语音检测模型,获得第一音频帧序列中各个音频帧的概率值;根据第一音频帧序列中各个音频帧的概率值,提取出待测音频中的语音信号。本发明能提升低信噪比下语音检测的准确度。
  • 手术室警报声的识别方法、装置、电子设备及存储介质-202310102796.0
  • 王晓晓;李楠;裴敏玥 - 北京大学第三医院(北京大学第三临床医学院)
  • 2023-02-13 - 2023-04-28 - G10L25/84
  • 本发明公开了一种手术室警报声的识别方法、装置、电子设备及存储介质,本发明先获取手术室中的待识别声源信号,然后,对待识别声源信号进行特征提取处理,得到声源特征信息;最后,通过构建声音识别模型来对声源特征信息进行声音识别处理,从而得到手术室中待识别声源信号的声音识别结果,如此,即可快速准确的判断出手术室中各个声音中是否夹杂有医疗设备的报警声,以便麻醉医师依据报警声及时采取处理措施;由此,本发明不依赖于麻醉医师自身来进行警报声的识别,不仅可准确无误的识别出每个医疗设备的警报声,从而避免警报声漏报的问题,同时,还能防止嘈杂环境对麻醉医师注意力和判断力的影响,从而消除因人为因素而对患者产生的安全隐患。
  • 声音识别装置、声音识别方法、记录介质以及机器人-201810156095.4
  • 中込浩一;山谷崇史;岛田敬辅 - 卡西欧计算机株式会社
  • 2018-02-23 - 2023-04-28 - G10L25/84
  • 本发明提供一种声音识别装置、声音识别方法、记录介质以及机器人。特征量提取部(203)从数字化的声音信号提取特征量并输出到似然计算部(207)。距离判别部(201)判别说话者与声音输入源的距离。似然计算部(207)根据判别,从识别对象表(105)选择在声音识别中使用的登记语,并将所选择的登记语用于似然计算部(207)中的似然计算。似然计算部(207)基于从特征量提取部(203)取得的特征量和所选择的登记语来计算似然,将似然最大的登记语作为识别结果而输出。
  • 语音信号检测方法及计算机可读存储介质-202211205753.7
  • 马冬梅 - 歌尔科技有限公司
  • 2022-09-29 - 2022-12-30 - G10L25/84
  • 本发明公开了一种语音信号检测方法及计算机可读存储介质,所述语音信号检测方法包括以下步骤:按照预设采样率采样一帧声音信号,将采样得到的一帧声音信号作为待检声音信号;计算待检声音信号的待检自相关值和待检过零率,并获取对待检声音信号的上一帧声音信号进行语音信号检测得到的检测结果;基于待检自相关值、待检过零率和上一帧声音信号的检测结果确定待检声音信号的检测结果,其中,声音信号的检测结果为表征声音信号是否为语音信号的结果。本发明实现了准确检测信噪比低的声音信号中的非语音信号和语音信号,提高了语音信号检测方法的适用性。
  • 基于进阶式的语音深度神经网络训练方法、装置-202210116109.6
  • 史慧宇;欧阳鹏 - 北京清微智能信息技术有限公司
  • 2022-02-07 - 2022-12-02 - G10L25/84
  • 本发明公开了一种基于进阶式的语音深度神经网络训练方法、装置、存储介质及电子装置。其中,该基于进阶式的语音深度神经网络训练方法包括:获取混合语音样本以及目标样本语音,其中,混合语音样本包括目标语音和噪音语音;将混合语音样本输入预设语音深度神经网络模型,得到预测目标语音,其中,预设语音神经网络模型包括进阶式提取器、编码器和重构器,确定预设语音深度神经网络模型为目标语音深度神经网络模型,基于本方案中训练的包括进阶式提取器、编码器和重构器的语音深度神经网络,解决了现有技术中,无法有效的从混合语音中分离出目标语音的技术问题。
  • 一种复杂噪声场景下的实时语音段落追踪方法-202010029721.0
  • 马翼平;张玮 - 中航华东光电(上海)有限公司
  • 2020-01-13 - 2022-11-25 - G10L25/84
  • 本发明公开了一种复杂噪声场景下的实时语音段落追踪方法,包含以下步骤:A、预处理;B、计算输入音频帧的离散傅里叶变换系数,C、假设前帧为噪声帧,计算初始噪声的功率,即计算傅里叶变换幅度谱的算术平均值;假设帧后的数据为带噪信号,计算带噪信号的功率;D、计算后验信噪比;E、计算先验信噪比;F、语音激活检测;G、噪声谱更新;H、计算增益系数,先利用语段之间的段落噪声估计场景中平稳噪声的频谱属性,然后设计增益函数增强语音、抑制平稳噪声。在此基础上进行浊音检测,追踪语音段落,并屏蔽语段之间的各类噪声。这样可以提高语音检测的准确率,抑制语音段叠加的噪声,以及彻底屏蔽影响听感的语段间的噪声。
  • 车辆提示音播放控制方法、存储介质及电子设备-202210473855.0
  • 陈其勇 - 东风汽车有限公司东风日产乘用车公司
  • 2022-04-29 - 2022-09-06 - G10L25/84
  • 本申请公开了一种车辆提示音播放控制方法、存储介质及电子设备,响应于目标提示音播放指令,获取车速、车辆加速度值、目标提示音的频率成分和环境噪音;根据所述车速、所述车辆加速度值和目标提示音的频率成分调整目标提示音的输出增益,生成增益目标提示音;确定所述增益目标提示音和所述环境噪音的突出度差值,若所述突出度差值大于预设突出度阈值,则输出所述增益目标提示音。由于车速和车辆加速度值越大产生的环境噪音越大,本申请根据车速、车辆加速度值和目标提示音的频率成分调整输出增益生成增益目标提示音,在增益目标提示音和环境噪音的突出度差值符合预设条件时输出增益目标提示音,将增益目标提示音与环境噪音区分开来。
  • 一种阵列信号的语音存在判断和自适应降噪方法-202210543879.9
  • 何俊杰 - 江苏爱谛科技研究院有限公司
  • 2022-05-19 - 2022-08-19 - G10L25/84
  • 本发明公开了一种阵列信号的语音存在判断和自适应降噪方法,其步骤为:首先对输入信号进行傅里叶变换得到频域信号。其次,计算自适应MVDR的复加权系数,并根据系数计算出所需的WNG和值。最后比较WNG极差值和波动阈值判断VAD,如果大于门限则认为存在语音,不更新系数。如果小于门限则认为不存在语音,此时更新复加权系数。本发明对于语音可以进行有效识别,从而避免了误判导致的语音受损,输出结果中保证了降噪效果的同时还能保护语音的失真度和可懂度。
  • 一种音频处理方法、装置、存储介质及电子设备-202210367406.8
  • 熊伟浩;周新权 - 北京字节跳动网络技术有限公司
  • 2022-04-08 - 2022-07-12 - G10L25/84
  • 本公开实施例公开了一种音频处理方法、装置、存储介质及电子设备。其中音频处理方法包括:获取待处理的音频帧,基于当前识别阈值确定所述音频帧的音频类型;在当前音频帧满足阈值调节条件的情况下,基于已识别的连续音频帧的特征信息判定已识别音频类型的判定状态;根据所述判定状态调节所述当前识别阈值,其中,调节后的识别阈值用于对下一音频帧进行音频类型的识别。通过上述技术方案,实现识别阈值的动态调节,进而根据动态调节的识别阈值进行音频类别,可以提高音频类型识别的准确率。
  • 声音信号检测方法及装置、计算机可读存储介质、终端-202210283475.0
  • 魏孜宸;杨可欣 - 展讯通信(上海)有限公司
  • 2022-03-22 - 2022-06-14 - G10L25/84
  • 一种声音信号检测方法及装置、计算机可读存储介质、终端,所述方法包括:确定由多个麦克风在第一预设时长内对同一输入信号采集得到的多路声音信号;确定所述多路声音信号中每两路声音信号之间的相关性系数、误差能量累积值以及能量差累积值;如果满足以下条件中的一项或多项,则确定所述输入信号中存在风噪:所述相关性系数至少一项小于预设相关性阈值、所述误差能量累积值至少一项大于第一预设差值、以及所述能量差累积值至少一项大于第二预设差值。本发明能够准确判断麦克风采集的声音信号中是否存在风噪,减少因环境风噪过大导致的非必要语音活动检测。
  • 实时风冲击噪声检测-201610174970.2
  • M.R.基尔施 - 大陆汽车系统公司
  • 2016-03-25 - 2022-06-03 - G10L25/84
  • 实时风冲击噪声检测。使用每频率语音的概率估计以及短期和长期的低频率能量来检测麦克风信号中的风冲击噪声。使用语音存在的概率估计可以准确地检测冲击无语音条件。但语音存在的概率单独地不足以在冲击语音与无冲击条件中的任一个之间进行区分。可以假设如果风冲击正在发生,则其正在语音和非语音段两者期间发生以帮助在其他可能的状态之间区分。即,可以使用概率差异作为用于进入冲击无语音状态的标准,并且然后一旦概率差异标准不再被满足就可以使用某些其他信息(例如,低频率能量)来确定何时转变到冲击语音状态或无冲击状态中的一个。
  • 信号处理装置、方法和程序-202080064274.0
  • 难波隆一;阿久根诚;及川芳明 - 索尼集团公司
  • 2020-09-04 - 2022-04-26 - G10L25/84
  • 本技术涉及一种使获得高质量目标声音成为可能的信号处理装置、方法和程序。该信号处理装置设置有:区间检测单元,用于在移动体周围存在其它移动体的状态下,基于收集移动体周围的声音所获得的收录信号以及从安装在移动体的传感器输出的传感器信号,检测收录信号中包含的移动体发出的声音的时间区间。本技术可以适用于记录系统。
  • 语音活动检测装置与方法-202010969320.3
  • 黄义政 - 瑞昱半导体股份有限公司
  • 2020-09-15 - 2022-03-15 - G10L25/84
  • 本发明公开一种语音活动检测装置与方法,能够依据环境检测结果选择多个语音活动检测结果之一作为是否有语音活动的根据。该语音活动检测装置包括环境检测电路、语音活动检测电路以及语音活动决策电路。该环境检测电路用来处理声音输入信号以产生环境检测结果。该语音活动检测电路用来依据多种语音活动检测算法分析该声音输入信号,以产生多个语音活动检测结果。该语音活动决策电路用来依据该环境检测结果选择该多个语音活动检测结果之一。
  • 语音消息处理方法及装置-201911125988.3
  • 邵雅婷;沈小正;周强 - 思必驰科技股份有限公司
  • 2019-11-18 - 2022-02-25 - G10L25/84
  • 本发明公开一种语音消息处理方法及装置。在该方法中,获取语音消息;提取与所述语音消息的至少一个语音帧分别相对应的至少一个语音特征,所述语音特征包括以下中任意的一者或多者:梅尔频率倒谱系数特征、巴克域频率倒谱系数特征和线性预测倒谱系数特征;针对所述语音消息中的各个语音帧,将所提取的关于各个语音帧的语音特征提供给语音噪音判别模型,以由该语音噪音判别模型确定各个语音帧是属于有效语音帧还是属于噪音帧;针对所述语音消息中的有效语音帧执行语音增强操作。由此,利用机器学习模型技术,能够较精确地识别语音帧中的有效语音帧和噪音帧,实现语音增强的目的,保障了语音信号的输出质量。
  • 一种语音有效性的检测方法、装置及设备-202010608291.8
  • 黄钦 - 大众问问(北京)信息科技有限公司
  • 2020-06-29 - 2022-01-14 - G10L25/84
  • 本发明实施例公开了一种语音有效性的检测方法、装置及设备,所述方法包括:采集当前时刻的第一语音信号;确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度;其中,所述语义置信度用于表征语音信号的有效性,所述第二语音信号为上一个时刻采集的语音信号;根据所述语义置信度和所述相关度,确定所述第一语音信号的有效性。通过采用上述技术方案,可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性,有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。
  • 掩蔽阈值估计方法、装置、电子设备和存储介质-202111250359.0
  • 秦永红;付贤会;刘武钊 - 北京融讯科创技术有限公司
  • 2021-10-26 - 2021-12-28 - G10L25/84
  • 本发明实施例公开了一种掩蔽阈值估计方法、装置、电子设备和存储介质。该方法包括:获取带噪语音信号的幅值谱,以及获取带噪语音信号中噪声信号的幅值谱;根据带噪语音信号的幅值谱和噪声信号的幅值谱确定带噪语音信号的语音特征谱偏差,以及根据带噪语音信号的幅值谱确定语音特征平坦度;根据语音特征谱偏差以及语音特征平坦度,确定带噪语音信号中不同频带的纯音系数;根据带噪语音信号的功率谱和带噪语音信号的幅值谱,以及纯音系数确定中间掩蔽阈值;根据预先确定的绝对掩蔽阈值和中间掩蔽阈值的比较结果,确定目标掩蔽阈值。本发明实施例可提高掩蔽阈值估计的准确度,进而能够有效增强噪声抑制结果,提高语音的识别效果。
  • 一种用于视频会议系统的语音活动检测系统-201910842478.1
  • 王向辉;黄绍锋;靳冠军;张升辉;刘晓霞 - 西安合谱声学科技有限公司
  • 2019-09-06 - 2021-12-21 - G10L25/84
  • 本发明属于语音信号处理领域,公开了一种用于视频会议系统的语音活动检测系统。分别对获取的带噪时域信号做瞬态冲击噪声检测、浊音/清音分类、基于语音存在概率的检测、基于信噪比的检测以及带噪语音信号的能量检测,通过各个模块的判决结果得到最终的语音活动检测结果。本发明对瞬态冲击噪声、非瞬态冲击噪声以及准平稳噪声有较好的检测效果。相较于现有技术,本发明具有检测结果对典型的会议室噪声鲁棒、对信噪比鲁棒、算法运算复杂度低、易于实现等优点。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top