[发明专利]语音检测方法在审

申请号：	202210319615.5	申请日：	2022-03-29
公开（公告）号：	CN116935900A	公开（公告）日：	2023-10-24
发明（设计）人：	杨锐廷;时林伟;王义圆;邓祥;彭少敏	申请（专利权）人：	哈曼国际工业有限公司
主分类号：	G10L25/84	分类号：	G10L25/84;G10L25/93;G10L25/18;G10L25/21;H04R3/04
代理公司：	北京市柳沈律师事务所 11105	代理人：	高巍
地址：	美国康***	国省代码：	暂无信息
权利要求书：	暂无信息	说明书：	暂无信息
摘要：	本公开提供一种使用入耳音频传感器检测语音的方法，包括对入耳音频传感器采集的输入信号的每一帧执行以下处理：基于当前帧的输入信号的至少一个特征，来计算计数改变值，其中所述至少一个特征包括估计信噪比、谱质心、谱通量、谱通量差值、谱平坦度、能量分布和邻帧之间的频谱相关性中的至少一个；将计算的计数改变值与前一帧的先前计数值相加，获得当前计数值；将获得的当前计数值与计数阈值进行比较；并且基于比较结果和特征属性来判断所述当前帧的输入信号的类别，其中所述类别包括噪声、浊音或清音。
搜索关键词：	语音检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于哈曼国际工业有限公司，未经哈曼国际工业有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210319615.5/，转载请声明来源钻瓜专利网。

上一篇：原子层沉积装置和原子层沉积方法
下一篇：进风切换装置和具有其的空气处理设备

同类专利

语音检测方法-202210319615.5
发明人：杨锐廷;时林伟;王义圆;邓祥;彭少敏 -专利权人：哈曼国际工业有限公司
申请日： 2022-03-29 - 公布日： 2023-10-24 - 主分类号： G10L25/84
摘要：本公开提供一种使用入耳音频传感器检测语音的方法，包括对入耳音频传感器采集的输入信号的每一帧执行以下处理：基于当前帧的输入信号的至少一个特征，来计算计数改变值，其中所述至少一个特征包括估计信噪比、谱质心、谱通量、谱通量差值、谱平坦度、能量分布和邻帧之间的频谱相关性中的至少一个；将计算的计数改变值与前一帧的先前计数值相加，获得当前计数值；将获得的当前计数值与计数阈值进行比较；并且基于比较结果和特征属性来判断所述当前帧的输入信号的类别，其中所述类别包括噪声、浊音或清音。

语音信号检测方法、装置及计算机可读存储介质-202210310374.8
发明人：容韦聪 -专利权人：安克创新科技股份有限公司
申请日： 2022-03-28 - 公布日： 2023-10-10 - 主分类号： G10L25/84
摘要：本申请公开了一种语音信号检测方法、装置及计算机可读存储介质，该方法包括先对待处理信号进行第一处理得到第一特征，并根据第一特征确定第一概率值；接着对待处理信号进行第二处理得到第二特征，并根据第二特征确定第二概率值；再对待处理信号的第一概率值以及第二概率值进行处理，得到待处理信号的目标概率值，并根据待处理信号的目标概率值判断待处理信号是否为语音信号。本申请通过对待处理信号进行两种不同的计算方式分别得到两个概率值，再结合该两个概率值得到最终的目标概率值，以使该目标概率值可同时兼具准确性以及低时延性，进而可使根据目标概率值确定的最终结果更具有效性。

强噪声环境下的语音检测方法-202311076367.7
发明人：李春霞 -专利权人：长春市鸣玺科技有限公司
申请日： 2023-08-25 - 公布日： 2023-09-19 - 主分类号： G10L25/84
摘要：本发明提出强噪声环境下的语音检测方法，包括：获取强噪声环境中的语音数据并对其预处理，进行滑动窗口分段，通过傅里叶变换将原始语音信号转换为频谱表示，输入到卷积神经网络CNN中提取有意义的语音特征数据；引入双向长短期记忆渐进式学习模型来估计语料层面的渐进式比率掩码后，估计的渐进式比率掩码被纳入最小值控制递归平均法程序中构建语音检测模型，通过改进优化算法计算损失对模型进行参数优化；根据用户反馈和模型性能，持续对语音检测模型进行优化和微调；使其能够自适应地调整降噪与语音失真之间的权衡，实现对各种噪声环境的适应性优化；通过利用PRMs所提供的信息，模型可以更为准确地估计噪声，进一步提升了语音检测的效果。

一种实时语音活动的检测方法、装置和电子设备-202310169414.6
发明人：梁民;付永强 -专利权人：全时云商务服务股份有限公司
申请日： 2023-02-27 - 公布日： 2023-09-15 - 主分类号： G10L25/84
摘要：本申请实施例公开了一种实时语音活动的检测方法、装置和电子设备，其方法包括：获取低信噪比环境和／或非平稳背景噪声环境下的数字信号所对应的当前帧的短时幅度谱改进型自相关函数积累统计量；根据当前帧的短时幅度谱改进型自相关函数积累统计量和预设更新模型计算对应的当前帧的语音活动检测判决参数；以及将当前帧的短时幅度谱改进型自相关函数积累统计量、当前帧的语音活动检测判决参数和当前帧的前一帧的语音活动检测判决结果指示信号均输入至预设判决决策模型中，输出当前帧的语音活动检测判决结果指示信号，以通过当前帧的判决指示信号指示当前低信噪比环境和／或非平稳背景噪声环境下是否有语音信号。

语音信号筛选方法、装置、音频设备和系统-202010183804.5
发明人：肖全之;闫玉凤;黄荣均;程子胜 -专利权人：珠海市杰理科技股份有限公司
申请日： 2020-03-16 - 公布日： 2023-09-12 - 主分类号： G10L25/84
摘要：本发明公开了一种语音信号筛选方法、装置、音频设备和系统，其中，所述方法包括：在时域上获取连续的若干帧原始音频信号，原始音频信号包含噪声信号和语音信号；将若干帧原始音频信号分别变换为频域中的若干帧对数谱信号；确定若干帧对数谱信号中满足峰值条件的频点得到峰值频点；统计每一帧对数谱信号中满足峰值条件的峰值频点的数目；将具有超过预设数目峰值频点的对数谱信号帧对应的原始音频信号帧确定为语音信号帧，语音信号帧为包含了语音信号的帧。能够减小噪声的影响，减小了误排除具有语音信号的音频信号帧的误排率，提高了筛选的准确性，也就是，有效、准确地筛选具有语音信号的音频信号帧。

一种基于多脉冲相干累加的信标信号高增益检测方法-202011259718.4
发明人：方世良;姚帅;方衍;安文威 -专利权人：南京世海声学科技有限公司
申请日： 2020-11-12 - 公布日： 2023-09-05 - 主分类号： G10L25/84
摘要：本发明公开一种基于多脉冲相干累加的信标信号高增益检测方法，该方法包括如下步骤：第一步：获取待处理采样数据序列；第二步：设置滑动窗的窗长和步进；第三步：设置滑动窗起始位置索引；第四步：对待处理的采样数据序列进行叠加得到叠加信号；第五步：对叠加信号做匹配滤波得到匹配结果；第六步：利用匹配结果计算匹配度并进行检测判决。通过对多脉冲信号进行相干叠加处理，使得信号波形相加，幅度倍增，而噪声部分仅是能量相加，可获得较高的处理增益，同时定义了匹配度来衡量拷贝信号与叠加信号的匹配程度，该方法可以提高信标信号的检测概率，降低虚警概率。

一种声控通讯处理方法、耳机、存储介质及计算机-202310897008.1
发明人：黄昱田;朱孟;邓旭东;秦美平;曾利群;王智坤 -专利权人：江西红声技术有限公司
申请日： 2023-07-21 - 公布日： 2023-08-22 - 主分类号： G10L25/84
摘要：本发明提供一种声控通讯处理方法、耳机、存储介质及计算机，应用于第一通讯设备，所述方法包括：自主接收外界环境声音信号；对所述外界环境声音信号进行分离处理得出语音信号和噪音信号；将所述语音信号进行分段处理以得到多个语音信号节段，并对各个所述语音信号节段加窗分帧处理；计算经加窗分帧处理后所述语音信号节段的平均幅值，判断所述平均幅值是否大于或等于预设的声控阈值；若是，则将所述语音信号发送至第二通讯设备，所述第二通讯设备与所述第一通讯设备通过局域网通讯。解决了现有技术中采用的通讯方式操作繁琐的技术问题。

声音区间检测装置、声音区间检测方法以及记录介质-201910195826.0
发明人：富田宽基 -专利权人：卡西欧计算机株式会社
申请日： 2019-03-15 - 公布日： 2023-07-25 - 主分类号： G10L25/84
摘要：本发明涉及声音区间检测装置、声音区间检测方法以及记录介质。声音区间检测装置具备：处理器；以及存储器，构成为通过执行该存储器中存储的命令，使得上述处理器执行以下的处理：从靶声音信号检测包括特定声音信号的特定声音区间，上述特定声音信号表示在比特定时间长的时间持续发出的同一子音的音素的状态，通过从上述靶声音信号至少除去检测出的上述特定声音区间，来从该靶声音信号检测包括语音信号的语音区间，上述语音信号表示由说话人发出的语音。

一种语音检测方法、装置、电子设备及存储介质-202010321831.4
发明人：徐波 -专利权人：广州多益网络股份有限公司;广东利为网络科技有限公司;多益网络有限公司
申请日： 2020-04-22 - 公布日： 2023-06-16 - 主分类号： G10L25/84
摘要：本发明公开了一种语音检测方法、装置、电子设备及存储介质，其中方法包括：分别按照第一帧长和第二帧长对待测音频进行分帧处理，获得第一音频帧序列和第二音频帧序列；其中，第一帧长小于第二帧长；按照预设的特征提取算法，提取待测音频的音频特征；其中，音频特征包括多分辨率声学特征，多分辨率声学特征根据第一音频帧序列和第二音频帧序列中各个音频帧的耳蜗图特征生成；将音频特征输入预先建立的基于深度神经网络的语音检测模型，获得第一音频帧序列中各个音频帧的概率值；根据第一音频帧序列中各个音频帧的概率值，提取出待测音频中的语音信号。本发明能提升低信噪比下语音检测的准确度。

声音认识装置、机器人、声音认识方法以及记录介质-201811551686.8
发明人：岛田敬辅 -专利权人：卡西欧计算机株式会社
申请日： 2018-12-18 - 公布日： 2023-05-23 - 主分类号： G10L25/84
摘要：本发明提供声音认识装置、机器人、声音认识方法以及记录介质，用于减低周围的声音带给声音认识的精度的影响。声音认识装置(100)认识用户(发声者)的嘴的活动。另外，声音认识装置(100)检测自装置的周围的声音当中的噪声音。然后，声音认识装置(100)基于用户的嘴的活动和自装置的周围的声音当中的噪声音来控制声音认识定时。

手术室警报声的识别方法、装置、电子设备及存储介质-202310102796.0
发明人：王晓晓;李楠;裴敏玥 -专利权人：北京大学第三医院（北京大学第三临床医学院）
申请日： 2023-02-13 - 公布日： 2023-04-28 - 主分类号： G10L25/84
摘要：本发明公开了一种手术室警报声的识别方法、装置、电子设备及存储介质，本发明先获取手术室中的待识别声源信号，然后，对待识别声源信号进行特征提取处理，得到声源特征信息；最后，通过构建声音识别模型来对声源特征信息进行声音识别处理，从而得到手术室中待识别声源信号的声音识别结果，如此，即可快速准确的判断出手术室中各个声音中是否夹杂有医疗设备的报警声，以便麻醉医师依据报警声及时采取处理措施；由此，本发明不依赖于麻醉医师自身来进行警报声的识别，不仅可准确无误的识别出每个医疗设备的警报声，从而避免警报声漏报的问题，同时，还能防止嘈杂环境对麻醉医师注意力和判断力的影响，从而消除因人为因素而对患者产生的安全隐患。

声音识别装置、声音识别方法、记录介质以及机器人-201810156095.4
发明人：中込浩一;山谷崇史;岛田敬辅 -专利权人：卡西欧计算机株式会社
申请日： 2018-02-23 - 公布日： 2023-04-28 - 主分类号： G10L25/84
摘要：本发明提供一种声音识别装置、声音识别方法、记录介质以及机器人。特征量提取部(203)从数字化的声音信号提取特征量并输出到似然计算部(207)。距离判别部(201)判别说话者与声音输入源的距离。似然计算部(207)根据判别，从识别对象表(105)选择在声音识别中使用的登记语，并将所选择的登记语用于似然计算部(207)中的似然计算。似然计算部(207)基于从特征量提取部(203)取得的特征量和所选择的登记语来计算似然，将似然最大的登记语作为识别结果而输出。

语音信号检测方法及计算机可读存储介质-202211205753.7
发明人：马冬梅 -专利权人：歌尔科技有限公司
申请日： 2022-09-29 - 公布日： 2022-12-30 - 主分类号： G10L25/84
摘要：本发明公开了一种语音信号检测方法及计算机可读存储介质，所述语音信号检测方法包括以下步骤：按照预设采样率采样一帧声音信号，将采样得到的一帧声音信号作为待检声音信号；计算待检声音信号的待检自相关值和待检过零率，并获取对待检声音信号的上一帧声音信号进行语音信号检测得到的检测结果；基于待检自相关值、待检过零率和上一帧声音信号的检测结果确定待检声音信号的检测结果，其中，声音信号的检测结果为表征声音信号是否为语音信号的结果。本发明实现了准确检测信噪比低的声音信号中的非语音信号和语音信号，提高了语音信号检测方法的适用性。

基于进阶式的语音深度神经网络训练方法、装置-202210116109.6
发明人：史慧宇;欧阳鹏 -专利权人：北京清微智能信息技术有限公司
申请日： 2022-02-07 - 公布日： 2022-12-02 - 主分类号： G10L25/84
摘要：本发明公开了一种基于进阶式的语音深度神经网络训练方法、装置、存储介质及电子装置。其中，该基于进阶式的语音深度神经网络训练方法包括：获取混合语音样本以及目标样本语音，其中，混合语音样本包括目标语音和噪音语音；将混合语音样本输入预设语音深度神经网络模型，得到预测目标语音，其中，预设语音神经网络模型包括进阶式提取器、编码器和重构器，确定预设语音深度神经网络模型为目标语音深度神经网络模型，基于本方案中训练的包括进阶式提取器、编码器和重构器的语音深度神经网络，解决了现有技术中，无法有效的从混合语音中分离出目标语音的技术问题。

一种复杂噪声场景下的实时语音段落追踪方法-202010029721.0
发明人：马翼平;张玮 -专利权人：中航华东光电（上海）有限公司
申请日： 2020-01-13 - 公布日： 2022-11-25 - 主分类号： G10L25/84
摘要：本发明公开了一种复杂噪声场景下的实时语音段落追踪方法，包含以下步骤：A、预处理；B、计算输入音频帧的离散傅里叶变换系数，C、假设前帧为噪声帧，计算初始噪声的功率，即计算傅里叶变换幅度谱的算术平均值；假设帧后的数据为带噪信号，计算带噪信号的功率；D、计算后验信噪比；E、计算先验信噪比；F、语音激活检测；G、噪声谱更新；H、计算增益系数，先利用语段之间的段落噪声估计场景中平稳噪声的频谱属性，然后设计增益函数增强语音、抑制平稳噪声。在此基础上进行浊音检测，追踪语音段落，并屏蔽语段之间的各类噪声。这样可以提高语音检测的准确率，抑制语音段叠加的噪声，以及彻底屏蔽影响听感的语段间的噪声。

信号处理方法、装置、电子设备及介质-202210377040.2
发明人：康东;刘良兵 -专利权人：维沃移动通信有限公司
申请日： 2022-04-11 - 公布日： 2022-11-04 - 主分类号： G10L25/84
摘要：本申请公开了一种信号处理方法、装置、电子设备及介质，属于通信技术领域。该信号处理方法包括：获取M帧信号的第一相位谱图，M为正整数；根据第一相位补偿函数，对该第一相位谱图进行相位补偿，得到第二相位谱图，该第二相位谱图为该M帧信号在目标频率的相位特征谱图。

车辆提示音播放控制方法、存储介质及电子设备-202210473855.0
发明人：陈其勇 -专利权人：东风汽车有限公司东风日产乘用车公司
申请日： 2022-04-29 - 公布日： 2022-09-06 - 主分类号： G10L25/84
摘要：本申请公开了一种车辆提示音播放控制方法、存储介质及电子设备，响应于目标提示音播放指令，获取车速、车辆加速度值、目标提示音的频率成分和环境噪音；根据所述车速、所述车辆加速度值和目标提示音的频率成分调整目标提示音的输出增益，生成增益目标提示音；确定所述增益目标提示音和所述环境噪音的突出度差值，若所述突出度差值大于预设突出度阈值，则输出所述增益目标提示音。由于车速和车辆加速度值越大产生的环境噪音越大，本申请根据车速、车辆加速度值和目标提示音的频率成分调整输出增益生成增益目标提示音，在增益目标提示音和环境噪音的突出度差值符合预设条件时输出增益目标提示音，将增益目标提示音与环境噪音区分开来。

一种阵列信号的语音存在判断和自适应降噪方法-202210543879.9
发明人：何俊杰 -专利权人：江苏爱谛科技研究院有限公司
申请日： 2022-05-19 - 公布日： 2022-08-19 - 主分类号： G10L25/84
摘要：本发明公开了一种阵列信号的语音存在判断和自适应降噪方法，其步骤为：首先对输入信号进行傅里叶变换得到频域信号。其次，计算自适应MVDR的复加权系数，并根据系数计算出所需的WNG和值。最后比较WNG极差值和波动阈值判断VAD，如果大于门限则认为存在语音，不更新系数。如果小于门限则认为不存在语音，此时更新复加权系数。本发明对于语音可以进行有效识别，从而避免了误判导致的语音受损，输出结果中保证了降噪效果的同时还能保护语音的失真度和可懂度。

一种基于HOG+SVM的短波通信话音检测方法-202210175396.8
发明人：白洁;陈路路;李宝莲;张玲;刘伟强;员建厦;陈莉;尹明辉;韩江龙;梁钰萱;杨佳贝 -专利权人：中国电子科技集团公司第五十四研究所
申请日： 2022-02-24 - 公布日： 2022-07-26 - 主分类号： G10L25/84
摘要：本发明提出了一种基于SVM+HOG的短波通信话音检测方法，可以应用于从短波侦控工作中录制的音频数据中自动检测话音。该方法先基于短波通信音频数据生成语谱图，再从语谱图中提取HOG特征，以HOG特征为输入，使用经过训练的SVM区分噪音和话音，从而达到从短波通信的音频数据中检测出话音的目标。本发明的话音检测算法具有检测准确率高、模型适应性强等优点。

一种音频处理方法、装置、存储介质及电子设备-202210367406.8
发明人：熊伟浩;周新权 -专利权人：北京字节跳动网络技术有限公司
申请日： 2022-04-08 - 公布日： 2022-07-12 - 主分类号： G10L25/84
摘要：本公开实施例公开了一种音频处理方法、装置、存储介质及电子设备。其中音频处理方法包括：获取待处理的音频帧，基于当前识别阈值确定所述音频帧的音频类型；在当前音频帧满足阈值调节条件的情况下，基于已识别的连续音频帧的特征信息判定已识别音频类型的判定状态；根据所述判定状态调节所述当前识别阈值，其中，调节后的识别阈值用于对下一音频帧进行音频类型的识别。通过上述技术方案，实现识别阈值的动态调节，进而根据动态调节的识别阈值进行音频类别，可以提高音频类型识别的准确率。

声音信号检测方法及装置、计算机可读存储介质、终端-202210283475.0
发明人：魏孜宸;杨可欣 -专利权人：展讯通信（上海）有限公司
申请日： 2022-03-22 - 公布日： 2022-06-14 - 主分类号： G10L25/84
摘要：一种声音信号检测方法及装置、计算机可读存储介质、终端，所述方法包括：确定由多个麦克风在第一预设时长内对同一输入信号采集得到的多路声音信号；确定所述多路声音信号中每两路声音信号之间的相关性系数、误差能量累积值以及能量差累积值；如果满足以下条件中的一项或多项，则确定所述输入信号中存在风噪：所述相关性系数至少一项小于预设相关性阈值、所述误差能量累积值至少一项大于第一预设差值、以及所述能量差累积值至少一项大于第二预设差值。本发明能够准确判断麦克风采集的声音信号中是否存在风噪，减少因环境风噪过大导致的非必要语音活动检测。

使用识别信号声学检测外部媒体设备状态的方法-202080072369.7
发明人：斯里达尔·皮利;佩杰曼·德加尼 -专利权人：元平台公司
申请日： 2020-09-25 - 公布日： 2022-06-10 - 主分类号： G10L25/84
摘要：一种通信系统检测已连接的电视的状态。通信系统经由网络接收与本地通信设备建立通信会话的请求。通信系统向本地已连接的音频输出设备输出参考音频信号。通信系统从本地麦克风捕获周围音频信号，并将参考音频信号和周围音频信号进行比较，以确定参考音频信号和周围音频信号是否通过满足相似性阈值而匹配。基于该比较来发起针对通信会话的动作。

实时风冲击噪声检测-201610174970.2
发明人： M.R.基尔施 -专利权人：大陆汽车系统公司
申请日： 2016-03-25 - 公布日： 2022-06-03 - 主分类号： G10L25/84
摘要：实时风冲击噪声检测。使用每频率语音的概率估计以及短期和长期的低频率能量来检测麦克风信号中的风冲击噪声。使用语音存在的概率估计可以准确地检测冲击无语音条件。但语音存在的概率单独地不足以在冲击语音与无冲击条件中的任一个之间进行区分。可以假设如果风冲击正在发生，则其正在语音和非语音段两者期间发生以帮助在其他可能的状态之间区分。即，可以使用概率差异作为用于进入冲击无语音状态的标准，并且然后一旦概率差异标准不再被满足就可以使用某些其他信息（例如，低频率能量）来确定何时转变到冲击语音状态或无冲击状态中的一个。

信号处理装置、方法和程序-202080064274.0
发明人：难波隆一;阿久根诚;及川芳明 -专利权人：索尼集团公司
申请日： 2020-09-04 - 公布日： 2022-04-26 - 主分类号： G10L25/84
摘要：本技术涉及一种使获得高质量目标声音成为可能的信号处理装置、方法和程序。该信号处理装置设置有：区间检测单元，用于在移动体周围存在其它移动体的状态下，基于收集移动体周围的声音所获得的收录信号以及从安装在移动体的传感器输出的传感器信号，检测收录信号中包含的移动体发出的声音的时间区间。本技术可以适用于记录系统。

语音活动检测装置与方法-202010969320.3
发明人：黄义政 -专利权人：瑞昱半导体股份有限公司
申请日： 2020-09-15 - 公布日： 2022-03-15 - 主分类号： G10L25/84
摘要：本发明公开一种语音活动检测装置与方法，能够依据环境检测结果选择多个语音活动检测结果之一作为是否有语音活动的根据。该语音活动检测装置包括环境检测电路、语音活动检测电路以及语音活动决策电路。该环境检测电路用来处理声音输入信号以产生环境检测结果。该语音活动检测电路用来依据多种语音活动检测算法分析该声音输入信号，以产生多个语音活动检测结果。该语音活动决策电路用来依据该环境检测结果选择该多个语音活动检测结果之一。

语音消息处理方法及装置-201911125988.3
发明人：邵雅婷;沈小正;周强 -专利权人：思必驰科技股份有限公司
申请日： 2019-11-18 - 公布日： 2022-02-25 - 主分类号： G10L25/84
摘要：本发明公开一种语音消息处理方法及装置。在该方法中，获取语音消息；提取与所述语音消息的至少一个语音帧分别相对应的至少一个语音特征，所述语音特征包括以下中任意的一者或多者：梅尔频率倒谱系数特征、巴克域频率倒谱系数特征和线性预测倒谱系数特征；针对所述语音消息中的各个语音帧，将所提取的关于各个语音帧的语音特征提供给语音噪音判别模型，以由该语音噪音判别模型确定各个语音帧是属于有效语音帧还是属于噪音帧；针对所述语音消息中的有效语音帧执行语音增强操作。由此，利用机器学习模型技术，能够较精确地识别语音帧中的有效语音帧和噪音帧，实现语音增强的目的，保障了语音信号的输出质量。

讲话区间检测装置、讲话区间检测方法及讲话区间检测程序-202080042621.X
发明人：广濑良文 -专利权人：松下知识产权经营株式会社
申请日： 2020-06-05 - 公布日： 2022-01-14 - 主分类号： G10L25/84
摘要：讲话区间检测装置包括：第1嘴唇形状估计部，基于包括讲话者的声音的声响数据估计讲话者的第1嘴唇形状；第2嘴唇形状估计部，基于至少拍摄到讲话者的面部的图像数据估计讲话者的第2嘴唇形状；和讲话区间检测部，基于第1嘴唇形状的变化和所述第2嘴唇形状的变化，在声响数据中检测讲话者发出声音的讲话区间。

一种语音有效性的检测方法、装置及设备-202010608291.8
发明人：黄钦 -专利权人：大众问问（北京）信息科技有限公司
申请日： 2020-06-29 - 公布日： 2022-01-14 - 主分类号： G10L25/84
摘要：本发明实施例公开了一种语音有效性的检测方法、装置及设备，所述方法包括：采集当前时刻的第一语音信号；确定所述第一语音信号的语义置信度及所述第一语音信号与第二语音信号的相关度；其中，所述语义置信度用于表征语音信号的有效性，所述第二语音信号为上一个时刻采集的语音信号；根据所述语义置信度和所述相关度，确定所述第一语音信号的有效性。通过采用上述技术方案，可以准确、快速地确定在智能语音交互过程中采集的语音信号的有效性，有效减少了智能语音交互过程中由于周围干扰信号的影响导致语音交互中断或产生错误响应的情况发生。

掩蔽阈值估计方法、装置、电子设备和存储介质-202111250359.0
发明人：秦永红;付贤会;刘武钊 -专利权人：北京融讯科创技术有限公司
申请日： 2021-10-26 - 公布日： 2021-12-28 - 主分类号： G10L25/84
摘要：本发明实施例公开了一种掩蔽阈值估计方法、装置、电子设备和存储介质。该方法包括：获取带噪语音信号的幅值谱，以及获取带噪语音信号中噪声信号的幅值谱；根据带噪语音信号的幅值谱和噪声信号的幅值谱确定带噪语音信号的语音特征谱偏差，以及根据带噪语音信号的幅值谱确定语音特征平坦度；根据语音特征谱偏差以及语音特征平坦度，确定带噪语音信号中不同频带的纯音系数；根据带噪语音信号的功率谱和带噪语音信号的幅值谱，以及纯音系数确定中间掩蔽阈值；根据预先确定的绝对掩蔽阈值和中间掩蔽阈值的比较结果，确定目标掩蔽阈值。本发明实施例可提高掩蔽阈值估计的准确度，进而能够有效增强噪声抑制结果，提高语音的识别效果。

一种用于视频会议系统的语音活动检测系统-201910842478.1
发明人：王向辉;黄绍锋;靳冠军;张升辉;刘晓霞 -专利权人：西安合谱声学科技有限公司
申请日： 2019-09-06 - 公布日： 2021-12-21 - 主分类号： G10L25/84
摘要：本发明属于语音信号处理领域，公开了一种用于视频会议系统的语音活动检测系统。分别对获取的带噪时域信号做瞬态冲击噪声检测、浊音/清音分类、基于语音存在概率的检测、基于信噪比的检测以及带噪语音信号的能量检测，通过各个模块的判决结果得到最终的语音活动检测结果。本发明对瞬态冲击噪声、非瞬态冲击噪声以及准平稳噪声有较好的检测效果。相较于现有技术，本发明具有检测结果对典型的会议室噪声鲁棒、对信噪比鲁棒、算法运算复杂度低、易于实现等优点。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音检测方法在审

专利文献下载