[发明专利]说话人转换的语音检测方法、装置、电子设备及存储介质在审

申请号：	202310781402.9	申请日：	2023-06-29
公开（公告）号：	CN116935890A	公开（公告）日：	2023-10-24
发明（设计）人：	赵江江;宋桂祥;杨正哲	申请（专利权）人：	中移在线服务有限公司;中国移动通信集团有限公司
主分类号：	G10L25/45	分类号：	G10L25/45;G10L25/27;G10L15/26;G10L15/18;G06F16/332;G06F16/33;G06F40/289
代理公司：	北京路浩知识产权代理有限公司 11002	代理人：	程琛
地址：	471023 河南省洛阳***	国省代码：	河南;41
权利要求书：	暂无信息	说明书：	暂无信息
摘要：	本申请涉及语音处理技术领域，提供一种说话人转换的语音检测方法、装置、电子设备及存储介质，方法包括：基于待检测的语音数据进行特征提取，得到特征数据；确定所述特征数据的语音窗类型；若所述语音窗类型为混合拼接语音窗类型，则确定所述特征数据在所述语音数据对应的语音段中，发生说话人转换时的第一时间戳；获取所述特征数据对应语音段的转写文本，确定所述转写文本中各文本信息在所述特征数据对应语音段的第二时间戳；根据所述第一时间戳与所述第二时间戳对所述转写文本进行分段拆分，得到拆分文本；对所述拆分文本进行角色标记，得到包含角色标识的拆分文本。本申请可提高机器人语义理解系统解析用户意图的准确性，进而提高用户体验感。
搜索关键词：	说话转换语音检测方法装置电子设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中移在线服务有限公司;中国移动通信集团有限公司，未经中移在线服务有限公司;中国移动通信集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202310781402.9/，转载请声明来源钻瓜专利网。

上一篇：一种远程摄像设备取景范围的辅助调整方法及系统
下一篇：一种甘蔗抗旱脱毒健康种子培育方法

同类专利

说话人转换的语音检测方法、装置、电子设备及存储介质-202310781402.9
发明人：赵江江;宋桂祥;杨正哲 -专利权人：中移在线服务有限公司;中国移动通信集团有限公司
申请日： 2023-06-29 - 公布日： 2023-10-24 - 主分类号： G10L25/45
摘要：本申请涉及语音处理技术领域，提供一种说话人转换的语音检测方法、装置、电子设备及存储介质，方法包括：基于待检测的语音数据进行特征提取，得到特征数据；确定所述特征数据的语音窗类型；若所述语音窗类型为混合拼接语音窗类型，则确定所述特征数据在所述语音数据对应的语音段中，发生说话人转换时的第一时间戳；获取所述特征数据对应语音段的转写文本，确定所述转写文本中各文本信息在所述特征数据对应语音段的第二时间戳；根据所述第一时间戳与所述第二时间戳对所述转写文本进行分段拆分，得到拆分文本；对所述拆分文本进行角色标记，得到包含角色标识的拆分文本。本申请可提高机器人语义理解系统解析用户意图的准确性，进而提高用户体验感。

算法智能优化方法、系统、高速数据采集卡以及存储介质-202310686962.6
发明人：孙贵荣;贺兰茂;王海波;顾岩 -专利权人：上海银帆信息科技有限公司
申请日： 2023-06-09 - 公布日： 2023-09-15 - 主分类号： G10L25/45
摘要：本申请涉及一种算法智能优化方法、系统、高速数据采集卡以及存储介质，涉及分布式光纤声波传感技术的领域，其中方法包括以下步骤：获取采集信号；基于采集信号，进行混频处理，并输出混频信号；基于混频信号进行滤波处理，在进行滤波处理时，将混频信号分别加入多个窗函数进行滤波，并比较多个加入窗函数的处理结果，选择最优的处理结果作为滤波信号；基于滤波信号依次进行平方根以及反正切处理，并输出信号为数字解调信号。本申请具有使得最终恢复的声音信号质量最佳的效果。

一种电机声音异常故障诊断方法、系统、及可存储介质-202310187876.0
发明人：钟张豪;丑永新;侯千红 -专利权人：盐城工学院
申请日： 2023-02-28 - 公布日： 2023-05-26 - 主分类号： G10L25/45
摘要：本发明属于噪声检测技术领域，公开了一种电机声音异常故障诊断方法，包括：对获取的电机噪声信号进行窗分隔的时域特征提取；使用主成分分析方法对提取的特征进行降维；根据降维后的特征矩阵生成随机森林神经网络训练数据集；通过训练集对随机森林网络模型进行训练，并使用卡帕系数评估分类器的分类性能；使用训练好的随机森林网络模型检测电机噪声。对电机噪声信号进行窗分隔的时域特征提取，可以对电机噪声进行快速、有效的识别，适用于工业应用。

语音信号的处理方法和装置-202110431392.7
发明人：贺玉梁 -专利权人：维沃移动通信有限公司
申请日： 2021-04-21 - 公布日： 2022-11-08 - 主分类号： G10L25/45
摘要：本申请公开了一种语音信号的处理方法和装置，属于信号处理技术领域。其中，所述语音信号的处理方法包括：选取接收的原始语音信号的分析窗和综合窗；依据预设的重构条件，基于分析窗和综合窗构建凸优化目标函数；其中，将所述综合窗作为待求解目标变量；对所述综合窗增加至少一种凸约束条件；基于所述凸优化目标函数和所述至少一种凸约束条件，对原始语音信号进行凸优化处理，得到重构后的语音信号。

一种基于自适应窗长的船舶螺旋桨空化噪声调制谱特征保真增强方法-201811036574.9
发明人：方世良;朱传奇;罗昕炜;安良 -专利权人：东南大学
申请日： 2018-09-06 - 公布日： 2022-08-19 - 主分类号： G10L25/45
摘要：本发明公开了一种基于自适应窗长的船舶螺旋桨空化噪声调制谱特征保真增强方法，该方法包括如下步骤：第一步：对船舶螺旋桨空化噪声信号进行宽带平方解调；第二步：预估解调谱，检测解调谱线谱位置，并给出各线谱频域信噪比；第三步：确定各线谱频率相对于螺旋桨轴频频率预估值的谐波次数；第四步：对各线谱频率进行加权融合，估计螺旋桨轴频频率；第五步：根据估计的螺旋桨轴频频率自适应调整解调谱分析窗长，对解调谱进行二次估计。本发明利用船舶螺旋桨空化噪声各解调谱线谱频率和螺旋桨轴频频率之间存在的固有整数倍关系，根据估计的螺旋桨轴频频率自适应调整解调谱分析窗长，对解调谱进行二次估计，获取调制谱特征保真增强的解调谱。

信号修正方法、装置、设备、存储介质及计算机程序产品-202210103474.3
发明人：陈孝良;李良斌 -专利权人：北京声智科技有限公司
申请日： 2022-01-27 - 公布日： 2022-05-20 - 主分类号： G10L25/45
摘要：本申请实施例提供了一种信号修正方法、装置、设备、存储介质及计算机程序产品。其中方法包括：根据信号之间的相关系数确定待修正信号，对待修正信号进行加窗处理，当加窗后得到的信号满足相关系数阈值条件时，确定加窗后的信号为修正后的信号。根据本申请实施例的方法，能够修正信号的相关系数，避免在利用相关系数进行处理时出现结果不准确的问题。

基于智能手机的风噪声的判断方法、装置以及电子设备-202110777462.4
发明人：方梓炎;黄哲龙;潘佳辉;周爽;钱增辉;李童;韩皓 -专利权人：南京航空航天大学
申请日： 2021-07-09 - 公布日： 2021-11-19 - 主分类号： G10L25/45
摘要：本发明公开了一种基于智能手机的风噪声的判断方法、装置以及电子设备，其中，判断方法包括：获取麦克风一段连续时间内收集的数据；对所述数据进行加窗处理；对每个窗口内的数据计算香农熵的值，得出香农熵序列；将所述香农熵序列中的值与设定阈值进行对比从而确定是否存在风噪声；该判断方法通过对移动设备自带的麦克风获取的数据进行加窗处理，进而计算数据的香农熵，通过香农熵与设定阈值的比较来判断移动设备的周围是否存在风噪声，不需要使用额外的设备。

一种抗噪语音识别系统-201810311359.9
发明人：薛珮芸;史燕燕;白静;郭倩岩 -专利权人：太原理工大学
申请日： 2018-04-09 - 公布日： 2021-08-24 - 主分类号： G10L25/45
摘要：本发明涉及语音识别技术领域。一种抗噪语音识别系统，对于语音信号进行加窗分帧，然后做离散傅里叶变换，求出语音信号的幅值和相角；通过谱减运算得到估计信号的功率谱；利用谱减前的相位角信息对信号进行重构，得到谱减后的语音序列；对新的语音序列采用非线性幂函数模拟人耳听觉特性提取耳蜗滤波倒谱特征CFCC及其一阶差分△CFCC，并利用维度筛选法进行特征混合；对融合特征用数据归一化处理，得到训练集标签和测试集标签；将归一化后的训练集采用PCA进行降维，并带入SVM模型，得到识别准确率。

音频信号检测方法、装置和存储介质-201910312801.4
发明人：陈洲旋 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2019-04-18 - 公布日： 2021-06-01 - 主分类号： G10L25/45
摘要：本申请实施例公开了一种音频信号检测方法、装置和存储介质，本申请在对音频信号进行检测时，可以获取待检测的音频信号，对该音频信号进行时频变换，得到频域信号，并对该频域信号的频率分布进行子带划分，获得该子带的平均能量值，并统计该子带的直方图概率分布图，该直方图概率分布图包含该音频信号频率的概率分布，在该音频信号频率的概率分布存在波谷时，确定该音频信号为频带缺失信号；该方案可以有效快速地筛选出有频带缺失的音频文件。

基于信号混叠和双声道相关性的超声波语音指令防御方法-202011460738.8
发明人：张卫明;俞能海;沈豪 -专利权人：中国科学技术大学
申请日： 2020-12-11 - 公布日： 2021-03-30 - 主分类号： G10L25/45
摘要：本发明公开了一种基于信号混叠和双声道相关性的超声波语音指令防御方法，利用了部分录音设备录入超声波攻击信号时产生的混叠现象。检测录音音频是否存在混叠信号，即可判断该音频为合法音频还是攻击信号。此外，有些录音设备具有多个麦克风，利用超声波攻击信号在多个麦克风之间录音结果相关性的差异，也能区分攻击信号和合法录音；测试表明本发明上述方案的防御效果优于现有方案。

音频特征提取方法及装置-201710839230.0
发明人：赵伟峰 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2017-09-18 - 公布日： 2020-09-15 - 主分类号： G10L25/45
摘要：本发明公开了一种音频特征提取方法及装置，属于音频处理领域。该音频特征提取方法包括：通过窗长为M的窗函数将音频信号分为多帧，得到样本信号；从样本信号中筛选出对应的能量值处于第一能量区间的信号帧；根据符合预定条件的信号帧对应的能量值确定第二能量区间的上限值和下限值；在筛选出的信号帧中，将对应的能量值处于第二能量区间的信号帧确定为音频信号的特征帧。本发明解决了相关技术中在音频处理领域应用中较少对音频信号进行特征提取，增加后续音频处理的负担的问题，达到了对音频信号进行特征进行高效提取，提高后续音频处理的效率的效果。

一种语音分析的方法、装置、电子设备和存储介质-201911165494.8
发明人：李红岩;刘岩;党莹;黄洪运;李玉莹 -专利权人：泰康保险集团股份有限公司
申请日： 2019-11-25 - 公布日： 2020-05-19 - 主分类号： G10L25/45
摘要：本发明公开了一种语音分析的方法、装置、电子设备和存储介质，涉及语音分析技术领域，用以解决现有技术中存在的语音分析的效率及准确率较低的问题，本发明方法包括：获取待分析的语音数据，其中，语音数据为实时获取的语音数据或历史的语音数据；对语音数据进行分帧处理，并对分帧处理后的语音数据进行傅里叶变换，得到多个音频帧；针对任意一个音频帧，检测音频帧是否为包含语音的音频帧；根据检测结果滤除不包含语音的音频帧，并对包含语音的音频帧进行语音分析。由于本发明仅对包含语音的音频帧进行语音分析，对于不包含语音的音频帧则不进行语音分析，提高了语音分析的效率；此外，对不包含语音的音频帧进行了滤除，提高了语音分析的准确率。

基于语音时频变换特征和整数线性规划的录音终端聚类方法-201810735094.5
发明人：李艳雄;张雪;张聿晗;李先苦 -专利权人：华南理工大学
申请日： 2018-07-06 - 公布日： 2018-11-30 - 主分类号： G10L25/45
摘要：本发明公开了一种基于语音时频变换特征和整数线性规划的录音终端聚类方法，步骤如下：a、对读入的录音进行预处理；b、从每帧语音中提取GTCC特征；c、构造带瓶颈层的深度自编码网络并提取瓶颈特征；d、构造高斯超矢量特征；e、对a中预处理得到语音提取频谱图特征；f、将e中的频谱图特征拼接在d中的高斯超矢量之后，得到最后刻画录音终端特性的语音时频变换特征；g、利用整数线性规划算法对所有录音样本的语音时频变换特征进行聚类，将聚类结果作为最终的分类依据。本方法的特征提取和聚类均是无监督的，与目前有监督方法相比，更具普适性。

基于模式聚类和子空间算法的语音欠定盲恢复方法及装置-201810678323.4
发明人：黄翔东;徐婧文 -专利权人：天津大学
申请日： 2018-06-27 - 公布日： 2018-11-16 - 主分类号： G10L25/45
摘要：本发明公开了一种基于模式聚类和子空间算法的语音欠定盲恢复方法及装置，方法包括：对M路观测信号做加汉宁窗L点50％重叠的STFT变换，得到观测频谱；逐帧对STFT混合信号频谱做基于插值法的频谱校正操作，并对所有谐波参数对进行模式筛选；逐帧重复上一步骤，收集所有时间帧得到的SAS模式组成单源域；对单源域中的SAS模式进行数据密度聚类，得到估计的源数目及混合矩阵；根据估计出的源数目及混合矩阵，并通过子空间算法恢复源信号。装置包括：将采集到的多路观测信号经过A/D采样得到样本序列，以并行数字输入的形式输入进DSP芯片，经内部处理，得到混合矩阵的估计；借助输出驱动及其显示模块显示混合矩阵的估计值。

一种基于特征的音乐版权识别方法-201711377591.4
发明人：尹学渊;王东明;何林 -专利权人：成都嗨翻屋文化传播有限公司
申请日： 2017-12-19 - 公布日： 2018-04-27 - 主分类号： G10L25/45
摘要：本发明公开了一种基于特征的音乐版权识别方法，包括获取待识别音频文件，对所述音频文件分片处理，提取音频片段的音频指纹，遍历指纹库的音频指纹，将提取的音频片段的音频指纹与指纹库的音频指纹进行匹配，获得匹配结果；对所述匹配结果进行优化处理，包括统计出现相同时间差最多的指纹个数是否大于第一预设阈值，如果是，计算出现相同时间差最多的音频指纹持续时间；判断所述音频指纹持续时间是否大于第二预设阈值，如果是，分析音频指纹对应的时间点的个数；判断所述时间点的个数是否大于第三预设阈值，如果是，获得每个音频片段的识别结果；将每个音频片段的识别结果进行合并处理。本发明的音乐版权识别方法，识别准确度和识别率高。

一种基于分层可靠度变化趋势的音频分割方法-201610872916.5
发明人：杨新宇;王银瑞;丁建行;董怡卓;罗晶;杨泽正;王艺蒙;李雨墨 -专利权人：西安交通大学
申请日： 2016-09-30 - 公布日： 2017-08-01 - 主分类号： G10L25/45
摘要：本发明公开了一种基于分层可靠度变化趋势的音频分割方法，具体步骤包括1)定长分析窗内基于可靠度变化趋势的分层跳变点检测；2)基于定长分析窗内跳变点检测的音频分割。本发明采用定长分析窗来避免分窗检测导致的累积误差，在定长分析窗内根据可靠度变化趋势来检测声学跳变点以解决冗余点过多与硬判决的局限性问题，同时在定长分析窗内采用自顶向下的分层检测方式来避免跳变点漏检的情况，能够有效减少冗余分割点，提高综合性能。

音声数据检测装置、音声监控系统及其方法-201210045216.0
发明人：刘昆;吴伟国 -专利权人：索尼公司
申请日： 2012-02-24 - 公布日： 2013-09-11 - 主分类号： G10L25/45
摘要：本发明公开音声数据检测装置、音声监控系统及其方法。该音声检测装置：音声数据接收部件，被配置为接收输入的音声数据流；音声数据处理部件，被配置为利用谱聚类方法对所述音声数据流进行分段处理，以将所述音声数据流分割为多个单一类型的音声数据段；以及声音检测部件，被配置为针对所述音声数据段提取检测特征，并利用预先建立的检测模型对该音声数据段的类型进行检测。

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]说话人转换的语音检测方法、装置、电子设备及存储介质在审

专利文献下载