“音频分类”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果452627个，建议您升级VIP下载更多相关专利

[发明专利]分区域音频播报方法、装置、设备、存储介质及车辆-CN201910981642.7在审
发明人：彭杰;李存海;赵冬冬;朱双其 -专利权人：南京领行科技股份有限公司
申请日： 2019-10-16 - 公布日： 2020-01-31 - 主分类号： G06F3/16 文献下载
摘要：本发明实施例公开了一种分区域音频播报方法、装置、设备、存储介质及车辆。其中，方法包括：获取乘客以及司机的位置信息；对应用软件即将播报的音频信息分类，得到分类结果；根据乘客的位置信息、司机的位置信息以及分类结果生成音频播报方案。本发明实施例的方案实现了在车内分区域播报音频信息，减少了司机以及乘客被无关音频信息影响。
播报音频信息分类结果分区域乘客司机存储介质应用软件车内分类

[发明专利]基于阵列水听器的声音识别方法和装置-CN202111356702.X在审
发明人：申和平;张海兵;冯权胜 -专利权人：武汉普惠海洋光电技术有限公司
申请日： 2021-11-16 - 公布日： 2022-03-22 - 主分类号： G10L25/51 文献下载
摘要：本发明提供一种基于阵列水听器的声音识别方法和装置，该方法包括：基于阵列水听器的多个基元，对目标声音进行采集，得到多个基元的目标音频信号；对各基元的目标音频信号进行多种特征提取，并对多种特征进行特征融合；将各基元的目标音频信号的融合特征输入分类模型中，得到各基元的目标音频信号对应的目标声音的预测类别；对多个基元的目标音频信号对应的预测类别进行融合，得到目标声音的最终类别。本发明实现基于目标音频信号融合特征和多阵元信号进行分类，获取目标声音的最终类别，有效提高分类结果的准确性和鲁棒性；并且在分类过程中，对多种目标音频信号进行同步学习，有效增强分类模型的判断能力，进一步提高分类结果的准确性
基于阵列水听器声音识别方法装置

[发明专利]从单音音频信号分离音频信源的神经网络分类器-CN200680041405.3无效
发明人： D·V·施穆克 -专利权人： DTS公司
申请日： 2006-10-03 - 公布日： 2009-02-11 - 主分类号： G10L19/00 文献下载
摘要：本发明提供了一种神经网络分类器，其可以对下混合到单一单音音频信号的多个任意且预先未知的音频信源进行分离和分类。这是通过将该单音音频信号分离成多个基线帧(可能交叠)，对这些帧加窗，提取每帧内的多个描述性特征，以及采用预训练的非线性神经网络作为分类器来实现的。每个神经网络输出表明单音音频信号的每个基线帧内的预定类型的音频信源的存在。神经网络分类器非常适于广泛变化的信号和信源参数、信源的时域和频域交叠以及实际生活信号中的回响和遮挡。分类器输出能够用作前端以形成多个音频信道用于源分离算法(例如，ICA)或用作后处理算法的参数(例如，对音乐进行分类，跟踪信源，为导航目的产生音频索引，以及重新混合安全性和监控、电话和无线通信以及电视会议
单音音频信号分离信源神经网络分类

[发明专利]音频数据标注的方法及其系统-CN201611247230.3在审
发明人：晁卫 -专利权人：北京酷我科技有限公司
申请日： 2016-12-29 - 公布日： 2018-07-06 - 主分类号： G10L25/51 文献下载
摘要：本发明提供一种音频数据标注的方法及其系统，该方法包括：接收待标注的音频数据；获取待标注的音频数据的音频片段，采用预训练的至少一个训练模型对音频片段进行分析，确定音频片段的分类标签；为音频片段对应的所述待标注的音频数据标注分类标签实现了音频数据的自动化标注，提高了音频数据标注的准确率。
音频数据标注音频片段分类标签训练模型准确率自动化分析

[发明专利]一种音频类别的确定方法、装置、电子设备及存储介质-CN202311182243.7在审
发明人：张德俊;王秋明 -专利权人：北京远鉴信息技术有限公司
申请日： 2023-09-14 - 公布日： 2023-10-24 - 主分类号： G10L25/30 文献下载
摘要：本申请提供了一种音频类别的确定方法、装置、电子设备及存储介质，确定方法包括：对待检测音频进行处理，对傅里叶变换处理后的待检测音频进行音频特征提取；将音频特征输入至音频类别检测模型的扩散网络层之中，确定出待检测音频的音频特征相对应的视频特征；将视频特征以及音频特征输入至分类网络层之中，对视频特征以及音频特征进行特征融合，并确定出融合后的特征，并对融合后的特征进行分类，输出待检测音频的音频类别信息。通过利用扩散网络层确定出音频特征相对应的视频特征，将音频特征以及视频特征进行融合，利用融合后的特征进行音频类别分类，确定出待检测音频的音频类别信息，从而提高了音频类别确定的准确性。
一种音频类别确定方法装置电子设备存储介质

[发明专利]音频分类方法和装置、电子设备及存储介质-CN202310568337.1在审
发明人：张旭龙;王健宗;程宁;孙一夫 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-19 - 公布日： 2023-08-25 - 主分类号： G06F16/65 文献下载
摘要：本申请实施例提供了一种音频分类方法和装置、电子设备及存储介质，属于人工智能技术领域。该方法包括：获取样本视频数据；对样本视频数据进行特征提取，得到样本图像数据、样本文本数据、样本音频数据；通过预设的初始匹配模型对样本音频数据、样本文本数据进行语义匹配，得到第一匹配数据；通过初始匹配模型对样本音频数据、样本图像数据进行语义匹配，得到第二匹配数据；根据第一匹配数据、第二匹配数据对初始匹配模型进行参数调整，得到目标匹配模型；根据目标匹配模型和预设的初始分类模型构建目标分类模型；通过目标分类模型对目标音频数据进行分类本申请实施例能够提高音频数据分类的准确性。
音频分类方法装置电子设备存储介质

[发明专利]基于多传感器数据决策级融合的睡眠分期方法-CN201810125718.1有效
发明人：顾陈;周燕萍;洪弘;蒋洁;李彧晟;孙理;朱晓华 -专利权人：南京理工大学
申请日： 2018-02-08 - 公布日： 2021-12-10 - 主分类号： G06K9/62 文献下载
摘要：本发明公开了一种基于多传感器数据决策级融合的睡眠分期方法，该方法首先使用雷达传感器和音频传感器采集整夜的雷达和音频数据，提取雷达和音频信号特征；根据特征数将其进行数据分类，根据数据分类建立雷达剩余片段模型和雷达+音频片段模型；接着用分类器对雷达剩余片段模型里的雷达特征进行识别分类，得到模型预测结果1，用分类器对雷达+音频片段模型里的雷达和音频特征进行识别分类，得到模型预测结果A和B；然后用朴素贝叶斯模型对模型预测结果
基于传感器数据决策融合睡眠分期方法

[发明专利]一种音频数据分类方法及装置-CN201310254043.8有效
发明人：谢志明;潘晖;潘石柱;张兴明;傅利泉;朱江明;吴军;吴坚 -专利权人：浙江大华技术股份有限公司
申请日： 2013-06-24 - 公布日： 2017-09-12 - 主分类号： G06F17/30 文献下载
摘要：本发明公开了一种音频数据分类方法，用以解决现有技术中存在的处理快慢不同的音频数据序列时，分类处理效果不好的问题。通过本发明实施例提供的技术方案，由于对同一段未知类别的音频数据序列进行了至少两次划分，得到了长短不一的多个音频数据子序列，从而相当于提高了该未知类别的音频数据序列的适应性，使之能够适用于分类器的训练样本中较快音频数据占比比较高，以及分类器的训练样本中较慢音频数据占比比较高的等不同情况。从而这样的方法适用性更广，对于快慢节奏不同的音频数据有较好的鲁棒性。
一种音频数据分类方法装置

[发明专利]音频分类器-CN201610601995.6有效
发明人：卢多维克·多米尼克·乔尔·勒保罗克;劳伦·勒福舍尔 -专利权人：汇顶科技（香港）有限公司
申请日： 2016-07-27 - 公布日： 2021-12-10 - 主分类号： G10L25/48 文献下载
摘要：本发明涉及一种音频分类器，该音频分类器包括：第一处理器，该第一处理器具有硬连线逻辑，该硬连线逻辑被配置成接收音频信号且从该音频信号检测音频活动；以及第二处理器，该第二处理器具有可重新配置的逻辑，该可重新配置的逻辑被配置成响应于该第一处理器检测音频活动而将该音频信号分类为一类型的音频信号
音频分类

[发明专利]音频处理方法、设备和计算机程序产品-CN202210192079.7在审
发明人：郑炜乔 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-02-28 - 公布日： 2022-06-07 - 主分类号： G10L17/02 文献下载
摘要：本申请涉及音频处理技术领域，提供了一种音频处理方法、计算机设备和计算机程序产品。本申请能够提高对音频中说话人属性信息的识别效率及准确性。该方法包括：针对待处理音频中每一帧提取各自对应的初级特征得到多个第一音频帧特征，通过说话人特征提取网络中特征提取层进一步获取多个第一音频帧特征分别对应的多个高级的第二音频帧特征，通过说话人特征提取网络中池化层将多个第二音频帧特征统一转化为待处理音频的音频特征，以将帧级别特征统一转化为音频级别特征且其能表征音频中说话人身份特性，将该音频特征同时输入到多个说话人属性分类器，根据各说话人属性分类器分别输出的分类标签同时得到待处理音频中说话人在多种属性下的分类结果
音频处理方法设备计算机程序产品

[发明专利]使用听觉数据的碰撞规避-CN201610948308.8有效
发明人：哈珀丽特辛格·班瓦伊特;韩正圭;吉内什·J·杰恩 -专利权人：福特全球技术公司
申请日： 2016-10-25 - 公布日： 2022-05-10 - 主分类号： B60W30/095 文献下载
摘要：一种用于自主车辆的控制器，该控制器接收来自一个或多个麦克风的音频信号。麦克风的输出被预处理以增强起源于车辆的音频特征。输出同样可以被处理以消除噪声。音频特征被输入到分类音频特征源头的机器学习模型。例如，特征可以被分类为起源于车辆。到音频特征源头的方向基于在来自多个麦克风的信号中音频特征的相对延迟确定。其中具有阈值以上置信度的音频特征被分类为起源于车辆的音频特征，碰撞规避相对于到音频特征源头的方向被执行。
使用听觉数据碰撞规避

[发明专利]基于知识蒸馏的肺音分类方法、系统、终端及存储介质-CN202011070732.X在审
发明人：李坚强;陈杰;明仲;梁中明;王成 -专利权人：深圳大学
申请日： 2020-10-09 - 公布日： 2020-11-13 - 主分类号： G10L25/51 文献下载
摘要：本发明公开了一种基于知识蒸馏的肺音分类方法、系统、终端及存储介质，所述方法包括：获取肺音音频，并基于所述肺音音频提取所述肺音音频的梅尔频谱特征，得到肺音数据集；基于所述肺音数据集对多个教师模型进行训练，得到已训练的多个教师模型；根据所述已训练的多个教师模型分别计算所述肺音数据集的软标签，并经转换后，得到多分类软标签；基于所述多分类软标签和肺音数据集训练学生模型，得到已训练的学生模型，并利用所述已训练的学生模型对所述肺音音频进行分类本发明可以基于知识蒸馏，通过利用多个教师模型的知识，指导学生模型学习，从而充分利用多方肺音音频，并准确对所述肺音音频进行分类。
基于知识蒸馏音分方法系统终端存储介质

[发明专利]视频分类方法、装置、电子设备及存储介质-CN202210247508.6在审
发明人：赵波;胡郡郡;唐大闰 -专利权人：北京明略昭辉科技有限公司
申请日： 2022-03-14 - 公布日： 2022-06-21 - 主分类号： G06F16/75 文献下载
摘要：本发明提供了一种视频分类方法、装置、电子设备及存储介质，该方法包括：获取待处理的目标视频；通过人工智能模型从所述目标视频中识别出目标音频特征和视频帧特征；将所述目标音频特征作为预训练的特征分类模型的输入，得到多种音频特征；其中，所述特征分类模型包括多个并行分支模型，每个分支模型由携带有一种标签类型的音频特征样本训练卷积神经网络得到；根据所述多种音频特征和所述视频帧特征确定所述目标视频的视频类别。本发明通过对目标视频中的音频特征进行细粒度划分，将得到的分类结果结合目标视频的视频帧特征确定视频的视频类别，提高了视频分类的准确率。
视频分类方法装置电子设备存储介质

[发明专利]一种基于时域信息增强的多模态微视频分类方法-CN202310378403.9在审
发明人：张博;张伟;朱志良;于海 -专利权人：东北大学
申请日： 2023-04-11 - 公布日： 2023-07-21 - 主分类号： G06F16/75 文献下载
摘要：本发明提供一种基于时域信息增强的多模态微视频分类方法，涉及视频分类技术领域。该方法首先将待分类微视频切分成多个视频片段；再分离视频片段中的视觉模态、音频模态和文本模态信息，并提取视觉模态特征、音频模态特征和文本模态特征；然后基于各视频片段的视觉模态特征和音频模态特征，选取最具表达力的视频片段；捕捉最具表达力的视频片段的视觉模态和音频模态的时间域相关信息，得到时域信息增强的特征矩阵；最后将时域信息增强的视觉模态特征、音频模态特征与原始的文本模态特征进行融合，得到最终的分类结果。该方法充分的利用了视频的音频和文本模态，对图像信息进行了补充，进一步的提高了分类精度。
一种基于时域信息增强多模态微视频分类方法

[发明专利]多通道语音检测的系统和方法-CN202280003961.0在审
发明人：艾隆·阿尔瓦雷斯·大卫;郑诣;谭欢 -专利权人：深圳市优必选科技股份有限公司
申请日： 2022-03-25 - 公布日： 2023-01-13 - 主分类号： G10L15/02 文献下载
摘要：本发明提供了一种多通道语音检测的系统和方法，该方法包括：接收包括一组音频信号的多通道音频输入；使用一神经网络分类器处理该多声道音频输入，以在该多声道音频输入的一系列时间窗口中生成一系列分类结果，其中，该神经网络分类器包括因果时间卷积网络(TCN)，其被配置为基于该多通道音频输入在对应时间窗口中和该对应时间窗口之前的一个或多个时间窗口中的部分确定每个时间窗口的分类结果；以及基于所述一系列分类结果确定该多声道音频输入在该一系列时间窗口中是否包括一个或多个语音片段
通道语音检测系统方法