“音频特征”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果2596798个，建议您升级VIP下载更多相关专利

[发明专利]音频数据的处理方法、装置、电子设备及计算机存储介质-CN201911193451.0有效
发明人：熊世富;潘嘉;高建清;刘聪;胡国平 -专利权人：科大讯飞股份有限公司
申请日： 2019-11-28 - 公布日： 2023-04-04 - 主分类号： G10L25/03 文献下载
摘要：本申请实施例公开了一种音频数据的处理方法、装置、电子设备及计算机存储介质，方法包括：检测到音频拼接指令；确定待拼接的N段原始音频特征序列，N为大于等于2的整数；根据所述N段原始音频特征序列生成参考音频特征序列，所述参考音频特征序列包括所述N段原始音频特征序列的全部音频帧；根据预设策略更新所述参考音频特征序列中的音频帧，得到目标音频特征序列。实施本申请实施例有利于提升拼接处的音频数据的完整性，使拼接处的音频过度更加自然。
音频数据处理方法装置电子设备计算机存储介质

[发明专利]音频识别方法、装置及设备-CN202310215708.8在审
发明人：张新成;任伟;和心愿 -专利权人：北京梧桐车联科技有限责任公司
申请日： 2023-02-28 - 公布日： 2023-06-23 - 主分类号： G10L17/02 文献下载
摘要：本申请公开了音频识别方法、装置及设备，属于计算机技术领域。方法包括：获取多个初始音频，多个初始音频对应同一个音频提供对象，音频提供对象的对象信息未知；拼接多个初始音频中的不相连的初始音频，得到多个拼接音频，拼接音频携带的目标语调特征强于初始音频中携带的初始语调特征；获取基准音频的声纹，基准音频对应的对象信息已知；根据多个拼接音频和基准音频的声纹确定多个初始音频的音频识别结果。通过拼接不相连的初始音频，使得拼接音频携带的目标语调特征强于初始语调特征。通过特征更强的目标语调特征辅助音频的识别，提高音频识别的准确率。
音频识别方法装置设备

[发明专利]音频情感识别方法、装置、设备、存储介质及产品-CN202211017941.7在审
发明人：林炳怀;王丽园 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-08-24 - 公布日： 2022-11-25 - 主分类号： G10L25/63 文献下载
摘要：本申请公开了一种音频情感识别方法、装置、设备、存储介质及产品，属于计算机技术领域。所述方法包括：获取待处理音频数据以及待处理音频数据对应的音频文本；基于待处理音频数据和音频文本进行特征提取处理，得到待处理音频数据对应的第一音频特征和待处理音频数据对应的第二音频特征；对第一音频特征和第二音频特征进行融合处理，得到待处理音频数据对应的融合音频特征；基于融合音频特征进行情感识别处理，得到待处理音频数据对应的情感类型信息。本申请实施例提供的技术方案，能够有效降低音频情感识别对自动语音识别精度的依赖程度，提升音频情感识别的稳定性和准确性。
音频情感识别方法装置设备存储介质产品

[发明专利]一种模型训练、音频降噪方法、装置、设备及存储介质-CN202210453491.X在审
发明人：赵情恩 -专利权人：北京百度网讯科技有限公司
申请日： 2022-04-27 - 公布日： 2022-07-22 - 主分类号： G10L21/02 文献下载
摘要：本公开提供了一种模型训练、音频降噪方法、装置、设备及存储介质，涉及数据处理技术领域，尤其涉及人工智能技术领域。具体实现方案为：获得第一样本音频特征、第二样本音频特征和样本图像；将第二样本音频特征输入音频降噪模型中的音频特征提取子网络，得到深层音频特征，将样本图像输入音频降噪模型中的图像特征提取子网络，得到样本图像特征；将深层音频特征和样本图像特征输入音频降噪模型中的联合子网络重建音频特征和图像；基于重建的音频特征与第一样本音频特征间的差异、及重建的图像与样本图像间的差异，获得训练损失；基于训练损失，对音频降噪模型进行训练应用本公开实施例提供的方案，能够训练得到对音频进行降噪处理的模型。
一种模型训练音频方法装置设备存储介质

[发明专利]音频合成模型的训练方法以及音频合成方法-CN202310776808.8在审
发明人：强春雨 -专利权人：北京达佳互联信息技术有限公司
申请日： 2023-06-28 - 公布日： 2023-09-19 - 主分类号： G10L13/027 文献下载
摘要：本公开关于一种音频合成模型的训练方法以及音频合成方法，其中，该训练方法获取训练数据，训练数据包括样本文本的样本音素特征以及样本文本的第一样本音频信息；将第一样本音频信息输入至待训练的音频合成模型中的第一音频特征提取层，得到第一样本音频信息的第一音频特征，第一音频特征提取层是音频合成模型包括的多个音频特征提取层中与样本文本的对象类型相匹配的特征提取层；基于待训练的音频合成模型、样本音素特征以及第一音频特征，得到样本文本对应的预测音频信息，继而得到训练完成的音频合成模型。通过采用本公开，可以统一提取不同的对象类型对应的音频特征以及音素特征，实现单模型输出多对象类型的音频信息。
音频合成模型训练方法以及

[发明专利]音频数据处理方法、装置、设备、存储介质及产品-CN202210935243.9在审
发明人：袁微 -专利权人：腾讯科技（深圳）有限公司
申请日： 2022-08-03 - 公布日： 2022-11-11 - 主分类号： G10H1/00 文献下载
摘要：本申请实施例提供了一种音频数据处理方法、装置、设备、存储介质及产品，包括：获取样本多轨音频数据以及N个音频片段分别对应的标注音频特征信息；根据音频片段N1的标注音频特征信息，确定音频片段N1的预测音频特征信息；采用初始音频生成模型根据音频片段集合中的音频片段的标注音频特征信息，预测音频片段Ni的预测音频特征信息；若获取到N个音频片段分别对应的预测音频特征信息，则根据N个音频片段分别对应的标注音频特征信息，以及N个音频片段分别对应的预测音频特征信息，对初始音频生成模型进行调整，将调整后的初始音频生成模型用于生成目标多轨音频数据，从而基于人工智能技术实现多轨音频数据的自动化智能化生成。
音频数据处理方法装置设备存储介质产品

[发明专利]语音情感识别方法和装置、服务器、计算机可读存储介质-CN201911300620.6在审
发明人：刘峰;涂臻;刘广志;刘云峰 -专利权人：深圳追一科技有限公司
申请日： 2019-12-17 - 公布日： 2020-05-12 - 主分类号： G10L25/63 文献下载
摘要：本申请涉及一种语音情感识别方法和装置、服务器、计算机可读存储介质，包括：从原始音频帧序列中获取有效音频片段。对有效音频片段提取音频特征及文本特征，将有效音频片段的音频特征及文本特征，输入至预设语音情感识别模型中进行语音情感识别，得到原始音频帧序列的情感分类。不仅从原始音频帧序列中的有效音频片段中提取出文本特征，还提取出音频特征。然后，将所提取出的文本特征和音频特征同时一起输入至预设语音情感识别模型中进行处理，最终得到原始音频帧序列的情感分类。显然，对原始音频帧序列中的有效音频片段同时从文本特征和音频特征两个维度进行识别出情感分类，大大提高了所得到的情感分类的准确性。
语音情感识别方法装置服务器计算机可读存储介质

[发明专利]对回声路径的语音延时估计方法、装置和存储介质-CN202110783456.X在审
发明人：高毅;罗程;李斌 -专利权人：腾讯科技（深圳）有限公司
申请日： 2021-07-12 - 公布日： 2023-01-17 - 主分类号： G10L21/0224 文献下载
摘要：所述方法包括：获取回声路径中与接收器对应的接收点处的当前接收音频帧；提取当前接收音频帧的音频指纹，得到当前第一音频特征；获取存储的多个第二音频特征；多个第二音频特征为包括当前时刻在内的历史时间段内，对依次经过与播放器对应的参考点的参考音频帧提取音频指纹得到第二音频特征后，按照各参考音频帧的时间顺序对应存储得到；将当前第一音频特征与多个第二音频特征分别进行特征匹配处理，基于匹配结果从多个第二音频特征中确定目标第二音频特征；根据目标第二音频特征所对应的存储顺序，确定回声路径的延时
回声路径语音延时估计方法装置存储介质

[发明专利]音频数据处理方法、装置及存储介质-CN201810941442.4有效
发明人：王征韬 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2018-08-17 - 公布日： 2021-03-16 - 主分类号： G10L25/51 文献下载
摘要：本发明公开了一种音频数据处理方法、装置及存储介质，所述方法包括：获取训练样本，然后提取训练样本中的多个特征信息，多个特征信息包括频谱高度特征、纯音乐与人声的鉴别特征、第一预设时长对应的音频开头特征以及第二预设时长对应的音频结尾特征，再将多个特征信息输入神经网络中进行特征融合训练，以得到训练后的特征融合参数，并根据特征融合参数生成音频分类模型，若接收到测试音频，则通过音频分类模型对测试音频进行分类。本发明实施例通过多个特征信息的特征融合，得到结合了多个方面特征的特征融合参数，并将特征融合参数再融入到音频分类模型中进行音频分类，提升了音频分类的准确率，能够有效区分现场音频与录音棚音频。
音频数据处理方法装置存储介质

[发明专利]音频的转换方法、装置、存储介质及电子设备-CN202110456269.0在审
发明人：戈文硕;刘恺;陈伟 -专利权人：北京搜狗科技发展有限公司
申请日： 2021-04-26 - 公布日： 2021-08-06 - 主分类号： G10L21/013 文献下载
摘要：本发明实施例提供了一种音频的转换方法、装置、存储介质以及电子设备，其中，所述方法包括：通过获取源说话人的初始音频，首先对初始音频进行特征识别，获得初始音频对应的语音识别特征以及音频隐层特征，接着将所提取的语音识别特征与音频隐层特征输入音频转换模型进行音色转换与方言口音处理，获得目标方言说话人的目标方言声学特征，然后可以根据目标方言声学特征生成对应的目标音频，通过音频转换模型语音识别特征与音频隐层特征进行处理，实现将任意说话人的音频转换为目标方言说话人的音频，不仅可以实现音色的转换，还可以在所转换的音频中携带目标方言口音，有效提高了音频的变声效果。
音频转换方法装置存储介质电子设备

[发明专利]基于声学特征的练琴音准检测方法及系统-CN202311153352.6在审
发明人：杨星星;严庆武;刘志敏;顾贤能;周萌;刘宁;严韩文;陈志 -专利权人：杭州育恩科技有限公司
申请日： 2023-09-08 - 公布日： 2023-10-13 - 主分类号： G10L25/51 文献下载
摘要：本发明提供一种基于声学特征的练琴音准检测方法及系统，涉及音频处理技术领域，包括基于在乐器上设置的声学传感器获取演奏者在练琴时的音频信息，从所述音频信息中提取频谱特征、时域特征，并融合所述频谱特征、所述时域特征确定第一音频特征；通过预设的采样窗口确定所述音频信息中每一帧音频的音频能量，根据所述音频能量结合所述音频信息在多个时刻的频谱的音阶峰值，确定所述音频信息对应的第二音频特征；将所述第一音频特征和所述第二音频特征输入预先构建的音准识别模型，通过所述音准识别模型判断所述音频信息的音准是否与预设音准标准相匹配。
基于声学特征琴音检测方法系统

[发明专利]角色识别方法、装置、计算机设备及存储介质-CN202211004872.6在审
发明人：蒋佳惟 -专利权人：中国平安人寿保险股份有限公司
申请日： 2022-08-22 - 公布日： 2022-11-22 - 主分类号： G10L25/63 文献下载
摘要：本发明公开了一种角色识别方法，该方法包括获取目标音频文本，对目标音频文本进行文本检测，得到文本检测结果；对所述检测失败结果对应的所述目标音频文本进行纠正处理，得到纠正音频文本；获取纠正音频文本对应的纠正音频数据，对纠正音频数据进行声纹特征提取，得到音频声纹特征；确定纠正音频文本对应的文本特征向量，以及确定音频声纹特征对应的音频特征向量；基于音频特征向量和文本特征向量，确定纠正音频文本对应的情绪识别结果，并基于情绪识别结果、音频特征向量和文本特征向量，确定纠正音频文本对应的角色类别。如此，本发明通过情绪识别结果对纠正音频文本对应的角色类别进行辅助识别，从而提高了对角色识别的准确性。
角色识别方法装置计算机设备存储介质

[发明专利]音频信号处理方法、装置、电子设备及存储介质-CN202310127570.6在审
发明人：韩润强;赵昊然;吕新亮;李楠;张晨 -专利权人：北京达佳互联信息技术有限公司
申请日： 2023-02-02 - 公布日： 2023-06-06 - 主分类号： G10L21/0208 文献下载
摘要：本公开关于一种音频信号处理方法、装置、电子设备及存储介质,所述方法包括：在音频信号收录过程中，获取第一音频信号和第二音频信号；第一音频信号包含目标对象的声音信号以及啸叫信号，第二音频信号为与声音信号对应的背景音频信号；根据预设的特征提取算法，分别对第一音频信号和第二音频信号进行特征提取，得到第一音频特征和第二音频特征；将第一音频特征和第二音频特征输入至预先训练的啸叫抑制模型进行处理，得到啸叫抑制处理后的音频特征；根据预设的特征还原算法，对啸叫抑制处理后的音频特征进行还原处理，得到目标音频信号。
音频信号处理方法装置电子设备存储介质

[发明专利]音频的检测方法、装置、电子设备及存储介质-CN202111545042.X在审
发明人：张宾;马戈;杨璇;史学杰;王子木;贾万疆;张靖宜;庞海天;吕明 -专利权人：国网电子商务有限公司;国网电商科技有限公司;中国工业互联网研究院;深圳江行联加智能科技有限公司
申请日： 2021-12-16 - 公布日： 2022-03-22 - 主分类号： G10L25/60 文献下载
摘要：本申请提供一种音频的检测方法、装置、电子设备及存储介质。其中，在音频的检测方法中，首先获取待检测设备的音频信号。对音频信号进行特征提取，得到音频信号的特征向量矩阵。然后对特征向量矩阵进行降噪优化，得到优化后的特征向量矩阵。最后调用预先训练的音频检测模型对优化后的特征向量矩阵进行处理，得到音频信号的音频类别。由此可知，利用本申请的方法，对获取到的音频信号进行特征提取，得到音频信号的特征向量矩阵，并对特征向量矩阵进行优化处理，能够更准确的表示音频信号的特征，再调用预先训练的音频检测模型对优化后的特征向量矩阵进行处理，得到音频信号的类别。
音频检测方法装置电子设备存储介质

[发明专利]音频的识别方法、装置、可读介质和电子设备-CN202111327471.X在审
发明人：何珂鑫;贾少勇;何怡;马泽君 -专利权人：北京有竹居网络技术有限公司
申请日： 2021-11-10 - 公布日： 2022-01-28 - 主分类号： G06F16/65 文献下载
摘要：本公开涉及一种音频的识别方法、装置、可读介质和电子设备，涉及电子信息处理技术领域，该方法包括：获取待识别音频，提取用于表征待识别音频的目标音频特征，目标音频特征的维度与待识别音频的时长正相关，利用预先训练的识别模型，根据目标音频特征确定指定维度的统计特征，并根据统计特征确定待识别音频包括的目标音频事件，识别模型根据预先采集的训练音频集训练得到，训练音频集包括不同时长的训练音频。本公开中识别模型对不同时长的音频进行特征提取，以得到指定维度的统计特征，从而识别音频中包括的音频事件，无需对音频进行截取或补齐操作，能够保留音频中完整的信息，提高识别的准确度。
音频识别方法装置可读介质电子设备