“音频特征提取”专利关键词查询_检索下载_查询列表_检索列表_行业专利分布_钻瓜专利网

钻瓜专利网为您找到相关结果3055603个，建议您升级VIP下载更多相关专利

[发明专利]一种基于循环神经网络语言模型的在线语音识别方法和系统-CN202110636164.3在审
发明人：欧智坚;刘岩;肖吉;孙磊 -专利权人：北京它思智能科技有限公司
申请日： 2021-06-08 - 公布日： 2021-09-10 - 主分类号： G10L15/01 文献下载
摘要：本发明提出了一种基于循环神经网络语言模型的在线语音识别方法和系统，所述方法包括：针对原始音频进行特征提取，获得完成特征提取的语音音频；将所述语音音频输入至声学模型中进行打分，获得声学模型得分；将重新打分后的语音音频输入至WFST和RNN语音模型中进行解码并重新打分，获得解码后的语音音频；将解码后的语音音频作为识别结果进行输出。
一种基于循环神经网络语言模型在线语音识别方法系统

[发明专利]一种基于时间卷积与自注意力的情感预测方法及系统-CN202210086699.2在审
发明人：孙涛;权志邦 -专利权人：齐鲁工业大学
申请日： 2022-01-25 - 公布日： 2022-04-29 - 主分类号： G06F16/906 文献下载
摘要：本发明提供了一种基于时间卷积与自注意力的情感预测方法及系统，包括：获取文本模态数据、音频模态数据以及视频模态数据；利用预先训练好的自编码语言模型提取文本模态数据的文本特征向量；利用预先训练好的音频特征提取模型提取音频模态的音频特征向量；利用预先训练好的视频特征提取模型提取视频模态的视频特征向量；将文本特征向量、音频特征向量以及视频特征向量进行融合，得到最终的融合后的多模态特征向量。本发明将一种基于时间卷积与自注意力机制的多模态数据特征表示方法，旨在改进当前多模态数据特征表示效果，以更好的用于多模态情感分析。
一种基于时间卷积注意力情感预测方法系统

[发明专利]基于深度学习的语音频带扩展方法、装置及编码方法-CN202210636744.7在审
发明人：李强;王尧;叶东翔;朱勇 -专利权人：北京百瑞互联技术有限公司
申请日： 2022-06-07 - 公布日： 2022-09-09 - 主分类号： G10L21/0388 文献下载
摘要：本申请公开了一种基于深度学习的语音频带扩展方法、装置及编码方法，属于音频编码技术领域，该方法包括：对音频数据进行编码至低延迟改进型离散余弦变换后，得到音频数据对应的谱系数，并进行特征提取，得到具有元音和摩擦音信息的第一特征参数；对音频数据进行重采样和长期后置滤波器处理，并对处理的结果进行特征提取，得到具有元音和摩擦音信息的第二特征参数；将第一特征参数和第二特征参数输入到预训练的神经网络模型中，生成音频数据对应的全带宽谱系数。本申请利用编码过程中的已有参数，并进行特征提取，获取音频数据中关于元音和摩擦音的特征，充分考虑原有音频数据中元音和摩擦音的不同，进行更加准确的频带扩展，提升用户体验。
基于深度学习语音频带扩展方法装置编码

[发明专利]音频审核的处理方法、装置、设备及存储介质-CN202010840734.6在审
发明人：付立 -专利权人：京东科技控股股份有限公司
申请日： 2020-08-20 - 公布日： 2022-03-11 - 主分类号： G06F16/68 文献下载
摘要：本发明实施例提供一种音频审核的处理方法、装置、设备及存储介质，该方法包括：获取待处理音频数据；对所述待处理音频数据进行特征提取，获得所述待处理音频数据对应的频谱特征数据；将所述频谱特征数据输入到预先训练获得的音频审核模型，获得所述待处理音频数据的识别结果，所述音频审核模型至少包括卷积神经网络模块和自注意力模块；根据所述识别结果确定并输出所述待处理音频数据的审核结果。由于音频审核模型是基于卷积神经网络并结合自注意力机制，卷积神经网络可以实现对浅层特征的提取，自注意力模块可以进行音频时序特征提取，从而有效提高音频特征的提取性能，进而提高音频审核模型的审核准确率。
音频审核处理方法装置设备存储介质

[发明专利]语音识别方法、装置、计算机设备及存储介质-CN202210587567.8在审
发明人：丁超越;宗道明;李家魁;李宝祥 -专利权人：上海商汤智能科技有限公司
申请日： 2022-05-25 - 公布日： 2022-07-29 - 主分类号： G10L15/02 文献下载
摘要：本公开提供了一种语音识别方法、装置、计算机设备及存储介质，其中，该方法包括：获取待识别的目标音频数据，并对所述目标音频数据进行音频特征提取，得到所述目标音频数据对应的音频提取特征；将所述音频提取特征输入至预先训练好的目标编码器中，得到所述目标编码器输出的与所述目标音频数据对应的音频编码特征；其中，所述目标编码器包含自注意力网络，所述自注意力网络在确定目标查询矩阵时采用池化处理操作；所述目标查询矩阵为所述自注意力网络在基于自注意力机制进行特征提取时确定的多个特征表示矩阵中的一个；基于所述音频编码特征，确定所述目标音频数据对应的语音识别结果。
语音识别方法装置计算机设备存储介质

[发明专利]音频事件检测方法、系统、移动终端及存储介质-CN201911207416.X在审
发明人：陈剑超;肖龙源;李稀敏;蔡振华;刘晓葳 -专利权人：厦门快商通科技股份有限公司
申请日： 2019-11-29 - 公布日： 2020-03-31 - 主分类号： G10L15/06 文献下载
摘要：本发明适用于语音识别技术领域，提供了一种音频事件检测方法、系统、移动终端及存储介质，该方法包括：获取原始音频信号，对原始音频信号进行特征提取，以得到音频特征；将音频特征输入神经网络模型中进行瓶颈特征提取和合并，以得到深层变换特征；对深层变换特征进行降维处理，以得到特征矢量，并将特征矢量作为当前帧的信息输入神经网络模型；获取训练集数据和待检测数据，根据训练集数据对神经网络模型进行训练，并将待检测数据输入至训练后的神经网络模型进行事件分析，以得到音频事件检测结果。本发明通过基于音频特征和深层变换特征的提取，提高了神经网络模型音频事件检测的准确性。
音频事件检测方法系统移动终端存储介质

[发明专利]音频分类方法、电子设备以及存储介质-CN202110537040.X有效
发明人：马路;杨嵩 -专利权人：北京世纪好未来教育科技有限公司
申请日： 2021-05-18 - 公布日： 2021-07-30 - 主分类号： G06F16/65 文献下载
摘要：本发明公开了一种音频分类方法、电子设备以及存储介质，其中，该方法包括：确定待处理音频信号；将待处理音频信号输入至编码器；将编码器输出的音频信号输入至瓶颈层；将瓶颈层输出的音频信号输入至多尺度特征提取模块，提取输入尺度特征提取模块的音频信号的不同尺度特征；将不同尺度特征输入至分类器，获取对音频的分类结果。解决了现有技术中由于采用短时傅里叶变换将时域音频转换到时频域的二维语谱图进行音频分类，导致分类模型较大，且准确率和实时率不高的问题。在本发明中利用堆叠的一维膨胀卷积网络提取输入音频的多尺度特征，并利用不同尺度特征进行音频分类，模型结构小，且具有较高的准确率和实时率。
音频分类方法电子设备以及存储介质

[发明专利]语音情绪波动分析方法及装置-CN201911341679.X在审
发明人：朱锦祥;单以磊;臧磊 -专利权人：深圳壹账通智能科技有限公司
申请日： 2019-12-24 - 公布日： 2020-04-28 - 主分类号： G10L25/63 文献下载
摘要：本发明实施例提供一种语音情绪波动分析方法，包括：获取待测语音数据的第一音频特征和第一文字特征；基于预先训练好的音频识别模型中的音频特征提取网络，提取第一音频特征中的第二音频特征；基于预先训练好的文字识别模型中的文字特征提取网络，提取第一文字特征中的第二文字特征；识别第二音频特征，获取音频情绪识别结果；识别第二文字特征，获取文字情绪识别结果；对音频情绪识别结果和文字情绪识别结果进行融合处理，得到情绪识别结果，并将所述情绪识别结果发送至关联终端
语音情绪波动分析方法装置

[发明专利]利用使用音频持续时间的机器学习模型进行的音频分类-CN201780085711.5在审
发明人： S·巴里塔卡;M·S·阿瑟瑞亚 -专利权人：惠普发展公司有限责任合伙企业
申请日： 2017-04-28 - 公布日： 2019-09-17 - 主分类号： G06F15/76 文献下载
摘要：一种音频信号分类器，所述音频信号分类器包括用于从音频信号中提取元数据的特征提取器，所述元数据定义所述音频信号的多个特征，所述特征提取器用于生成包括所述音频信号的所选择的特征的特征向量，所选择的特征包括所述音频信号的持续时间，并且每个所选择的特征具有特征值。一种机器学习模型，所述机器学习模型被训练成基于所述特征向量将所述音频信号分类为多个音频信号类别中的一个音频信号类别。所述机器学习模型用于基于所述特征值提供多个类别值，每个类别值与所述多个音频信号类别中的一个音频信号类别相对应，所述多个类别值共同指示所述音频信号的类别。
音频信号机器学习模型音频信号分类特征提取器多个类别特征向量元数据音频分类

[发明专利]基于有监督学习的说话人分割方法、终端设备及存储介质-CN202110398136.2在审
发明人：曾志先 -专利权人：厦门快商通科技股份有限公司
申请日： 2021-04-14 - 公布日： 2022-10-18 - 主分类号： G10L15/04 文献下载
摘要：本发明涉及基于有监督学习的说话人分割方法、终端设备及存储介质，该方法中包括：S1：采集多条多人通话音频，并对每条音频进行预处理和切分后，组成训练集；S2：对切分后的各子音频片段进行特征提取，根据提取的特征完成对训练集中各子音频片段对应的说话人角色的标注；S3：构建用于说话人角色识别的深度学习网络模型，并通过标注后的训练集对深度学习网络模型进行训练；S4：将待分割的多人通话音频进行预处理和切分后，对每个子音频片段进行特征提取，特征提取结果输入训练后的深度学习网络模型后，输出该多人通话音频包含的各子音频片段对应的说话人角色。
基于监督学习说话分割方法终端设备存储介质

[发明专利]基于乐谱的乐谱音频检测方法、装置、设备和计算机介质-CN202210355782.5在审
发明人：张航;徐豪骏;李山亭 -专利权人：上海妙克信息科技有限公司
申请日： 2022-04-06 - 公布日： 2022-07-29 - 主分类号： G10H1/00 文献下载
摘要：本公开的实施例公开了基于乐谱的乐谱音频检测方法、装置、设备和计算机介质。该方法的一具体实施方式包括：将弹奏乐谱音频转化为目标音频格式，得到目标弹奏乐谱音频；对目标乐谱音频进行特征提取处理，以生成乐谱特征向量；基于目标弹奏乐谱音频，生成音频时域数据；对音频时域数据进行特征提取处理，以生成音频特征向量；将乐谱特征向量与音频特征向量进行合并处理，得到合并特征向量，以及将合并特征向量输入至预先训练的音频打分模型，得到音频评分作为弹奏评分。该实施方式无须将弹奏的音频转换为MIDI文件，避免了音准损失而导致的检测误差。
基于乐谱音频检测方法装置设备计算机介质

[发明专利]语音合成、特征提取模型训练方法、装置、介质及设备-CN202010768365.4有效
发明人：殷翔 -专利权人：北京字节跳动网络技术有限公司
申请日： 2020-08-03 - 公布日： 2022-09-16 - 主分类号： G10L15/02 文献下载
摘要：本公开涉及一种语音合成、特征提取模型训练方法、装置、介质及设备，所述语音合成方法包括：获取待处理的唇动数据；通过声学特征提取模型对所述唇动数据进行处理，以得到所述唇动数据对应的声学特征信息；根据所述声学特征信息进行语音合成，以得到与所述唇动数据对应的音频信息；其中，所述声学特征提取模型是通过将样本唇动数据对应的目标文本信息作为模型约束条件进行训练得到的。由此，可以一定程度上保证确定出的音频信息中语义连续性和准确性。该声学特征提取模型是基于文本信息对模型进行约束训练获得的，可以通过增加文本学习的辅助任务以提高该声学特征提取模型对不同的测试数据的适用，提高该声学特征提取模型的准确性和适用范围。
语音合成特征提取模型训练方法装置介质设备

[发明专利]音乐分类方法、音乐分类装置、电子设备及存储介质-CN202310572879.6在审
发明人：张旭龙;王健宗;程宁;茹港徽 -专利权人：平安科技（深圳）有限公司
申请日： 2023-05-19 - 公布日： 2023-08-04 - 主分类号： G06F16/65 文献下载
摘要：方法包括：获取样本音乐的样本音频数据和样本歌词数据；对样本音频数据进行音频特征提取，得到样本音频特征；对样本歌词数据进行歌词特征提取，得到样本歌词特征；基于样本音频特征和样本歌词特征，构建正音乐样本对和负音乐样本对；基于正音乐样本对和负音乐样本对对神经网络模型进行模型训练，得到音乐分类模型；获取目标音乐的目标数据；对目标数据进行特征提取，得到目标音乐的目标音乐特征；基于音乐分类模型和目标音乐特征对目标音乐进行流派评分
音乐分类方法装置电子设备存储介质

[发明专利]一种基于语音识别的构音障碍自动评估系统和方法-CN201911234291.X在审
发明人：茹克艳木·肉孜;苏荣锋;王岚 -专利权人：中国科学院深圳先进技术研究院
申请日： 2019-12-05 - 公布日： 2021-06-08 - 主分类号： G10L15/26 文献下载
摘要：该系统包括第一特征提取单元、第二特征提取单元、特征拼接单元、多层感知机、评估单元，特征拼接单元与第一特征提取单元、第二特征提取单元、多层感知机具有通信连接，评估单元与多层感知机具有通信连接，其中第一特征提取单元用于提取传统的句子级别的声学特征；第二特征提取单元提取帧级别的音频标注和帧音素‑概率的关系；特征拼接单元将第一特征提取的特征和第二特征提取单元提取的特征进行拼接；多层感知机基于拼接特征输出个体句子障碍程度和相应的预测概率；评估单元利用个体句子的预测概率信息得到总体评估结果
一种基于语音识别音障自动评估系统方法

[发明专利]一种基于音频特征的工程车辆工况识别方法-CN202111615063.4在审
发明人：刘文才;刘峰;张庆铭;毛永涛;毛青;姚凯学;刘光林 -专利权人：贵州英利智能控制系统有限公司
申请日： 2021-12-27 - 公布日： 2022-04-29 - 主分类号： G10L25/51 文献下载
摘要：本发明公开了一种基于音频特征的工程车辆工况识别方法，包括：A.采集工程车辆在已知工况下的音频数据作为样本数据；B.对样本数据进行预处理和特征提取，得到样本特征矩阵；C.将样本特征矩阵输入神经网络模型进行训练；D.将未知工况的音频数据进行预处理和特征提取，输入训练好的神经网络模型进行工况识别。本发明公开了音频特征及特征提取的方法与步骤，提出了一种基于神经网络的工程车辆的工作状态的识别办法，可根据当前车辆发出的噪音实时辨识出工程车辆的工况，有效提高工程车辆的使用效率，节约企业成本。
一种基于音频特征工程车辆工况识别方法