专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]利用音频判别模型对音频进行判别的判别设备及存储介质-CN202210046402.X在审
  • 颜永红;张学帅;张鹏远 - 中国科学院声学研究所
  • 2022-01-14 - 2022-04-26 - G10L25/66
  • 本说明书实施例提供一种利用音频判别模型对音频进行判别的判别设备及存储介质,判别设备包括:第一预处理模块,配置为对待判别咳嗽音频进行处理,得到目标梅尔谱特征;第一划分模块,配置为对目标梅尔谱特征进行划分,得到处于不同频段的第一梅尔谱特征和第二梅尔谱特征;频域特征提取模块,配置为将第一梅尔谱特征以及第二梅尔谱特征输入频域特征提取层,得到第一频域特征和第二频域特征;时序特征提取模块,配置为将第一梅尔谱特征及第二梅尔谱特征输入时序特征提取层,得到第一时序特征和第二时序特征;分类模块,配置为将第一频域特征、第二频域特征、第一时序特征和第二时序特征输入分类层,得到待判别咳嗽音频携带指定肺炎信息的概率。
  • 利用音频判别模型进行别的设备存储介质
  • [发明专利]音频特征提取方法及装置-CN202310767508.3在审
  • 吕少卿;俞鸣园;王克彦;孙俊伟;曹亚曦 - 浙江华创视讯科技有限公司
  • 2023-06-26 - 2023-09-29 - G10L21/0232
  • 本发明实施例提供了一种音频特征提取方法及装置,其中,该方法包括:获取目标音频信号的倒谱系数集合,其中,倒谱系数集合中记录了目标音频信号的倒谱系数;对倒谱系数集合中的倒谱系数进行分组,得到第一子带集合,其中第一子带集合中包括多个子带,每个子带中包括倒谱系数集合中的多个倒谱系数;对第一子带集合中每个子带中的倒谱系数进行正则化处理,得到目标子带集合,其中,目标子带集合中的子带与第一子带集合中的子带一一对应;根据目标子带集合确定目标音频信号的音频特征通过本发明,解决了相关技术中存在的提取音频特征时无法有效抑制抗噪声的问题。
  • 音频特征提取方法装置
  • [发明专利]基于人工智能的网络训练方法及装置、电子设备-CN202111146925.3有效
  • 张旭龙;王健宗 - 平安科技(深圳)有限公司
  • 2021-09-28 - 2023-09-01 - G06N3/08
  • 本申请的实施例揭示了一种基于人工智能的网络训练方法、装置、电子设备和存储介质,方法包括:提取音频样本的第一音频特征和第二音频特征,文本样本的第一文本特征和第二文本特征;将第一音频特征和第一文本特征融合得到第一融合特征,将第二音频特征和第二文本特征融合得到第二融合特征提取第一融合特征对应的第三音频特征和第四音频特征提取第二融合特征对应的第三文本特征和第四文本特征;将第三音频特征和第三文本特征融合,将第四音频特征和第四文本特征融合;基于第一损失值和第二损失值之和,调整第二音频特征提取网络的参数,使得第二音频特征提取网络具备提取音频样本中与文本样本相似特征的能力。
  • 基于人工智能网络训练方法装置电子设备
  • [发明专利]一种音视频多模态的关键词唤醒方法及装置-CN202310909532.6在审
  • 白炳潮;宛敏红;宋伟;朱世强 - 之江实验室
  • 2023-07-24 - 2023-08-22 - G10L15/02
  • 本发明公开了一种音视频多模态的关键词唤醒方法及装置,该方法包括:获取图像序列和音频序列;对所述图像序列进行嘴唇检测处理并提取检测到的嘴唇部分图像,将提取出的嘴唇图像序列利用嘴唇特征提取神经网络进行处理,得到图像特征;对所述音频序列做音频特征提取,将提取到的音频特征利用音频特征处理神经网络进行处理,得到音频高维特征;对所述图像特征和所述音频高维特征进行特征融合;将融合得到的音视频特征利用多模特征处理神经网络进行处理,得到多模高维特征;将所述图像特征音频高维特征和多模高维特征融合成一个混合高维特征;基于所述混合高维特征,利用关键词唤醒分类器判断是否需要唤醒。
  • 一种视频多模态关键词唤醒方法装置
  • [发明专利]一种音视频多模态情感分类方法及系统-CN202110646620.2有效
  • 岑敬伦;李志鹏;青春美;罗万相 - 华南理工大学
  • 2021-06-10 - 2022-06-14 - G06V40/16
  • 本发明涉及语音和图像处理、模式识别领域,为一种音视频多模态情感分类方法及系统,其方法包括步骤:对原始视频数据的处理与计算,得到视频数据样本、音频数据样本及文本特征样本;构建情感特征提取网络,分别对视频数据样本、音频数据样本及文本特征样本进行特征提取,获得多模态中的视觉模态特征音频特征及文本特征;将提取到的视觉模态特征音频特征及文本特征进行维度统一,输入到张量融合网络中进行融合学习,最后进行分类输出多模态情感分类概率结果本发明能够对跨模态之间的情感信息进行有效的整合,对视频、音频及文本进行时空高维度上的特征提取,拼接成多模态特征向量,再融合学习并进行情感分类。
  • 一种视频多模态情感分类方法系统
  • [发明专利]音频播放方法、装置、存储介质及移动终端-CN201911368033.0有效
  • 徐云峰;刘世顺 - 惠州TCL移动通信有限公司
  • 2019-12-26 - 2021-08-03 - H04M1/72442
  • 本申请公开了一种音频播放方法、装置、存储介质及移动终端,方法包括:当接收到消息或者来电时,按照预设音量值播放提示信息;录制播放中的所述提示信息,得到当前场景音频文件;对所述当前场景音频文件进行频谱特征提取,判断提取出的目标频谱特征值是否在预设频谱特征值范围内,所述预设频谱特征值范围为对预设音频文件进行频谱特征提取得到的频谱特征值范围;若目标频谱特征值未在预设频谱特征值范围内,则基于所述预设音频文件对所述预设音量值进行调整,并按照调整后的音量值播放所述预设音频文件。通过对录制的当前场景音频文件进行频谱特征提取,以判断当前场景是否为嘈杂环境,从而自动调整音量值,以使用户可以听到提示信息。
  • 音频播放方法装置存储介质移动终端
  • [发明专利]一种基于transformer的声场景分类方法-CN202310065531.8在审
  • 张晓明;王廷德;卓思超;王芳;黎泉龙;管玙璠 - 北京石油化工学院
  • 2023-02-06 - 2023-03-14 - G10L25/51
  • 本发明公开了一种基于transformer的声场景分类方法,涉及声场景分类技术领域,包括以下步骤:获取待分类的音频数据;基于特征金字塔网络构建声场景分类模型,其包括特征提取模块和特征融合模块;特征提取模块包括依次连接的一个PatchPartition层,及多个特征提取层,多个特征提取层中分别连接有两个SwinTransformerBlock;特征融合模块对多个特征提取层生成的特征图进行级联合并处理;利用声场景分类模型对待分类的音频数据进行分类本发明实现对层级网络间特征图信息的关注,通过融合特征图的方式使图像包含更多的语义及空间信息,能更快完成模型收敛,显著提高声场景分类的准确率。
  • 一种基于transformer声场分类方法

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top