专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果3055603个,建议您升级VIP下载更多相关专利
  • [发明专利]一种视听伪造检测方法及装置-CN202210062374.0有效
  • 赫然;黄怀波;刘晨雨;李佳;段俊贤 - 中国科学院自动化研究所
  • 2022-01-19 - 2023-05-09 - G06V40/16
  • 本发明提供一种视听伪造检测方法及装置,该方法包括:获取待测视频数据;其中,待测视频数据包括至少两个视频帧,每个视频帧均包括至少一组由人脸图像和音频数据组成的视听对;将各视听对输入至训练好的双流网络,得到待测视频数据的伪造检测结果;其中,双流网络包括图像网络分支、音频网络分支和预测网络;图像网络分支用于提取人脸图像的面部关键点特征,并基于面部关键点特征提取人脸图像的帧间一致性特征音频网络分支用于提取音频数据的音频特征,并基于音频特征提取音频数据的时间一致性特征;预测网络基于帧间一致性特征和时间一致性特征获取待测视频数据的伪造检测结果。
  • 一种视听伪造检测方法装置
  • [发明专利]声纹特征提取方法、说话人识别方法、模型训练方法及装置-CN202310571244.4在审
  • 陈亚峰;郑斯奇;王绘;程路遥 - 阿里巴巴(中国)有限公司
  • 2023-05-18 - 2023-09-05 - G10L17/02
  • 本申请实施例公开了一种声纹特征提取方法、说话人识别方法、模型训练方法及装置。主要技术方案包括:获取包含语音的音频段;提取音频段的频谱特征;将音频段的频谱特征输入声纹提取模型,获取声纹提取模型输出的声纹特征;其中,声纹提取模型包括卷积神经网络层和池化全连接层;卷积神经网络层包括一个以上串连的基础模块,基础模块对输入该基础模块的特征进行不同通道维度的特征提取和融合,得到该基础模块输出的特征;利用最后一个基础模块输出的特征得到卷积神经网络层输出的特征;池化全连接层对卷积神经网络层输出的特征进行池化和全连接处理,得到声纹特征。通过本申请能够提升提取的声纹特征的准确性,提高声纹提取模型的泛化性能。
  • 声纹特征提取方法说话识别模型训练装置
  • [发明专利]音频修复方法、装置、计算机设备和存储介质-CN202310672388.9在审
  • 徐雪;张驰;杨洁琼;江文乐 - 中国工商银行股份有限公司
  • 2023-06-08 - 2023-08-22 - G10L21/007
  • 本申请涉及一种音频修复方法、装置、计算机设备、存储介质和计算机程序产品,可用于音频处理技术领域,也可用于金融科技领域或其他相关领域。该方法包括:获取金融系统的待修复音频的原始频谱图;对原始频谱图进行特征提取处理,得到待修复音频的原始频谱特征图,对原始频谱特征图进行不同倍数的下采样处理,得到待修复音频的多个尺度的频谱特征图;对各个尺度的频谱特征图进行特征提取处理,得到各个尺度的目标频谱特征图;根据待修复音频和各个尺度的目标频谱特征图,进行音频重建处理,得到待修复音频的目标频谱图;对目标频谱图进行音频转化,得到待修复音频的修复音频。采用本方法,能够提高音频修复效果。
  • 音频修复方法装置计算机设备存储介质
  • [发明专利]多模态语音情感识别方法、装置、设备及存储介质-CN202310715208.0在审
  • 张旭龙;王健宗;程宁;赵嘉豪 - 平安科技(深圳)有限公司
  • 2023-06-15 - 2023-08-22 - G10L25/63
  • 本发明公开了一种多模态语音情感识别方法,该方法包括获取至少一个音频数据;对音频数据的音频内容进行音频特征提取,得到梅尔频谱图、过零率特征图以及频谱质心特征图;基于梅尔频谱图、过零率特征图以及频谱质心特征图,确定语调特征;对音频数据进行语音识别,得到文本内容,并对文本内容进行文本特征提取,得到内容特征;将语调特征和内容特征进行拼接,得到音频拼接特征,并通过音频拼接特征确定情感识别结果。本发明通过语调特征和内容特征音频数据进行情感识别,实现了多模态对音频数据的情感识别,提升了金融或保险等行业中情感识别的准确性。以及在面对复杂语音数据时,也可以准确识别语音中的情感。
  • 多模态语音情感识别方法装置设备存储介质
  • [发明专利]一种模型训练、音频降噪方法、装置、设备及存储介质-CN202210453491.X在审
  • 赵情恩 - 北京百度网讯科技有限公司
  • 2022-04-27 - 2022-07-22 - G10L21/02
  • 本公开提供了一种模型训练、音频降噪方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及人工智能技术领域。具体实现方案为:获得第一样本音频特征、第二样本音频特征和样本图像;将第二样本音频特征输入音频降噪模型中的音频特征提取子网络,得到深层音频特征,将样本图像输入音频降噪模型中的图像特征提取子网络,得到样本图像特征;将深层音频特征和样本图像特征输入音频降噪模型中的联合子网络重建音频特征和图像;基于重建的音频特征与第一样本音频特征间的差异、及重建的图像与样本图像间的差异,获得训练损失;基于训练损失,对音频降噪模型进行训练应用本公开实施例提供的方案,能够训练得到对音频进行降噪处理的模型。
  • 一种模型训练音频方法装置设备存储介质
  • [发明专利]语种识别方法、装置、服务器及存储介质-CN202011033457.4在审
  • 张大威;姜涛;王晓瑞;王俊;李岩 - 北京达佳互联信息技术有限公司
  • 2020-09-27 - 2021-01-05 - G10L15/00
  • 本公开关于一种语种识别方法、装置、服务器及存储介质,该方法包括:获取待检测音频信号中的声学特征;将声学特征输入预先训练的声纹特征提取网络模型中,得到预先训练的声纹特征提取网络模型中目标神经网络层输出的特征,作为待检测音频信号中的声纹特征;根据待检测音频信号中的声纹特征以及各个预设语种音频信号中的声纹特征,确定待检测音频信号与各个预设语种音频信号之间的对数似然比值;根据各个对数似然比值,确定待检测音频信号与各个预设语种音频信号之间的特征相似度;根据特征相似度,从各个预设语种音频信号对应的语种信息中,确定待检测音频信号的语种信息。
  • 语种识别方法装置服务器存储介质
  • [发明专利]降噪方法、装置、设备及存储介质-CN202211188872.6在审
  • 邓鑫 - 珠海市魅族科技有限公司
  • 2022-09-28 - 2023-02-03 - G10K11/178
  • 该方法通过从预设的控制终端读取降噪规划信息,其中,降噪规划信息为用户通过控制终端编辑得到;根据降噪规划信息确定降噪模式,并基于降噪模式从控制终端读取特征音频;基于降噪模式确定特征提取方式,并根据特征提取方式从特征音频提取降噪特征;通过预设的声音传感器采集声音信号,并基于降噪特征和声音信号生成降噪信号;通过降噪信号控制预设的扬声器进行播放,以进行降噪;从而解决了现有技术中无法基于特征音频进行有效降噪的问题。
  • 方法装置设备存储介质

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top