专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果2596798个,建议您升级VIP下载更多相关专利
  • [发明专利]音频识别方法、装置及设备-CN202310215708.8在审
  • 张新成;任伟;和心愿 - 北京梧桐车联科技有限责任公司
  • 2023-02-28 - 2023-06-23 - G10L17/02
  • 本申请公开了音频识别方法、装置及设备,属于计算机技术领域。方法包括:获取多个初始音频,多个初始音频对应同一个音频提供对象,音频提供对象的对象信息未知;拼接多个初始音频中的不相连的初始音频,得到多个拼接音频,拼接音频携带的目标语调特征强于初始音频中携带的初始语调特征;获取基准音频的声纹,基准音频对应的对象信息已知;根据多个拼接音频和基准音频的声纹确定多个初始音频音频识别结果。通过拼接不相连的初始音频,使得拼接音频携带的目标语调特征强于初始语调特征。通过特征更强的目标语调特征辅助音频的识别,提高音频识别的准确率。
  • 音频识别方法装置设备
  • [发明专利]音频情感识别方法、装置、设备、存储介质及产品-CN202211017941.7在审
  • 林炳怀;王丽园 - 腾讯科技(深圳)有限公司
  • 2022-08-24 - 2022-11-25 - G10L25/63
  • 本申请公开了一种音频情感识别方法、装置、设备、存储介质及产品,属于计算机技术领域。所述方法包括:获取待处理音频数据以及待处理音频数据对应的音频文本;基于待处理音频数据和音频文本进行特征提取处理,得到待处理音频数据对应的第一音频特征和待处理音频数据对应的第二音频特征;对第一音频特征和第二音频特征进行融合处理,得到待处理音频数据对应的融合音频特征;基于融合音频特征进行情感识别处理,得到待处理音频数据对应的情感类型信息。本申请实施例提供的技术方案,能够有效降低音频情感识别对自动语音识别精度的依赖程度,提升音频情感识别的稳定性和准确性。
  • 音频情感识别方法装置设备存储介质产品
  • [发明专利]一种模型训练、音频降噪方法、装置、设备及存储介质-CN202210453491.X在审
  • 赵情恩 - 北京百度网讯科技有限公司
  • 2022-04-27 - 2022-07-22 - G10L21/02
  • 本公开提供了一种模型训练、音频降噪方法、装置、设备及存储介质,涉及数据处理技术领域,尤其涉及人工智能技术领域。具体实现方案为:获得第一样本音频特征、第二样本音频特征和样本图像;将第二样本音频特征输入音频降噪模型中的音频特征提取子网络,得到深层音频特征,将样本图像输入音频降噪模型中的图像特征提取子网络,得到样本图像特征;将深层音频特征和样本图像特征输入音频降噪模型中的联合子网络重建音频特征和图像;基于重建的音频特征与第一样本音频特征间的差异、及重建的图像与样本图像间的差异,获得训练损失;基于训练损失,对音频降噪模型进行训练应用本公开实施例提供的方案,能够训练得到对音频进行降噪处理的模型。
  • 一种模型训练音频方法装置设备存储介质
  • [发明专利]音频合成模型的训练方法以及音频合成方法-CN202310776808.8在审
  • 强春雨 - 北京达佳互联信息技术有限公司
  • 2023-06-28 - 2023-09-19 - G10L13/027
  • 本公开关于一种音频合成模型的训练方法以及音频合成方法,其中,该训练方法获取训练数据,训练数据包括样本文本的样本音素特征以及样本文本的第一样本音频信息;将第一样本音频信息输入至待训练的音频合成模型中的第一音频特征提取层,得到第一样本音频信息的第一音频特征,第一音频特征提取层是音频合成模型包括的多个音频特征提取层中与样本文本的对象类型相匹配的特征提取层;基于待训练的音频合成模型、样本音素特征以及第一音频特征,得到样本文本对应的预测音频信息,继而得到训练完成的音频合成模型。通过采用本公开,可以统一提取不同的对象类型对应的音频特征以及音素特征,实现单模型输出多对象类型的音频信息。
  • 音频合成模型训练方法以及
  • [发明专利]音频数据处理方法、装置、设备、存储介质及产品-CN202210935243.9在审
  • 袁微 - 腾讯科技(深圳)有限公司
  • 2022-08-03 - 2022-11-11 - G10H1/00
  • 本申请实施例提供了一种音频数据处理方法、装置、设备、存储介质及产品,包括:获取样本多轨音频数据以及N个音频片段分别对应的标注音频特征信息;根据音频片段N1的标注音频特征信息,确定音频片段N1的预测音频特征信息;采用初始音频生成模型根据音频片段集合中的音频片段的标注音频特征信息,预测音频片段Ni的预测音频特征信息;若获取到N个音频片段分别对应的预测音频特征信息,则根据N个音频片段分别对应的标注音频特征信息,以及N个音频片段分别对应的预测音频特征信息,对初始音频生成模型进行调整,将调整后的初始音频生成模型用于生成目标多轨音频数据,从而基于人工智能技术实现多轨音频数据的自动化智能化生成。
  • 音频数据处理方法装置设备存储介质产品
  • [发明专利]音频数据处理方法、装置及存储介质-CN201810941442.4有效
  • 王征韬 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2018-08-17 - 2021-03-16 - G10L25/51
  • 本发明公开了一种音频数据处理方法、装置及存储介质,所述方法包括:获取训练样本,然后提取训练样本中的多个特征信息,多个特征信息包括频谱高度特征、纯音乐与人声的鉴别特征、第一预设时长对应的音频开头特征以及第二预设时长对应的音频结尾特征,再将多个特征信息输入神经网络中进行特征融合训练,以得到训练后的特征融合参数,并根据特征融合参数生成音频分类模型,若接收到测试音频,则通过音频分类模型对测试音频进行分类。本发明实施例通过多个特征信息的特征融合,得到结合了多个方面特征特征融合参数,并将特征融合参数再融入到音频分类模型中进行音频分类,提升了音频分类的准确率,能够有效区分现场音频与录音棚音频
  • 音频数据处理方法装置存储介质
  • [发明专利]音频的转换方法、装置、存储介质及电子设备-CN202110456269.0在审
  • 戈文硕;刘恺;陈伟 - 北京搜狗科技发展有限公司
  • 2021-04-26 - 2021-08-06 - G10L21/013
  • 本发明实施例提供了一种音频的转换方法、装置、存储介质以及电子设备,其中,所述方法包括:通过获取源说话人的初始音频,首先对初始音频进行特征识别,获得初始音频对应的语音识别特征以及音频隐层特征,接着将所提取的语音识别特征音频隐层特征输入音频转换模型进行音色转换与方言口音处理,获得目标方言说话人的目标方言声学特征,然后可以根据目标方言声学特征生成对应的目标音频,通过音频转换模型语音识别特征音频隐层特征进行处理,实现将任意说话人的音频转换为目标方言说话人的音频,不仅可以实现音色的转换,还可以在所转换的音频中携带目标方言口音,有效提高了音频的变声效果。
  • 音频转换方法装置存储介质电子设备
  • [发明专利]角色识别方法、装置、计算机设备及存储介质-CN202211004872.6在审
  • 蒋佳惟 - 中国平安人寿保险股份有限公司
  • 2022-08-22 - 2022-11-22 - G10L25/63
  • 本发明公开了一种角色识别方法,该方法包括获取目标音频文本,对目标音频文本进行文本检测,得到文本检测结果;对所述检测失败结果对应的所述目标音频文本进行纠正处理,得到纠正音频文本;获取纠正音频文本对应的纠正音频数据,对纠正音频数据进行声纹特征提取,得到音频声纹特征;确定纠正音频文本对应的文本特征向量,以及确定音频声纹特征对应的音频特征向量;基于音频特征向量和文本特征向量,确定纠正音频文本对应的情绪识别结果,并基于情绪识别结果、音频特征向量和文本特征向量,确定纠正音频文本对应的角色类别。如此,本发明通过情绪识别结果对纠正音频文本对应的角色类别进行辅助识别,从而提高了对角色识别的准确性。
  • 角色识别方法装置计算机设备存储介质
  • [发明专利]音频的识别方法、装置、可读介质和电子设备-CN202111327471.X在审
  • 何珂鑫;贾少勇;何怡;马泽君 - 北京有竹居网络技术有限公司
  • 2021-11-10 - 2022-01-28 - G06F16/65
  • 本公开涉及一种音频的识别方法、装置、可读介质和电子设备,涉及电子信息处理技术领域,该方法包括:获取待识别音频,提取用于表征待识别音频的目标音频特征,目标音频特征的维度与待识别音频的时长正相关,利用预先训练的识别模型,根据目标音频特征确定指定维度的统计特征,并根据统计特征确定待识别音频包括的目标音频事件,识别模型根据预先采集的训练音频集训练得到,训练音频集包括不同时长的训练音频。本公开中识别模型对不同时长的音频进行特征提取,以得到指定维度的统计特征,从而识别音频中包括的音频事件,无需对音频进行截取或补齐操作,能够保留音频中完整的信息,提高识别的准确度。
  • 音频识别方法装置可读介质电子设备

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top