专利名称
主分类
A 农业
B 作业;运输
C 化学;冶金
D 纺织;造纸
E 固定建筑物
F 机械工程、照明、加热
G 物理
H 电学
专利下载VIP
公布日期
2023-10-24 公布专利
2023-10-20 公布专利
2023-10-17 公布专利
2023-10-13 公布专利
2023-10-10 公布专利
2023-10-03 公布专利
2023-09-29 公布专利
2023-09-26 公布专利
2023-09-22 公布专利
2023-09-19 公布专利
更多 »
专利权人
国家电网公司
华为技术有限公司
浙江大学
中兴通讯股份有限公司
三星电子株式会社
中国石油化工股份有限公司
清华大学
鸿海精密工业股份有限公司
松下电器产业株式会社
上海交通大学
更多 »
钻瓜专利网为您找到相关结果14个,建议您升级VIP下载更多相关专利
  • [发明专利]听歌识曲的多版本结果确定方法和设备-CN202310329159.7在审
  • 龚韬;苏斌;谭志力;陈颖 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-03-24 - 2023-07-04 - G06F16/683
  • 本申请涉及听歌识曲技术领域,提供一种听歌识曲的多版本结果确定方法、和设备,可以避免单结果返回导致仅返回盗歌的情况。本申请中,获取用户请求识别的音频片段;基于音频片段的指纹与听歌识曲音频指纹库里的指纹之间的相似度,在听歌识曲音频库里确定被召回歌曲;基于被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池;同歌组库里的同歌组是基于同一首歌的不同版本形成的;将多结果歌曲池里的各歌曲归至相应的版本类别,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,以将多版本结果返回给用户。
  • 听歌识曲版本结果确定方法设备
  • [发明专利]音色识别模型训练方法及相关组件、音色识别方法-CN202211667038.5在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-12-22 - 2023-04-25 - G10L15/06
  • 本申请公开了一种音色识别模型训练方法及相关组件、音色识别方法,包括:利用待训练音色识别模型的生成器网络对音频样本一和音频样本二进行特征提取,得到音色嵌入特征一和音色嵌入特征二;利用判别器模型对音色嵌入特征一和音色嵌入特征二进行场景判断,利用判别器损失函数对判别器模型进行对抗训练;利用生成器损失函数对生成器网络进行对抗训练;利用音色嵌入特征一和音色嵌入特征二对分类器网络进行训练,得到目标音色识别模型。通过对抗训练的方式对待训练音色模型中的生成器网络进行训练同时训练分类器模型,训练后的目标音色识别模型能够将同一主体在不同场景下的音频对应的主体身份均识别为该主体。
  • 音色识别模型训练方法相关组件
  • [发明专利]音色特征提取模型的训练和音频合成的方法及装置-CN202211485541.9在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-11-24 - 2023-03-28 - G10L13/02
  • 本申请实施例公开了一种音色特征提取模型的训练和音频合成的方法及装置,属于计算机技术领域。所述方法包括:根据待训练的音色特征提取模型对第一人物的第一样本音频提取第一音色特征,对第一人物的第二样本音频提取第二音色特征,对第二人物的第三样本音频提取第三音色特征;以最小化第一音色特征与第二音色特征的差异、且最大化第一音色特征与第三音色特征的差异为训练目的,对待训练的音色特征提取模型进行训练;若满足训练结束条件,则将满足训练结束条件的音色特征提取模型确定为目标音色特征提取模型。采用本申请实施例,可以提高音色特征提取的效率。
  • 音色特征提取模型训练音频合成方法装置
  • [发明专利]一种语音合成方法、电子设备及计算机可读存储介质-CN202210962981.2在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-08-11 - 2022-11-11 - G10L13/02
  • 本申请公开了一种语音合成方法、电子设备及介质,获取待处理文本对应的多个音素序列;提取音素序列中各音素对应的音素特征。对每个音素对应的音素特征进行音色解耦,以得到解耦后的音素特征。依据解耦后的音素特征和目标人物的音色特征,得到符合目标人物音色的音频。对音素特征进行解耦,降低了原本存在的个人音色特征造成的干扰。在需要生成符合目标人物音色的音频时,无需再获取大量具有目标人物音色特征的音频数据进行训练,只需要从少量具有目标人物音色特征的音频数据中提取出目标人物的音色特征,依据解耦后的音素特征和目标人物的音色特征,便可以得到符合目标人物音色的音频,降低了音色迁移的成本。
  • 一种语音合成方法电子设备计算机可读存储介质
  • [发明专利]音频文本识别模型的训练方法和音频文本识别方法-CN202210923888.0在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-08-02 - 2022-10-25 - G10L15/06
  • 本申请涉及一种音频文本识别模型的训练方法、音频文本识别方法、计算机设备和计算机程序产品。通过将音频特征序列输入待训练音频文本识别模型,由待训练音频文本识别模型基于音频特征序列得到语种序列识别结果,基于语种序列识别结果和音频特征序列得到文本序列识别结果,根据第一损失函数以及第二损失函数,调整待训练音频文本识别模型的模型参数,直至满足模型训练条件时得到音频文本识别模型,并通过该音频文本识别模型对音频进行文本识别。相较于传统的通过混合模型进行识别的方式,本方案通过音频特征和语种序列训练音频文本识别模型,使得训练得到的音频文本识别模型能够结合语种对音频进行文本识别,提高了音频文本识别的准确度。
  • 音频文本识别模型训练方法
  • [发明专利]语种分类方法、装置及计算机可读存储介质-CN202210743472.0在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-06-28 - 2022-09-30 - G10L15/00
  • 本申请实施例提供一种语种分类方法、装置及计算机可读存储介质,该方法包括:获取待分类音频的频谱特征;调用训练完成的目标声学模型对频谱特征进行处理,得到待分类音频的音素序列;训练完成的目标声学模型是基于音素词典训练得到的神经网络模型,音素词典用于指示不同语种的字符与音素之间的对应关系;调用训练完成的目标语种分类模型对音素序列进行处理,得到待分类音频所属的语种;训练完成的目标语种分类模型是由多个训练音频的音素序列训练得到,每个训练音频具有标注的预设语种标签,训练完成的目标语种分类模型记录有音频的音素序列与音频所属语种的对应关系。采用本申请实施例,可以提高语种分类的准确率。
  • 语种分类方法装置计算机可读存储介质
  • [发明专利]一种哼唱识别方法、设备及介质-CN202210583214.0在审
  • 谭志力;苏斌 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-05-26 - 2022-09-02 - G10L25/03
  • 本申请公开了一种哼唱识别方法、设备及介质,应用于歌曲识别技术领域,包括:分别提取第一音频数据和第二音频数据的音高,得到所述第一音频数据对应的第一音高序列以及所述第二音频数据对应的第二音高序列;按照预设窗长和预设窗移分别对所述第一音高序列和所述第二音高序列进行切分,得到所述第一音高序列对应的第一音高向量序列和所述第二音高序列对应的第二音高向量序列;确定所述第一音高向量序列以及所述第二音高向量序列中音高向量的向量距离;基于所述向量距离确定所述第一音高向量序列以及所述第二音高向量序列的序列距离;基于所述序列距离确定所述第一音频数据对应的哼唱识别结果。这样,能够提升哼唱识别准确度。
  • 一种哼唱识别方法设备介质
  • [发明专利]模型训练方法、语音合成方法、设备和计算机程序产品-CN202111676481.4在审
  • 谭志力 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2021-12-31 - 2022-04-12 - G10L13/02
  • 本申请涉及智能语音领域,提供了一种模型训练方法、语音合成方法、设备和计算机程序产品。本申请能够提高文字音素转化模型的训练效率。该方法包括:从训练数据库中获取包含具有多种发音的目标文字的文本序列及该文本序列对应发音的音频素材,通过语音识别模型提取该音频素材对应的音素序列并将其作为音素序列标注结果,及将文本序列输入至待训练的文字音素转化模型得到其输出的音素序列预测结果,然后将该音素序列标注结果与音素序列预测结果进行比较获得音素序列预测偏差,根据该音素序列预测偏差调整待训练的文字音素转化模型参数,当满足训练完成条件时得到文字音素转化模型。
  • 模型训练方法语音合成设备计算机程序产品

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top