“谭志力”申请（专利权）人搜索_中国专利权人_发明人_技术持有人_科研专家_钻瓜专利网

钻瓜专利网为您找到相关结果14个，建议您升级VIP下载更多相关专利

[发明专利]歌名相似度的确定方法、设备和存储介质-CN202310804396.4在审
发明人：龚韬;谭志力;苏斌;陈颖 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-06-30 - 公布日： 2023-10-27 - 主分类号： G06F18/22 文献下载
摘要：本公开提供了一种歌名相似度的确定方法、设备和存储介质，属于文本处理技术领域。在本公开实施例中，在长度较长的歌名中确定是否存在与长度较短的歌名相同的字段，如果存在，则根据该字段的首端与长歌名的首端之间的距离计算两个歌名之间相似度。当存在两个较短且不同的歌名需要计算相似度时，计算得到的相似度很低，可以提高计算出的相似度的准确性。
歌名相似确定方法设备存储介质

[发明专利]音频合成方法、计算机设备及存储介质、程序产品-CN202310246019.3在审
发明人： 谭志力;陈颖;苏斌;龚韬 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-03-08 - 公布日： 2023-07-25 - 主分类号： G10L13/02 文献下载
摘要：本申请提供了一种音频合成方法、计算机设备及存储介质、程序产品，该方法包括：将目标文本的音素特征信息与目标文本对应的标签信息进行特征融合处理，得到目标音素特征信息；将目标音素特征信息以及目标音高特征信息进行拼接处理，得到拼接特征信息；根据拼接特征信息，生成预测梅尔频谱；通过声码器对预测梅尔频谱进行转换处理，得到与目标文本对应的曲谱匹配的音频数据。采用本申请，可以降低音频合成的成本，且有利于提升合成的音频数据的音色稳定性。
音频合成方法计算机设备存储介质程序产品

[发明专利]听歌识曲的多版本结果确定方法和设备-CN202310329159.7在审
发明人：龚韬;苏斌;谭志力;陈颖 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-03-24 - 公布日： 2023-07-04 - 主分类号： G06F16/683 文献下载
摘要：本申请涉及听歌识曲技术领域，提供一种听歌识曲的多版本结果确定方法、和设备，可以避免单结果返回导致仅返回盗歌的情况。本申请中，获取用户请求识别的音频片段；基于音频片段的指纹与听歌识曲音频指纹库里的指纹之间的相似度，在听歌识曲音频库里确定被召回歌曲；基于被召回歌曲在预先构建的同歌组库里进行检索，扩充得到多结果歌曲池；同歌组库里的同歌组是基于同一首歌的不同版本形成的；将多结果歌曲池里的各歌曲归至相应的版本类别，在每个版本类别中选取热度值满足预设热度条件的歌曲，得到多版本结果，以将多版本结果返回给用户。
听歌识曲版本结果确定方法设备

[发明专利]歌声合成数据集生成方法、计算机设备和存储介质-CN202310304912.7在审
发明人：苏斌;龚韬;谭志力;陈颖 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2023-03-20 - 公布日： 2023-07-04 - 主分类号： G10L25/69 文献下载
摘要：本申请涉及一种歌声合成数据集生成方法、计算机设备、存储介质和计算机程序产品。所述方法包括：根据候选歌声合成数据集中音频的特征分布信息，得到所述音频的质量数据；若所述音频的质量数据满足预设阈值，则对所述候选歌声合成数据集中的多个音频进行筛选，得到初始化歌声合成数据集，并将所述候选歌声合成数据集中不属于所述初始化歌声合成数据集的音频作为候选音频；根据所述候选音频的特征分布信息和所述初始化歌声合成数据集的总特征分布信息，对所述初始化歌声合成数据集进行迭代更新，得到目标歌声合成数据集。采用本方法能够提高歌声合成数据集质量。
歌声合成数据生成方法计算机设备存储介质

[发明专利]特征频点识别模型训练和音频指纹识别方法、设备及产品-CN202211094118.6在审
发明人：孔令城;胡诗超;谭志力;陈颖 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-09-08 - 公布日： 2023-05-09 - 主分类号： G10L25/51 文献下载
摘要：本申请涉及音频处理领域，提供了一种特征频点识别模型的训练方法、音频指纹识别方法、计设备和产品，能够提高识别得到的特征频点和音频指纹的准确性。所述方法包括：获取原始歌曲音频的带噪歌曲音频；所述带噪歌曲音频的带噪歌曲信号包括噪声信号和所述原始歌曲音频的原始歌曲信号；确定所述原始歌曲信号频域下的参考特征频点；将所述带噪歌曲信号输入到待训练的神经网络模型，通过所述神经网络模型获取频域下与所述带噪歌曲信号中的原始歌曲信号关联的预测特征频点；基于所述预测特征频点和所述参考特征频点之间的差异值，调整所述神经网络模型的模型参数，直到满足训练结束条件，得到训练好的特征频点识别模型。
特征识别模型训练音频指纹识别方法设备产品

[发明专利]音色识别模型训练方法及相关组件、音色识别方法-CN202211667038.5在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-12-22 - 公布日： 2023-04-25 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种音色识别模型训练方法及相关组件、音色识别方法，包括：利用待训练音色识别模型的生成器网络对音频样本一和音频样本二进行特征提取，得到音色嵌入特征一和音色嵌入特征二；利用判别器模型对音色嵌入特征一和音色嵌入特征二进行场景判断，利用判别器损失函数对判别器模型进行对抗训练；利用生成器损失函数对生成器网络进行对抗训练；利用音色嵌入特征一和音色嵌入特征二对分类器网络进行训练，得到目标音色识别模型。通过对抗训练的方式对待训练音色模型中的生成器网络进行训练同时训练分类器模型，训练后的目标音色识别模型能够将同一主体在不同场景下的音频对应的主体身份均识别为该主体。
音色识别模型训练方法相关组件

[发明专利]音色特征提取模型的训练和音频合成的方法及装置-CN202211485541.9在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-11-24 - 公布日： 2023-03-28 - 主分类号： G10L13/02 文献下载
摘要：本申请实施例公开了一种音色特征提取模型的训练和音频合成的方法及装置，属于计算机技术领域。所述方法包括：根据待训练的音色特征提取模型对第一人物的第一样本音频提取第一音色特征，对第一人物的第二样本音频提取第二音色特征，对第二人物的第三样本音频提取第三音色特征；以最小化第一音色特征与第二音色特征的差异、且最大化第一音色特征与第三音色特征的差异为训练目的，对待训练的音色特征提取模型进行训练；若满足训练结束条件，则将满足训练结束条件的音色特征提取模型确定为目标音色特征提取模型。采用本申请实施例，可以提高音色特征提取的效率。
音色特征提取模型训练音频合成方法装置

[发明专利]一种语音合成方法、电子设备及计算机可读存储介质-CN202210962981.2在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-08-11 - 公布日： 2022-11-11 - 主分类号： G10L13/02 文献下载
摘要：本申请公开了一种语音合成方法、电子设备及介质，获取待处理文本对应的多个音素序列；提取音素序列中各音素对应的音素特征。对每个音素对应的音素特征进行音色解耦，以得到解耦后的音素特征。依据解耦后的音素特征和目标人物的音色特征，得到符合目标人物音色的音频。对音素特征进行解耦，降低了原本存在的个人音色特征造成的干扰。在需要生成符合目标人物音色的音频时，无需再获取大量具有目标人物音色特征的音频数据进行训练，只需要从少量具有目标人物音色特征的音频数据中提取出目标人物的音色特征，依据解耦后的音素特征和目标人物的音色特征，便可以得到符合目标人物音色的音频，降低了音色迁移的成本。
一种语音合成方法电子设备计算机可读存储介质

[发明专利]音频文本识别模型的训练方法和音频文本识别方法-CN202210923888.0在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-08-02 - 公布日： 2022-10-25 - 主分类号： G10L15/06 文献下载
摘要：本申请涉及一种音频文本识别模型的训练方法、音频文本识别方法、计算机设备和计算机程序产品。通过将音频特征序列输入待训练音频文本识别模型，由待训练音频文本识别模型基于音频特征序列得到语种序列识别结果，基于语种序列识别结果和音频特征序列得到文本序列识别结果，根据第一损失函数以及第二损失函数，调整待训练音频文本识别模型的模型参数，直至满足模型训练条件时得到音频文本识别模型，并通过该音频文本识别模型对音频进行文本识别。相较于传统的通过混合模型进行识别的方式，本方案通过音频特征和语种序列训练音频文本识别模型，使得训练得到的音频文本识别模型能够结合语种对音频进行文本识别，提高了音频文本识别的准确度。
音频文本识别模型训练方法

[发明专利]语种分类方法、装置及计算机可读存储介质-CN202210743472.0在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-06-28 - 公布日： 2022-09-30 - 主分类号： G10L15/00 文献下载
摘要：本申请实施例提供一种语种分类方法、装置及计算机可读存储介质，该方法包括：获取待分类音频的频谱特征；调用训练完成的目标声学模型对频谱特征进行处理，得到待分类音频的音素序列；训练完成的目标声学模型是基于音素词典训练得到的神经网络模型，音素词典用于指示不同语种的字符与音素之间的对应关系；调用训练完成的目标语种分类模型对音素序列进行处理，得到待分类音频所属的语种；训练完成的目标语种分类模型是由多个训练音频的音素序列训练得到，每个训练音频具有标注的预设语种标签，训练完成的目标语种分类模型记录有音频的音素序列与音频所属语种的对应关系。采用本申请实施例，可以提高语种分类的准确率。
语种分类方法装置计算机可读存储介质

[发明专利]一种哼唱识别方法、设备及介质-CN202210583214.0在审
发明人： 谭志力;苏斌 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2022-05-26 - 公布日： 2022-09-02 - 主分类号： G10L25/03 文献下载
摘要：本申请公开了一种哼唱识别方法、设备及介质，应用于歌曲识别技术领域，包括：分别提取第一音频数据和第二音频数据的音高，得到所述第一音频数据对应的第一音高序列以及所述第二音频数据对应的第二音高序列；按照预设窗长和预设窗移分别对所述第一音高序列和所述第二音高序列进行切分，得到所述第一音高序列对应的第一音高向量序列和所述第二音高序列对应的第二音高向量序列；确定所述第一音高向量序列以及所述第二音高向量序列中音高向量的向量距离；基于所述向量距离确定所述第一音高向量序列以及所述第二音高向量序列的序列距离；基于所述序列距离确定所述第一音频数据对应的哼唱识别结果。这样，能够提升哼唱识别准确度。
一种哼唱识别方法设备介质

[发明专利]模型训练方法、语音合成方法、设备和计算机程序产品-CN202111676481.4在审
发明人： 谭志力 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2021-12-31 - 公布日： 2022-04-12 - 主分类号： G10L13/02 文献下载
摘要：本申请涉及智能语音领域，提供了一种模型训练方法、语音合成方法、设备和计算机程序产品。本申请能够提高文字音素转化模型的训练效率。该方法包括：从训练数据库中获取包含具有多种发音的目标文字的文本序列及该文本序列对应发音的音频素材，通过语音识别模型提取该音频素材对应的音素序列并将其作为音素序列标注结果，及将文本序列输入至待训练的文字音素转化模型得到其输出的音素序列预测结果，然后将该音素序列标注结果与音素序列预测结果进行比较获得音素序列预测偏差，根据该音素序列预测偏差调整待训练的文字音素转化模型参数，当满足训练完成条件时得到文字音素转化模型。
模型训练方法语音合成设备计算机程序产品

[发明专利]歌曲的特征提取模型训练方法、歌曲识别方法及相关设备-CN202110903817.X在审
发明人： 谭志力;孔令城 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2021-08-06 - 公布日： 2021-11-12 - 主分类号： G10L25/51 文献下载
摘要：本发明实施例提供了一种歌曲的特征提取模型训练方法、歌曲识别方法及相关设备，用于提升对歌曲识别的准确率。本申请实施例中歌曲的识别方法，包括：获取目标音频片段；提取出所述目标音频片段的歌词向量；提取出所述目标音频片段的目标嵌入向量；将所述目标音频片段的歌词向量和目标嵌入向量输入至特征提取模型，得到所述目标音频片段的融合向量；根据所述目标音频片段的融合向量，与数据库中每首歌曲的多个音频片段分别对应的多个融合向量，识别出与所述目标音频片段最相似的歌曲。
歌曲特征提取模型训练方法识别相关设备

[发明专利]音频识别模型训练方法，音色相似度检测方法-CN202110809025.6在审
发明人： 谭志力;胡诗超 -专利权人：腾讯音乐娱乐科技（深圳）有限公司
申请日： 2021-07-16 - 公布日： 2021-10-01 - 主分类号： G10L15/06 文献下载
摘要：本申请公开了一种音频识别模型训练方法，一种音色相似度检测方法。本申请中的音频识别模型以两个有噪音色特征及其二者的相似度作为输入数据，能够输出该相似度的纠正结果，该纠正过程无需关注噪声大小、时长大小与相似度大小是不是线性关系，也不用关注音频中的噪声大小，因此可以降低计算开支和耗时，还提高了音色相似度的纠正准确率。
音频识别模型训练方法音色相似检测

1
共 14 条