[发明专利]检测模型训练方法、盗版歌曲检测方法以及相关设备在审

申请号：	202211413235.4	申请日：	2022-11-11
公开（公告）号：	CN115757859A	公开（公告）日：	2023-03-07
发明（设计）人：	何礼	申请（专利权）人：	腾讯音乐娱乐科技（深圳）有限公司
主分类号：	G06F16/65	分类号：	G06F16/65;G06F16/683;G06F16/68;G06F18/214
代理公司：	深圳市深佳知识产权代理事务所(普通合伙) 44285	代理人：	陈彦如
地址：	518052 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	检测模型训练方法盗版歌曲以及相关设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施例公开了检测模型训练方法、盗版歌曲检测方法以及相关设备，用于提升盗版歌曲检测效率。本申请实施例方法包括：获取预先标记有歌曲标签的多个预处理歌曲；以每个预处理歌曲的第一歌曲信息为检索关键词，获得与每个第一歌曲信息对应的检索结果；从训练歌曲对应的检索结果中提取对应的检索结果摘要；轮流以每个预处理歌曲为训练歌曲，将训练歌曲的第一歌曲信息以及训练歌曲对应的检索结果摘要输入预训练模型，以输出训练歌曲的正版置信度和盗版置信度；根据正版置信度、盗版置信度、训练歌曲的歌曲标签以及预设的损失函数，计算损失值；基于损失值调整预训练模型的模型参数，直至损失值满足预设收敛条件时得到目标检测模型。

技术领域

本申请实施例涉及音频处理领域，尤其涉及检测模型训练方法、盗版歌曲检测方法以及相关设备。

背景技术

近年来盗版歌曲不断新增，对歌曲曲库造成污染，影响到歌曲推荐以及歌曲检索等各个方面。

现在，主要采用人工审核的方式，对原版歌曲和盗版歌曲进行鉴别。

在实现本发明的过程中，发明人发现现有技术至少存在审核效率低下的问题。由人工进行歌曲审核，无法应对当前海量的存量歌曲以及每日大量的新增歌曲。

发明内容

本申请实施例提供了检测模型训练方法、盗版歌曲检测方法以及相关设备，用于提升盗版歌曲检测效率。

本申请实施例第一方面提供一种检测模型训练方法，包括：

获取预先标记有歌曲标签的多个预处理歌曲，所述歌曲标签用于标识预处理歌曲为盗版歌曲或正版歌曲；

以每个所述预处理歌曲的第一歌曲信息为检索关键词，获得与每个所述第一歌曲信息对应的检索结果；

从所述训练歌曲对应的检索结果中提取对应的检索结果摘要；