[发明专利]歌曲标签整理、访问方法及其装置、设备、介质、产品在审

专利信息
申请号: 202111333487.1 申请日: 2021-11-11
公开(公告)号: CN114048347A 公开(公告)日: 2022-02-15
发明(设计)人: 肖翔;贺佳敏;梁海龙 申请(专利权)人: 广州歌神信息科技有限公司
主分类号: G06F16/65 分类号: G06F16/65;G06F16/68
代理公司: 广州利能知识产权代理事务所(普通合伙) 44673 代理人: 王增鑫
地址: 510655 广东省广州市*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请涉及歌曲检索技术领域,公开一种歌曲标签整理、访问方法及其装置、设备、介质、产品,所述整理方法包括:获取曲库中的目标歌曲;查询确定所述目标歌曲相对应的多个预设的标签子集,将各标签子集合并为标签集合,其中,第一标签子集为预设歌单库中收藏该首目标歌曲的各个歌单所映射的自有标签集的合集;统计目标歌曲的标签集合中的每个标签命中所述歌单库中歌单相对应的自有标签集的频次,将频次满足预设条件的多个标签确定为目标歌曲的归纳标签。本申请以歌单为曲库中的目标歌曲的标签素材来源,利用歌单相对应的自有标签集为目标歌曲打标,便于据此为用户所收藏的歌曲制备归纳标签,方便用户精准高效地查询其自身收藏的大量歌曲。
搜索关键词: 歌曲 标签 整理 访问 方法 及其 装置 设备 介质 产品
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州歌神信息科技有限公司,未经广州歌神信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202111333487.1/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于深度学习的徐州梆子作曲方法-201910540526.1
  • 郭威;余南南;朱媛媛 - 江苏师范大学
  • 2019-06-21 - 2023-10-03 - G06F16/65
  • 本发明公开了一种基于深度学习的徐州梆子作曲方法,首先通过稀疏成分分离提取徐州梆子乐曲中的梆子敲击部分以分离其他乐曲和梆子部分;然后,通过深度学习训练得出乐曲的特征;最后,利用递归神经网络进行训练和预测乐曲,再和生成的梆子相结合得到新的徐州梆子乐曲。采用本发明能够自动生成新的徐州梆子乐曲,对徐州梆子乐曲的保护和传承有重大意义。
  • 一种歌曲分类方法及装置-201911425030.6
  • 高月洁;梁晓晶;刘华平;郑博 - 杭州网易云音乐科技有限公司
  • 2019-12-31 - 2023-09-29 - G06F16/65
  • 本申请涉及数据处理领域,尤其涉及一种歌曲分类方法及装置,获取歌曲的歌词文件和音高线文件,其中,所述音高线文件至少包括每个音符的开始时间、结束时间和对应的音高,所述歌词文件至少包括每个字的字长信息;根据所述音高线文件中每个音符的开始时间、结束时间和对应音高,以及所述歌词文件中每个字的字长信息,确定所述歌曲的多维乐理特征;利用经过训练的分类器,将所述多维乐理特征与难度类别分类条件进行比对,确定所述歌曲所属的难度类别,这样,实现高效、准确地对歌曲进行难度分级。
  • 一种智能分类方法及系统-202310624490.1
  • 陶壮壮;李孝梁 - 河南工业和信息化职业学院
  • 2023-05-29 - 2023-09-15 - G06F16/65
  • 本申请公开了一种智能分类方法及系统,用于使用户可以快速找到类似喜欢的音乐或专辑,提高用户的听音乐体验。本申请方法包括:获取目标音乐文件的音乐文件信息,所述音乐文件信息包括音乐封面图像、音乐类型信息以及所属专辑封面图像;根据所述音乐封面图像确定第一色彩主题,根据所述所属专辑封面图像确定第二色彩主题;根据所述第一色彩主题、所述第二色彩主题和所述音乐类型信息确定所述目标音乐文件的色彩主题标签;根据所述色彩主题标签对所述目标音乐文件进行分类管理。
  • 音乐类型识别方法、装置、设备及存储介质-202110311431.X
  • 刘奡智;郭锦岳;韩宝强;肖京 - 平安科技(深圳)有限公司
  • 2021-03-24 - 2023-09-15 - G06F16/65
  • 本发明涉及人工智能领域,公开了一种音乐类型识别方法、装置、设备及存储介质。该方法包括:获取用户配置的待播放音乐的第一音乐类型,读取待播放的音乐文件;基于预置事件定义,将音乐文件的音乐数据转化为基于事件的离散表示数据,对离散表示数据进行向量转换,得到初始音乐特征向量;将初始音乐特征向量输入预置音乐类型识别模型进行识别,输出音乐文件为人为创作音乐的第一概率值;根据第一概率值和预置概率阈值,确定音乐文件对应的第二音乐类型,判断第一音乐类型是否与第二音乐类型相同;若相同,则播放音乐文件,否则识别下一音乐文件。本发明提供的音乐类型识别方法识别速度快,准确率高。
  • 一种基于Labeled LDA模型的歌手分类方法-202010477122.5
  • 籍汉超;王丹;张力;齐保峰 - 北京酷我科技有限公司
  • 2020-05-29 - 2023-09-15 - G06F16/65
  • 本发明涉及一种基于Labeled LDA模型的歌手分类方法,包括如下步骤:S1收集歌手的人工标签并进行预处理;S2建立基于用户行为的歌手分类模型并收集用户行为数据;S3清洗用户行为数据,过滤其中不利于模型训练的数据;S4分配用户行为数据中每个歌手对应每个用户的权值;S5合并用户行为数据与人工标签数据,生成训练数据;S6基于训练数据,参考标签组合关系,进行基于优化Gibbs采样的Labeled LDA模型训练。本发明,以用户的播歌行为作为训练数据,对用户的覆盖高且兼顾各个用户群体的偏好特征,用户行为的变化反映社会热点、公众认知而变化,模型可以周期性训练以跟随变化,适应性强,精确程度高,提高标签覆盖率,划分类别足够细。
  • 歌曲标签确定方法、装置、计算机设备以及存储介质-201911261720.2
  • 缪畅宇 - 腾讯科技(深圳)有限公司
  • 2019-12-10 - 2023-09-08 - G06F16/65
  • 本申请公开了一种歌曲标签确定方法、装置、计算机设备以及存储介质,属于数据处理领域。方法包括:获取目标歌曲的频域信息;将频域信息输入到第一类标签确定模型中,由第一类标签确定模型基于频域信息确定目标歌曲的第一类标签,其中,第一类标签用于表示第二类标签的标签类型,第二类标签用于表示目标歌曲的音频特征;基于目标歌曲的第一类标签,确定第一类标签对应的第二类标签确定模型;将频域信息输入到第二类标签确定模型中,由第二类标签确定模型基于频域信息确定目标歌曲的至少一个第二类标签。本申请通过模型来为目标歌曲自动确定第一类标签和第二类标签,无需人工操作,大大提高了确定歌曲标签的效率。
  • 音乐流派的分类方法、装置及存储介质-202010183719.9
  • 林梅露;吴康健;吴斌;王征韬;夏志强;雷兆恒 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2020-03-16 - 2023-09-08 - G06F16/65
  • 本发明实施例公开了一种音乐流派的分类方法、装置及存储介质。该方案通过收集预设流派音乐的正负样本,提取正负样本中音乐的第一歌词文本数据,并对第一歌词文本数据进行预处理,提取正负样本中音乐的音频数据,并对音频数据进行预处理,对音频数据进行压缩,并提取压缩后的音频数据中的第一音频特征,根据训练后的预设语言模型提取第一歌词文本数据的语义编码,将语义编码与第一音频特征进行结合,并将结合后的数据输入至基于语言模型生成的音乐分类模型以进行训练,并根据训练后的音乐分类模型确定待分类音乐的音乐流派。本申请实施例所提供的方案通过训练完成后的分类模型确定待分类音乐的流派,提升了音乐流派分类的准确性。
  • 基于文本信息的音频分类方法、装置、设备及介质-202310652068.7
  • 葛建帮;李嘉豪;高良心;黄凌云 - 平安科技(深圳)有限公司
  • 2023-06-02 - 2023-09-01 - G06F16/65
  • 本申请涉及人工智能技术领域,提出一种基于文本信息的音频分类方法、装置、电子设备及存储介质,所述方法包括:将获取到的音频数据转换为音频文本以获取音频分词数据集;筛选分词数据集以构建音频关键词表;基于音频文本和音频关键词表构建文本句索引数据集;基于文本句索引数据集训练自定义文本分类模型;依据经过训练的自定义文本分类模型获取目标音频的文本信息特征;依据集成学习模型对音频特征和文本信息特征进行筛选以获取音频分类显著特征;基于音频分类显著特征和集成学习模型对目标音频进行分类。本申请通过综合音频数据的音频特征和文本特征,同时在文本中融入关键词的方式来对音频数据进行分类,可以有效提高对音频分类的准确度。
  • 音频分类方法和装置、电子设备及存储介质-202310568337.1
  • 张旭龙;王健宗;程宁;孙一夫 - 平安科技(深圳)有限公司
  • 2023-05-19 - 2023-08-25 - G06F16/65
  • 本申请实施例提供了一种音频分类方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取样本视频数据;对样本视频数据进行特征提取,得到样本图像数据、样本文本数据、样本音频数据;通过预设的初始匹配模型对样本音频数据、样本文本数据进行语义匹配,得到第一匹配数据;通过初始匹配模型对样本音频数据、样本图像数据进行语义匹配,得到第二匹配数据;根据第一匹配数据、第二匹配数据对初始匹配模型进行参数调整,得到目标匹配模型;根据目标匹配模型和预设的初始分类模型构建目标分类模型;通过目标分类模型对目标音频数据进行分类。本申请实施例能够提高音频数据分类的准确性。
  • 一种音乐搜索系统-201911025938.8
  • 刘永武;李红宇;逯强;刘江丹 - 哈尔滨师范大学
  • 2019-10-25 - 2023-08-25 - G06F16/65
  • 本发明公开了一种音乐搜索系统,包括历史音乐信息提取单元、历史音乐库、输入单元、关键字识别单元、语义分析单元、音乐类型分析单元、搜索定位单元和输出单元,搜索定位单元用于根据音乐类型分析单元分析出的分类、关键词在历史音乐库中其他所属分类中出现的概率和搜索词中的关键字/在音乐服务器中进行搜索,将音乐服务器中共同满足上述条件的搜索结果进行排序显示;本发明能够根据用户平时的听歌习惯和歌曲相关信息,综合用户输入的搜索词进行综合性的提供音乐搜索服务,音乐搜索结果能够最大限度符合用户的个性化,可以提高搜索准确性,最快时间提供一个最符合用户个性化的搜索结果供用户进行选择。
  • 面向庭审笔录自动生成的语言领域模型自适应分类方法-202310646456.4
  • 雍文渊;孔维骏;孔常青;张庆敏;檀丹丹 - 讯飞智元信息科技有限公司
  • 2023-05-31 - 2023-08-11 - G06F16/65
  • 本发明提供一种面向庭审笔录自动生成的语言领域模型自适应分类方法和装置,其中方法包括:获取庭审语音流,所述庭审语音流包括至少一段庭审语音;基于当前段的庭审语音之前的历史庭审语音的识别文本,进行庭审领域分类,得到分类结果,或者,获取庭审语音流的预设领域作为分类结果;基于分类结果对应的语言领域模型,对当前段的庭审语音进行语音识别,得到当前段的庭审语音的识别文本,并将当前段的庭审语音加入历史庭审语音进行分类结果更新,直至庭审语音流停止更新;基于各段庭审语音的识别文本,生成庭审笔录。本发明提供的面向庭审笔录自动生成的语言领域模型自适应分类方法和装置,可以提高庭审场景下语音转写的可靠性和准确率。
  • 一种歌曲推荐方法、歌曲推荐装置以及存储介质-202310663028.2
  • 黄昕;吴喆 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2023-06-06 - 2023-08-04 - G06F16/65
  • 本申请实施例公开了一种歌曲推荐方法、歌曲推荐装置以及存储介质,用于信息处理技术领域。该方法包括:获取用户在目标音乐模块中的目标听歌行为数据、以及预设音乐模块对应的听歌行为聚类;预设音乐模块中的听歌行为量大于目标音乐模块中的听歌行为量,听歌行为聚类为对预设音乐模块中的听歌行为数据进行聚类得到;确定目标听歌行为数据在听歌行为聚类中对应的目标听歌行为聚类;将目标听歌行为数据对应的特征向量以及目标听歌行为聚类对应的聚类向量进行特征融合,得到用户对应的目标听歌行为向量;将目标听歌行为向量对应的歌曲在目标音乐模块中推荐给用户,能在目标音乐模块中给该用户推荐歌曲时更加符合该用户的偏好。
  • 音乐分类方法、音乐分类装置、电子设备及存储介质-202310572879.6
  • 张旭龙;王健宗;程宁;茹港徽 - 平安科技(深圳)有限公司
  • 2023-05-19 - 2023-08-04 - G06F16/65
  • 本申请提供了一种音乐分类方法、音乐分类装置、电子设备及存储介质,属于人工智能技术领域。方法包括:获取样本音乐的样本音频数据和样本歌词数据;对样本音频数据进行音频特征提取,得到样本音频特征;对样本歌词数据进行歌词特征提取,得到样本歌词特征;基于样本音频特征和样本歌词特征,构建正音乐样本对和负音乐样本对;基于正音乐样本对和负音乐样本对对神经网络模型进行模型训练,得到音乐分类模型;获取目标音乐的目标数据;对目标数据进行特征提取,得到目标音乐的目标音乐特征;基于音乐分类模型和目标音乐特征对目标音乐进行流派评分,得到流派评分数据,并根据流派评分数据得到目标音乐的流派类别。本申请能够提高音乐分类的准确性。
  • 一种基于深度学习的音乐分类方法-202010301644.X
  • 廖建新;张磊;陈爽;王玉龙;赵海秀;王晶;刘同存 - 北京邮电大学
  • 2020-04-16 - 2023-07-28 - G06F16/65
  • 一种基于深度学习的音乐分类方法,包括:将音乐的音频文件转化成梅尔声谱图,并生成音乐标签的独热向量;将音乐的梅尔声谱图和音乐标签的独热向量分别传入卷积神经网络和循环神经网络,通过卷积神经网络获得音乐的频域和时域特征向量,通过循环神经网络获得音乐‑标签关系向量,然后将卷积神经网络和循环神经网络各自的输出向量映射到相同维度后,连接合并构成一个音乐‑标签嵌入向量;将音乐‑标签嵌入向量传入标签预测层,其输出是音乐对应每个类别标签的概率值,最后根据概率值,从所有类别标签中挑选多个类别标签作为音乐的分类。本发明属于信息技术领域,能基于音乐类别的繁多和交错关系,实现音乐类别标签的准确预测。
  • 音乐推荐方法、音乐推荐装置、电子设备及存储介质-202310571840.2
  • 张旭龙;王健宗;程宁;赵嘉豪 - 平安科技(深圳)有限公司
  • 2023-05-19 - 2023-07-25 - G06F16/65
  • 本申请提供了一种音乐推荐方法、音乐推荐装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取候选音乐和参考音乐,参考音乐根据目标对象的操作指令得到;对候选音乐进行频谱变换,得到候选音乐频谱序列,并对参考音乐进行频谱变换得到参考音乐频谱序列;对候选音乐频谱序列进行音频特征提取,得到候选音乐情感表征向量,并对参考音乐频谱序列进行音频特征提取,得到参考音乐情感表征向量;基于候选音乐情感表征向量、参考音乐情感表征向量对候选音乐和参考音乐进行相关性评分,得到音乐相关分值;根据音乐相关分值和预设的推荐数目对候选音乐进行筛选,得到目标音乐;将目标音乐推送给目标对象。本申请能够音乐推荐的准确性。
  • 一种声纹聚类方法、装置、处理设备以及计算机存储介质-201910991655.2
  • 冯晨;王健宗;彭俊清 - 平安科技(深圳)有限公司
  • 2019-10-18 - 2023-07-21 - G06F16/65
  • 本申请涉及人工智能领域,提供了一种声纹聚类方法、装置、处理设备以及计算机存储介质,用于提高声纹聚类处理的处理效率。方法包括:处理设备获取初始声纹信息的i‑vector特征信息;处理设备通过余弦计算算法,计算i‑vector特征信息中不同向量之间的余弦距离;处理设备将i‑vector特征信息中余弦距离小于距离阈值的不同向量识别为相似向量;处理设备根据相似向量以及预设的分块数量,对i‑vector特征信息进行分块处理,得到多个i‑vector子特征信息;处理设备在分别对多个i‑vector子特征信息进行无预设类别的凝聚层次聚类处理的过程中,分别将每个i‑vector子特征信息中簇间距离小于预设簇间距离的不同信息簇进行两两合并,再将两两合并之后的多个i‑vector子特征信息合并得到声纹聚类信息。
  • 一种基于多模态学习的音乐情感分类方法-202010199527.7
  • 李晓双;韩立新;李景仙 - 河海大学
  • 2020-03-20 - 2023-07-18 - G06F16/65
  • 本发明公开了一种基于多模态学习的音乐情感分类方法,包含以下步骤:数据预处理,根据所需模态信息对音乐的音频、歌词、评论分别进行预处理来获取模型的有效输入;表示学习,将每个模态使用不同的建模方式分别映射到各自的表示空间;特征提取,提取不同模态的模型映射后的特征向量,并降维至同一维度;多模态融合,将三种不同模态的特征进行级联早融合,从而建立更全面的特征表示;情感分类决策,使用融合后的特征对音乐进行有监督的情感分类。本发明的音乐情感分类方法,提供了一种基于多模态联合学习的方法,可以有效的减少目前主流的单模态模型方法存在噪声或数据缺失的不足,增加音乐情感分类的准确性和稳定性。
  • 一种用于监管领域的文本纠错方法、存储介质和装置-202111052921.9
  • 孙晓兵;齐路;唐会军;刘栓林 - 北京数美时代科技有限公司
  • 2021-09-06 - 2023-07-18 - G06F16/65
  • 本发明公开了一种用于监管领域的文本纠错方法、存储介质和装置,涉及直播领域。该方法包括:获取ASR实时转译文本,通过训练后的BERT分类模型对所述转译文本进行分类处理,并输出所述转译文本所属监管子领域,并根据所述监管子领域对所述转译文本打上标签;通过训练后的子领域BERT纠错模型对带标签的所述转译文本进行纠错处理,获得纠错文本。通过BERT分类模型对转译文本进行分类处理,经分类处理后,根据不同监管子领域文本通过对应的子领域BERT纠错模型进行纠错处理,获得纠错文本,有效的提升直播场景下监管各领域内ASR对音频转译文本的字准确率,并快速应用到相关领域。
  • 一种基于迁移学习的音频分类方法-201911365456.7
  • 杜春河;丁宁 - 广州荔支网络技术有限公司
  • 2019-12-26 - 2023-06-30 - G06F16/65
  • 本发明公开了一种基于迁移学习的音频分类方法,包括如下步骤:人工标注音频分类数据,建立音频分类数据集;收集公开的文本分类数据,建立公开数据集;筛选出公开数据集中分类在音频分类数据集类别中的数据并与音频分类数据集组成训练集;利用训练集训练分类模型;利用分类模型对音频进行分类。不需要大量标注数据,有效降低成本,集合公开数据集和音频分类数据集,保证模型效果。
  • 一种分类机器学习模型指纹提取和验证方法及其装置-202310011333.3
  • 钟焰涛;王伟 - 华润数字科技有限公司
  • 2023-01-05 - 2023-06-06 - G06F16/65
  • 本发明公开了一种分类机器学习模型指纹提取和验证方法及其装置,方法包括以下步骤:获取分类机器学习模型的边界数据值,筛选边界数据值得到指纹数据值;将指纹数据值输入至待验证学习模型中,得到待验证标签值;根据指纹数据值和待验证标签值,计算分类机器学习模型与待验证学习模型之间的性能差异值;根据性能差异值和预设的性能阈值,判断待验证学习模型是否窃取自分类机器学习模型。通过获取和筛选分类机器学习模型的边界数据值,提高指纹数据值的校验效率和降低计算量,能有效地提高待验证学习模型的断定准确率。
  • 一种音频节目分类的修正方法-201911269615.3
  • 杜春河;丁宁 - 广州荔支网络技术有限公司
  • 2019-12-11 - 2023-05-30 - G06F16/65
  • 本发明公开了一种音频节目分类的修正方法,包括:建立fasttext分类模型;通过fasttext分类模型对未分类的新音频节目进行第一次分类;判断新音频节目通过fasttext分类模型得出的第一次分类是否正确;若第一次分类不正确,则进行重新分类。可修正音频节目的分类信息,提高音频节目分类的正确率。
  • 音频的分段违规审核方法、装置、电子设备及存储介质-202310188312.9
  • 罗欢;邬雨可;颜杰;余相君 - 上海喜马拉雅科技有限公司
  • 2023-03-01 - 2023-05-26 - G06F16/65
  • 本发明提供了一种音频的分段违规审核方法、装置、电子设备及存储介质,涉及音频处理领域。通过获得待处理音频的待处理ASR文本,再对待处理ASR文本进行拆分得到与待处理音频的子音频对应的多个子文本。接着分别将每个子文本输入训练后的违规审核模型,得到每个子文本的目标违规标签向量,最后基于每个子文本的目标违规标签向量,确定每段子音频的目标违规类型标签,目标违规类型标签表征子音频为违规音频或者不违规音频。如此,通过自动化的审核方式能够及时有效的审核出违规音频,并且本方案对待处理音频进行分段审核的方式能够准确定位到较长待处理音频中的小段违规的子音频。
  • 基于迁移学习的提升长尾分布语音总体分类准确度的方法-202011532360.8
  • 谢宗霞;王艳清 - 天津大学
  • 2020-12-22 - 2023-04-11 - G06F16/65
  • 本发明公开了一种基于迁移学习的提升长尾分布语音总体分类准确度的方法,首先,通过对呈现长尾分布的数据集进行训练建立由CNN和RNN网络构成的R‑CNN模型,CNN网络用于提取语音特征,RNN网络对的CNN网络提取的语音特征进行时序建模,进一步挖掘语音信息,提取到类间可分特征,用于后续语音分类;然后,对R‑CNN模型进行两次训练,其中:第一次模型训练是将长尾分布的数据用于模型训练,得到初步的模型参数;二次模型训练是将均衡分布的数据用于模型训练,把第一次模型训练得到的CNN网络浅层参数固定,迁移到二次的模型训练中;使用二次训练后的模型进行语音分类预测,从而提升语音分类模型的总体分类效果。
  • 音频播放设备的检测方法、装置、可读介质及电子设备-202111163019.4
  • 杨伟明;郭润增;王少鸣 - 腾讯科技(深圳)有限公司
  • 2021-09-30 - 2023-04-07 - G06F16/65
  • 本申请公开了一种音频播放设备的检测方法、装置、可读介质以及电子设备,所述方法包括:获取待测音频播放设备播放的待测音频数据;根据预设分段时长对待测音频数据进行划分,得到多个待测音频片段;提取待测音频片段的待测音频特征,并对待测音频特征进行聚类预测,得到待测音频片段的预测结果;根据预测结果在预设分类库中进行匹配,以确定待测音频片段的预测类别;根据多个待测音频片段的预测类别确定待测音频播放设备的检测结果,检测结果包括正常设备和异常设备。本申请实施例可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。本申请实施例提供的技术方案细化了检测数据,提高了检测精度和准确性,计算速度快,有效提高检测效率。
  • 音频处理方法、装置、设备及计算机可读存储介质-202211088204.6
  • 朱鸿宁 - 腾讯科技(深圳)有限公司
  • 2022-09-07 - 2023-04-07 - G06F16/65
  • 本申请公开了一种音频处理方法、装置、设备及计算机可读存储介质,属于计算机技术领域。方法包括:确定待处理的多个音频片段分别对应的声纹向量,声纹向量用于指示音频片段对应的声纹特征;根据各个音频片段对应的声纹向量,确定初始相似度矩阵,初始相似度矩阵中包括任意两个音频片段对应的声纹向量之间的相似度;根据初始相似度矩阵中各行对应的动态阈值,对初始相似度矩阵进行调整,得到参考相似度矩阵;根据参考相似度矩阵确定多个音频片段中存在的音频对象的数目;根据音频对象的数目,对多个音频片段进行聚类,得到各个音频对象对应的音频片段。该方法确定的音频对象的数目的准确性较高,音频对象聚类的准确率较高,音频处理效果较好。
  • 音视频多任务学习、评估方法、计算机设备及介质-202211453411.7
  • 聂鑫;洪国伟;董治;姜涛 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2022-11-17 - 2023-04-04 - G06F16/65
  • 本申请实施例公开了一种音视频多任务学习、评估方法、计算机设备及存储介质,该方法包括:获取音视频训练数据集,音视频训练数据集包括视频训练数据、音频训练数据和标注数据;对视频训练数据进行特征提取处理,得到目标视频特征向量,以及对音频训练数据进行特征提取处理,得到目标音频特征向量;利用目标音频特征向量、目标视频特征向量以及音视频质量标签对第一深度学习神经网络模型进行训练,得到第一任务损失函数值、第二任务损失函数值和第三任务损失函数值;根据第一任务损失函数值、第二任务损失函数值和第三损失函数值调整模型参数并进行重新训练,得到音视频多任务评估模型。通过这种方式可以提高音视频多任务评估的效率和准确性。
  • 基于半监督类增量学习的音频分类方法和装置-202211676823.7
  • 许可乐;王强;王怀民;史佩昌;冯大为;王涛 - 中国人民解放军国防科技大学
  • 2022-12-26 - 2023-03-14 - G06F16/65
  • 本申请涉及一种基于半监督类增量学习的音频分类方法和装置。通过获取待分类的音频数据,将待分类的音频数据输入至基于时序一致性正则化方法和损失函数算法,在有序序列任务集合对应的数据集上逐项任务训练得到的模型,并进行半监督类增量学习,得到待分类的音频数据的分类标签,完成对音频的分类。本发明通过半监督类增量音频分类模型的时序一致性正则化方法对模型的参数持续更新,保证了模型与数据集中的音频信号样本的匹配度越来越高,从而保证模型在分类时越来越准确;通过存储在半监督类增量音频分类模型的损失函数算法过程中产生的音频样本,有效的预防了模型在学习过程中产生灾难性遗忘的问题,保障了模型在进行音频分类时的稳定性。
  • 音频帧聚类方法、装置及设备-202010314785.5
  • 王征韬 - 腾讯音乐娱乐科技(深圳)有限公司
  • 2020-04-20 - 2023-03-10 - G06F16/65
  • 本申请提供音频帧聚类方法、装置及设备,其中,方法包括:获取目标音频数据对应的距离矩阵;从该距离矩阵中确定出第一种子元素,以该第一种子元素为区域生长的起点,将该距离矩阵中满足区域生长条件的各个元素确定为第一元素,将该第一元素中的各个元素对应的音频帧的类别确定为第一类别;获取该距离矩阵包括的元素集合与第一集合之间的差集;从该差集中确定出第二种子元素,以该第二种子元素为区域生长的起点,将该距离矩阵中满足该区域生长条件的各个元素确定为第二元素,将该第二元素中的各个元素对应的音频帧的类别确定为第二类别。采用本申请实施例,可以实现将多个具有相似特征的音频帧聚类,从而提高查找效率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top