[发明专利]一种基于LDA模型的歌曲分类方法有效
申请号: | 201710129308.X | 申请日: | 2017-03-06 |
公开(公告)号: | CN106951474B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 张翔;孙伟;余璇 | 申请(专利权)人: | 上海海事大学 |
主分类号: | G06F16/63 | 分类号: | G06F16/63;G06F16/61;G06F16/638 |
代理公司: | 上海三和万国知识产权代理事务所(普通合伙) 31230 | 代理人: | 陈伟勇 |
地址: | 201306 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lda 模型 歌曲 分类 方法 | ||
本发明涉及模式识别领域,介绍了一种歌曲分类的方法。该歌曲分类方法主要是将歌曲库中的所有歌曲的相对音高以及分类数目作为LDA主题模型的输入,进而对歌曲库中的所有歌曲进行分类。这里的LDA主题模型分类方法是通过每首歌曲的相对音高之间的相似度将歌曲库中所有的歌曲分成用户指定类别数目。最终可以计算出每首歌主题类别的概率分布,即p(topick|song)。新歌曲入库可以基于歌曲库的分类结果对新入库歌曲进行分类。本发明可以用于哼唱检索系统,能够缩小基于相对音高检索时检索的范围,缩短检索的时间提高检索的效率。
技术领域
本发明涉及音乐与机器学习领域,具体涉及使用LDA模型根据歌曲旋律的相对音高对歌曲进行分类。
背景技术
随着互联网技术的发展和多媒体压缩技术的进步,数字歌曲大量涌现。在这种情况下歌曲检索就变成了海量检索,对歌曲进行分类可以大幅度缩小检索的范围,提高检索的效率。传统的歌曲检索大多是根据人工标致的关键字进行检索,也就是基于文本的歌曲检索,标注的信息有歌曲的名字、歌手、专辑等。传统的分类方式也是基于文本对歌曲进行分类,比较流行的分类方式是歌手、专辑、歌词的风格、使用的乐器、演唱方法等。但是很多人在进行歌曲的搜索时常常记不得关键的文本信息。只记得歌曲内容的只言片语,更或者只记得歌曲的部分节奏等等,这些问题给歌曲检索带来诸多麻烦,并且基于文本检索在生成歌曲库的时候工作量极大。
因为传统的基于文本的歌曲检索技术的诸多不便,于是出现了通过提取音频的特征信息进行检索的基于内容的歌曲检索技术。基于内容的歌曲检索技术只需用户记得部分关键信息便能进行检索,弥补了传统检索的不足。基于内容的歌曲检索所使用的关键信息有音频指纹、歌曲旋律等,这些都可从用户记住的信息中获取。哼唱检索是基于内容的歌曲检索方式的一种。随着多种旋律匹配算法的出现,基于旋律的哼唱检索方式得到了很大的发展。但歌曲量比较大,检索的范围比较广是目前哼唱检索技术所面临的难题。因此,寻找基于旋律的歌曲分类方法是一个急迫的问题。
隐式狄利克雷分配(Latent Dirichlet allocation,LDA)是一种主题模型,该模型原本用于文本,是一种对文档内容高度压缩通过文档相似度对文档进行分类的模型。LDA模型是一种词袋模型,即假设文档没有任何语法和句法,只是一组词的结合,词与词之间没有任何的顺序。它假设一篇文章中有多个主题,而每个主题又有多个词。LDA主题模型根据文档内容的相似度可以计算出每篇文章主题的概率分布。另外LDA主题模型是一种无监督学习算法,在运行时不需要任何手动的输入,只需在运行前设置好分类数目。分类后对于每一类主题都有一些对主题“贡献度”较高的词,这些词能够很好的描述该类。LDA主题模型常用领域有文本识别、文本分类以及文本相似度计算等。
发明内容
为了解决现今哼唱检索范围太大效率太低的问题,本发明的目的在于弥补传统检索方法所面临的不足,提出一种基于歌曲内容对歌曲进行分类的方法。
本发明提出的技术方案是一种基于LDA模型的歌曲分类方法,其特征是所述方法包括下列两个步骤,步骤1.1和步骤1.2。
步骤1.1、提取歌曲库中每首歌曲的相对音高集作为歌曲的标志数据用于分类。
步骤1.2、基于用户输入的分类个数K与歌曲库中所有歌曲的相对音高集使用LDA模型对歌曲进行分类。
步骤1.1包括以下步骤:
步骤11:用户通过旋律提取算法提取出歌曲库中每首歌曲的音高集。这里音高按时间排序,可以通过设置采样频率的大小控制时间片的大小。
步骤12:音高集中小于等于零的值视为无效信息。删除音高集中的无效信息,得到多个音高序列片段。
步骤13:对照音高频率表去掉音高序列片段中每个音高的误差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海海事大学,未经上海海事大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710129308.X/2.html,转载请声明来源钻瓜专利网。