[发明专利]一种根据图片自动播放歌曲的方法及系统有效
申请号: | 201410161263.0 | 申请日: | 2014-04-21 |
公开(公告)号: | CN103927366B | 公开(公告)日: | 2017-03-22 |
发明(设计)人: | 严建峰;姚婷婷;刘志强;杨璐;李云飞;曾嘉 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 常亮 |
地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 根据 图片 自动 播放歌曲 方法 系统 | ||
技术领域
本发明属于机器学习及模式识别领域,具体涉及一种根据图片自动播放歌曲的方法及系统。
背景技术
随着信息化的迅速普及,各种类型(如文本,音频,视频等)的信息带来了信息量的急剧增加。如何将内容相近但类型不同的信息进行整合,将其根据内容进行分类,使人们在需求某一特定内容的信息时,不必受限于信息的类型,从而达到多元化信息获取的目的,目前成为亟待解决的问题。
为了处理这些不同类型的信息,需要对各种类型的信息进行基于主题模型的分类。其中,LDA(Latent Dirichlet Allocation)主题模型算法是对文字隐含主题进行建模的方法,它是一个集合概率模型,主要用于处理离散的数据集合,目前主要用在数据挖掘和自然语言处理中,可降低维度。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。
此外,PLSI(概率潜在语义索引,probabilistic latent semantic indexing)是一种常用的概率语义模型,它把文档中的每个词建模成混合模型中取出的一个样本。其中,混合模型中的成分是满足多项式分布的随机变量。文档中不同的词可能是由不同的语义所产生的。每个文档被表示为一系列的混合组成部分,因此降维变成了在固定集合语义上的一个概率分布。LDA模型的生成过程与PLSI在本质上是相同的。PLSI是从潜在的类模型中获取一个混合分解,它目前广泛应用于信息的检索与过滤、自然语言处理、机器学习和一些相关的领域。LDA与PLSI主要的区别在于:LDA把文档在主题上的分布以及主题在单词表上的分布都看作是随机变量,由超参进行控制;而PLSI把这两个分布都看作是参数。这导致随着训练文档数的增加,在测试集中,由训练集得出的模型可能会导致过拟合的现象。
当前已有很多学者在潜在狄利克雷模型(即LDA)的基础上,通过加入标签、时间因素、作者间相关性因素、监督或无监督因素等等,做出了进一步的改进。目前,主题模型的应用覆盖了文本挖掘、信息处理、图像处理等多个领域。
鉴于上述原因,本发明利用LDA主题模型将具有相似信息内容但是不同信息类型(图片和文本)的信息进行分类,提供了一种根据图片自动播放歌曲的方法及系统。使得用户可以边欣赏图片边倾听与图片情境相近的音乐,提高了人们的生活水平及情操修养。并且儿童可以边看图片边听到与图片主题相对应歌词的歌曲,增加对事物的认识,本发明对父母进行幼儿早期教育具有积极的意义。
发明内容
本发明提供一种根据图片自动播放歌曲的方法,包括以下步骤:
S1、对图片库中所有图片标注标签,对歌曲库中所有歌曲的歌词标注标签;
S2、对图片库中所有图片进行预处理得到字典,根据所述字典重构所述图片库中所有图片;
S3、扫描已经重构的图片,通过LDA得到所述图片的主题,将所述图片对应的标签添加到其自身的主题中,同时通过所述LDA得到歌曲库中歌词的主题,并将所述歌词对应的标签添加到其自身的主题中;
S4、根据图片库中图片的主题得到所述图片的标签,在歌曲库中查找到标签与所述图片的标签相同的歌词,并播放对应歌曲。
优选的,步骤S1中对所述图片及歌词分别标注的标签是属于同一个集合。
优选的,步骤S2中所述预处理的过程为:从图片库中的每张图片里选出N个碎片,每个碎片用SIFT向量表示,从所有的碎片里,用k-means聚类算法得到T个中心点,所述T个中心点构成字典。
优选的,在步骤S3中,若图片或歌词没有对应的标签,则将所述图片或歌词主题的标签作为所述图片或歌词的标签。
优选的,步骤S3中所述图片及歌词通过的LDA为相同的主题模型算法。
优选的,一个标签仅属于一个主题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410161263.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于事件的微博采集系统及方法
- 下一篇:交互式搜索及推荐方法和装置