[发明专利]一种基于词移距离结合词向量的音乐文案生成方法有效
申请号: | 201811525805.2 | 申请日: | 2018-12-13 |
公开(公告)号: | CN109657212B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 彭敏;王维川;胡刚;金志欢;高望 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06F40/284;G06F16/63;G06F16/951 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 距离 结合 向量 音乐 文案 生成 方法 | ||
本发明公开了一种基于词移距离结合词向量的音乐文案生成方法,首先从音乐软件网站爬取歌曲的歌词文本、评论文本;然后对歌词文本、评论文本进行分词处理;接着对分词中得到的词语进一步使用向量化表示,获取词语的向量分布表示;计算歌曲中歌词文本向量与所有评论文本向量之间的词移距离,获得各个歌曲评论文本的词移距离排序;设定词移距离的边界值阈值N,将词移距离小于边界值阈值N的歌曲评论文本按词移距离的大小进行排序,作为筛选后的评论文本;最后将备选的评论文本进行去重处理,删除其中不符合自然语法规则的句子,添加上歌曲的属性信息作为推荐给用户的歌曲音乐文案。本发明生成的音乐文案篇幅较小,提高了人们挑选歌曲的效率。
技术领域
本发明属于信息技术领域,涉及一种自然语言处理的文本摘要生成方法,具体涉及一种结合文本的词向量嵌入表示和基于词移距离的文本相似度计算两方面优势的基于歌曲评论文本的个性化音乐文案生成方法。
背景技术
互联网时代的不断发展帮助人们可以通过更多便捷的工具获取到音乐,人们不必再购买MP3类设备专门进行音乐的听取,同时也打破了音乐传播地域的限制。但是音乐的数量与此同时飞速增长,每天都有数以百计的新歌增加到全球曲库当中,人们挑选想要听的歌曲成为当前的一大难题。
歌曲厂商为了推广歌曲时,通常会附加音乐的个性化描述或背景简介,也即音乐文案,以达到取悦听众的目的。但这些传统文案主要往往由人工编辑或筛选完成,计算机起辅助作用,来帮助文案中进行纠错及排版。同时传统编辑歌曲文案的方式费时费力,人工成本较大。对于听歌群体来讲,传统人工文案一是无法满足听歌的多元化需求,二是编辑起来耗费时间较多,且效率较低。传统听歌软件一般针对听歌多元化和效率问题选择歌单推荐,利用从众心理将热度较大的歌曲推荐给听歌群体,但是忽视了听歌群体本身的感受以及选择权。
发明内容
本发明旨在提高音乐文案生成的效率,帮助人们在更短的时间内了解歌曲、挑选歌曲,提高传统人工生成歌曲文案的时效性,改变传统人工音乐文案生成过程中的文案生成来源单一性特点,增加生成后音乐文案的篇幅可控性以及音乐文案与歌曲本身的相关性和听取歌曲人群对歌曲理解的共通性,让人们更好地选择歌曲同时享受歌曲。本发明同时克服了传统音乐文案生成耗时长、人工成本投入大、文案辐射歌曲范围小的缺陷,提出了一种以相对代价较小可以对所有歌曲进行歌曲文案生成的方法。
本发明所采用的技术方案是:一种基于词移距离结合词向量的音乐文案生成方法,其特征在于,包括以下步骤:
步骤1:从音乐软件网站爬取歌曲的歌词文本和评论文本;
步骤2:对歌曲的歌词文本和评论文本进行分词处理;
步骤3:对步骤2分词中得到的词语进一步使用向量化表示,获取词语的向量分布表示;
步骤4:计算步骤3中歌曲的歌词文本向量与所有评论文本向量之间的词移距离,获得这首歌的歌词文本和所有评论文本的词移距离排序;
步骤5:设定词移距离的边界值阈值N,将步骤4中词移距离小于边界值阈值N的歌曲文本、评论文本按词移距离大小进行排序,作为筛选后的评论文本,用于下一步音乐文本的生成工作;
步骤6:将步骤5中的筛选的评论文本进行去重处理,删除不符合语法规则的句子,添加上歌曲的基本信息作为推荐给用户的歌曲音乐文案。
本发明基于词移距离和结合词向量的音乐文案生成算法,从歌曲评论中选择出与歌曲相关的评论,相关性表现在与歌曲内容相关、与歌手相关、与歌曲主题相关上,再将评论使用句法分析处理生成歌曲文案。歌曲文案的生成在保证速度的同时也保证了文案的质量。同时生成的文案篇幅较小,提高了人们挑选歌曲的效率,方便人们增加听歌的多元化选择。
附图说明
图1为本发明实施例的流程图;
图2为本发明实施例的词移距离边界比较的效果图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811525805.2/2.html,转载请声明来源钻瓜专利网。