[发明专利]旋律的填词方法、装置及终端设备有效
申请号: | 201810905480.4 | 申请日: | 2018-08-09 |
公开(公告)号: | CN109241312B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 邓立邦 | 申请(专利权)人: | 广东数相智能科技有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文;麦小婵 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 旋律 填词 方法 装置 终端设备 | ||
1.一种旋律的填词方法,其特征在于,至少包括如下步骤:
将待填词的旋律转换为声音波形图,并按照预设的频段时间,对所述声音波形图进行拆分,得到多个拆分波形图;
依次将所述多个拆分波形图与汉字读音波形图数据库中汉字读音波形图进行相似度比较,分别获得每个所述拆分波形图对应的汉字;其中,所述汉字读音波形图数据库记录了所有汉字的汉字读音波形图;
将所有的所述拆分波形图和所有所述拆分波形图对应的汉字,按拆分顺序输出,得到所述旋律及所述旋律对应的歌词。
2.根据权利要求1所述的旋律的填词方法,其特征在于,所述汉字读音波形图数据库记录了第一汉字的汉字读音波形图;
所述第一汉字的汉字读音波形图由所述第一汉字的多个语种的音频文件转换而获得。
3.根据权利要求2所述的旋律的填词方法,其特征在于,所述第一汉字通过多渠道抓取的方式获得。
4.根据权利要求1所述的旋律的填词方法,其特征在于,所述依次将所述多个拆分波形图与汉字读音波形图数据库中汉字读音波形图进行相似度比较,分别获得每个所述拆分波形图对应的汉字,具体为:
获取每个所述拆分波形图对应的频段向量,以及获取每个所述汉字读音波形图对应的汉字读音向量;
通过余弦相似度算法,分别计算每个所述频段向量与每个所述汉字读音向量的夹角余弦值大小;
将所述余弦值由大到小进行排列,得到与每个所述拆分波形图相似度最高的汉字作为对应的汉字。
5.一种旋律的填词设备,其特征在于,包括:
旋律拆分模块,用于将待填词的旋律转换为声音波形图,并按照预设的频段时间,对所述声音波形图进行拆分,得到多个拆分波形图;
比较模块,用于依次将所述多个拆分波形图与汉字读音波形图数据库中汉字读音波形图进行相似度比较,分别获得每个所述拆分波形图对应的汉字;其中,所述汉字读音波形图数据库记录了所有汉字的汉字读音波形图;
输出模块,将所有的所述拆分波形图和所有所述拆分波形图对应的汉字,按拆分顺序输出,得到所述旋律及所述旋律对应的歌词。
6.根据权利要求5所述的旋律的填词设备,其特征在于,所述汉字读音波形图数据库记录了第一汉字的汉字读音波形图;
所述第一汉字的汉字读音波形图由所述第一汉字的多个语种的音频文件转换而获得。
7.根据权利要求6所述的旋律的填词设备,其特征在于,还包括:
汉字获取模块,用于通过多渠道抓取的方式获取所述第一汉字。
8.根据权利要求5所述的旋律的填词设备,其特征在于,所述比较模块包括余弦计算单元;
所述余弦计算单元用于获取每个所述拆分波形图对应的频段向量,以及获取每个所述汉字读音波形图对应的汉字读音向量;
通过余弦相似度算法,分别计算每个所述频段向量与每个所述汉字读音向量的夹角余弦值大小;
将所述余弦值由大到小进行排列,得到与每个所述拆分波形图相似度最高的汉字作为对应的汉字。
9.一种旋律的填词终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至4任一项所述的填词方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东数相智能科技有限公司,未经广东数相智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810905480.4/1.html,转载请声明来源钻瓜专利网。