[发明专利]一种实现逐字歌词的方法及系统在审
申请号: | 201611170762.1 | 申请日: | 2016-12-16 |
公开(公告)号: | CN108206029A | 公开(公告)日: | 2018-06-26 |
发明(设计)人: | 翟海平 | 申请(专利权)人: | 北京酷我科技有限公司 |
主分类号: | G11B27/10 | 分类号: | G11B27/10 |
代理公司: | 北京亿腾知识产权代理事务所 11309 | 代理人: | 陈霁 |
地址: | 100084 北京市海淀区农大*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 歌词 音频文件 频谱图 时间戳 逐行 时间戳信息 处理模块 歌词显示 过渡边缘 获取模块 匹配模块 转换模块 分界 复杂度 歌词字 时间点 解析 听力 播放 反馈 时机 制作 | ||
1.一种实现逐字歌词的方法,其特征在于,包括以下步骤:
获取逐字歌词所在的逐行歌词和对应的音频文件;
对所述音频文件进行音频解析,获得所述音频文件的频谱数据,根据所述频谱数据生成所述音频文件的频谱图;
根据所述逐行歌词每行的时间戳信息确定每行歌词位置在所述音频文件的频谱图相对应的位置;
根据所述逐行歌词的每行歌词位置在所述音频文件的频谱图相对应的位置,调整所述逐行歌词的每行歌词中每一个字在所述音频文件的频谱图中的对应位置,并获得逐字歌词显示的音频文件。
2.根据权利要求1所述的方法,其特征在于,所述对所述音频文件进行音频解析,获得所述音频文件的频谱数据的步骤中包括:根据傅里叶变换公式对所述音频文件进行音频解析,所述傅里叶变换公式如下所示:
其中,k=0,1,……,N-1;x(n)为音频采样;N为采样数量;j为虚数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述逐行歌词每行的时间戳信息确定每行歌词位置在所述音频文件的频谱图相对应的位置的步骤中包括:根据所述逐行歌词每行的时间戳确定所述每行歌词的起始位置和终止位置,并使所述每行歌词的起始位置和终止位置与所述音频文件的频谱图中的位置相对应。
4.根据权利要求3所述的方法,其特征在于,所述根据所述逐行歌词每行的时间戳确定所述每行歌词的起始位置和终止位置的步骤中包括:确定所述每行歌词中的每个字都是均匀分布。
5.根据权利要求1所述的方法,其特征在于,所述根据所述逐行歌词的每行歌词位置在所述音频文件的频谱图相对应的位置,调整所述逐行歌词的每行歌词中每一个字在所述音频文件的频谱图中的对应位置的步骤中包括:通过调整频谱图波形的位置来调整所述逐行歌词中每一个字的正确位置。
6.一种实现逐字歌词的系统,其特征在于,包括:
获取模块,用于获取逐字歌词所在的逐行歌词和对应的音频文件;
转换模块,用于对所述音频文件进行音频解析,获得所述音频文件的频谱数据,根据所述频谱数据生成所述音频文件的频谱图;
匹配模块,用于根据所述逐行歌词每行的时间戳信息确定每行歌词位置在所述音频文件的频谱图相对应的位置;
处理模块,用于根据所述逐行歌词的每行歌词位置在所述音频文件的频谱图相对应的位置,调整所述逐行歌词的每行歌词中每一个字在所述音频文件的频谱图中的对应位置,并获得逐字歌词显示的音频文件。
7.根据权利要求6所述的系统,其特征在于,所述转换模块具体用于,根据傅里叶变换公式对所述音频文件进行音频解析,所述傅里叶变换公式如下所示:
其中,k=0,1,……,N-1;x(n)为音频采样;N为采样数量;j为虚数。
8.根据权利要求6所述的系统,其特征在于,所述匹配模块具体用于,根据所述逐行歌词每行的时间戳确定所述每行歌词的起始位置和终止位置,并使所述每行歌词的起始位置和终止位置与所述音频文件的频谱图中的位置相对应。
9.根据权利要求8所述的系统,其特征在于,所述匹配模块具体用于,确定所述每行歌词中的每个字都是均匀分布。
10.根据权利要求6所述的系统,其特征在于,所述处理模块具体用于,通过调整频谱图波形的位置来调整所述逐行歌词中每一个字的正确位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京酷我科技有限公司,未经北京酷我科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611170762.1/1.html,转载请声明来源钻瓜专利网。