[发明专利]语音文件的LRC时间轴文件自动生成方法及相关设备有效
申请号: | 201710042000.1 | 申请日: | 2017-01-20 |
公开(公告)号: | CN106897379B | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 涂继宏 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/44 | 分类号: | G06F16/44;G10L21/02 |
代理公司: | 44381 广州德科知识产权代理有限公司 | 代理人: | 万振雄<国际申请>=<国际公布>=<进入 |
地址: | 523859 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 文件 lrc 时间 自动 生成 方法 相关 设备 | ||
本发明实施例公开一种语音文件的LRC时间轴文件自动生成方法及相关设备,该方法包括:当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;然后按照语音文件的语句间隔将语音文件分成多个语音区间,并记录每个语音区间的开始时间;再依据语音识别技术识别语音文件,生成与该语音文件对应的文本文件,其中,文本文件记录了与语音区间对应的文本的开始时间;最后将文本文件与录音稿文件进行对比,并生成LRC时间轴文件。可见,实施本发明实施例,能够智能地生成语音文件的LRC时间轴文件,省去了大量的人工工作,提高了效率,降低了成本。
技术领域
本发明涉及多媒体技术领域,尤其涉及一种语音文件的LRC时间轴文件自动生成方法及相关设备。
背景技术
目前对于学习终端或者家教终端中的英语听说或者有声教材模块使用的数据均是教材同步课文的语音和对应的文字数据,也即常用的MP3+LRC的形式。对同步于语音文件的文本数据,目前的制作方法中,需要完全人工进行拆分、文字识别、对文本数据进行语音录制、制作时间轴文件、人工校对等等,制作方式步骤多,制作效率比较低、耗时长、制作成本代价高。
发明内容
本发明实施例公开了一种语音文件的LRC时间轴文件自动生成方法及相关设备,大大提高了制作LRC时间轴文件的效率。
本发明实施例第一方面公开一种语音文件的LRC时间轴文件自动生成方法,包括:
当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;
按照所述语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间;
依据语音识别技术识别所述语音文件,生成与所述语音文件对应的文本文件,其中,所述文本文件记录与所述语音区间对应的开始时间;
将所述文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件。
作为一种可选的实施方式,在本发明实施例第一方面中,所述方法中将文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件的步骤包括:
判断是否已经读取完所述录音稿文件的文本或者已经读取完文本文件的文本,如果没有读取完,则按预设的单位长度依次读取所述录音稿文件的文本,并将读取的文本与所述文本文件的语音区间对应的文本进行对比,若相似度小于预设的阀值,则读取文本文件的下一个单位长度文本并与录音稿文件进行对比,直到相似度达到预设的阀值;再将所述语音区间对应的文本的开始时间与读取的录音稿文件写入LRC时间轴文件;如果读取完所述录音稿文件的文本或者读取完文本文件的文本,生成整个语音文件对应的LRC时间轴文件。
作为一种可选的实施方式,在本发明实施例第一方面中,所述按照语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间的步骤之后,所述方法还包括:
依据语种识别技术识别出各语音区间音频发音的语言种类;
再根据识别的语言种类调用对应的语音识别接口进行语音识别,生成与所述语音文件对应的文本文件。
作为一种可选的实施方式,在本发明实施例第一方面中,所述获取未经处理的语音文件及相应的录音稿文件的步骤之后,所述方法还包括:
按预设的降噪值和音频分贝值对所述语音文件进行预处理,从而提升语音识别成文本的精度。
作为一种可选的实施方式,在本发明实施例第一方面中,所述生成LRC时间轴文件的步骤之后,所述方法还包括:
将所述语音文件与所述LRC时间轴文件加密打包生成用户设备使用的数据。
本发明实施例第二方面公开一种语音文件的LRC时间轴文件自动生成装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710042000.1/2.html,转载请声明来源钻瓜专利网。