[发明专利]语音文件的LRC时间轴文件自动生成方法及相关设备有效
申请号: | 201710042000.1 | 申请日: | 2017-01-20 |
公开(公告)号: | CN106897379B | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 涂继宏 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F16/44 | 分类号: | G06F16/44;G10L21/02 |
代理公司: | 44381 广州德科知识产权代理有限公司 | 代理人: | 万振雄<国际申请>=<国际公布>=<进入 |
地址: | 523859 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开一种语音文件的LRC时间轴文件自动生成方法及相关设备,该方法包括:当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;然后按照语音文件的语句间隔将语音文件分成多个语音区间,并记录每个语音区间的开始时间;再依据语音识别技术识别语音文件,生成与该语音文件对应的文本文件,其中,文本文件记录了与语音区间对应的文本的开始时间;最后将文本文件与录音稿文件进行对比,并生成LRC时间轴文件。可见,实施本发明实施例,能够智能地生成语音文件的LRC时间轴文件,省去了大量的人工工作,提高了效率,降低了成本。 | ||
搜索关键词: | 语音 文件 lrc 时间 自动 生成 方法 相关 设备 | ||
【主权项】:
1.一种语音文件的LRC时间轴文件自动生成方法,其特征在于,包括:/n当没有处理完所有的语音文件时,获取未经处理的语音文件及相应的录音稿文件;/n按照所述语音文件的语句间隔将所述语音文件分成多个语音区间,并记录每个语音区间的开始时间;/n依据语音识别技术识别所述语音文件,生成与所述语音文件对应的文本文件,其中,所述文本文件记录与所述语音区间对应的开始时间;/n将所述文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件;/n所述将文本文件与所述录音稿文件进行对比,并生成LRC时间轴文件,包括:/n判断是否已经读取完所述录音稿文件的文本或者已经读取完文本文件的文本,如果没有读取完,则按预设的单位长度依次读取所述录音稿文件的文本,并将读取的文本与所述文本文件的语音区间对应的文本进行对比,若相似度小于预设的阀值,则读取文本文件的下一个单位长度文本并与录音稿文件进行对比,直到相似度达到预设的阀值;再将所述语音区间对应的文本的开始时间与读取的录音稿文件写入LRC时间轴文件;如果读取完所述录音稿文件的文本或者读取完文本文件的文本,生成整个语音文件对应的LRC时间轴文件;所述单位长度是以句号为长度,或者按照行为长度。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710042000.1/,转载请声明来源钻瓜专利网。