[发明专利]截断语音文件的方法、终端设备及计算机存储介质有效
申请号: | 201710471549.2 | 申请日: | 2017-06-20 |
公开(公告)号: | CN107291676B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 高瑞 | 申请(专利权)人: | 广东小天才科技有限公司 |
主分类号: | G06F40/131 | 分类号: | G06F40/131;G06F40/194;G10L15/26 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 523860 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 截断 语音 文件 方法 终端设备 计算机 存储 介质 | ||
本发明提供了一种截断语音文件的方法、终端设备及计算机可读存储介质,涉及截取语音技术领域。该方法包括:将语音文件按照语句转换为文本文件,并记录文本文件中每个语句停顿时的文本时间点;将转换后的文本文件与语音文件按照语句进行匹配成功后,将匹配成功后的文本文件中每个语句对应的文本时间点记录为停顿时间点;收集记录的所有停顿时间点,生成时间点信息文件;将语音文件按照时间点信息文件进行截音,生成语句文件。本发明通过停顿时间点将语音文件进行截音生成单个的语句文件,可以实现批处理整段语音文件,提高了截音效率,降低了语句文件的制作成本,使得语句文件的生成过程更加简单化。
技术领域
本发明属于截取语音的技术领域,尤其涉及一种截断语音文件的方法、终端设备及计算机存储介质。
背景技术
目前人们获取电教产品中同步教材的点读数据,需要把教材中的内容进行拆解并复制到电子表格中。拆解后的每个单词或短语、每个语句分别占用电子表格中的一行,且每行对应一个相应的编号。将表格中的内容再按照人物角色进行分类,由不同音色的录音员对照表格进行录音后生成整段语音。人工将上述整段语音截断生成语句文件,每个语音文件匹配表格中的编号进行命名。最后,将这些语音文件导入点读数据中,达到点击单句听取单句的语音效果。这种截音方法效率低,且语音文件与相应的语音编号易错位匹配。
上述问题亟待解决。
发明内容
针对现有截音方法效率低,且语音文件与相应的语音编号易错位匹配的缺陷,本发明提供一种截断语音文件的方法、终端设备及计算机存储介质。
本发明实施例的第一方面提供了一种截断语音文件的方法,包括:
将语音文件按照语句转换为文本文件,并记录文本文件中每个语句停顿时的文本时间点;
将转换后的文本文件与语音文件按照语句进行匹配成功后,将匹配成功后的文本文件中每个语句对应的文本时间点记录为停顿时间点;
收集记录的所有停顿时间点,生成时间点信息文件;
将语音文件按照时间点信息文件进行截音,生成语句文件。
进一步地,将语音文件按照语句转换为文本文件,并记录文本文件中每个语句停顿时的文本时间点之前包括:
录制语音文件时,录入录音者在语句与语句之间做语气的停顿。
进一步地,将语音文件按照语句转换为文本文件,并记录文本文件中每个语句停顿时的文本时间点包括:
将语音文件导入语音识别工具;
记录通过语音识别工具识别出的文本文件,以及文本文件中每个语句的开始/停止的文本时间点;
进一步地,将转换后的文本文件与语音文件按照语句进行匹配成功后,将匹配成功后的文本文件中每个语句对应的文本时间点记录为停顿时间点包括:
将转换后的文本文件与语音文件按照语句逐一进行匹配,若成功,则将匹配成功后的文本文件中每个语句对应的文本时间点记录为停顿时间点;
若失败,则重复将语音文件按照语句转换为文本文件,直至与语音文件按照语句匹配成功;
进一步地,将语音文件按照时间点信息文件进行截音,生成语句文件包括:
将时间点信息文件导入语音截音工具;
语音截音工具通过批处理将语音文件根据时间点信息文件截断,生成语句文件。
本发明实施例的第二方面提供了一种截断语音文件的装置,包括:
记录模块,用于将语音文件按照语句转换为文本文件,并记录文本文件中每个语句停顿时的文本时间点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东小天才科技有限公司,未经广东小天才科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710471549.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种行业信息分类编码管理系统和方法
- 下一篇:一种海报管理方法、装置和系统