[发明专利]音频转写文件生成方法、相关设备及可读存储介质有效
申请号: | 202010744772.1 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111863043B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 田志强;曹亚;苏文畅;王玮 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031;G06F16/61;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 转写 文件 生成 方法 相关 设备 可读 存储 介质 | ||
本申请公开了一种音频转写文件生成方法、相关设备及可读存储介质。基于上述方案,可以将音频数据,以及,与该音频数据对应的转写结果数据,存储至一个音频转写文件中,该音频转写文件中包括至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各文件单元中的音频数据片段组成该音频数据;各文件单元中的转写结果数据片段组成该转写结果数据。当用户需要时,将该音频转写文件提供给用户,用户对该音频转写文件进行解析即可得到音频数据,以及,与音频数据对应的转写结果数据。
技术领域
本申请涉及数据处理技术领域,更具体的说,是涉及一种音频转写文件生成方法、相关设备及可读存储介质。
背景技术
随着语音识别技术的发展,音频转写技术应运而生,基于音频转写技术对音频进行处理,可以得到与音频对应的转写结果。目前,音频,以及,音频对应的转写结果是分别存储的,用户如果需要应用音频及其对应的转写结果,需要分别将存储有音频的文件及存储有音频对应的转写结果的文件,提供给用户,用户再分别对两个文件进行解析,才能得到音频及其对应的转写结果。
因此,对音频以及音频对应的转写结果的存储方式进行优化,显得尤为必要。
发明内容
鉴于上述问题,本申请提出了一种音频转写文件生成方法、相关设备及可读存储介质。具体方案如下:
一种音频转写文件生成方法,包括:
获取音频数据,以及,与所述音频数据对应的转写结果数据;
对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;
根据各所述文件单元,生成音频转写文件。
可选地,所述对所述音频数据及所述转写结果数据进行解析,得到至少一个文件单元,包括:
对所述转写结果数据进行解析,获取至少一个转写结果数据片段;
根据各转写结果数据片段对应的音频起始时间和音频结束时间,对所述音频数据进行解析,获取至少一个音频数据片段;
基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元。
可选地,所述基于所述至少一个转写结果数据片段,以及,所述至少一个音频数据片段,获取至少一个文件单元,包括:
针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段组合生成一个文件单元;
或者,
针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段进行组合,生成一个文件单元;
针对所述音频数据片段中,不存在对应转写结果数据片段的每个音频数据片段,生成一个文件单元,该文件单元中的转写结果数据片段为空。
可选地,所述根据各所述文件单元,生成音频转写文件,包括:
根据各所述文件单元,生成第一音频转写文件;所述第一音频文件包括第一文件头信息和至少一个文件块,所述第一文件头信息包括文件头总大小,所述音频数据的信息,所述转写结果数据的信息,以及各所述文件块的大小;
或者;
根据各所述文件单元,生成第二音频转写文件;所述第二音频文件包括第二文件头信息和各所述文件单元,所述第二文件头信息包括文件头总大小,所述音频数据的信息以及所述转写结果数据的信息。
可选地,所述根据各所述文件单元,生成第一音频转写文件,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010744772.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锆基非晶合金铸锭的生产方法
- 下一篇:一种含提钛尾渣的玻镁板及其制备方法