[发明专利]音频转写文件生成方法、相关设备及可读存储介质有效
申请号: | 202010744772.1 | 申请日: | 2020-07-29 |
公开(公告)号: | CN111863043B | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 田志强;曹亚;苏文畅;王玮 | 申请(专利权)人: | 安徽听见科技有限公司 |
主分类号: | G11B27/031 | 分类号: | G11B27/031;G06F16/61;G10L15/26 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王娇娇 |
地址: | 230088 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 音频 转写 文件 生成 方法 相关 设备 可读 存储 介质 | ||
1.一种音频转写文件生成方法,其特征在于,包括:
获取音频数据,以及,与所述音频数据对应的转写结果数据;
对所述转写结果数据进行解析,获取至少一个转写结果数据片段;根据各转写结果数据片段对应的音频起始时间和音频结束时间,对所述音频数据进行解析,获取至少一个音频数据片段;基于所述至少一个转写结果数据片段,以及,所述转写结果数据片段对应的至少一个音频数据片段,得到至少一个文件单元,每个文件单元中包含音频数据片段及该音频数据片段对应的转写结果数据片段,各所述文件单元中的音频数据片段组成所述音频数据;各所述文件单元中的转写结果数据片段组成所述转写结果数据;
根据各所述文件单元,生成音频转写文件。
2.根据权利要求1所述的方法,其特征在于,所述基于所述至少一个转写结果数据片段,以及,所述转写结果数据片段对应的至少一个音频数据片段,获取至少一个文件单元,还包括:
针对每个转写结果数据片段,将所述转写结果数据片段,以及,与其对应的音频数据片段进行组合,生成一个文件单元;
针对所述音频数据片段中,不存在对应转写结果数据片段的每个音频数据片段,生成一个文件单元,该文件单元中的转写结果数据片段为空。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述文件单元,生成音频转写文件,包括:
根据各所述文件单元,生成第一音频转写文件;所述第一音频转写文件包括第一文件头信息和至少一个文件块,所述第一文件头信息包括文件头总大小,所述音频数据的信息,所述转写结果数据的信息,以及各所述文件块的大小;
或者;
根据各所述文件单元,生成第二音频转写文件;所述第二音频转写文件包括第二文件头信息和各所述文件单元,所述第二文件头信息包括文件头总大小,所述音频数据的信息以及所述转写结果数据的信息。
4.根据权利要求3所述的方法,其特征在于,所述根据各所述文件单元,生成第一音频转写文件,包括:
将各所述文件单元,划分为至少一个文件块;
根据所述音频数据、所述转写结果数据、各所述文件块,确定所述第一文件头信息;
基于各所述文件块和所述第一文件头信息,生成第一音频转写文件。
5.根据权利要求3所述的方法,其特征在于,所述根据各所述文件单元,生成第二音频转写文件,包括:
根据所述音频数据、所述转写结果数据,确定所述第二文件头信息;
基于各所述文件单元和所述第二文件头信息,生成第二音频转写文件。
6.根据权利要求4所述的方法,其特征在于,在基于各所述文件块和所述第一文件头信息,生成第一音频转写文件之后,所述方法还包括:
读取所述第一音频转写文件的第一文件头信息;
根据所述第一音频转写文件的第一文件头信息,确定所述第一音频转写文件中各文件块的起始位置和结束位置;
针对每一文件块,从所述文件块的起始位置开始至结束位置,依次读取所述文件块中的各文件单元,得到每个文件单元包含的音频数据片段以及音频转写数据片段。
7.根据权利要求5所述的方法,其特征在于,在基于各所述文件块和所述第二文件头信息,生成第二音频转写文件之后,所述方法还包括:
读取所述第二音频转写文件的第二文件头信息;
根据所述第二音频转写文件的第二文件头信息,确定所述第二音频转写文件中文件单元的起始位置;
从所述文件单元的起始位置开始,依次读取所述文件块中的各文件单元,得到每个文件单元包含的音频数据片段以及音频转写数据片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽听见科技有限公司,未经安徽听见科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010744772.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种锆基非晶合金铸锭的生产方法
- 下一篇:一种含提钛尾渣的玻镁板及其制备方法