[发明专利]一种字幕生成方法、装置、电子设备及可读存储介质在审

申请号：	202210748491.2	申请日：	2022-06-28
公开（公告）号：	CN115150567A	公开（公告）日：	2022-10-04
发明（设计）人：	徐雪萍;陈海涛	申请（专利权）人：	成都爱奇艺智能创新科技有限公司
主分类号：	H04N5/278	分类号：	H04N5/278;G10L25/51
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	李清风
地址：	610096 四川省成都市自由贸***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种字幕生成方法装置电子设备可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例提供了一种字幕生成方法、装置、电子设备及可读存储介质，其中，方法包括获取目标音频和目标文本，目标音频与目标文本相匹配；确定目标解码图；将目标音频输入所述目标解码图，得到目标文本中的每个字符与目标音频中的音频帧的对应关系；根据对应关系，确定目标文本的每个文本片段的时间信息，时间信息包括起始时刻和持续时长，每个文本片段包括至少一个字符；在输出目标音频的过程中，根据目标文本的每个文本片段的时间信息，输出目标文本的每个文本片段对应的字幕。本发明实施例提供的字幕生成方法可以提高字幕制作的效率。

技术领域

本发明涉及多媒体处理技术领域，特别是涉及一种字幕生成方法、装置、电子设备及可读存储介质。

背景技术

随着知识、信息获取方式的多元化，人们的阅读习惯也发生着改变，有声读物在此场景下应运而生。有声读物即为有声读物，如有声新闻，有声小说，儿童有声读物等。有声读物是通过视频软件做出有声读物的背景视频及字幕，然后为该有声读物录入对应的声音得到的。

目前，有声读物的字幕制作采用人工标注的方式，该方式效率较低。

发明内容

本发明实施例的目的在于提供一种字幕生成方法、装置、电子设备及可读存储介质，以提高字幕制作的效率。具体技术方案如下：

在本发明实施的第一方面，首先提供了一种字幕生成方法，包括：

获取目标音频和目标文本，所述目标音频与所述目标文本相匹配；

确定目标解码图；

将所述目标音频输入所述目标解码图，得到所述目标文本中的每个字符与所述目标音频中的音频帧的对应关系；

根据所述对应关系，确定所述目标文本的每个文本片段的时间信息，所述时间信息包括起始时刻和持续时长，每个所述文本片段包括至少一个字符；