[发明专利]字幕的生成方法、服务器、终端设备及系统有效
申请号: | 201910330080.X | 申请日: | 2019-04-23 |
公开(公告)号: | CN111835988B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 潘立祥;张磊;彭俊 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N5/278 | 分类号: | H04N5/278;H04N21/488;H04N21/431;H04N21/233 |
代理公司: | 北京博雅睿泉专利代理事务所(特殊普通合伙) 11442 | 代理人: | 郭少晶 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字幕 生成 方法 服务器 终端设备 系统 | ||
本发明公开了一种字幕的生成方法、服务器、终端设备及系统,该方法包括:获取视频的语音流信息;根据所述语音流信息,获得字幕内容、所述字幕内容的起始展示时间和结束展示时间;对所述字幕内容的起始展示时间、结束展示时间对应的时间区间进行均分处理,得到所述字幕内容中各个字的起始展示时间;利用所述字幕内容、所述字幕内容中一个或多个字的起始展示时间和所述字幕内容的结束展示时间生成字幕流,并将所述字幕流发送至终端设备。
技术领域
本发明涉及字幕生成技术领域,更具体地,涉及一种字幕的生成方法、一种服务器、一种终端设备以及一种字幕的生成系统。
背景技术
随着互联网技术的发展,越来越多的用户在终端设备上观看视频。该视频可以是录播视频,也可以是直播视频。
现有技术提供的视频显示的字幕均是提前录入的,并没有实现与视频中的语音的同步性。
发明内容
本发明的一个目的是提供一种用于生成实时字幕的新技术方案。
根据本发明的第一方面,提供了一种字幕的生成方法,由服务器实施,包括:
获取视频的语音流信息;
根据所述语音流信息,获得字幕内容、所述字幕内容的起始展示时间和结束展示时间;
对所述字幕内容的起始展示时间、结束展示时间对应的时间区间进行均分处理,得到所述字幕内容中一个或多个字的起始展示时间;
利用所述字幕内容、所述字幕内容中一个或多个字的起始展示时间和所述字幕内容的结束展示时间生成字幕流,并将所述字幕流发送至终端设备。
可选地,所述方法还包括:
检测所述视频流的时间戳是否存在异常,得到检测结果;
在所述检测结果为所述视频流的时间戳存在异常的情况下,重新获取视频流的时间戳。
可选地,所述检测所述视频流的时间戳是否存在异常,得到检测结果包括:
获取所述当前视频流的时间戳和上一个视频流的时间戳,并得到所述当前视频流的时间戳和所述上一个视频流的时间戳的时间差值;
判断所述时间差值是否位于预设时间差值范围内,得到判断结果;
根据所述判断结果确定所述当前视频流的时间戳是否存在异常。
可选地,所述语音流信息包括音频数据信息和时间戳信息,其中,所述根据所述语音流信息,获得字幕内容、所述字幕内容的起始展示时间和结束展示时间包括:
获得所述音频数据信息的数据量,并根据所述音频数据信息的数据量确定所述字幕内容的相对起始展示时间和相对结束展示时间;
根据所述时间戳信息、所述字幕内容的相对起始展示时间和相对结束展示时间,得到所述字幕内容的起始展示时间和结束展示时间。
可选地,所述方法还包括:
对所述字幕内容进行分组处理,得到多组字幕内容,以使每一组字幕内容以一行字幕的形式在所述终端设备进行展示;其中,
所述利用所述字幕内容、所述字幕内容中一个或多个字的起始展示时间和所述字幕内容的结束展示时间生成字幕流包括:
根据每组字幕内容、所述每组字幕内容中一个或多个字的起始展示时间和所述每组字幕内容的结束展示时间,生成字幕流。
可选地,所述对所述字幕内容进行分组处理,得到多组字幕内容,以使每一组字幕内容以一行字幕的形式在所述终端设备进行展示包括:
利用每组字幕内容的预设字数,对每一个语音流对应的字幕内容进行分组,得到多组字幕内容;或者,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910330080.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:通信处理方法和通信处理装置
- 下一篇:预制构件连接件及混凝土预制构件连接结构