[发明专利]视频生成方法及装置有效

专利信息
申请号: 202011481666.5 申请日: 2020-12-15
公开(公告)号: CN112637670B 公开(公告)日: 2022-07-29
发明(设计)人: 汤然;王一;郑龙;何钧 申请(专利权)人: 上海哔哩哔哩科技有限公司
主分类号: H04N21/435 分类号: H04N21/435;H04N21/44;H04N21/431;H04N21/488
代理公司: 北京智信禾专利代理有限公司 11637 代理人: 刘晓楠
地址: 200433 上海市*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 本申请提供视频生成方法及装置,其中所述视频生成方法包括:从目标视频中获取目标视频帧,并获取所述目标视频帧对应的弹幕文件;确定所述目标视频帧对应的蒙版文件;根据所述蒙版文件,将所述弹幕文件绘制到所述目标视频帧中,生成弹幕视频帧;将所述弹幕视频帧组合成所述目标视频对应的弹幕视频。如此,可以直接根据蒙版文件,将弹幕内嵌进入视频帧内,且不渲染蒙版范围内的弹幕,达到内嵌蒙版弹幕的效果,避免画面被弹幕遮挡,保证用户正常观看;其次,由于此时视频和弹幕是一体的,不会因为播放器卡顿造成蒙版弹幕和视频实际内容的不同步,提高了用户观感,保证用户观看视频的体验。
搜索关键词: 视频 生成 方法 装置
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海哔哩哔哩科技有限公司,未经上海哔哩哔哩科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202011481666.5/,转载请声明来源钻瓜专利网。

同类专利
  • 应用于直播场景的跨屏互动方法、装置、设备及介质-202311203530.1
  • 刘祖渊;杨白云 - 星河视效科技(北京)有限公司
  • 2023-09-19 - 2023-10-27 - H04N21/435
  • 本发明公开了一种应用于直播场景的跨屏互动方法、装置、设备及介质,涉及直播技术领域,通过实时收集和分析观众的互动反馈,如评论和弹幕,进而为主播展示情感反馈图,可帮助其迅速把握直播间氛围,同时,系统会自动对正向和负向情感分数进行高亮提示,并将关键时段的直播内容存储和分类,从而增强主播与观众间的交互体验,提高直播的质量和观众满意度。通过系统分析正向和负向的直播主题,可以帮助直播平台和主播选择正向的直播主题以提高观众观看直播的热情。
  • 一种端到端字幕生成方法、装置、电子设备和存储介质-202311171397.6
  • 赵子厚;杨松;杨波 - 飞狐信息技术(天津)有限公司
  • 2023-09-12 - 2023-10-20 - H04N21/435
  • 本申请公开了一种端到端字幕生成方法、装置、电子设备和存储介质,该方法和装置应用于电子设备,具体为获取待生成字幕的原始音视频材料;基于预先训练的语音识别模型对原始音视频材料中的音频数据进行识别处理,得到包括多个字符的文本材料;对文本材料进行断句处理,得到包括多个单句的第一优先权列表;基于预设的单句长度阈值对第一优先权列表进行处理,得到字幕文件,字幕文件包括多个符合字幕显示特点的字幕断句。本方案可以基于电子设备自动完成字幕文件,而无需人工操作,从而节省了大量的人力物力,且提高了效率。
  • 多媒体文件播放方法、装置及可读存储介质-202310826867.1
  • 葛盼盼;黄栋;胡苏;顾明;饶明佺 - 咪咕文化科技有限公司;中国移动通信集团有限公司
  • 2023-07-06 - 2023-10-13 - H04N21/435
  • 本申请公开了一种多媒体文件播放方法、装置及可读存储介质,涉及移动音视频直播技术领域。该多媒体文件播放方法,包括:确定目标多媒体文件的当前播放时刻对应的目标角色对的情感进度;在所述目标多媒体文件的播放界面中的情感播放进度条中显示所述当前播放时刻对应的目标角色对的情感进度;其中,所述情感播放进度条用于指示所述目标多媒体文件中所述目标角色对的情感进度。上述方案,通过在目标多媒体文件的播放界面中的实时进行目标角色对的情感进度的显示,以此提升基于播放进度条的观看者粘合度。
  • 基于语言模型的营销视频生成方法、系统、设备及介质-202310830822.1
  • 陈开冉;黎展;黄志文 - 广州探迹科技有限公司
  • 2023-07-06 - 2023-10-10 - H04N21/435
  • 本发明提出了一种基于语言模型的营销视频生成方法、系统、设备及介质,方法包括:获取目标场景信息,根据所述目标场景训练所述语言模型;采集第一文本信息以及背景视频;确定所述背景视频对应的目标场景,通过所述语言模型对所述第一文本信息进行文本加工,生成第二文本信息;第二文本信息经预处理后获取第三文本信息,所述第三文本信息经转换接口生成对应的背景音频;根据所述背景视频、背景音频以及第三文本信息生成营销视频。本发明通过目标场景下训练的语言模型,生成具备营销特点的长文案,提升营销视频的质量,减轻了工作量,大幅提高效率。
  • 一种基于golang的高并发信号处理平台-202310841942.1
  • 朱利人 - 奥视(天津)科技有限公司
  • 2023-07-11 - 2023-10-10 - H04N21/435
  • 本发明提供了一种基于golang的高并发信号处理平台,包括视频处理模块、弹幕渲染模块、并发协调模块;视频处理模块记录和转换数字音频和视频,并将其转化为流数据;视频处理模块对多个任务进行多线程处理;视频处理模块将一些常用的资源存储至内存中,进行复杂操作前,通过操作系统进行预先提取;当用户输入弹幕时,弹幕渲染将弹幕图片投放至视频流中;并发协调模块将任务按照优先级分配到不同的队列中,通过协程池来消费,消息队列中的任务。本发明有益效果:具有高效并发控制和协程调度的能力,内存消耗低,跨平台支持,运行速度快。
  • 信息处理设备、信息处理方法-201980018039.7
  • 山岸靖明 - 索尼公司
  • 2019-03-01 - 2023-10-10 - H04N21/435
  • 该信息处理装置设置有:AV解码器41,其获取并再现包括能够使用用于处理来自用户的语音请求的服务的服务对象的视频数据;以及应用程序执行环境43,其将用于向用户教导该服务对象的附加图像添加到再现的视频。附加图像具有对于每个服务对象唯一的视觉特征,使得该服务对象由服务中的语音识别唯一地确定。
  • 视频信息生成方法、装置、电子设备及可读存储介质-202310778812.8
  • 叶小卫;夏安享;朱强;沈丽倩;朱欣灿 - 中国电信股份有限公司
  • 2023-06-28 - 2023-10-03 - H04N21/435
  • 本申请实施例提供了一种视频信息生成方法、装置、电子设备及可读存储介质,属于数据处理领域,所述方法包括:获取待处理视频对应的目标图像;其中,所述目标图像包括所述待处理视频的至少一帧画面;确定所述目标图像中的目标对象,并根据所述目标图像生成所述目标对象对应的状态属性词,以及获取所述目标图像对应的场景属性词;根据所述目标对象、所述状态属性词以及所述场景属性词,生成所述目标图像对应的画面文本;根据所述画面文本确定所述待处理视频对应的视频信息。可以提高视频信息的准确度以及获取效率。
  • 图像处理方法、装置、设备和存储介质-202310722493.9
  • 李凤山;高上;冷志勇 - 北京花房科技有限公司
  • 2023-06-16 - 2023-09-19 - H04N21/435
  • 本发明实施例提供一种图像处理方法、装置、设备和存储介质,该方法包括:终端设备响应于用户触发的选择操作,在视频文件中确定目标图像帧。其中,视频文件包括对至少一张原始图像进行视频编码得到的至少一张图像帧,目标图像帧为至少一张图像帧中的任一张,任一张原始图像包含直播界面中显示的虚拟对象。然后,终端设备借助硬件解码模块对该目标图像帧进行解码。最终,终端设备渲染该解码结果。可见,终端设备是借助硬件解码模块进行视频文件中的目标图像帧的解码,因此,可以提高图像解码的速度,并进一步降低图像的渲染延迟。
  • 一种虚拟空间的评论数据处理方法、装置及电子设备-202310753205.6
  • 刘康俊;吴亚光 - 北京万物镜像数据服务有限公司
  • 2023-06-26 - 2023-09-19 - H04N21/435
  • 本公开涉及一种虚拟空间的评论数据处理方法、装置及电子设备,属于计算机信息处理技术领域。虚拟空间的评论数据处理方法包括:获取虚拟空间内至少一个用户的空间评论记录数据;根据至少一个空间评论记录数据的空间位置信息和时间信息,对评论数据进行聚类处理,得到至少一个聚类分组;每个聚类分组分别对应一个场景空间;对每个聚类分组对应的场景空间进行划分,得到多个体块;显示体块内用户的评论数据。本公开实现了在虚拟空间中对评论数据的精准定位,从而使得用户可以在元宇宙的虚拟空间中随心所欲地发送评论数据。
  • 直播方法、终端设备及系统-202210191933.8
  • 李晓林 - 青岛海信商用显示股份有限公司
  • 2022-02-28 - 2023-09-05 - H04N21/435
  • 本申请实施例提供一种直播方法、终端设备及系统,该方法包括:按照预设采样周期采集轨迹消息以及音频信号,根据轨迹消息获得轨迹数据,并对音频信号进行处理获得音频数据;将轨迹数据以及音频数据分别通过第一声道和第二声道同步传输至第二终端,第二终端解析轨迹数据获得待显示轨迹消息,对音频数据进行处理获得待播放音频信号,使得第二终端播放待播放音频信号以及显示待显示轨迹消息,提高了远程授课的效果。
  • 弹幕的控制方法、装置、电子设备和存储介质-202111276356.4
  • 江婧轩;高烨 - 北京字跳网络技术有限公司
  • 2021-10-29 - 2023-08-29 - H04N21/435
  • 本公开实施例提供了一种弹幕的控制方法、装置、电子设备和存储介质。该方法包括:播放设置有目标视频贴纸的目标视频,其中,所述目标视频贴纸中包含第一选项和第二选项;在所述目标视频的播放过程中,控制所述目标视频中的第一弹幕和第二弹幕沿不同轨迹在弹幕显示区域中移动,其中,所述第一弹幕通过触发所述第一选项生成,所述第二弹幕通过触发所述第二选项生成。本公开实施例通过采用上述技术方案,能够提供多样化的弹幕显示方式,满足用户多样化的弹幕交互需求。
  • 推广信息显示方法及装置-202310602668.2
  • 吴小勇;张子豪;刘邦;豆成权 - 优酷网络技术(北京)有限公司
  • 2023-05-25 - 2023-08-22 - H04N21/435
  • 本申请实施例提供一种推广信息显示方法及装置,该方法包括:根据外挂字幕文件获取目标视频对应的字幕文本。在字幕文本中提取目标字段。获取与目标字段相匹配的目标推广信息。将目标推广信息显示在屏幕中。通过根据外挂字幕文件,简单快速的获取到目标视频的完整字幕文本,保证原始信息量的充足性,之后再从字幕文本中提取出存在推广价值的目标字段,然后将与目标字段相匹配的目标推广信息显示在屏幕中,因为字幕和视频内容是强相关的,因此基于对字幕文本的分析进行广告投放,可以有效保证广告投放的准确性和关联性,同时上述的自动分析并匹配的处理过程,可以快速高效的实现广告投放的处理。
  • 弹幕素材生成方法、推荐方法、装置、设备、介质及产品-202111581487.3
  • 张继丰 - 北京百度网讯科技有限公司
  • 2021-12-22 - 2023-08-18 - H04N21/435
  • 本公开提供了一种弹幕素材生成方法、推荐方法、装置、设备、介质及产品,涉及人工智能技术领域,具体涉及语音识别技术领域。具体实现方案为:获取直播的多媒体数据;在所述直播的多媒体数据中,确定用于生成弹幕素材的目标数据;对所述目标数据进行处理,得到与所述目标数据对应的弹幕素材。本公开能够及时根据直播过程中实时播放的多媒体数据生成弹幕素材。在用户需要发送弹幕时,及时向用户推荐实时生成的弹幕素材,能够满足用户参与弹幕梗以及及时参与互动的需求。
  • 视频标题的提取方法及装置-202310588056.2
  • 冯舒扬;张婕蕾 - 上海哔哩哔哩科技有限公司
  • 2023-05-23 - 2023-08-08 - H04N21/435
  • 本申请提供视频标题的提取方法及装置,其中视频标题的提取方法包括:对待处理视频进行抽帧,获得至少一个视频帧,并对视频帧进行文本识别,获得视频帧包括的至少一个文本对象;根据设定文本过滤策略,从至少一个视频帧中确定候选视频帧,并确定候选视频帧包括的候选文本对象,其中,设定文本过滤策略基于待提取的目标标题设置;对不同候选视频帧包括的候选文本对象进行关联,获得候选标题集合;根据候选标题集合,确定待处理视频包括的目标标题。如此,通过待提取的目标标题对应的约束策略,可以滤除与待提取的目标标题不相关的文本内容,然后通过不同候选视频帧之间的文本对象追踪,可以滤除不同视频帧之间大量相同的冗余信息。
  • 音频弹幕的处理方法、装置、电子设备和可读存储介质-202310560235.5
  • 郭阳敏 - 维沃移动通信有限公司
  • 2023-05-18 - 2023-08-04 - H04N21/435
  • 本申请公开了一种音频弹幕的处理方法、装置、电子设备和可读存储介质,属于音频处理领域。音频弹幕的处理方法,包括:获取视频中的第一音频和第二音频,第一音频是包含人声的音频,第二音频是不包含人声的音频;获取第一音频弹幕;根据第一音频弹幕与第一音频确定第一音频弹幕的分类结果;根据分类结果对应的策略,在播放第二音频的情况下,播放第一音频弹幕。
  • 用于自动字幕显示的系统和方法-201910930371.2
  • G.加纳佩西 - 哈曼国际工业有限公司
  • 2019-09-29 - 2023-08-01 - H04N21/435
  • 本公开涉及用于自动字幕显示的系统、装置和方法。在一个实施方案中,提供了一种方法,所述方法包括确定用于空间的对话语言,以及识别在所述空间中在显示器上呈现的显示内容。所述方法还可以包括基于针对所述空间确定的所述对话语言而请求用于所述显示内容的字幕数据,以及由所述控制装置控制用于所述显示内容的字幕数据的呈现,以便在装置上输出,其中针对所述确定的对话语言选择呈现的字幕数据。过程和配置可以包括通过语音辨识、面部辨识和用户简档设置中的一个或多个来确定对话语言。另外,可以针对车舱以及一般的显示装置的观看区域中的显示器来提供自动字幕显示。
  • 视频字幕生成方法、装置、介质及电子设备-202310457969.0
  • 孙修松;马泽君 - 北京有竹居网络技术有限公司
  • 2023-04-25 - 2023-07-21 - H04N21/435
  • 本公开涉及一种视频字幕生成方法、装置、介质及电子设备,方法包括:获取目标音频;确定所述目标音频中的事件在所述目标音频中持续的事件时间范围,所述事件包括在所述目标音频中的语音片段中发生的事件和在所述目标音频中的非语音片段中发生的事件;根据所述事件在所述目标音频中持续的事件时间范围,将所述事件对应的事件标签作为字幕添加到视频对应该事件时间范围的视频帧中,所述视频为与所述目标音频对应的视频,提升了视频字幕展示的效果。
  • 直播间亲密度展示方法、装置、电子设备及存储介质-202111682973.4
  • 汪刚 - 武汉斗鱼鱼乐网络科技有限公司
  • 2021-12-31 - 2023-07-11 - H04N21/435
  • 本公开提供了一种直播间亲密度展示方法,包括:在检测到与目标主播相关的至少一个直播间处于开播状态时,接收服务器发送的数据列表,数据列表包含目标主播和用户之间的亲密度信息;将数据列表分别分配至多个目标直播间;在多个目标直播间中展示亲密度信息;其中,目标直播间为与目标主播相关联且处于开播状态的直播间。本公开还提供一种直播间亲密度展示装置、电子设备以及存储介质。服务器将包含目标主播与用户之间的亲密度信息的数据列表发送到终端中,由终端处理数据列表的数据后,向用户展示相应的亲密度信息。由此减少了服务器的工作量,降低了服务器的运行压力,同时不需要额外创建获取数据的请求接口,简化了直播间展示亲密度的方法。
  • 一种视频合成方法及装置-202111671074.4
  • 任龙;马兆祥;郑德峰 - 北京字跳网络技术有限公司
  • 2021-12-31 - 2023-07-11 - H04N21/435
  • 本发明实施例提供了一种视频合成方法及装置,涉及视频处理技术领域。该方法包括:接收视频合成指令,所述视频合成指令用于指示对至少两个视频片段进行合成;确定所述视频合成装置的硬件配置参数;根据所述硬件配置参数确定所述视频合成装置的性能信息;根据所述性能信息和预设对应关系,确定第一分辨率和第一帧率;所述预设对应关系包括所述性能信息与所述第一分辨率和所述第一帧率的对应关系;基于所述第一分辨率和所述第一帧率对所述至少两个视频片段进行合成。本发明实施例用于平衡视频合成的稳定性和合成的视频的质量。
  • 一种溯源视频的获取方法及相关装置-202211731448.1
  • 崔秋松;戴雪飞;周圣强;黄岗 - 苏州万店掌网络科技有限公司
  • 2022-12-30 - 2023-06-27 - H04N21/435
  • 本申请公开了一种溯源视频的获取方法,包括:响应于扫码设备的扫码指令,拦截所述扫码设备的扫描记录;基于预设格式将所述扫描记录封装为视频请求指令;将所述视频请求指令发送至云管理平台,以便所述云管理平台基于所述视频请求指令中的扫描记录获取目标时间段内对应的视频,并作为溯源视频进行保存。通过当扫码设备进行扫码时直接拦截扫码设备的扫描数据,并封装为视频请求指令发送到云平台,该云平台直接基于指令获取到对应的溯源视频,应用于不同的设备时不需要再重新进行配置,避免了因不同设备而需要的重新对接,提高了获取溯源视频的效率。本申请还公开了一种溯源视频的获取装置、服务器以及计算机可读存储介质,具有以上有益效果。
  • 视频生成方法、装置、电子设备和存储介质-202110057581.2
  • 莫唯书 - 北京字跳网络技术有限公司
  • 2021-01-15 - 2023-06-27 - H04N21/435
  • 本公开实施例提供了一种视频生成方法、装置、电子设备和存储介质。该方法包括:接收采用目标音乐生成视频的第一触发操作;响应于所述第一触发操作,基于所述目标音乐的第一音乐特征信息,自用户的候选素材集中选取与所述目标音乐匹配的候选素材作为目标候选素材,并依据所述目标候选素材生成目标视频,所述目标视频以所述目标音乐作为背景音乐。本公开实施例通过采用上述技术方案,可以自动根据用户所选择的音乐,利用与该音乐匹配的素材生成视频,能够降低视频的制作门槛,缩短用户制作视频所耗费的时间,并能够提高所生成的视频与用户所选择的音乐的匹配度,提升所生成视频的质量。
  • 一种全感数字人直播系统及其操作方法-202310177627.3
  • 林云帆;林龙;符志成 - 广州数娱信息科技有限公司
  • 2023-02-28 - 2023-06-13 - H04N21/435
  • 本发明公开了一种全感数字人直播系统及其操作方法,包括场景模块,预览模块,直播工具栏模块,输出模块以及文案播报模块,场景模块能够插入不同类型的若干层,且场景模块通过拖拉调节若干层之间的层叠关系,预览模块内设置预览窗,输出模块内设置输出窗;文案播报模块支持导入xls格式的文案库,文案库提取主持人带有关键字的整行,且能够对文案库中的文案进行自动分段,文案库导入后自动按顺序调用接口生成视频。通过AI自动匹配或半人工决策方式进行互动播放处理,解决直播场景过程中,数字内容生产、直播间互动、数字互动白板提示、画面融合等核心问题;能够降低门槛拥有更稳定、超写实、智能化的数字主播,实现企业生产力的真正解放。
  • 一种显示设备、页面显示方法及存储介质-202211637780.1
  • 刘浩;赵文慧 - 海信视像科技股份有限公司
  • 2022-12-16 - 2023-06-09 - H04N21/435
  • 本公开涉及一种显示设备、页面显示方法及存储介质,涉及显示设备技术领域。其中,显示设备包括:控制器被配置为:控制显示器显示设置页面,设置页面中包括多个菜单项;获取各个菜单项对应的操作属性,操作属性用于指示对应菜单项是否可操作;在确定焦点处于第一菜单项所处的区域内,且第一菜单项对应的操作属性指示第一菜单项不可操作的情况下,加载第一菜单项对应的引导信息,引导信息包括第一菜单项不可操作的说明信息和/或解决策略;控制显示器显示引导信息。本公开实施例用于自动显示置灰菜单项对应的引导信息。
  • 互动视频多画面呈现方法及装置、存储介质和终端-202310028674.1
  • 唐高望 - 杭州米络星科技(集团)有限公司
  • 2023-01-09 - 2023-06-09 - H04N21/435
  • 本发明公开了一种互动视频多画面呈现方法及装置、存储介质和终端,其中方法包括:获取多路待合并视频,并将待合并视频解码为对应的待合并视频数据流;按常规布局方式将所有待合并视频数据流合并为合成视频数据流,获取合成视频数据流的画面布局信息,并基于合成视频数据流和画面布局信息生成合成画面视频,并将合成画面视频推流至云服务器平台,以使得观看端从云服务器平台获取到合成画面视频后,可基于画面布局信息对合成视频数据流的画面显示布局进行调整;其中画面布局信息包括合成视频数据流的画面显示中每路视频画面的位置信息。本发明在仅需要合成一条合成画面视频的基础上,为用户提供了多种画面呈现方式,减少合流转推的数量,大大降低服务器资源占用,节省成本。
  • 一种客户端占用空间优化方法及装置-202011617662.5
  • 张冬雪 - 百果园技术(新加坡)有限公司
  • 2020-12-30 - 2023-06-02 - H04N21/435
  • 本申请实施例公开了一种客户端占用空间优化方法及装置。该方法包括:从分布式数据库中获取离线的优选规则信息和内存空间阈值信息;针对首次启动客户端的移动端,根据移动端的内存空间信息和内存空间阈值信息,确认向客户端发送基础礼物信息或者个性化礼物信息;若向客户端发送个性化礼物信息,则从分布式数据库中获取客户端用户的离线数据,根据该离线数据和优选规则信息,生成个性化礼物信息,并将个性化礼物信息发送至客户端;在预设时间节点,从分布式数据库中获取客户端用户的离线数据,根据该离线数据和优选规则信息,生成礼物保留信息,并将礼物保留信息发送至客户端。基于此,可预防用户因客户端内存占用过大流失,提升用户的留存率。
  • 一种弹幕屏蔽方法、装置、计算机设备和存储介质-202011105129.0
  • 刘建壮 - 广州博冠信息科技有限公司
  • 2020-10-15 - 2023-05-30 - H04N21/435
  • 本发明公开了一种弹幕屏蔽方法、装置、计算机设备和存储介质,可显示视频页面,视频页面包括目标视频和目标视频的弹幕信息;当检测到针对弹幕信息中的目标弹幕信息的弹幕屏蔽操作时,将目标弹幕信息作为待屏蔽弹幕信息,添加到目标屏蔽弹幕信息集合中;从目标视频的弹幕信息中,识别与目标屏蔽弹幕信息集合中的待屏蔽弹幕信息关联的关联弹幕信息;在目标视频的显示过程中,屏蔽目标视频的弹幕信息中的关联弹幕信息,由此,本发明屏蔽的关联弹幕信息,是根据用户选择的待屏蔽弹幕信息确定的,所以弹幕信息的屏蔽可以符合用户的个性化屏蔽需求,且弹幕的屏蔽无需服务器侧的工作人员频繁更新关键字,可有效降低对服务器侧的人工资源需求。
  • 视频字幕的处理方法、装置、设备和存储介质-202110168920.4
  • 苏再卿;焦少慧;张清源;赵世杰;詹亘 - 北京字节跳动网络技术有限公司
  • 2021-02-07 - 2023-05-26 - H04N21/435
  • 本发明公开了一种视频字幕的处理方法、装置、设备和存储介质。该方法包括:确定原始视频中各视频帧的字幕区域,并识别所述字幕区域内的字幕信息,得到第一候选字幕;对所述原始视频的音频信息进行语音识别,得到第二候选字幕;根据所述第一候选字幕和所述第二候选字幕,生成目标字幕;将所述目标字幕和所述原始视频的视频数据结合,生成包含所述目标字幕的目标视频。在对原始视频的字幕进行处理的过程中,不仅结合了原始视频中字幕区域内的原始字幕信息,还结合了原始视频中的音频信息,即利用多种不同模态的信息来生成目标字幕,使得经过字幕处理后的目标视频的字幕与实际更相符,从而提高了字幕信息的准确性。
  • 一种用于互联网交流演示的互动方法及系统-202310214826.7
  • 张思晓 - 山东水浒文化传媒有限公司
  • 2023-03-08 - 2023-05-16 - H04N21/435
  • 本发明涉及数据处理技术领域,具体涉及一种用于互联网交流演示的互动方法及系统。该方法通过获得连续时刻的文本弹幕数据的分词数据,根据连续时刻弹幕数据的数据量变化趋势和信息价值密度增量,获得价值密度变化率筛选出有信息价值的第二类弹幕,对第二类弹幕中分词的数量和频率分析获得分词的第一重要程度,根据分词的分布情况获得第二重要程度,根据第一重要程度和第二重要程度获得分词权重,根据分词重要程度调整分词权重筛选获得重要词,根据重要词获得每条弹幕的特征向量,根据特征向量筛选出最佳弹幕进行提醒。本发明通过数据分析,快速准确地提取弹幕中有价值的信息,实现更好的互动。
  • 一种视频运动字幕检测方法-202111003875.3
  • 宋一平;梁骏;钟宇清;宋蕴;杨常星 - 杭州国芯科技股份有限公司
  • 2021-08-30 - 2023-05-16 - H04N21/435
  • 本发明公开了一种视频运动字幕检测方法。目前的视频图像处理技术往往针对所有像素采取一样的图像处理手段,而不会对运动字幕区域采取单独的处理方式。本发明方法首先输入连续两帧视频逐行序列,然后提取运动像素区域,再提取运动字幕区域,优化、展宽运动字幕区域后,输出运动字幕区域。本发明方法利用输入两帧逐行图像序列的差值,选取运动像素区域,进而从中选取运动字幕区域,可以有效提取视频中的运动字幕区域,从而可以对运动字幕进行单独的图像处理,达到改善运动字幕显示效果的目的。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top