[发明专利]标题生成方法、装置、电子设备和存储介质有效
申请号: | 202110114237.2 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112818984B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 姚晓宇;李海;谭颖 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06V20/30 | 分类号: | G06V20/30;G06V20/40;G06F40/30;G06F40/253 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 吕俊秀 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标题 生成 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种标题生成方法、装置、电子设备和存储介质,所述方法包括:获取目标视频,从所述目标视频的多个图像帧中,分别检测具有标题特性的区域,得到区域位置,根据所述多个图像帧对应的所述区域位置,确定标题候选区域在图像帧中的位置,对所述多个图像帧中的所述标题候选区域进行文本识别,得到所述目标视频的目标标题,使得根据目标视频的多个图像帧,分析得到视频的标题可能出现的标题候选区域,排除了视频中众多的混淆信息,提高了标题确定时的准确性,然后对标题候选区域进行文本识别,从而自动生成目标视频的目标标题,降低了生成标题时的人工干预程度,提高了为视频生成标题的效率。
技术领域
本发明涉及视频技术领域,特别是涉及一种标题生成方法、一种标题生成装置、一种电子设备和一种计算机可读存储介质。
背景技术
目前,各个地方的众多本地频道都有新闻报道节目。对于当今快节奏的生活方式,将新闻报道逐条拆成多段新闻视频,成为用户观看网络视频的一大需求。
为了让用户能够在众多的新闻视频中快速找到自己感兴趣的内容进行了解,在将新闻报道拆成多段的过程中,有一个很重要的工作就是给每段新闻视频配上合适的标题。
由于每天的新闻报道很多,为每段新闻视频都生成合适的标题是一件工作量很大的工作,视频中会出现字幕、画面内容中的文字等众多混淆信息,从众多混淆信息中找出标题,从而导致从视频中找出标题耗时耗力的问题。
发明内容
本发明实施例的目的在于提供一种标题生成方法、一种标题生成装置、一种电子设备和一种计算机可读存储介质,从而解决视频中会出现字幕、画面内容中的文字等众多混淆信息,从众多混淆信息中找出标题,从而导致从视频中找出标题耗时耗力的技术问题。
为了解决上述问题,在本发明实施的第一方面,首先提供了一种标题生成方法,包括:
获取目标视频;
从所述目标视频的多个图像帧中,分别检测具有标题特性的区域,得到区域位置;
根据所述多个图像帧对应的所述区域位置,确定标题候选区域在所述图像帧中的位置;
对所述多个图像帧中的所述标题候选区域进行文本识别,得到所述目标视频的目标标题。
可选地,所述从所述目标视频的多个图像帧中,分别检测具有标题特性的区域,得到区域位置包括以下至少一种:
通过对比不同图像帧,得到所述不同图像帧中像素值的差值小于预设阈值的区域位置;
分别检测所述多个图像帧中包含文本的区域,得到所述多个图像帧中包含文本的区域位置;
分别对所述多个图像帧进行边缘检测,得到所述多个图像帧中被边缘所围绕的区域的区域位置。
可选地,所述根据所述多个图像帧对应的所述区域位置,确定标题候选区域在所述图像帧中的位置包括:
对所述多个图像帧对应的区域位置进行统计,生成所述区域位置的次数分布数据;
对所述次数分布数据进行梯度运算,得到梯度运算结果;
根据所述梯度运算结果,确定所述标题候选区域在所述图像帧中的位置。
可选地,在所述对所述多个图像帧中的所述标题候选区域进行文本识别,得到所述目标视频的目标标题之前,所述方法还包括:
针对各个图像帧,分别检测所述标题候选区域的图像变化率是否小于预设阈值;
剔除所述图像变化率大于预设阈值的所述标题候选区域。
可选地,所述对所述多个图像帧中的所述标题候选区域进行文本识别,得到所述目标视频的目标标题包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110114237.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:资源分配方法、装置、设备及介质
- 下一篇:一种虚拟对象的控制方法和装置