[发明专利]一种动静态字幕的提取方法及装置在审
申请号: | 202011022711.0 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112115945A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 钟艺豪;李百川 | 申请(专利权)人: | 有米科技股份有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 钱娜 |
地址: | 510006 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 静态 字幕 提取 方法 装置 | ||
本发明提供一种动静态字幕的提取方法及装置,利用边缘提取算法对读取到的第一视频帧进行处理,得到帧二值边缘图;基于直线检测算法和直线过滤方式检测所述帧二值边缘图中的竖直直线和水平直线并过滤,得到确定直线的第二视频帧并进行分割,得到多个画面;计算每一画面对应的画面区域改变率,得到所有画面对应的画面区域改变率;基于所有画面所对应的画面区域改变率,确定第二视频帧中所包含的动态画面和静态画面;针对动态画面和静态画面采用大小不同的采用率进行采样后,进行OCR处理和去重处理,得到各自对应的动态字幕和静态字幕。由此,实现准确快速有效的提取出广告视频中的动态字幕和静态字幕的目的。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种动静态字幕的提取方法及装置。
背景技术
随着智能电子设备和通讯网络的不断更新发展,通过移动电子设备观看图片和视频已成为人们日常生活中不可或缺的一部分。基于此,利用视频投放和推广广告也越来越普遍。
目前,广告视频主要由动态画面和静态画面构成,广告视频的字幕也同样分为动态字幕和静态字幕,动态字幕会出现在动态画面中,静态字幕会出现在静态画面中。在字幕变动方面,动态字幕往往随着画面的改变而变动,静态字幕不会随着时间的变化而变化,或者间隔很久变化一次。在所起的作用方面,动态字幕主要提供产品的细致描述,静态字幕主要提供产品的信息。基于广告营销方面的需求,需要对广告视频中的动态字幕和静态字幕进行分离。
在现有技术中,主要利用人工的方式去识别、提取动态字幕和静态字幕,该过程不仅耗时、效率低、准确率也非常低。
发明内容
有鉴于此,本发明实施例提供一种动静态字幕的提取方法及装置,以解决现有技术中识别和提取动静态字幕耗时、效率低和准确率低的问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开了一种动静态字幕的提取方法,包括:
利用边缘提取算法对读取到的第一视频帧进行处理,得到帧二值边缘图;
基于直线检测算法检测所述帧二值边缘图中的竖直直线和水平直线;
对检测到的竖直直线和水平直线进行直线过滤,得到确定直线的第二视频帧;
对所述确定直线的第二视频帧并进行分割,得到多个画面;
计算每一画面对应的画面区域改变率,得到所有画面对应的画面区域改变率;
基于所述所有画面所对应的画面区域改变率,确定所述第二视频帧中所包含的动态画面和静态画面;
针对所述动态画面,基于预设第一采样率进行采样,并对采样后的动态画面进行光学字符识别OCR处理和去重处理,得到动态字幕;
针对所述静态画面,基于预设第二采样率进行采样,并对采样后的静态画面进行光学字符识别OCR处理和去重处理,得到静态字幕,所述第二采样率大于所述第一采样率。
可选的,所述基于直线检测算法检测所述帧二值边缘图中的竖直直线和水平直线之后,还包括:
若未检测到长度大于阈值的直线,确定所述视频帧中的画面全部为动态画面,所述直线包括竖直直线和水平直线;
基于预设第一采样间隔对所述动态画面进行采样,并对采样后的动态画面进行光学字符识别OCR处理和去重处理,得到动态字幕。
可选的,所述对检测到的竖直直线和水平直线进行直线过滤,得到确定直线的第二视频帧,包括:
去除位于所述帧二值边缘图边缘的水平直线和竖直直线;
合并剩余的水平直线中距离小于预设距离的水平直线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于有米科技股份有限公司,未经有米科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011022711.0/2.html,转载请声明来源钻瓜专利网。