[发明专利]一种视频图像中叠加时间字符的增强方法在审
申请号: | 202010422327.3 | 申请日: | 2020-05-19 |
公开(公告)号: | CN111899202A | 公开(公告)日: | 2020-11-06 |
发明(设计)人: | 聂晖;杨小波;李军 | 申请(专利权)人: | 武汉东智科技股份有限公司 |
主分类号: | G06T5/20 | 分类号: | G06T5/20;G06T7/194;G06N3/04 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 430000 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 图像 叠加 时间 字符 增强 方法 | ||
本发明属于计算机视觉领域,尤其涉及一种视频图像时间标注信息的识别增强方法。本发明包括:训练UNet(一种图像分割神经网络)实现图像中像素级时间字符提取模型;在待检图像上借助时间字符提取模型对原始图像背景进行灰色化抑制,以增强被识别时间字符的可辨识度。本发明针对自然场景监控图像中的字符特征,实现了一种时间标注信息的增强方法,攻克了对视频图像‘无衬底’叠加时间字符进行识别时亟待解决的难题。本发明关注叠加字符与图像背景的‘分离‑抑制’处理,是一种场景文字识别领域极具应用价值的图像增强技术。
技术领域
本发明属于计算机视觉领域,适用于公安及相关行业视频监控系统画面中叠加时间字符的检测。尤其涉及一种视频图像时间标注信息的识别增强方法。
背景技术
随着社会安全管理的发展,海量视频监控图像中时间标注信息的识别,对于公安行业的技侦工作具有显著而特殊的应用价值,也是公安部对全国视频图像联网应用平台运维工作的考核内容之一。
依据《GA/T 751-2008视频图像文字标注规范》实施要求,在自然场景图像中叠加的时间字符,不能使用‘衬底’图块掩盖背景。不难理解,字符叠加于户外监控的随机场景图像上,单个字符笔画空隙之间、相邻字符间隔之间都保持背景可见,极易受到光照随机分布、背景琐碎物体等干扰,给时间字符识别带来较大的难度。
发明内容
本发明所要解决的技术问题是针对自然场景图像中‘无衬底’叠加的时间字符,提出一种字符增强技术方案,克服现有技术存在的视频图像时间标注信息的识别难题。
为解决上述技术问题,本发明的基本技术构思是,训练UNet(一种图像分割神经网络)实现图像中像素级时间字符提取模型;在待检图像上借助时间字符提取模型对原始图像背景进行灰色化抑制,以增强被识别时间字符的可辨识度。
为此,本发明提出一种针对视频图像中叠加时间字符的增强方法,包括以下步骤:
步骤i、定制化批量生成UNet训练样本;
步骤ii、使用UNet训练图像中时间字符像素的提取模型;
步骤iii、基于时间字符提取模型得到的蒙版对待检图像背景进行抑制。
优选的,所述步骤i,定制化生成UNet批量训练样本的具体步骤包括:
1-1)取批量随机的视频图像作为背景,绘制黑白颜色、多种字体的时间字符,‘无衬底’叠加在其上,作为训练输入样本;
1-2)取同等大小的黑色图像作为背景,在与输入样本相同坐标位置上叠加颜色为白色、其它内容与特征相同的时间字符,作为一一对应的提取目标样本;
优选的,所述步骤ii、使用UNet训练图像中时间字符像素的提取模型的具体步骤包括:
2-1)设置特征提取卷积网络结构
M组‘卷积+池化下采样’,其中每组卷积有N层,并包含BatchNormal和ReLU操作;
M组池化后使用一层单层卷积调整通道数,以匹配后续的上采样;
K组‘上采样+卷积’,其中每组卷积有L层;
每一层上采样的输出矩阵,依次连接到对应下采样卷积层的输出矩阵;
K组上采样后使用一层单层卷积将通道数减少至1,用于输出最终特征。
2-2)定义训练参数,输出分割模型
卷积层配置,输出channel数量maps,卷积核大小k,stride为s,padding为p;
池化和上采样配置,滑窗大小Window,stride为s,padding为p;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉东智科技股份有限公司,未经武汉东智科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010422327.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序