[发明专利]新闻图像中水平标题字幕的简单快速定位方法有效
申请号: | 201510034625.4 | 申请日: | 2015-01-23 |
公开(公告)号: | CN104616295B | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 王志衡;郭超;司增艳;贾利琴;王静;霍占强;姜国权;邓超;刘红敏 | 申请(专利权)人: | 河南理工大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 454000 河南*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种新闻图像中水平标题字幕的简单快速定位方法,包括采集图像并输入计算机;截取整幅图像下面的区域作为处理区域,计算处理区域内各点的梯度,并利用阈值获得其边缘图;根据边缘图中各行包含的边缘点数目获得上下边界位置;对于获得的上下边界位置,基于最大特征得分获得其对应的目标区域;利用目标区域的梯度信息值确定第一个标题字幕区域;根据左边界位置差及高度比获得其余标题字幕区域;输出获得的标题字幕区域的边界位置信息。本发明提供的方法能够简单快速地定位新闻图像中的水平标题字幕。 | ||
搜索关键词: | 新闻 图像 水平 标题 字幕 简单 快速 定位 方法 | ||
【主权项】:
一种新闻图像中水平标题字幕的简单快速定位方法,其特征在于,包括步骤:步骤S1:采集图像并输入计算机;步骤S2:截取整幅图像的下1/4区域作为处理区域G,利用Sobel算子计算G内各点梯度,并利用阈值T对G内各点进行二值化处理获得边缘图e,其中阈值T设定为G内各点梯度幅值的均值,边缘图e中边缘点对应数值为1,其余为0;步骤S3:通过计算边缘图中各行包含的边缘点数目获得上下边界位置,具体方式为,记G内各行边缘点数目为V(h),h=1,2,...,H,若连续m行均满足V(h)>T1,且m>T2,则记录连续区域的首行和末行作为上下边界[Ui,Di],i=1,2,...,K;上述过程中H表示行数,阈值T1的确定方法为T1=δ·∑V(h)/H,调节系数δ的取值范围为0.4~0.5,阈值T2的取值范围为10~15,K表示上下边界的个数;步骤S4:对于步骤S3得到的一个上下边界[Ui,Di],基于最大特征得分获得其对应的目标区域G(Ui,Di,Li,Ri),具体方式为,以[Ui,Di]为上下边界、变化左右边界[l,r],按照如下方式计算矩形区域G(Ui,Di,l,r)的特征得分:(1)计算区域左、右边界的特征得分:Line(l)、Line(r)分别表示左、右边界位置处的竖直直线,e(X)表示边缘图上点X处的数值,阈值a的取值范围为1~2;(2)计算区域内部的特征得分:权重系数γ的取值范围是1~2;(3)计算惩罚项PM(l,r):考虑G中以[Ui,Di]为上下边界的长方形区域,利用大小为(Di‑Ui‑10)×ε的小窗口沿区域水平中心线滑动,ε的取值范围是21~25,如果小窗口包含的边缘点个数为0则记录小窗口的中心位置;若矩形区域G(Ui,Di,l,r)包含所述的中心位置,则PM(l,r)=0,反之PM(l,r)=1;(4)计算矩形区域G(Ui,Di,l,r)的特征得分:FS(l,r)=B(l,r)·PL(l,r)·PR(l,r)·PM(l,r)/(r‑l+1);(5)以[Ui,Di]为上下边界,变化左右边界[l,r],计算所有矩形区域G(Ui,Di,l,r)的特征得分FS(l,r),记当l=Li,r=Ri时矩形区域特征得分最大,则将G(Ui,Di,Li,Ri)作为[Ui,Di]对应的目标区域;步骤S5:基于目标区域的梯度信息值确定第一个标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域G(Ui,Di,Li,Ri),计算其梯度信息值其中dx(X)和dy(X)分别表示点X处的水平梯度幅值和垂直梯度幅值,将梯度信息值最大的目标区域G(UF,DF,LF,RF)确定为第一个标题字幕区域;步骤S6:根据左边界位置差及高度比获得其余标题字幕区域,具体方式为,对于步骤S4确定的任一目标区域G(Ui,Di,Li,Ri),如果同时满足如下条件将其认定为标题字幕区域:(1)||Li‑LF||<Tp,其中Tp的取值范围为90~120;(2)其中Th的取值范围为0.7~0.9;步骤S7:输出步骤S5、S6获得的标题字幕区域的边界位置信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南理工大学,未经河南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510034625.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种展示手机程序变化过程的方法
- 下一篇:一种基于预处理的目标轨迹估计方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序