[发明专利]一种基于汉字笔画特征的中文文本图像倒置判别方法有效
申请号: | 201710695383.2 | 申请日: | 2017-08-15 |
公开(公告)号: | CN107609482B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 王建;庞彦伟 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/40;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明涉及一种基于汉字笔画特征的中文文本图像倒置判别方法,包括用I表示输入扫描文本图的灰度图像;对灰度图像I进行去噪、对比度增强以及二值化处理,得到的二值化处理结果用B表示;将B划分为大小相等的36个子区域,选择靠近中心位置的16个子区域作为候选文本区域表示;对于每个候选文本区域,计算其相应的中文本点的数目并做归一化处理:选取特征提取所用的文本区域;选择两个模板,模板1为用于描述汉字中左撇和右捺组成结构的“人”形笔画检测模板2为用于描述汉字中的横折笔画的 |
||
搜索关键词: | 一种 基于 汉字 笔画 特征 中文 文本 图像 倒置 判别 方法 | ||
【主权项】:
一种基于汉字笔画特征的中文文本图像倒置判别方法,包括下列步骤:(1)判断输入扫描文本图像类型,如果是灰度图像,则保持不变;如果是彩色图像,则将将其转换为灰度图像,用I表示灰度图像;(2)对灰度图像I进行去噪、对比度增强以及二值化处理,得到的二值化处理结果用B表示;(3)将B划分为大小相等的36个子区域,选择靠近中心位置的16个子区域作为候选文本区域,用Ti(i=1,2,...,16)表示;(4)对于每个候选文本区域,按照下式计算其相应的中文本点的数目并做归一化处理,得到表示各候选文本子区域的特征的Ri:式中,(s,t)∈Ti表示Ri中的各像素点坐标,M×N为灰度图像I的总像素点数;(5)预设两个小于1的阈值TH2和TH3,对于某个Ti,如果满足TH2<Ri<TH3,则将该区域选为特征提取所用的文本区域,用Hk(k=1,2,...,K)表示用于特征提取的文本区域集合,K为文本区域的总数;(6)选择两个模板,模板1为用于描述汉字中左撇和右捺组成结构的“人”形笔画检测模板2为用于描述汉字中的横折笔画的形的笔画检测模板;(7)使用笔画特征提取算法,计算文本区域所对应的特征值:N1、N2、M1和M2,笔画特征提取算法如下:1)对于某个用于特征提取的文本区域Hk,用形态学细化技术对文本点进行细化处理,最终得到单像素宽的文字骨架结构信息,用S表示细化结果;2)使用模板1和模板2,分别对S进行模板匹配,对于模板1,过程是:对于Hk中的某一个骨架点,将其与模板1的参考点位置对齐,然后对骨架点邻域内与模板1对应位置上各点进行“同或”运算;计算Hk内各骨架点“同或”运算结果的累加值,并做归一化处理,计算结果用表示Uk(j),其中j表示Hk中的骨架点的序号,对于Hk中第j个骨架点,如果满足Uk(j)>TH3,则将该点标记为第1类特征点;对于模板2,按照类似的过程标记第2类特征点;3)对于每个Hk中的所有骨架点,使用步骤2)判断该点是否是两类特征点,并分别对文本图像的第1类特征点和第2类特征点数进行累加,将两类特征点的总数作为两个特征值,用N1和N2表示;4)将图像S旋转180°,处理结果用S′表示,对S′重复步骤2)和步骤3),用M1和M2表示S′对应的第1类特征点和第2类特征点的总数;(9)文本图像倒置检测:1)根据特征量N1、N2、M1和M2,计算复合特征值F,即有F=N1M1×N2M2]]>2)预设一个大于0.6的阈值TH4,根据F的取值大小,判别文本图像是否存在倒置,即有
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710695383.2/,转载请声明来源钻瓜专利网。