[发明专利]一种基于多区域特征的电子公文分类方法在审
申请号: | 201510761336.4 | 申请日: | 2015-11-10 |
公开(公告)号: | CN105389557A | 公开(公告)日: | 2016-03-09 |
发明(设计)人: | 王东;李晓东;陈俊健;顾艳春 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/46 |
代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 许英伟 |
地址: | 528000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 区域 特征 电子 公文 分类 方法 | ||
1.一种基于多区域特征的电子公文分类方法,其特征在于,包括以下步骤:1)图像预处理
(1)图像灰度化;
(2)图像自适应滤波;
(3)图像灰度拉伸;
(4)图像最优阈值计算;
(5)图像二值化;
(6)图像倾斜矫正;
2)区域特征提取
(1)图像分块像素分布统计特征;
(2)平滑图像直方图特征;
(3)图像纹理特征;
3)标准文档多区域特征提取及入库
(1)标准文档图像预处理;
(2)标准文档图像关键区域选择;
(3)标准文档图像各区域特征提取,获得各区域特征向量;
(4)生成文档类型特征矩阵;
4)文档类型识别
(1)从数据库读取文档类型特征矩阵和对应的特征区域;
(2)获取被检文档图像对应特征区域图像;
(3)计算被检文档图像各特征区域特征向量;
(4)计算被检文档的特征矩阵;
(5)两个特征的相关系数矩阵,计算文档类型相似度。
2.根据权利要求1所述一种基于多区域特征的电子公文分类方法,其特征在于,所述图像二值化为:先通过对图像进行灰度拉伸和灰度平滑矫正,然后采用最优阈值方法进行图像二值化。
3.根据权利要求1所述一种基于多区域特征的电子公文分类方法,其特征在于,所述图像分块像素分布统计特征为:首先,对各区域图像进一步分块;然后,分别统计每个分块中像素个数,计算其在区域图像中的占比,最后,生成分布统计直方图。
4.根据权利要求1所述一种基于多区域特征的电子公文分类方法,其特征在于,所述图像平滑图像直方图特征为:首先,区域图像进行高斯平滑;然后,分别计算区域图像灰度分布直方图。
5.根据权利要求1所述一种基于多区域特征的电子公文分类方法,其特征在于,所述图像纹理特征为:首先,区域图像进行高斯平滑;然后,分别计算区域图像的surf特征点和特征向量。
6.根据权利要求1所述一种基于多区域特征的电子公文分类方法,其特征在于,所述标准文档多区域特征为:将文档图像的各个关键区域设为文档分类的特征提取区域,通过对各区域图像提取区域图像的统计特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510761336.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:获取车辆位置方法、装置及系统
- 下一篇:一种身份证网络解码系统