[发明专利]一种基于大数据OCR物联网的人工智能工会信息录入系统在审
申请号: | 201711361209.0 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108090488A | 公开(公告)日: | 2018-05-29 |
发明(设计)人: | 孔祥明;李春成 | 申请(专利权)人: | 广东广业开元科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 北京科家知识产权代理事务所(普通合伙) 11427 | 代理人: | 陈娟 |
地址: | 510070 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 录入 文字信息 信息录入系统 人工智能 集成系统 手机拍照 信息转化 大数据 物联网 采集 拍照 扫描技术 系统集成 信息采集 纸质资料 上传 身份证 | ||
1.一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中录入步骤为:
步骤一:通过手机拍照身份证或采集的纸质资料;
步骤二:上传至OCR集成系统;
步骤三:OCR集成系统对拍照的照片的内容进行识别;
步骤四:照片中的信息转化为文字信息;
步骤五:对文字信息采集、录入。
2.如权利要求1所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中OCR集成系统包括生成影像模块、图像处理模块、文字识别模块、文字编辑模块和日期提醒模块。
3.如权利要求1所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中生成影像模块运用打开手机上的摄像头,通过用户对各种证件、信息表格进行拍照,获取需要处理的图片或者通过手机中已有的图片,获取所需要处理的图片。
4.如权利要求2所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中文字识别模块经过图像文字转换、图像的二值化、单字切割、文字特征抽取、比对识别、以及智能化校正,最后将识别结果输出。
5.如权利要求4所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中图像的二值化根据灰度图像中每个像素的坐标值和灰度级值的
对应关系,一幅灰度图像可表示成二维函数f(x,y),其中,x、y为像素坐标值;f(x,y)为该像素灰度值;
假定一幅灰度图像中像素的灰度级值的取值范围为0~Mf,希望能够更加突出图像中的文字部分,抑制那些并不感兴趣的灰度区域,通常图像中的文字都为黑色,在灰度图像中灰度值较小,这里g通过扩展灰度值范围在(0,a)暗色区和(b,Mf)的亮色区,压缩灰度值(a,b)区间的范围,使图像中的文字区域更加突出采用分段线性变换的方法,其数学表达式如式:
设定适当的折线拐点位置即(a,b,c,d)的值,控制分段直线的斜率,对灰度空间0~a和b~Mf进行扩展,对a~b的灰度空间进行压缩,经过灰度调整后,设定某个门限值,灰度值大于门限值的像素点用255来代替,表示为白色的点;小于门限值的像素点用0代替,表示为黑色,即得到了的二值图。
6.如权利要求4所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中单字切割包括行切分和字切分。
7.如权利要求4所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中字切分的方法为:
(1)在ja≤j≤ja+wm范围内计算第一个Li=1Σf(i,j)=0(L为每行的高度)的点,设为jb,从而切出ja~jb之间的单个文字图像;
若不存在这样的点,则转到第(5)步;
(2)若ja-jb<δ(δ由经验确定),即不足一个最小的字符宽,则为噪音干扰,不计,转(3);否则转(4);
(3)在jb≤j≤ja+wm范围内计算第一个Li=1Σf(i,j)=0的点,设为jb,从而切出ja~jb之间的单个文字图像,若不存在这样的点,则转到第(5)步;
(4)用字典对上述切割出的图像进行匹配,若匹配成功,记下jb,转(6);否则转(3);
(5)在ja+wm-d≤j≤ja+wm范围内求出使得Li=1Σf(i,j)取最小值的点,记为jb;
(6)从jb作垂线即为文字的分界线(右边界),第j字的宽度为ja~jb;
(7)从jb开始,计算Li=1Σf(i,j),当Li=1Σf(i,j)≠0时设为j′a,且ja′>jb,则ja′为第j+1个文字的左边界,重复以上步骤。
8.如权利要求4所述的一种基于大数据OCR物联网的人工智能工会信息录入系统,其特征在于:其中行切分为文字的行与行之间通常都有一定的空白间隙,文本中利用这个空白间隙进行行切分设文字图像中的第i行,第j列的像素值为f(i,j);
则f(i,j)=0背影1文字于是,第i行水平方向上的积分投影为Lj=1Σf(i,j),其中L为行的长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东广业开元科技有限公司,未经广东广业开元科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711361209.0/1.html,转载请声明来源钻瓜专利网。