[发明专利]一种文件扫描系统、计算机设备及可读存储介质在审
申请号: | 201811136499.3 | 申请日: | 2018-09-28 |
公开(公告)号: | CN109271993A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 徐常柏 | 申请(专利权)人: | 徐常柏 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/60 |
代理公司: | 北京思创大成知识产权代理有限公司 11614 | 代理人: | 董晓盈 |
地址: | 243000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可读存储介质 文件扫描系统 计算机设备 文件图像 处理器 文本文件 预处理 图像采集单元 文本文件形式 摄像头 扫描结果 扫描文件 实时采集 实时获取 实时扫描 实现文件 使用终端 手机文件 输出识别 图像采集 图形采集 终端设备 字符识别 扫描 采集 图像 | ||
公开了一种文件扫描系统、计算机设备及可读存储介质,包括图像采集单元,使用所述使用终端的摄像头进行图像采集;处理器,处理器用于接收所述图形采集单元采集的文件图像,并执行以下处理:对所述图像进行预处理;利用OCR框架进行字符识别;输出识别结果作为手机文件扫描结果;生成扫描文件。本发明通过终端设备的实时扫描,基于实时采集的文件图像,获得文本文件识别结果,以文本文件形式生成,实现文件扫描实时获取。
技术领域
本发明涉及文件扫描领域,更具体地,涉及一种文件扫描系统、计算机设备及可读存储介质。
背景技术
字符是人类文明发展历史的产物,是人类沟通的工具。字符识别是一个模板识别领域的大多数主题都可以满足最基本的问题。字符识别是一个利用计算机和图像处理技术在各个领域起着重要的作用。工业使用字符识别是非常重要的,它的发展水平已经吸引到了图像界的关注,原因在于:一方面,字符识别技术的发展是非常困难的,难度不仅在于字符图像识别系统,在于实际应用的复杂性和应用部门成本承受能力;另一方面,图像识别发展的效益非常显著,其实际应用系统将产生巨大的经济效益和社会效益。例如,车牌号码识别、手写字符识别,字符识别技术已广泛应用于电脑、手机。
就目前而言,越来越多的情况需要人们利用便携式终端进行实时的文件扫描,获得扫描后的文本文件,进而对文本文件进行编辑。因此,有必要开发一种文件扫描系统、计算机设备及可读存储介质。
公开于本发明背景技术部分的信息仅仅旨在加深对本发明的一般背景技术的理解,而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。
发明内容
本发明提出了一种文件扫描系统、计算机设备及可读存储介质,其能够通过终端设备的实时扫描,获得文本文件识别结果,基于获得的扫描结果再进行其他文件操作。
根据本发明的第一方面,提出了一种文件扫描系统,其应用于使用人的使用终端。所述文件扫描系统包括:
图像采集单元,使用所述使用终端的摄像头进行图像采集;
处理器,所述处理器用于接收所述图形采集单元采集的文件图像,并执行以下处理步骤:
1)对所述图像进行预处理;
2)利用OCR框架进行字符识别;
3)输出识别结果作为手机文件扫描结果;
4)生成扫描文件。
优选地,在步骤1)中,所述图像预处理包括图像二值化处理。
优选地,在步骤1)中,所述预处理包括图像锐化处理。
优选地,在步骤1)中,所述预处理包括图像中值滤波处理。
优选地,在步骤1)中,所述预处理包括线性灰度变换。
优选地,在步骤1)中,所述预处理还包括黑白图转换。
优选地,在步骤2)中,所述OCR框架处理包括:
2-1)提取字符图像特征;
2-2)将所述字符图像特征与样本库特征进行匹配;
2-3)基于特征匹配识别字符。
优选地,在步骤2-1)中,通过以下方式进行特征提取:
2-1-1)搜索字符区域,找出字符区域的上、下、左、右边界;
2-1-2)将字符区域平均分成n*n的小区域;
2-1-2)计算每个区域中像素的所占比例,获得特征结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐常柏,未经徐常柏许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811136499.3/2.html,转载请声明来源钻瓜专利网。