[发明专利]一种基于手动拍照的化验单识别方法在审
申请号: | 201710149906.3 | 申请日: | 2017-03-14 |
公开(公告)号: | CN106991416A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 尹建伟;王宸敏;邓水光;李莹;吴健;吴朝晖;章笠中 | 申请(专利权)人: | 浙江大学;医惠科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 马士林 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 手动 拍照 化验单 识别 方法 | ||
技术领域
本发明属于医疗OCR技术领域,具体涉及一种基于手动拍照的化验单识别方法。
背景技术
OCR(Optical Character Recognition,光学字符识别)是利用光学技术对文字和字符进行扫描,获取文字和字符的图像信息,利用各种模式识别算法对文字形态特征进行分析,判断出文字的标准编码,转化为计算机内码,并按通用格式存储在文本文件中,是一种快捷的文字输入方式。
OCR技术的发展,经历了如下几个阶段:第一阶段,识别印刷体的数字、英文及部分符号,并且需要是指定的字体;第二阶段,基于手写体字符识别;第三阶段,针对质量较差的文档及大字符集的识别。
我国OCR技术方面的研究工作伴随着OCR技术第三阶段的发展而起步,从印刷体单字体识别,到印刷体多字体识别,直至多字体大字符集简繁混排、中英文混排识别逐步发展。随着OCR技术的逐渐成熟,OCR技术开始应用于各个领域,OCR技术应用于证件识别、车牌识别、票据识别、银行卡识别、文档识别等,在银行、保险、金融、物流、审计、税务、海关、公安、边检等众多行业都已经形成市场成熟的OCR产品。OCR技术的应用减少了设备的配置,降低了人力成本,提高了工作效率。
OCR技术的广泛应用已经渗透到市场的各个领域,但对于医疗行业OCR技术的应用还处于起步和发展阶段,OCR技术应用于医疗行业的化验单识别还未形成成熟的、市场化的产品。另一方面,在医院进行常规检查后,人们希望了解检查的各项指标反映的身体情况,但没有权威的医生和医疗团队进行化验单的解读。因此,化验单识别和解读成为目前市场的强烈需求,规范化验单识别处理流程方法势在必行。
发明内容
鉴于上述,本发明提供了一种基于手动拍照的化验单识别方法,能够实现化验单的自动识别,从而最大化地提高化验单识别的准确率。
一种基于手动拍照的化验单识别方法,包括如下步骤:
(1)对化验单图像进行预处理;
(2)对预处理后的化验单图像进行切割分栏,以提取有效内容列;
(3)将所述的有效内容列逐个输入至开源引擎Tesseract中,得到有效内容列所对应的文本信息;
(4)对所述的文本信息进行纠错处理。
所述步骤(1)中对化验单图像进行预处理的过程如下:
1.1将化验单图像转换为灰度图后进行去噪处理;
1.2对去噪处理后的化验单图像进行二值化;
1.3对二值化后的化验单图像进行抗扭斜处理。
所述步骤1.1中采用高斯模糊去噪算法对灰度图进行去噪处理。
所述步骤1.2中的二值化过程为:初始化设定一个灰度阈值t,根据灰度阈值t将去噪处理后的化验单图像分割成前景和背景;然后计算前景像素所占比例wf、背景像素所占比例wb、前景像素的平均灰度值avgf以及背景像素的平均灰度值avgb,通过二分法对目标函数g(t)=wf×avgf+wb×avgb进行优化求解,求解出目标函数g(t)最大化时所对应的灰度阈值t并使其作为全局最优阈值topt;最后利用全局最优阈值topt对去噪处理后的化验单图像进行分割,以实现图像二值化。
所述步骤1.3中的抗扭斜处理过程为:首先,对二值化后的化验单图像进行线段检测,并删除其中斜率超过一定阈值的线段;然后,对斜率相近且距离相近的线段进行合并,再删除长度小于一定阈值的线段;最后,对剩余线段的斜率取平均,按斜率平均值对二值化后的化验单图像进行偏转校正。
所述步骤(2)的具体实现过程如下:
2.1对预处理后的化验单图像在水平方向上进行区域分割,以得到若干个内容区域;
2.2对于任一内容区域,先忽略其位于图像顶端、底端、左侧和右侧的部分,然后检测其中每一列像素,令噪点(即二值化后标记为1的像素点)所占比例少于一定阈值的列作为空白列,其余作为内容列;
2.3合并相邻的内容列,进而对于合并后的内容列,令宽度小于一定阈值的内容列作为无效内容列,其余作为有效内容列提取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学;医惠科技有限公司,未经浙江大学;医惠科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710149906.3/2.html,转载请声明来源钻瓜专利网。