[发明专利]一种结构化处方图片识别方法及装置有效
申请号: | 202110381096.0 | 申请日: | 2021-04-09 |
公开(公告)号: | CN112766248B | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 赵鑫;焦小斌 | 申请(专利权)人: | 苏州艾隆科技股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/40 |
代理公司: | 南京中高专利代理有限公司 32333 | 代理人: | 沈雄 |
地址: | 215000 江苏省苏州市自由*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 结构 处方 图片 识别 方法 装置 | ||
本发明公开了一种结构化处方图片识别方法及装置,其中方法包括:获取待录入处方图片;对待录入处方图片进行区域标记并切割,得到多个第一待识别区域图像;根据区域标记的关联性对第一待识别区域图像进行分类;根据类别拼接第一待识别区域图像,得到第二待识别区域图像;对第二待识别区域图像进行文字识别;根据预设匹配模式将第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。通过对处方图像标记区域的重新拼接,提升了识别的精确度和完整度,使得整个处方需要识别的地方不漏识,不需要识别的地方不多识,提高了处方图像识别录入的自动化程度及处理效率。
技术领域
本发明涉及图像处理技术领域,具体涉及一种结构化处方图片识别方法及装置。
背景技术
现阶段处方录入的方式主要有两种,一种是人工手动录入,另一种是通过文字视觉识别技术,即光学字符识别(Optical Character Recognition,OCR)技术对处方进行识别,然后自动录入。
但是对于OCR识别来说,仅仅是识别出了文字,后续录入还是需要人工处理、精确匹配信息,自动化程度不够高,处理效率较低。
发明内容
有鉴于此,本发明实施例提供了一种结构化处方图片识别方法及装置,以解决现有技术中OCR识别对于处方图像自动录入的效率不够高的问题。
本发明实施例提供了一种结构化处方图片识别方法,包括:
获取待录入处方图片;
对待录入处方图片进行区域标记并切割,得到多个第一待识别区域图像;
根据区域标记的关联性对第一待识别区域图像进行分类;
根据类别拼接第一待识别区域图像,得到第二待识别区域图像;
对第二待识别区域图像进行文字识别;
根据预设匹配模式将第二待识别区域图像的文字信息与电子文档所对应的位置进行绑定。
可选地,预设匹配模式为:
当第二待识别区域图像包含的文字数据小于预设值时,根据第二待识别区域图像与第一模板区域的交并比进行匹配;
若交并比的比值超过预设阈值,则判定为匹配成功;
当第二待识别区域图像包含的文字数据大于预设值时,判断第二待识别区域图像是否包含于第二模板区域中的标记区域;
若第二待识别区域图像包含于第二模板区域中的标记区域,则判定为匹配成功。
可选地,预设阈值为60%。
可选地,在对待录入处方图片进行区域标记并切割,得到多个待识别区域图像之前,还包括:
将录入处方图片根据模板处方进行透视与矫正,使录入处方图片的内容与模板处方对齐。
可选地,还包括:对模板处方进行标记,赋予不同位置文字信息对应的文字属性;其中,文字属性包括医院名称、科室名称、患者信息和诊断结果中的至少一者。
可选地,根据区域标记的关联性拼接多个待识别区域图像包括:
将多个待识别区域图像按行排列,使每一行仅有一个连续的识别区域。
可选地,根据类别拼接第一待识别区域图像,得到第二待识别区域图像还包括:用像素值为255的图像填充第二待识别区域图像的右侧、下侧和右下侧区域,使第二待识别区域图像中的单个待识别文字的像素数量所占总像素数量的比例降低,以提高待识别文字的分辨率至300dpi~400dpi。
在本实施例中,
可选地,预设值为二十个字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州艾隆科技股份有限公司,未经苏州艾隆科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110381096.0/2.html,转载请声明来源钻瓜专利网。