[发明专利]针对医学资料图片的文本识别方法和装置有效
申请号: | 201710305560.1 | 申请日: | 2017-05-03 |
公开(公告)号: | CN107315989B | 公开(公告)日: | 2020-06-12 |
发明(设计)人: | 周列淳;岳智磊;刘泓;江岩 | 申请(专利权)人: | 天方创新(北京)信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G16H30/20 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张润 |
地址: | 100081 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 针对 医学 资料 图片 文本 识别 方法 装置 | ||
本发明公开了一种针对医学资料图片的文本识别方法和装置,其中方法包括:基于光学字符识别OCR算法对待识别的医学资料图片进行文本区域划分,得到多个分块;确定多个分块的位置信息和类型信息,并根据位置信息和类型信息从多个分块中获取多个待合并分块;识别多个待合并分块的文本内容;根据多个待合并分块的文本内容对多个待合并分块进行合并。该方法能够有效避免因图片表现形式不一致,而导致对图片的文本区域的划分不准确的问题,提高了对图片的文本区域划分精度,提升了使用体验。
技术领域
本发明涉及医疗领域,尤其涉及一种针对医学资料图片的文本识别方法和装置。
背景技术
相关技术中,可通过传统的光学字符识别(Optical Character Recognition,OCR)算法对图片进行文本区域划分。特别是对包含多种内容的图片进行文本区域划分尤为明显。然而,传统的OCR算法可能会因为图片的表现形式不同而造成了文本区域划分不准确。例如,对不同医疗机构发出的不同形式的医学资料图片进行文本区域划分时,可能将同一条检查项的信息分到另外一个文本区域中的问题发生,具体如图1所示。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种针对医学资料图片的文本识别方法,该方法能够有效避免因图片表现形式不一致,而导致对图片的文本区域的划分不准确的问题,提高了对图片的文本区域划分精度,提升了使用体验。
本发明的第二个目的在于提出一种针对医学资料图片的文本识别装置。
为达上述目的,本发明第一方面实施例提出了一种针对医学资料图片的文本识别方法,包括:基于光学字符识别OCR算法对待识别的医学资料图片进行文本区域划分,得到多个分块;确定所述多个分块的位置信息和类型信息,并根据所述位置信息和类型信息从所述多个分块中获取多个待合并分块;识别所述多个待合并分块的文本内容;根据所述多个待合并分块的文本内容对所述多个待合并分块进行合并。
本发明实施例的针对医学资料图片的文本识别方法,首先基于光学字符识别OCR算法对待识别的医学资料图片进行文本区域划分,得到多个分块;其次,确定多个分块的位置信息和类型信息,并根据位置信息和类型信息从多个分块中获取多个待合并分块;再次,识别多个待合并分块的文本内容;最后根据多个待合并分块的文本内容对多个待合并分块进行合并,从而有效避免因图片表现形式不一致,而导致对图片的文本区域划分不准确的问题,提高了对图片的文本区域划分精度,提升了使用体验。
为达上述目的,本发明第二方面实施例提出了一种针对医学资料图片的文本识别装置,包括:区域划分模块,用于基于光学字符识别OCR算法对待识别的医学资料图片进行文本区域划分,得到多个分块;待合并分块获取模块,用于确定所述多个分块的位置信息和类型信息,并根据所述位置信息和类型信息从所述多个分块中获取多个待合并分块;识别模块,用于识别所述多个待合并分块的文本内容;合并模块,用于根据所述多个待合并分块的文本内容对所述多个待合并分块进行合并。
本发明实施例的针对医学资料图片的文本识别装置,首先通过区域划分模块基于光学字符识别OCR算法对待识别的医学资料图片进行文本区域划分,得到多个分块;其次,待合并分块获取模块确定多个分块的位置信息和类型信息,并根据位置信息和类型信息从多个分块中获取多个待合并分块;再次,识别模块识别多个待合并分块的文本内容;最后,合并模块根据多个待合并分块的文本内容对多个待合并分块进行合并,从而有效避免因图片表现形式不一致,而导致对图片的文本区域的划分不准确的问题,提高了对图片的文本区域划分精度,提升了使用体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天方创新(北京)信息技术有限公司,未经天方创新(北京)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710305560.1/2.html,转载请声明来源钻瓜专利网。