[发明专利]表格类医疗影像的识别方法及装置有效
申请号: | 202110313437.0 | 申请日: | 2021-03-24 |
公开(公告)号: | CN112883926B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王若楠;张秋晖;刘兴旺;丁笑天 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/148;G06V30/19;G06V10/80;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 薛平;王天尧 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 医疗 影像 识别 方法 装置 | ||
本发明公开了一种表格类医疗影像的识别方法及装置,其中该方法包括:将表格类医疗影像输入卷积神经网络模型,执行:从该影像中提取出多个不同尺度大小的融合特征图;从最小尺度大小的特征图中检测出表格线;将最小特征图划分为不同类型区域,确定每一类型区域的外接矩形;切分特征图及基于表格线对表格类型区域进行单元格划分,得到所有单元格;分别对非表格类型区域及表格类型区域的每一单元格进行OCR识别,按照外接矩形及每一单元格的位置输出识别结果。本发明实现了基于表格线检测与图像区域划分的表格类医疗影像的识别,可以提高表格类医疗影像识别的精度和效率,进而可以提高核保、理赔等业务中表格类医疗影像数据录入的精度和效率。
技术领域
本发明涉及图像识别技术领域,尤其涉及表格类医疗影像的识别方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着保险领域科技的进步,精细化保险的需求日益强烈,这种需求要求保险的客户在购买保险、保险核赔时需要提供更多的医疗影像的数据(体检报告、医疗发票、诊断记录等),保险公司再根据影像上的数据开展精细化的核保、理赔业务,但是随着数据量的剧增,保险公司的核保、核赔的成本与时效也在剧增,因此需要寻求一种提高该项业务的技术。
OCR技术目前已广泛应用于各类证件等纸质单据的识别中,对于医疗影像也有一定的应用效果,但由于医疗影像的版面布局的复杂(表格多、样式复杂),例如,医疗影像中住院费用清单存在大量表格区域,表示每行文字分别代表药品名、数量、单价、总价等信息,对于此医疗影像数据,目前表格类医疗影像的识别主要利用字段检测与位置判定得到识别结果,识别精度和效率均低,因此针对以上的核保、理赔业务中医疗影像数据的录入,往往采用人工录入的方式进行,这种方法不仅效率低、也容易出错。
发明内容
本发明实施例提供一种表格类医疗影像的识别方法,用以高效精确地识别表格类医疗影像,该方法包括:
获取表格类医疗影像;
将所述表格类医疗影像输入预先建立的卷积神经网络模型,所述卷积神经网络模型根据多个历史表格类医疗影像样本预先训练生成,用于执行如下步骤:
对所述表格类医疗影像进行特征提取,得到多个不同尺度大小的融合特征图;
从最小尺度大小的融合特征图中检测出表格线;
将检测出表格线的融合特征图划分为不同类型区域,基于所述多个不同尺度大小的融合特征图确定每一类型区域的外接矩形,所述类型区域包括表格类型区域和非表格类型区域;
按照不同类型区域的划分结果,切分最小尺度大小的融合特征图;基于检测出的表格线,对表格类型区域特征图进行单元格分割处理,得到表格类型区域特征图的所有单元格;
分别对非表格类型区域特征图及表格类型区域特征图的每一单元格进行光学字符识别OCR识别,按照所述外接矩形及每一单元格的位置信息输出识别结果。
本发明实施例还提供一种表格类医疗影像的识别装置,用以高效精确地识别表格类医疗影像,该装置包括:
获取单元,用于获取表格类医疗影像;
表格线检测及区域划分单元,用于将所述表格类医疗影像输入预先建立的卷积神经网络模型,所述卷积神经网络模型根据多个历史表格类医疗影像样本预先训练生成,用于执行如下步骤:
对所述表格类医疗影像进行特征提取,得到多个不同尺度大小的融合特征图;
从最小尺度大小的融合特征图中检测出表格线;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313437.0/2.html,转载请声明来源钻瓜专利网。