[发明专利]表格类医疗影像的识别方法及装置有效
申请号: | 202110313437.0 | 申请日: | 2021-03-24 |
公开(公告)号: | CN112883926B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 王若楠;张秋晖;刘兴旺;丁笑天 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/148;G06V30/19;G06V10/80;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 薛平;王天尧 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 表格 医疗 影像 识别 方法 装置 | ||
1.一种表格类医疗影像的识别方法,其特征在于,包括:
获取表格类医疗影像;
将所述表格类医疗影像输入预先建立的卷积神经网络模型,所述卷积神经网络模型根据多个历史表格类医疗影像样本预先训练生成,用于执行如下步骤:
对所述表格类医疗影像进行特征提取,得到多个不同尺度大小的融合特征图;从最小尺度大小的融合特征图中检测出表格线;
将检测出表格线的融合特征图划分为不同类型区域,基于所述多个不同尺度大小的融合特征图确定每一类型区域的外接矩形,所述类型区域包括表格类型区域和非表格类型区域;
按照不同类型区域的划分结果,切分最小尺度大小的融合特征图;基于检测出的表格线,对表格类型区域特征图进行单元格分割处理,得到表格类型区域特征图的所有单元格;
分别对非表格类型区域特征图及表格类型区域特征图的每一单元格进行OCR识别,按照所述外接矩形及每一单元格的位置信息输出识别结果;
从最小尺度大小的融合特征图中检测出表格线,包括:在从最小尺度大小的融合特征图上,对每个像素点进行分类;其中,0代表该像素点没有直线,1代表该像素点有直线;利用射线追踪算法将值为1的所有像素点合并为线段,得到所述表格线;
基于所述多个不同尺度大小的融合特征图确定每一类型区域的外接矩形,包括:分别在每个特征图上的每个像素点上生成多个待选的候选框;多个待选的候选框尺寸不同;利用回归的方式,从多个待选的候选框中回归出不同类型区域的外接矩形及每一外接矩形对应的类型;利用非极大抑制NMS算法,根据每一外接矩形对应的类型,将相同类型区域的多个外接矩形合并,得到最终的每一类型区域的外接矩形;
按照不同类型区域的划分结果,切分最小尺度大小的融合特征图;基于检测出的表格线,对表格类型区域特征图进行单元格分割处理,得到表格类型区域特征图的所有单元格,包括:将每一类型区域单独切分为图片;对于表格类型区域的图片,计算表格类型区域的外接矩形所在直线与检测出表格线的一个相交区域,以所述相交区域修正表格真正所在区域;将表格内的直线按行列分割成若干单元格,并按坐标排列,得到了整张医疗影像的切分图像以及表格类型区域特征图的所有单元格。
2.如权利要求1所述的表格类医疗影像的识别方法,其特征在于,获取表格类医疗影像,包括:
获取RGB格式的表格类医疗影像;
对所述RGB格式的表格类医疗影像进行预处理操作,得到预处理操作后的表格类医疗影像;
将所述表格类医疗影像输入预先建立的卷积神经网络模型,包括:将所述预处理操作后的表格类医疗影像输入预先建立的卷积神经网络模型。
3.如权利要求1所述的表格类医疗影像的识别方法,其特征在于,将所述表格类医疗影像输入预先建立的卷积神经网络模型,包括:将所述表格类医疗影像的尺寸缩放到512×512后输入预先建立的卷积神经网络模型;
所述融合特征图的数目为3个。
4.如权利要求1所述的表格类医疗影像的识别方法,其特征在于,对所述表格类医疗影像进行特征提取,得到多个不同尺度大小的融合特征图,包括:
对所述表格类医疗影像进行特征提取,得到多个不同尺度大小的、不同属性类型的融合特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110313437.0/1.html,转载请声明来源钻瓜专利网。