[发明专利]图像信息提取方法、装置、电子设备及存储介质有效
申请号: | 202011502197.0 | 申请日: | 2020-12-18 |
公开(公告)号: | CN112560855B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 张舒婷;赖众程;李骁;姜笃一;李林毅;马超;王小红 | 申请(专利权)人: | 平安银行股份有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V20/62;G06V10/44;G06V10/30;G06V10/774;G06V10/764;G06V30/146;G06V30/18;G06V30/164;G06V30/19;G06F16/35;G06F40/216;G06F40/295 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 信息 提取 方法 装置 电子设备 存储 介质 | ||
1.一种图像信息提取方法,其特征在于,所述方法包括:
获取原始图像,对所述原始图像进行图像主体提取处理,得到标准图像;
利用预设的文本提取算法对所述标准图像进行文本提取,得到文字块集合;
根据所述文字块集合在所述标准图像中的排列顺序,生成所述文字块集合的原始顺序链,查找所述原始顺序链中每一个文字块的相邻文字块,其中,所述相邻文字块包括下相邻文字块和右相邻文字块;
通过遍历操作从所述文字块集合中依次选择其中一个文字块,将选择的所述文字块与对应的右相邻文字块输入至预训练的顺序重排模型,得到第一概率值,以及将选择的所述文字块与对应的下相邻文字块再次输入至所述顺序重排模型中,得到第二概率值;
在所述第一概率值大于所述第二概率值,维持所述原始顺序链,若所述第一概率值小于或者等于所述第二概率值,将所述下相邻文字块插入至选择的所述文字块和所述右相邻文字块之间,得到标准顺序链;
对所述标准顺序链中的文字块进行拼接处理,得到字符串,利用预构建的实体识别模型对所述字符串进行字段抽取,得到输出字段集,并对所述输出字段集进行格式化处理,得到目标信息集。
2.如权利要求1所述的图像信息提取方法,其特征在于,所述对所述原始图像进行图像主体提取处理,得到标准图像,包括:
利用预设的边缘检测算法对所述原始图像进行边缘检测处理,得到初始图像;
对所述初始图像进行仿射变换,得到标准图像。
3.如权利要求2所述的图像信息提取方法,其特征在于,所述利用预设的边缘检测算法对所述原始图像进行边缘检测处理,得到初始图像,包括:
对所述原始图像进行高斯滤波,得到降噪图像;
计算所述降噪图像中每个像素点的梯度值,根据所述梯度值筛选边缘像素点;
提取所述边缘像素点组成的区域,得到所述初始图像。
4.如权利要求1所述的图像信息提取方法,其特征在于,所述查找所述原始顺序链中每一个文字块的相邻文字块,包括:
获取所述文字块的中心点,计算所述中心点的纵坐标与其他文字块的中心点的纵坐标之间的中心差值,选择所述中心差值最小且在所述文字块的下方的文字块为下相邻文字块;或
计算所述文字块的左上角纵坐标与其他文字块的左上角纵坐标之间的左对齐差值,选择所述左对齐差值最小且在所述文字块的下方的文字块为下相邻文字块;或
计算所述文字块的右上角纵坐标与其他文字块的右上角纵坐标之间的右对齐差值,选择所述右对齐差值最小且在所述文字块的下方的文字块为下相邻文字块。
5.如权利要求1所述的图像信息提取方法,其特征在于,所述将选择的所述文字块和与对应的右相邻文字块输入至预训练的顺序重排模型,得到第一概率值,包括:
对选择的所述文字块和对应的右相邻文字块进行向量化处理,得到文字块向量和右相邻文字块向量;
利用所述顺序重排模型中的分类网络和预设的激活函数对所述文字块和所述右相邻文字块向量进行概率计算,得到第一概率值。
6.如权利要求1所述的图像信息提取方法,其特征在于,所述利用预构建的实体识别模型对所述字符串进行字段抽取,得到输出字段集,之前包括:
获取历史数据集,对所述历史数据集进行字段标记处理,得到训练数据集;
构建初始实体识别模型;
利用所述训练数据集对所述初始实体识别模型进行迭代训练,直到所述初始识别模型收敛,得到所述实体识别模型。
7.如权利要求1至6中任意一项所述的图像信息提取方法,其特征在于,所述对所述输出字段集进行格式化处理,得到目标信息集,包括:
对所述输出字段集进行去分隔符处理,得到标准字段集;
提取所述标准字段集的字段类型,根据所述字段类型对所述标准字段集进行相应的统一格式转换,得到目标信息集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安银行股份有限公司,未经平安银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011502197.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种地铁深基坑自动化喷抹机
- 下一篇:一种吸顶式油烟机及其制造方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置