[发明专利]图像数据处理方法、装置、计算机设备及存储介质在审
申请号: | 201811106590.0 | 申请日: | 2018-09-21 |
公开(公告)号: | CN109492143A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 黄锦伦 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/53 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种图像数据处理方法、装置、计算机设备及存储介质,应用在图像识别技术领域。该方法包括:采用爬虫工具爬取原始图像,每一原始图像对应一图像类型;采用文本定位算法对原始图像进行文本定位,获取至少一个文本行区域,对每一文本行区域进行截图,获取区域块图像;基于图像类型和区域块图像的位置信息,获取目标OCR识别模型;采用目标OCR识别模型对区域块图像进行识别,获取目标识别结果,目标识别结果包括至少两个识别文字和对应的识别概率;基于至少两个识别文字和对应的识别概率,获取目标文字,将目标文字确定为标注文本,基于区域块图像和标注文本,获取目标图像样本。该方法可有效提高目标图像样本的获取效率并降低获取成本。 | ||
搜索关键词: | 获取目标 区域块 原始图像 文本 图像 图像数据处理 计算机设备 存储介质 图像类型 文本行 标注 图像识别技术 定位算法 目标识别 目标图像 目标文字 爬虫工具 图像样本 概率 样本 应用 | ||
【主权项】:
1.一种图像数据处理方法,其特征在于,包括:采用爬虫工具爬取原始图像,每一所述原始图像对应一图像类型;采用文本定位算法对所述原始图像进行文本定位,获取至少一个文本行区域,并对每一所述文本行区域进行截图,获取对应的区域块图像,每一所述区域块图像对应一位置信息;基于所述图像类型和所述区域块图像的位置信息,获取目标OCR识别模型;采用所述目标OCR识别模型对所述区域块图像进行识别,获取与所述区域块图像相对应的目标识别结果,所述目标识别结果包括至少两个识别文字和与每一所述识别文字相对应的识别概率;基于至少两个所述识别文字和与每一所述识别文字相对应的识别概率,获取与所述区域块图像相对应的目标文字,将所述目标文字确定为标注文本,基于所述区域块图像和所述标注文本,获取目标图像样本。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811106590.0/,转载请声明来源钻瓜专利网。