[发明专利]基于光学字符识别的地理图片位置信息识别方法及系统在审
申请号: | 202110913963.0 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113609324A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 刘晗;傅洛伊;王新兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/587;G06K9/20;G06K9/32 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 光学 字符 识别 地理 图片 位置 信息 方法 系统 | ||
本发明提供了一种基于光学字符识别的地理图片位置信息识别方法及系统,包括:从地学文献中抽取插图;对抽取的插图预处理,进而对图片光学字符识别,根据光学字符识别的结果对图片筛选出包含地理位置信息的图片;对包含地理位置信息的图片的光学字符识别的结果数据清洗,把含有经纬度信息的文本规格化,构建经纬度关系矩阵,判断出图片包含的经纬度位置信息;标注出图片中识别出的经线和纬线,在前端实时展现出来,支持根据反馈实时调整识别结果。本发明使用OCR技术,构建了经纬度关系矩阵,以较高的准确性实现了地学文献中地理图片位置信息的识别与抽取,使得地学的研究人员可以更为方便地检索和标记文献,并且支持交互来校正识别结果。
技术领域
本发明涉及地理图片信息识别和抽取的技术领域,具体地,涉及一种基于光学字符识别技术的地理图片位置信息识别方法及系统,尤其是,优选的涉及一种基于光学字符识别技术的地理图片位置信息识别和抽取系统。
背景技术
随着科学技术的不断进步,作为知识载体的文献数量也飞速增加。具体到地学领域,大量增加的文献以及较传统的文献检索方式限制了地学科研人员的研究效率。具体来说,按文献研究的地理位置范围来检索论文,会比传统的按照标题、关键字、作者等信息来检索更加高效和实用。对于地学的研究人员来说,能批量处理一批文献,并快速得到它们研究的地理位置范围,将是非常重要的。目前已有的工具还不能做到高效地提取出文献中图片研究的地理位置范围,已有的文献检索工具也还不能支持按照研究的地理位置来检索图片。
现在已有的工具pdffigures、pdffigures2以及cermine等可以帮助我们快速地从pdf格式的文献中提取出图片,这可以方便我们后续对提取出来的图片进行分析和处理。
百度飞桨团队开源的OCR工具Paddle-OCR能够对中英文等多种文字进行OCR识别,但是识别的效果还不够理想。光学字符识别即ORC。
公开号为CN106776777A的中国发明专利文献公开了地理位置信息的识别方法、识别装置及终端,地理位置信息的识别方法包括:在接收到用户指定的目标图片时,提取目标图片的特征信息;获取终端当前所接入的无线接入点的唯一标识信息,并根据无线接入点的唯一标识信息,确定目标图片数据库,其中,目标图片数据库中包含有多张与地理位置信息相对应的图片;根据目标图片的特征信息,在目标图片数据库中查询与目标图片相匹配的图片,并将查找到的与目标图片相匹配的图片对应的地理位置信息作为目标图片对应的地理位置信息。
但发明人认为目前已有的工具还不能做到高效地提取出文献中图片研究的地理位置范围,已有的文献检索工具也还不能支持按照研究的地理位置来检索图片。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种基于光学字符识别的地理图片位置信息识别方法及系统。
根据本发明提供的一种基于光学字符识别的地理图片位置信息识别方法,包括如下步骤:
图片抽取步骤:从地学文献中抽取出插图;
文本识别步骤:对抽取出的插图进行预处理工作,并对预处理后的图片进行光学字符识别,根据光学字符识别的结果对图片进行筛选,筛选出包含地理位置信息的图片;
经纬度抽取步骤:对包含地理位置信息的图片的光学字符识别的结果进行数据清洗,把含有经纬度信息的文本规格化,构建经纬度关系矩阵,初步判断出图片包含的经纬度位置信息;
可视呈现步骤:标注出图片中识别出的经线和纬线,在前端实时展现出来,并支持根据反馈实时调整识别结果。
优选的,所述图片抽取步骤包括如下步骤:
提取地学文献子步骤:从数据库获取地学文献的相关数据,地学文献的相关数据包括标题、ID和PDF文件;
抽取图片子步骤:使用图片抽取工具对PDF类型的地学文献进行图片抽取,抽取出地学文献中的插图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913963.0/2.html,转载请声明来源钻瓜专利网。