[发明专利]基于光学字符识别的地理图片位置信息识别方法及系统在审
申请号: | 202110913963.0 | 申请日: | 2021-08-10 |
公开(公告)号: | CN113609324A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 刘晗;傅洛伊;王新兵 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06F16/58;G06F16/587;G06K9/20;G06K9/32 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 光学 字符 识别 地理 图片 位置 信息 方法 系统 | ||
1.一种基于光学字符识别的地理图片位置信息识别方法,其特征在于,包括如下步骤:
图片抽取步骤:从地学文献中抽取出插图;
文本识别步骤:对抽取出的插图进行预处理工作,并对预处理后的图片进行光学字符识别,根据光学字符识别的结果对图片进行筛选,筛选出包含地理位置信息的图片;
经纬度抽取步骤:对包含地理位置信息的图片的光学字符识别的结果进行数据清洗,把含有经纬度信息的文本规格化,构建经纬度关系矩阵,初步判断出图片包含的经纬度位置信息;
可视呈现步骤:标注出图片中识别出的经线和纬线,在前端实时展现出来,并支持根据反馈实时调整识别结果。
2.根据权利要求1所述的基于光学字符识别的地理图片位置信息识别方法,其特征在于,所述图片抽取步骤包括如下步骤:
提取地学文献子步骤:从数据库获取地学文献的相关数据,地学文献的相关数据包括标题、ID和PDF文件;
抽取图片子步骤:使用图片抽取工具对PDF类型的地学文献进行图片抽取,抽取出地学文献中的插图。
3.根据权利要求1所述的基于光学字符识别的地理图片位置信息识别方法,其特征在于,所述文本识别步骤包括如下步骤:
图像预处理子步骤:将抽取出的插图进行光学字符识别前的预处理工作,所述预处理工作包括:对图片进行裁剪和将图片转换成灰度图片;
光学字符识别子步骤:使用识别工具对处理后的图片进行光学字符识别,将识别得到的结果以及图片信息存入json文件;
图片筛选子步骤:根据光学字符识别的结果和地理图片中经纬度位置信息的特征,对识别出来的图片进行筛选,筛选出含有地理位置信息的图片。
4.根据权利要求1所述的基于光学字符识别的地理图片位置信息识别方法,其特征在于,所述经纬度抽取步骤包括如下步骤:
文本筛选分类子步骤:对光学字符识别出来的文本进行筛选,筛选出包含地理位置信息的文本,并将包含地理位置信息的文本分为带经纬度信息的文本和带地名信息的文本;
数字规格化子步骤:将带经纬度信息的文本中的数字进行规格化处理,修正光学字符识别潜在的错误,将数字转换成统一的格式储存;
构建经纬度关系矩阵子步骤:将经过所述文本筛选分类子步骤和数字规格化子步骤处理之后的文本按照方位顺序进行排列,并根据处理之后的文本的位置关系和经纬度数值关系构建经纬度关系矩阵,获得经纬度信息。
5.根据权利要求1所述的基于光学字符识别的地理图片位置信息识别方法,其特征在于,所述可视呈现步骤包括如下步骤:
经纬度标识子步骤:将识别出来的经线和纬线标注出来,使用加粗和改颜色在原图中清晰地标示;
前端展示子步骤:在前端展示被标注了经纬度的地理图片,并且以列表的形式展示抽取到的表示地名的文本信息。
6.一种基于光学字符识别的地理图片位置信息识别系统,其特征在于,包括如下模块:
图片抽取模块:从地学文献中抽取出插图;
文本识别模块:对抽取出的插图进行预处理工作,并对预处理后的图片进行光学字符识别,根据光学字符识别的结果对图片进行筛选,筛选出包含地理位置信息的图片;
经纬度抽取模块:对包含地理位置信息的图片的光学字符识别的结果进行数据清洗,把含有经纬度信息的文本规格化,构建经纬度关系矩阵,初步判断出图片包含的经纬度位置信息;
可视呈现模块:标注出图片中识别出的经线和纬线,在前端实时展现出来,并支持根据反馈实时调整识别结果。
7.根据权利要求6所述的基于光学字符识别的地理图片位置信息识别系统,其特征在于,所述图片抽取模块包括如下模块:
提取地学文献子模块:从数据库获取地学文献的相关数据,地学文献的相关数据包括标题、ID和PDF文件;
抽取图片子模块:使用图片抽取工具对PDF类型的地学文献进行图片抽取,抽取出地学文献中的插图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110913963.0/1.html,转载请声明来源钻瓜专利网。