[发明专利]图纸中目录的识别方法、装置、电子设备和存储介质在审
申请号: | 202210818069.X | 申请日: | 2022-07-12 |
公开(公告)号: | CN115205885A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 张泽斌;吴强;康振强;夏莲 | 申请(专利权)人: | 万翼科技有限公司 |
主分类号: | G06V30/422 | 分类号: | G06V30/422;G06V30/412;G06V30/416 |
代理公司: | 深圳智汇远见知识产权代理有限公司 44481 | 代理人: | 聂磊 |
地址: | 519031 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图纸 目录 识别 方法 装置 电子设备 存储 介质 | ||
本申请涉及一种图纸中目录的识别方法、装置、电子设备和存储介质,应用于数据处理技术领域,其中,方法包括:获取到待识别图纸,确定待识别图纸中的目标元素信息,所述目标元素信息为目标目录的表头信息;确定各所述目标元素信息对应的目标元素内容,所述目标元素内容为所述目标目录的表身信息;基于所述目标元素信息和所述目标元素内容,确定所述目标目录。以解决现有技术中,对于目录不在图框中,只是以表格形式存在的情况下,并不能识别目录的问题。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种图纸中目录的识别方法、装置、电子设备和存储介质。
背景技术
在建筑领域及其他工业领域中,用户常常凭借专业的知识对CAD图纸中的内容进行识别,用以建立实体三维模型或指导实际生产。实际应用时,通常设置图纸目录,以便于实现分类和查找。
通常,目录一般存储在图框中,通过对图框进行识别后,确定其中的目录。但是,由于目录样式较多,对于目录不在图框中,只是以表格形式存在的情况下,并不能识别目录,导致不能提取到图纸中全部目录。
发明内容
本申请提供了一种图纸中目录的识别方法、装置、电子设备和存储介质,用以解决现有技术中,对于目录不在图框中,只是以表格形式存在的情况下,并不能识别目录的问题。
第一方面,本申请实施例提供了一种图纸中目录的识别方法,包括:
获取待识别图纸;
确定待识别图纸中的目标元素信息,所述目标元素信息为目标目录的表头信息;
确定各所述目标元素信息对应的目标元素内容,所述目标元素内容为所述目标目录的表身信息;
基于所述目标元素信息和所述目标元素内容,确定所述目标目录。
可选的,所述目标元素信息包括元素名称和第一元素位置,所述元素名称包括序号,所述确定各所述目标元素信息对应的目标元素内容,包括:
基于所述序号的第一元素位置,确定与所述序号在同一列的序号元素内容;
确定每个所述序号元素内容所在行中,各所述目标元素信息对应的目标元素内容,所述目标元素内容中包括所述序号元素内容。
可选的,所述基于所述第一元素位置,确定与所述序号在同一列的序号元素内容,包括:
按照从上到下的顺序,依次提取所述序号所在列中的元素内容;
在所述当前元素内容满足预设条件时,确定所述当前元素内容为所述序号元素内容,所述当前元素内容为所述序号所在列中的任一元素内容,所述预设条件包括所述当前元素内容与相邻的元素内容间,按照预设方式递增。
可选的,还包括:
在所述当前元素内容下方未提取到元素内容时,停止提取所述序号所在列中的元素内容。
可选的,所述确定待识别图纸中的目标元素信息,包括:
对待识别图纸中的进行文字识别,得到文字识别结果,所述文字识别结果包括文字内容和文字位置;
确定所述文字内容中,与预设关键字数据库中的关键字一致的目标文字内容;
基于所述文字位置,确定与所述目标文字内容在同一行的所述文字识别结果为所述目标元素信息。
可选的,所述目标元素内容中包括序号内容、图号内容和图名内容;
所述基于所述目标元素信息和所述目标元素内容,确定所述目标目录,包括:
基于去重条件对所述目标元素内容进行去重处理,得到去重元素内容,所述去重条件包括所述序号内容唯一、所述图号内容唯一,且所述图名内容唯一;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于万翼科技有限公司,未经万翼科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210818069.X/2.html,转载请声明来源钻瓜专利网。