[发明专利]一种端子排接线识别并结构化导出的方法在审
申请号: | 202111154013.0 | 申请日: | 2021-09-29 |
公开(公告)号: | CN114283409A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 王新新;武玉萍;白英;郭科;邵雪瑾;李佳怡;施浩楠;宋江宁;彭海涛;胡广燕;王金有;王茜 | 申请(专利权)人: | 宁夏宁电电力设计有限公司 |
主分类号: | G06V30/10 | 分类号: | G06V30/10;G06V30/413;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京天翼专利代理有限责任公司 32112 | 代理人: | 奚铭 |
地址: | 750001 宁夏回族自治区*** | 国省代码: | 宁夏;64 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 端子 接线 识别 结构 导出 方法 | ||
1.一种端子排接线识别并结构化导出的方法,其特征是采集变电站端子排图像,首先经过OCR对图像进行文字识别,并根据OCR识别出的文本框位置及其图像特征,进行端子排接线编号类型识别,最后根据约束导出端子排接线编号的结构化结果,所述结构化结果指识别出的编号和编号类型对应所识别的端子排结构。
2.根据权利要求1所述的一种端子排接线识别并结构化导出的方法,其特征是所述OCR文字识别具体为:
1)对变电站端子排图像进行预处理,包括几何畸变、畸形矫正、去除模糊和图像增强;
2)采用自底向上的方法,检测细粒度字符文本后将其连接成粗粒度的文本区域;
3)训练文本识别网络,将粗粒度文本区域识别的文字识别信息输入到ResNet识别网络,进行训练,损失函数采用CTC loss,在损失值达到最低时认为识别成功;
4)对识别出的文本信息进行贪心编码GREEDY DECODER,贪心策略为:选择的词有最高的可能性;
5)生成并输出最终的文本结果。
3.根据权利要求1所述的一种端子排接线识别并结构化导出的方法,其特征是所述编号类型识别包括:
1)从文本框的位置出发,筛选出识别结果为单个数字类型的文本框,文本框对应的类型为端子口编号;
2)从图像特征出发,识别出端子排主体线,然后根据主体线的位置,主体线上的文本框对应的类型为端子组编号;
3)识别端子排图像中的端子排轮廓,除端子口编号、端子组编号以外,处于轮廓内部的其他文本框对应的类型为接线编号。
4.根据权利要求3所述的一种端子排接线识别并结构化导出的方法,其特征是编号类型识别具体为:
2.1)对端子排图像预处里,包括转换为灰度图像、高斯模糊、边缘锐化;
2.2)识别端子组文本框,根据端子排图像特征,首先识别端子排主体纵向排列的圆形区域,采用RANSAC算法识别出圆形区域排列的直线,得到的直线即为端子排主体所在直线,将被直线所截的文本框作为端子组文本框,其文本内容即为端子组编号;
2.3)识别端子口文本框,首先提取识别结果为数字的文本框作为候选端子口,然后采用基于密度的聚类算法DBSCAN对所有被识别为数字的文本框进行聚类,获得聚类结果,具有坐标点最多的类簇被认为是端子口所在的类簇,确定端子口文本框,其文本内容即为端子口编号;
2.4)识别接线编号的文本框,对端子排灰度图像进行阈值处理、腐蚀杂乱区域后膨胀,再识别轮廓,得到端子排和接线的区域轮廓,未被标记为端子组编号或端子口编号的文本框,如果其位置处于轮廓内部,则被认为是接线编号的文本框,其文本内容即为接线编号。
5.根据权利要求3所述的一种端子排接线识别并结构化导出的方法,其特征是所述结构化导出具体为:
1)分别对端子口编号的文本框从上到下进行排序,上下指按照端子口编号从小到大,最小的端子口为‘上’,最大的端子口为‘下’;
2)对每个端子口,计算端子口与左右侧接线的纵向距离与设定阈值比较,小于设定阈值的则为端子口左右两侧接线,如左右两侧有接线,将与端子口纵向距离最小的接线,作为该端子口对应的接线;如果端子口左右两侧无对应接线,左右接线置为空;
3)将端子口分配给对应的端子组:纵向上每个端子口属于其紧随的端子组;
4)将每个端子口及其左右接线对应到相应的端子组,得到端子排的结构化识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁夏宁电电力设计有限公司,未经宁夏宁电电力设计有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111154013.0/1.html,转载请声明来源钻瓜专利网。