[发明专利]基于种子图片识别的输电线路设备关联图片爬取方法在审
申请号: | 201710083698.1 | 申请日: | 2017-02-16 |
公开(公告)号: | CN106844747A | 公开(公告)日: | 2017-06-13 |
发明(设计)人: | 何冰;蓝耕;谢小松;印明骋;王欣庭;赖志超;柴忠良;纪航 | 申请(专利权)人: | 国网上海市电力公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/16 |
代理公司: | 上海科盛知识产权代理有限公司31225 | 代理人: | 赵志远 |
地址: | 200002 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 种子 图片 识别 输电 线路 设备 关联 方法 | ||
技术领域
本发明涉及一种图片爬取方法,尤其是涉及一种基于种子图片识别的输电线路设备关联图片爬取方法。
背景技术
电力是现代工业发展的根本,也是我国的重要资源。为确保电力网络的安全运行,如何对电力网络进行安全巡检,是我们目前研究关注的重点。电线路巡检目前主要可分为人工巡检、机器人巡检、载人直升机巡检和无人机巡检4种方式。传统的人工巡检不仅要求巡检人员具有相关的专业知识,而且还极大的依赖于巡检员的工作态度,并且恶劣的环境也对人工巡检提出了极大的挑战。相比于人工巡检,其他3种巡检方式不仅提高了检修效率,而且人力成本低、风险小。在这类现代的电路巡检方法过程中,会拍摄大量的电路巡检图片,而利用这些巡检图片作为资源,可以开发出一个通过电力图像来分析电力器件安全性的智能系统。在开发一个具有智能检测的系统时,系统的图像资源集的大小对系统的智能识别准备率具有决定性的影响。目前,仅仅依靠巡检过程中现场采集的图片非常有限,而且单一电力企业没有足够的训练数据,计算机的训练集太小,学习训练不够充分,所以导致识别率不高。
因此需要在互联网中搜索图片,然而基于文本关键词的搜索方式在目前已经非常成熟,但是这种基于文本的搜索方式不仅仅依赖对信息的标签分类和搜索引擎供应商的信息存储量,用户输入关键字的细微差别也会对搜索结果的准确度产生重要影响。并且,这种搜索方式只能对万维网上的网页文本内容进行搜索,已经无法满足用户对万维网上多媒体信息的搜索诉求。
发明内容
本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于种子图片识别的输电线路设备关联图片爬取方法。
本发明的目的可以通过以下技术方案来实现:
一种基于种子图片识别的输电线路设备关联图片爬取方法,包括步骤:
S1:获取种子图片;
S2:基于种子图片利用搜索引擎的图片搜索服务器搜索得到关联图片;
S3:下载关联图片。
所述步骤S2具体包括步骤。
S21:将种子图片发送至搜索引擎的图片搜索服务器并一同发送搜索请求;
S22:图片搜索服务器基于种子图片所搜得到关联图片;
S23:接收并获取由搜索服务器返回的关联图片的下载链接;
S23:保存获取的关联图片的下载链接。
所述步骤S23包括步骤:
S231:接收由搜索服务器返回的每一张关联图片的下载链接属性;
S232:从反馈的每一张关联图片的下载链接属性中获取该关联图片的下载链接。
所述步骤S3中,下载关联图片时更新并保存下载状态和源搜索引擎。
所述步骤S4中,采用异步多线程方式下载关联图片。
所述步骤S2中,利用搜索引擎的图片搜索服务器搜索得到关联图片。
与现有技术相比,本发明具有以下优点:
1)利用种子图片在互联网中获得更多的关联图片,基于图片的内容来表达自己的搜索意图,不受文字偏差的影响,得到的关联图片更准确,利于得到充足的智能巡检系统的训练数据。
2)将获取的关联图片的下载链接进行本地保存,从而实现断点续传。
3)从服务器返回的下载链接属性筛选出下载链接,避免了搜索引擎的反爬机制影响。
附图说明
图1为本发明的结构示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
一种基于种子图片识别的输电线路设备关联图片爬取方法,如图1所示,包括步骤:
S1:获取种子图片;
S2:基于种子图片利用多个搜索引擎的图片搜索服务器搜索得到关联图片,具体包括步骤:
S21:将种子图片发送至搜索引擎的图片搜索服务器并一同发送搜索请求;
S22:图片搜索服务器基于种子图片所搜得到关联图片;
S23:接收并获取由搜索服务器返回的关联图片的下载链接;
S23:保存获取的关联图片的下载链接,具体包括步骤:
S231:接收由搜索服务器返回的每一张关联图片的下载链接属性;
S232:从反馈的每一张关联图片的下载链接属性中获取该关联图片的下载链接。
S3:采用异步多线程方式下载关联图片,同时更新并保存下载状态和源搜索引擎。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司,未经国网上海市电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710083698.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电动推杆的齿轮系统结构及电动推杆
- 下一篇:行走小车驱动系统的被传动轴组件