[发明专利]一种视觉问答方法、系统及服务器有效

申请号：	202110540093.7	申请日：	2021-05-18
公开（公告）号：	CN113205507B	公开（公告）日：	2023-03-10
发明（设计）人：	卫星;沈奥;韩知渊;翟琰;李航;葛久松;陆阳;赵冲	申请（专利权）人：	合肥工业大学
主分类号：	G06T7/00	分类号：	G06T7/00;G06T7/11;G06F16/332;G06F16/58;G06F16/583;G06F16/78;G06F16/783;G06F16/215;G06Q50/06;G07C1/20
代理公司：	北京东方盛凡知识产权代理有限公司 11562	代理人：	菅士腾
地址：	230009 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视觉问答方法系统服务器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种视觉问答方法、系统及服务器，包括：获取输电设备的图像数据，图像数据包括视频数据和图片数据；预处理图像数据，得到原始数据集；对原始数据集依次进行视觉问答标注和语义分割标注，得到视觉问答数据集；对视觉问答数据集进行训练，得到视觉问答模型；输入问题文本和图片到视觉问答模型，得到视觉问答结果。本发明对图像数据进行视觉问答标注和语义分割标注，得到视觉问答数据集，从而建立了图像数据的语义分割与文本问答之间的图文链接；根据该视觉问答数据集训练得到的视觉问答模型，以图文链接作为锚点，将输入的图片与文本在语义上对齐，提高了视觉问答模型的性能，获得了更加准确的视觉问答结果。

技术领域

本发明涉及一种视觉问答技术领域，特别是涉及一种视觉问答方法、系统及服务器。

背景技术

目前电力系统的输电设备巡检方式大致可以分为人工巡检和无人机巡检两种。其中无人机巡检由于其成本低、效率高、细节精等特点，得到越来越多的应用。

但是，无人机巡检所获得的大量输电设备航拍图像数据，由于缺少针对输电设备航拍图像的公共数据集，导致计算机不能直接读取和标注图片信息，从而缺乏标注数据对模型进行监督训练，很难高质量完成输电设备外观缺陷检测任务。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种视觉问答方法、系统及服务器，用于解决现有技术中缺少针对输电设备航拍图像的公共数据集，很难高质量完成电输电设备外观缺陷检测任务的问题。

本发明的第一方面提供一种视觉问答方法，包括：获取输电设备的图像数据，所述图像数据包括视频数据和图片数据；

预处理所述图像数据，得到原始数据集；

对所述原始数据集依次进行视觉问答标注和语义分割标注，得到视觉问答数据集；

将所述视觉问答数据集输入视觉问答模型进行训练，得到训练后的视觉问答模型；

输入问题文本和图片到所述训练后的视觉问答模型，得到视觉问答结果。