[发明专利]一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置有效
申请号: | 202110401101.X | 申请日: | 2021-04-14 |
公开(公告)号: | CN113297902B | 公开(公告)日: | 2023-08-08 |
发明(设计)人: | 赵江华;王学志;周园春 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
主分类号: | G06V20/13 | 分类号: | G06V20/13;G06V10/764;G06V10/774;G06N20/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模式 在线 标注 遥感 影像 生成 样本 数据 方法 装置 | ||
本发明涉及一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置。该方法的步骤包括:将遥感影像标注众包任务划分为若干子任务;读取各子任务对应的遥感影像区域数据作为遥感影像子图,采用机器学习模型对遥感影像子图提取待标注的矢量多边形;将子任务分配给参与众包任务的用户,执行子任务并得到用户对子任务中待标注的矢量多边形的语义标注结果;将采用机器学习模型获得的遥感影像未标注区域的预测结果与已标注的矢量多边形区域进行叠加合并,生成遥感影像标注样本数据集。本发明能够大大降低众包在线标注的工作量,能够保证所有子任务均能被执行,能够减轻在线可视化渲染的负担。
技术领域
本发明属于遥感图像领域中的遥感影像在线标注流程,涉及采用众包方式制作遥感影像标注样本数据集,主要应用于遥感影像语义分割深度学习模型的训练等应用。
背景技术
遥感技术的快速发展使得覆盖全球的影像获取越来越方便,而且影像分辨率的提高使得影像的数据量呈几何级数递增。在使用遥感影像进行土地覆盖、资源和环境保护等领域的分析时,都需要对遥感影像进行解译。遥感影像自动解译需要样本来提高解译能力和精度,同时解译结果也需要样本来验证。传统的采集遥感影像样本数据的做法是研究人员下载并标记大量遥感影像,来满足其设计的机器学习方法。这种方式不仅耗时、成本高,还受制于遥感影像信息提取人员的时间和精力,以及对不同土地利用类型在遥感影像中的表现特征的熟悉程度,往往难以扩展可用训练样本的数据量。
众包是一种分布式的问题解决和生产模式,是解决难以自动处理任务的一种有效方式。人的知识,智慧,经验,技能都可以通过互联网转换成实际收益,对数据质量的提高也能起到一定作用,特别是在人类比较擅长的图像解释方面。因此本发明通过众包方式来收集遥感影像标注样本集。
发明内容
为了满足公众参与遥感影像信息提取工作的需求,同时扩展可用遥感影像训练样本的数据量,本发明提供一种基于众包模式在线标注遥感影像生成样本数据集的方法和装置。
本发明采用的技术方案如下:
一种基于众包模式在线标注遥感影像生成样本数据集的方法,包括以下步骤:
将遥感影像标注众包任务划分为若干子任务;
读取各子任务对应的遥感影像区域数据作为遥感影像子图,采用机器学习模型对遥感影像子图提取待标注的矢量多边形;
将子任务分配给参与众包任务的用户,执行子任务并得到用户对子任务中待标注的矢量多边形的语义标注结果;
采用机器学习模型获得遥感影像未标注区域的语义信息预测结果;
将遥感影像未标注区域的语义信息预测结果与已标注的矢量多边形区域进行叠加合并,生成遥感影像标注样本数据集。
进一步地,所述将遥感影像标注任务划分为若干子任务,包括:根据遥感影像的像素的行列数量,将含有若干像素的子图作为子任务。
进一步地,所述将子任务分配给参与众包任务的用户,包括:
每个子任务有一个具体的任务量和一个参与任务执行的最大人数;
根据当前参与用户的列表,按子任务的优先级进行顺序分配。
进一步地,对子任务按照被处理次数划分所述优先级,未被处理的子任务优先级最高,每个优先级内的子任务随机排序。
进一步地,对于已经被处理过的子任务,判断用户id以避免同一用户多次参与同一子任务;对于被处理完成的子任务,添加参与处理该子任务的用户id,并修改该子任务的优先级。
进一步地,所述执行子任务,包括:用户通过目视解译对待标注的多边形进行语义标注,即标注该多边形内的地物类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110401101.X/2.html,转载请声明来源钻瓜专利网。