[发明专利]一种基于众包的图片分组采集系统有效
申请号: | 201810343483.3 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108764279B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 梅建萍;胡业晟 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图片 分组 采集 系统 | ||
一种基于众包的图片分组采集系统,包括:登录注册修改设置模块,用于用户需经过注册、登录,系统通过数据库修改和保存用户信息;随机读取图片模块,根据用户选择的任务中每组图像的数目N从图库中随机选取待分组图片和提示;交互界面设计模块,通过分组的方式用户将图片分别归入不同的组别;用户操作记录保存模块,用于对用户的一些操作记录进行保存;众包结果评估模块,用于通过矩阵的方式来表示标签之间的关系,通过计算得到用户分组的准确度;展示和导出模块,用于对聚类结果进行展示并可导出为不同格式的文件;数据库设计模块,用于设计类,分别储存用户信息、图片信息、聚类任务信息和包任务信息。本发明提升面向聚类的辅助信息的有效性。
技术领域
本发明涉及机器学习和图像识别领域,更进一步涉及一种基于众包的图片分组采集系统。
背景技术
在很多半监督图像聚类方法中,都要用到某种表示的辅助信息来辅助聚类,比如带有类别标签的图像或者两个图像之间的约束关系,即两个图像是否属于同一个类。众包提供了一种相对廉价的获取人工给出的辅助信息的技术,已经被学术界和商业界成功应用。由于聚类分析一般用于探索性数据分析,即聚类前并不清楚有多少个类以及每个类的信息分别是什么,在实际应用中就不能定义类别的标签。两两约束关系虽然在大多数聚类问题中都适用,但是由于每个约束只涉及两个图像,需要大量约束才能使得聚类效果得到明显改善。因此,定义新的更加有效的辅助信息类型并且通过众包来获取对开发更加高效、廉价的半监督聚类方法具有重要意义。
发明内容
为了克服已有技术面向聚类的辅助信息的有效性较差的不足,本发明提供了一种提升面向聚类的辅助信息的有效性的基于众包的图片分组采集系统,通过众包平台让参与者对从目标图像库中抽取的若干个图像进行分组从而采集多个图像子集的分组结果。
本发明解决其技术问题所采用的技术方案是:
一种基于众包的图片分组采集系统,所述系统包括:
登录注册修改设置模块,用于用户需经过注册、登录,系统通过数据库修改和保存用户信息;
随机读取图片模块,根据用户选择的任务中每组图像的数目N从图库中随机选取待分组图片和提示;
交互界面设计模块,通过分组的方式用户将图片分别归入不同的组别,若没有所需组别可新增分组;每个组别能够添加新标签,在分组完成或者需要休息时点击提交将已经分组的数据提交给数据库进行储存;
用户操作记录保存模块,用于对用户的一些操作记录进行保存,包括完成任务需要的时间,任务个数,以及完成分组的图片数目。
众包结果评估模块,用于通过矩阵的方式来表示标签之间的关系,通过计算得到用户分组的准确度;
展示和导出模块,用于对聚类结果进行展示,分组展示和列表展示,并可导出为不同格式的文件;
数据库设计模块,用于设计4个类,分别储存用户信息、图片信息、聚类任务信息和包任务信息。
进一步,所述随机读取图片模块中;设数据库中有X0张未分组的图片,以及l个已分组的图片子集库L;根据用户选择的任务中每组图片的数目N(N≥10)以及所需要的示例数,从L随机抽取k+k′(k≥1,k′≥0)个已分组的图片子集,其中k个分组共包含P(PN)张图片的分组结果被隐藏只用于最后的评估,k′个分组结果向用户展示作为提示;从X0抽取N-P张未分组的图片构成N张待分组的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810343483.3/2.html,转载请声明来源钻瓜专利网。