[发明专利]基于LabelMe的数据标注作业和试卷的评阅方法及系统在审
| 申请号: | 202210527577.2 | 申请日: | 2022-05-16 |
| 公开(公告)号: | CN115018449A | 公开(公告)日: | 2022-09-06 |
| 发明(设计)人: | 杨晨;刘小华;刘鹤鸣 | 申请(专利权)人: | 深圳职业技术学院 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q50/20;G06F16/16 |
| 代理公司: | 深圳市壹壹壹知识产权代理事务所(普通合伙) 44521 | 代理人: | 库水龙 |
| 地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 labelme 数据 标注 作业 试卷 评阅 方法 系统 | ||
本发明实施例公开了一种基于LabelMe的数据标注作业和试卷的评阅方法及系统,所述方法包括:步骤1:对文件进行预处理;步骤2:构建预设的自然语言处理模型并训练,从预处理后的文件中提取答案和标准答案进行比对,完成评阅;步骤3:综合计算得到作业或试卷的最终分数;步骤4:对数据标注作业或试卷进行查重。本发明解决了目前数据标注作业和试卷依赖人工评阅的关键问题,提高数据标注作业和试卷评阅效率和质量,降低数据标注作业和试卷评阅成本;本发明为数据标注在社会、行业企业、高校等处的有效应用提供保障。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于LabelMe的数据标注作业和试卷的评阅方法及系统。
背景技术
随着人工智能技术突飞猛进地发展,数据标注行业也受到了越来越多的关注。在人工智能训练师的国家职业技能标注中,明确指出该职业包含数据标注员和人工智能算法测试员两个工种。人工智能行业企业纷纷寻找专业的数据标注工程师,协同政府、产业协会、高校等机构组织关于数据标注的竞赛和职业认证。高校也开始开设围绕数据标注为核心的课程。
随着数据标注竞赛、职业资格考试、课程的不断涌现和发展,数据标注作业和试卷的数量急剧增加。然而,显著区别于传统学科的作业和考试,其内容多为基于图像的框标注、线标注、区域标注和点标注,而非以文字的形式呈现,且多为无纸化操作,需要特定的软件。当前对于这些数据标注作业和试卷的评阅高度依赖人工,评阅成本较高。以一份包括人脸分类标注、物品分类标注、行人矩形框标注、车牌矩形框标注、人脸矩形框标注、车辆区域标注、道路标志线区域标注和人脸点标注的试题为例,人工评阅一份试卷约需要0.5小时。此外,评阅人高强度连续工作之下必然导致部分作业或者试卷的评分不客观,降低评分质量。
LabelMe是麻省理工学院的计算机科学和人工智能实验室(CSAIL)研发的图像标注软件。该软件为开源软件,使用Python编写,具有图形界面,已被广泛应用于各类数据标注的任务中。使用LabelMe进行数据标注之后会生成一个JSON格式的文件,该文件中包含了多项信息,如软件版本、标签、颜色、点坐标、形状、原始图像路径、原始图像数据。自动化评阅的难点在于,一张图片中可能存在多个需要标注的目标,如何进行坐标计算来判定一个物体是否被正确标注。
发明内容
本发明实施例所要解决的技术问题在于,提供一种基于LabelMe的数据标注作业和试卷的评阅方法及系统,以解决目前数据标注作业和试卷依赖人工评阅的关键问题,提高数据标注作业和试卷评阅效率和质量,降低数据标注作业和试卷评阅成本。
为了解决上述技术问题,本发明实施例提出了一种基于LabelMe的数据标注作业和试卷的评阅方法,包括:
步骤1:通过LabelMe对作业或试卷文件进行数据标注,得到图像文件和对应的JSON文件并提交,对得到的JSON文件进行预处理,剔除其中不合格文件和无需继续评阅的数据,得到预处理后的JSON文件;
步骤2:构建预设的自然语言处理模型并训练,从预处理后的JSON文件中提取人脸分类标注和物品分类标注的答案进行语义理解,然后与标准答案进行比对,完成对处理后的文件的评阅;读取预处理后的JSON文件中的行人矩形框标注、车牌矩形框标注、人脸矩形框标注、车辆区域标注、道路标志线区域标注中的对应的points中的坐标,计算其与标准答案中对应图像的交并比,然后选定多个阈值来进行评分;读取预处理后的JSON文件中的人脸点标注中的对应的points中的坐标,将其与标准答案中的点进行映射,然后计算其与标准答案中同序号点的距离,选定阈值来进行评分;
步骤3:与数据预处理中的扣分项进行综合计算,得到作业或试卷的最终分数;
步骤4:对数据标注作业或试卷进行查重,将同一批数据标注作业或试卷中相同的图像文件的JSON文件找出,对其中的点坐标进行比对,如果两份作业或试卷的重复率超过预设阈值,则判定为抄袭行为,推送给相关人员复核。
进一步地,步骤1中根据以下子步骤对文件进行预处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳职业技术学院,未经深圳职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210527577.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:平面光波电路光分路器/混频器
- 下一篇:一种塑料件组装包装系统及其设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





