[发明专利]一种深度学习标注样本的管理系统及方法在审
申请号: | 201910974814.8 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110851630A | 公开(公告)日: | 2020-02-28 |
发明(设计)人: | 廖剑锋 | 申请(专利权)人: | 武汉市慧润天成信息科技有限公司 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/58;G06F16/583;G06K9/62 |
代理公司: | 武汉蓝宝石专利代理事务所(特殊普通合伙) 42242 | 代理人: | 王振宇 |
地址: | 430000 湖北省武汉市江*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 标注 样本 管理 系统 方法 | ||
本发明涉及一种深度学习标注样本的管理系统及方法,其中,该系统包括应用层、数据处理层和数据存储层。应用层用于输入操作指令至数据处理层。数据处理层包括样本重命名模块、样本管理模块和格式转化模块,其中样本重命名模块根据数据存储层中原始标注样本的基本信息,对所述原始标注样本进行重命名。格式转化模块用于接收用户交互界面输入的格式转化指令,将标注样本转化为目标格式的数据集。用户能够通过应用层输入操作指令,对数据存储层中的原始标注样本进行重命名,以使用户快速了解标注样本的基本信息,不需再次开发代码分析标注样本的类型,提高对标注样本的管理效率。本发明将标注样本转化为目标格式的数据集,便于深度学习的应用。
技术领域
本发明涉及计算机信息管理领域,尤其涉及一种深度学习标注样本的管理系统及方法。
背景技术
当前,AI的应用越来越多,社会影响也越来越大。但在“人脸识别”、“自动驾驶”、“语音识别”等应用领域崛起的背后,核心依然是越发庞大但要求越发精准的数据。“数据标注”工作自然也就成为将最原始数据变成算法可用数据的关键步骤,是关乎整个AI产业的基础。
虽然国内外有很多公开的数据供我们选择,但基本上所有的样本数据的表达方式和存储方式都不同,这些数据都是人工管理,并且管理方式不够统一,这样就会造成大量的人力资源浪费,而且人工作业数据录入的速度慢、准确率低。
由于现有的标注工具针对图片标注的输出文档名称与图片名称是相关联的,利用多个不同的标注软件对同一张图片的标注样本输出也是一样的,当多个标注样本名称类似时,现有的人工管理方式容易混淆各个标注样本对应的类型,难以正确高效的在深度学习标注样本数据库中查找同种类型的标注数据进行训练。再有,不同深度学习算法针对训练集的格式要求不同,而标注样本的格式与训练集所需的格式存在差异。
发明内容
本发明针对现有技术中存在的上述问题,提供一种深度学习标注样本的管理系统及方法。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供一种深度学习标注样本的管理系统,包括应用层、数据处理层和数据存储层;
所述应用层包括用户交互界面,用于输入操作指令至数据处理层;
所述数据处理层包括:样本重命名模块,用于接收用户交互界面输入的样本重命名指令,根据数据存储层中原始标注样本的基本信息,对所述原始标注样本进行重命名;其中,所述基本信息至少包括标注对象、图像宽×高、图像场景、图像编号、图像格式和重命名时间;
样本管理模块:用于接收用户交互界面输入的样本管理指令,对数据存储层中的标注样本进行管理操作;所述管理操作至少包括查询、分析、下载和删除;
格式转化模块,用于接收用户交互界面输入的格式转化指令,将标注样本转化为目标格式的数据集。
所述数据存储层,用于存储标注样本。
进一步,所述样本管理模块包括:
样本查询子模块,用于接收样本查询指令,查询数据存储层中的标注样本;
样本分析子模块,用于接收样本分析指令,对标注样本进行分析;
样本下载子模块,用于接收样本下载指令,下载指定的标注样本;
样本删除子模块,用于接收样本删除指令,删除指定的标注样本。
进一步,所述数据处理层还包括:样本质检模块,用于接收用户交互界面输入的质检指令,检查每一标注样本和样本图像的映射关系,根据检查结果删除或修改错误的标注样本。
进一步,所述样本质检模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉市慧润天成信息科技有限公司,未经武汉市慧润天成信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974814.8/2.html,转载请声明来源钻瓜专利网。