[发明专利]一种低训练成本的人工智能平台及其使用方法在审
申请号: | 202210403085.2 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114841365A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 吴博文;龚科;陈添水 | 申请(专利权)人: | 拓元(广州)智慧科技有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 511455 广东省广州市南沙区丰泽东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 训练 成本 人工智能 平台 及其 使用方法 | ||
本发明提供了一种低训练成本的人工智能平台及其使用方法,所述低训练成本的人工智能平台,包括:数据管理模块,用于存储、管理数据集,以及进行模块之间的数据交互;标注模块,用于对数据集进行标注;训练和部署模块,用于使用已标注的数据集对模型进行训练,以及将训练好的模型部署出去。本发明能够极大地降低人工智能开发的开发门槛,减低开发成本,使得人工智能项目可以快速验证,迅速落地。
技术领域
本发明涉及深度学习领域,具体涉及一种低训练成本的人工智能平台及其使用方法。
背景技术
随着深度学习技术出现,大数据以及计算能力的提高,人工智能成为推动科技跨域发展、产业优化升级、生产力整体跃升的重要驱动力量,其基础性和关键性作用日益凸显。但是,目前在数据收集,数据标注、模型调参、优化部署等环节需要消耗大量的人力,使得人工智能赋能各个行业的成本非常高昂,难以真正地普及。
另一方面,深度学习模型的训练和部署具有一定的复杂性,需要聘用掌握一定专业技能的工作人员专门从事相关工作,而当下,算法人员的人力成本也是相当昂贵的。
具体地,当前人工智能要在行业中使用,先要收集行业细分领域的数据,由标注人员标注这部分数据,然后由算法工程师训练模型做初步的预研,训练出来的模型交给部署人员去做部署。模型上线后,如发现有错误样例,则需要收集更多数据做标注加入到训练数据中,重新做训练部署,这样形成一个多人员合作的大循环,反复迭代模型,直到准确率达到可以接受的范围。这种大循环需要多种角色的工作人员参与,而且流程很长,需要的人力成本太高,制约着人工智能应用的普及。
因此,急需开发一种简单的、能够低成本实现人工智能训练和部署的平台来解决这些问题。
发明内容
本发明的目的在于针对现有技术中的问题,提供一种低训练成本的人工智能平台及其使用方法,以降低深度学习模型训练的复杂度,降低人工智能应用的成本。
为实现上述目的,本发明采用以下技术方案:
一种低训练成本的人工智能平台,包括:
数据管理模块,用于存储、管理数据集,以及进行模块之间的数据交互;
标注模块,用于对数据集进行标注;
训练和部署模块,用于使用已标注的数据集对模型进行训练,以及将训练好的模型部署出去;
所述数据管理模块包括:
数据导入子模块,用于导入外部的数据集;
数据版本管理子模块,用于对数据集添加版本标签和描述,以区分数据集的不同版本;
所述标注模块包括:
预标注子模块,用于对数据集进行全自动预标注,或供用户对数据集进行半自动预标注;
标注作业子模块,用于供用户对数据集进行标注作业;
数据集发布子模块,用于将标注好的数据集发布到数据管理模块的存储空间中,供训练和部署模块调用。
进一步地,所述标注模块还包括:
任务分配子模块,用于供用户创建标注任务,把较大的数据集拆分成若干较小的子数据集,分配给不同的标注人员进行标注;
任务审核子模块,用于供分配任务的用户确认任务进度,以及对标注人员已标注的数据集进行审核;
所述数据管理模块还包括:数据集分享子模块,用于在不同的用户账号之间进行数据集分享,以辅助任务分配子模块实现任务分配过程中的数据集分享。
进一步地,所述数据管理模块还包括:样例数据收集子模块,用于收集训练和部署模块中部署出去的模型运行时的样例数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拓元(广州)智慧科技有限公司,未经拓元(广州)智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210403085.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种离散加工管理方法及系统
- 下一篇:基于沉浸式多媒体技术的立体音响系统