[发明专利]模型的自训练方法、装置、计算机设备及存储介质在审

专利信息
申请号: 201811605200.4 申请日: 2018-12-26
公开(公告)号: CN111435449A 公开(公告)日: 2020-07-21
发明(设计)人: 熊友军;罗沛鹏;廖洪涛 申请(专利权)人: 深圳市优必选科技有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06F40/295;G06N3/04;G06N3/08
代理公司: 深圳中细软知识产权代理有限公司 44528 代理人: 仉玉新
地址: 518000 广东省深圳市南山区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 训练 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请涉及一种模型的自训练方法,该方法包括:接收自定义的语料模板和实体;根据所述语料模板和实体生成训练语料,所述训练语料中包括训练文本和对应的文本标注,所述训练文本是根据所述语料模板和实体进行组合生成的;将所述训练文本作为待训练模型的输入,将对应的文本标注作为所述待训练模型的期望输出对所述待训练模型进行训练,训练完成得到目标模型。该模型的自训练方法只需要用户自定义语料模板和实体便可自动生成训练语料,并自动根据训练语料进行模型的训练得到目标模型,简单方便,实现了简易、便捷、高效地识别机器语料。此外,还提出了一种模型的自训练装置、计算机设备及存储介质。

技术领域

发明涉及计算机处理领域,尤其是涉及一种模型的自训练方法、装置、计算机设备及存储介质。

背景技术

随着计算能力的提升和深度学习算法的广泛应用,越来越多的问题能够被深度学习解决。然而,深度学习技术具有一定的门槛,需要比较扎实的数学、编程基础,当面对庞大的信息需求时,专业的深度学习者也难于支持。尤其,在机器学习中,因传统的深度学习应用的门槛高,大多数人无法通过简易便捷的方式解决机器人语料识别的问题,导致降低机器的分类或实体识别任务的效率。

发明内容

基于此,有必要针对上述问题,提供了一种能简易、便捷、高效地识别机器语料的模型的自训练方法、装置、计算机设备及存储介质。

第一方面,本发明实施例提供一种模型的自训练方法,所述方法包括:

接收自定义的语料模板和实体;

根据所述语料模板和实体生成训练语料,所述训练语料中包括训练文本和对应的文本标注,所述训练文本是根据所述语料模板和实体进行组合生成的;

将所述训练文本作为待训练模型的输入,将对应的文本标注作为所述待训练模型的期望输出对所述待训练模型进行训练,训练完成得到目标模型。

在其中一个实施例中,当所述待训练模型为意图识别模型时,所述文本标注是根据所述语料模板的类型确定的;当所述待训练模型为实体识别模型时,所述文本标注是根据所述训练样本中的实体的类型确定的。

在其中一个实施例中,在所述接收自定义的语料模板和实体之前,还包括:接收针对应用的模型训练请求,根据所述训练请求为所述应用的模型分配唯一的模型标识,所述模型标识用于区分不同应用的模型;所述接收自定义的语料模板和实体,包括:接收与所述模型标识对应的自定义语料模板和实体。

在其中一个实施例中,在所述根据所述语料模板和实体生成训练语料之后,还包括:根据预设规则对所述训练语料中的训练文本进行检查,所述预设规则包括是否存在重复配置的训练文本、训练文本的长度是否符合预设长度中的至少一种;当所述训练文本不符合所述预设规则时,则生成提醒通知。

在其中一个实施例中,在所述根据所述语料模板和实体生成训练语料之后,还包括:统计训练服务器的剩余计算资源,当所述剩余计算资源大于预设资源阈值时,则将所述待训练模型的训练任务发送给所述训练服务器;所述将所述训练文本作为待训练模型的输入,将对应的文本标注作为所述待训练模型的期望输出对所述待训练模型进行训练,得到目标模型,包括:通过所述训练服务器将所述训练文本作为待训练模型的输入,将对应的文本标注作为所述待训练模型的期望输出对所述待训练模型进行训练,得到目标模型。

在其中一个实施例中,所述统计训练服务器的剩余计算资源,包括:获取影响所述训练服务器剩余计算资源的指标,所述指标包括:内存的占用、CPU使用率、GPU使用率,GPU的显存中的至少一种;获取正在训练的模型数量和所述训练语料的大小;根据所述指标、所述正在训练的模型数量和所述训练语料的大小计算得到所述训练服务器的剩余计算资源。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市优必选科技有限公司,未经深圳市优必选科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811605200.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top