[发明专利]一种模型更新方法、装置及设备有效
申请号: | 202211409620.1 | 申请日: | 2022-11-11 |
公开(公告)号: | CN115659182B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 李常宝;顾平莉;王书龙;贾贺;袁媛 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N20/00 |
代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 更新 方法 装置 设备 | ||
本说明书实施例公开了一种模型更新方法、装置及设备,方案包括:获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;采用所述样本数据对所述已训练完成的网络模型进行更新。结合识别数据在人工检验阶段的状态信息,确定样本数据,可将人工检验阶段提供的数据属性值应用到模型更新中,使得网络模型可以更符合实际需求。
技术领域
本申请涉及计算机技术领域,尤其涉及一种模型更新方法、装置及设备。
背景技术
数据标注是目前人工智能应用于数据处理的重要步骤,其核心作用是生成用于人工智能模型训练的数据样本,支撑模型生成或进化,数据标注的质量直接决定训练模型的应用效果,其重要性不言而喻。
目前,数据标注手段主要包括人工打标方法和自动标注软件,其中:人工打标方法针对待处理的文本、图像等数据进行确认、分类、批注等人工打标操作,标注内容包括布尔标签、分类标签、特征标签等,通过逐条标注生成标注结果集合,并在标注过程中完成对标注结果的人工确认。自动标注软件包括华为平台ModelArts、百度PP平台EastDL等典型软件,上述平台主要提供基于预置算法模型的自动打标能力,可对文本、图像等数据进行自动化批量标注,生成的数据标注结果需要人工进行确认。
由于目前数据标注通常是在模型开发阶段,数据标注通常由算法或模型设计人员完成,并且,采用的训练数据与将模型投入使用的使用方需要识别的数据通常存在一定的差异,使得设计人员开发出的模型在使用方处的效果并不是很好。因此,需要提供一种能够让使用方获取效果更好的模型的方法。
发明内容
本说明书实施例提供一种模型更新方法、装置及设备,以解决现有的模型更新方法存在的需要模型开发的技术人员标注样本,模型效果不佳的问题。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种模型更新方法,包括:
获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;
将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;
采用所述样本数据对所述已训练完成的网络模型进行更新。
本说明书实施例提供的一种模型更新装置,包括:
数据获取模块,用于获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;
样本确定模块,用于将处于所述确认态且数据属性值被修改过的识别数据确定为样本数据;
模型更新模块,用于采用所述样本数据对所述已训练完成的网络模型进行更新。
本说明书实施例提供的一种模型更新设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取采用已训练完成的网络模型识别得到的多个识别数据;各个所述识别数据具有表示所述识别数据所处的人工检验阶段的状态信息;所述状态信息包括表示浏览态、确认态、存疑态、修改态中的任一种状态的信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211409620.1/2.html,转载请声明来源钻瓜专利网。