[发明专利]误识别纠正的数据识别方法、模型训练方法、装置和设备有效

专利信息
申请号: 202310941877.X 申请日: 2023-07-28
公开(公告)号: CN116662764B 公开(公告)日: 2023-09-29
发明(设计)人: 李常宝;顾平莉;王书龙;袁媛;贾贺;李茜;潘爽;尹发 申请(专利权)人: 中国电子科技集团公司第十五研究所
主分类号: G06F18/20 分类号: G06F18/20;G06F18/214
代理公司: 北京启焱知识产权代理有限公司 11894 代理人: 崔建丽
地址: 100083 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 识别 纠正 数据 方法 模型 训练 装置 设备
【说明书】:

本说明书实施例公开了一种误识别纠正的数据识别方法、模型训练方法、装置和设备。数据识别方法包括:获取用户待操作记录;对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集;若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;基于所述新模型准确率与所述原模型准确率,确定上线模型;基于所述上线模型,对待识别数据进行识别,获得数据识别结果。

技术领域

本申请涉及人工智能技术领域,尤其涉及一种误识别纠正的数据识别方法、模型训练方法、装置和设备。

背景技术

数据识别模型用于对特定数据进行数据识别、数据分类等操作,数据识别模型经训练评估后,进入上线服务阶段,其识别能力一般是固化的。而在用户实际使用过程中,由于训练样本集数据变化等原因,数据识别模型在进行数据识别时,可能存在局部数据误识别的情况。

现有技术中,一般采用机器自动标注技术进行数据识别的修正。但是机器自动标注技术只能应用于建模阶段,无法解决模型上线后的能力修正,更无法将用户经验持续在线融合。

因此,需要一种新的数据识别方法,以发现并修正数据识别模型的区域误识别,从而提高数据识别、数据分类的准确性。

发明内容

本说明书实施例提供一种误识别纠正的数据识别方法、模型训练方法、装置和设备,用于解决如下技术问题:现有的机器自动标注技术进行数据识别的修正,只能应用于建模阶段,无法解决模型上线后的能力修正,更无法将用户经验持续在线融合。

为解决上述技术问题,本说明书实施例是这样实现的:

本说明书实施例提供的一种误识别纠正的数据识别方法,包括:

获取用户待操作记录;

对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集,所述用户行为操作包括确认操作、修改操作及浏览操作,其中:若对所述用户待操作记录进行用户行为操作为修改操作,则采用余弦向量获取与所述用户待操作记录相似度高于预设值的记录集,将所述记录集中的各记录的待确认指数增加1作为所述更新的待确认指数;

若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;

若所述新模型准确率相对于所述原模型准确率大于等于预设比值,将所述新模型做为上线模型;

基于所述上线模型,对待识别数据进行识别,获得数据识别结果。

本说明书实施例提供一种误识别纠正的模型训练方法,该训练方法包括:

获取用户待操作记录;

对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集,所述用户行为操作包括确认操作、修改操作及浏览操作,其中:若对所述用户待操作记录进行用户行为操作为修改操作,则采用余弦向量获取与所述用户待操作记录相似度高于预设值的记录集,将所述记录集中的各记录的待确认指数增加1作为所述更新的待确认指数;

若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310941877.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top