[发明专利]误识别纠正的数据识别方法、模型训练方法、装置和设备有效
申请号: | 202310941877.X | 申请日: | 2023-07-28 |
公开(公告)号: | CN116662764B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 李常宝;顾平莉;王书龙;袁媛;贾贺;李茜;潘爽;尹发 | 申请(专利权)人: | 中国电子科技集团公司第十五研究所 |
主分类号: | G06F18/20 | 分类号: | G06F18/20;G06F18/214 |
代理公司: | 北京启焱知识产权代理有限公司 11894 | 代理人: | 崔建丽 |
地址: | 100083 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 纠正 数据 方法 模型 训练 装置 设备 | ||
本说明书实施例公开了一种误识别纠正的数据识别方法、模型训练方法、装置和设备。数据识别方法包括:获取用户待操作记录;对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集;若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;基于所述新模型准确率与所述原模型准确率,确定上线模型;基于所述上线模型,对待识别数据进行识别,获得数据识别结果。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种误识别纠正的数据识别方法、模型训练方法、装置和设备。
背景技术
数据识别模型用于对特定数据进行数据识别、数据分类等操作,数据识别模型经训练评估后,进入上线服务阶段,其识别能力一般是固化的。而在用户实际使用过程中,由于训练样本集数据变化等原因,数据识别模型在进行数据识别时,可能存在局部数据误识别的情况。
现有技术中,一般采用机器自动标注技术进行数据识别的修正。但是机器自动标注技术只能应用于建模阶段,无法解决模型上线后的能力修正,更无法将用户经验持续在线融合。
因此,需要一种新的数据识别方法,以发现并修正数据识别模型的区域误识别,从而提高数据识别、数据分类的准确性。
发明内容
本说明书实施例提供一种误识别纠正的数据识别方法、模型训练方法、装置和设备,用于解决如下技术问题:现有的机器自动标注技术进行数据识别的修正,只能应用于建模阶段,无法解决模型上线后的能力修正,更无法将用户经验持续在线融合。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种误识别纠正的数据识别方法,包括:
获取用户待操作记录;
对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集,所述用户行为操作包括确认操作、修改操作及浏览操作,其中:若对所述用户待操作记录进行用户行为操作为修改操作,则采用余弦向量获取与所述用户待操作记录相似度高于预设值的记录集,将所述记录集中的各记录的待确认指数增加1作为所述更新的待确认指数;
若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;
若所述新模型准确率相对于所述原模型准确率大于等于预设比值,将所述新模型做为上线模型;
基于所述上线模型,对待识别数据进行识别,获得数据识别结果。
本说明书实施例提供一种误识别纠正的模型训练方法,该训练方法包括:
获取用户待操作记录;
对所述用户待操作记录进行用户行为操作,更新所述用户待操作记录的用户行为状态、所述用户待操作记录的待确认指数及新数据集,获得更新的用户行为状态、更新的待确认指数及更新的新数据集,所述用户行为操作包括确认操作、修改操作及浏览操作,其中:若对所述用户待操作记录进行用户行为操作为修改操作,则采用余弦向量获取与所述用户待操作记录相似度高于预设值的记录集,将所述记录集中的各记录的待确认指数增加1作为所述更新的待确认指数;
若所述更新的待确认指数满足预设条件,则基于原数据集及所述更新的新数据集构建学习样本集对原模型进行重训获得新模型,对所述新模型及所述原模型进行评估,获得新模型准确率及原模型准确率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第十五研究所,未经中国电子科技集团公司第十五研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310941877.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置