[发明专利]一种文本标注噪声检测方法、装置、存储介质及电子设备有效
申请号: | 202110587910.4 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113343695B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 马星扬;夏妍 | 申请(专利权)人: | 镁佳(北京)科技有限公司 |
主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/216;G06F40/30;G06N20/00 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 李静玉 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本标注噪声检测方法、装置、存储介质及电子设备,该方法包括:获取待训练模型的样本数据集;根据样本数据集采用K折交叉验证得到模型预测结果;基于模型预测结果的输出计算样本数据集中每个数据的信任度;根据信任度和信任度阈值的关系确定样本数据集的噪声文本。通过实施本发明,提出了信任度度量指标,通过对数据样本集中的数据进行信任度评估,根据阈值筛选出噪声文本,可以用于工程上的数据标注纠错。并且,由于该检测方法的检测过程与神经模型无关,无需对模型做任何改动;因此,该检测方法与概率估计和鲁棒性的方法相比,集成性强,简化了繁琐的工程步骤;能够提供灵活的信任度配置,检测过程及效果更加可控。 | ||
搜索关键词: | 一种 文本 标注 噪声 检测 方法 装置 存储 介质 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镁佳(北京)科技有限公司,未经镁佳(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110587910.4/,转载请声明来源钻瓜专利网。