[发明专利]一种数据处理方法及装置、可读存储介质有效
申请号: | 202011644826.3 | 申请日: | 2020-12-31 |
公开(公告)号: | CN112734035B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 张翼;顾华鑫;李辰;廖强 | 申请(专利权)人: | 成都佳华物链云科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/776;G06V10/82 |
代理公司: | 北京超凡宏宇知识产权代理有限公司 11463 | 代理人: | 张萌 |
地址: | 610000 四川省成都市天府新区华*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 可读 存储 介质 | ||
1.一种数据处理方法,其特征在于,包括:
获取多张样本图片和预先训练好的多个验证模型;每张样本图片对应一个标注标签;
将所述多张样本图片分别输入到所述多个验证模型中,获得每个验证模型输出的验证结果;所述验证结果中包括:每张样本图片的标签为预设的多个标签中的每个标签的概率;所述标注标签属于所述多个标签中的标签,所述预设的多个标签不相同;
根据所述多个验证模型输出的验证结果确定每张样本图片对应的标注标签与所述多个标签之间的平均交叉熵;
根据多张样本图片的平均交叉熵确定所述多个标签的拟合分布;
根据每张样本图片的平均交叉熵在所述拟合分布中的概率确定每张样本图片对应的标注标签是否为正确标签。
2.根据权利要求1所述的方法,其特征在于,在所述获取多张样本图片和预先训练好的多个验证模型之前,所述方法还包括:
获取交叉数据集;所述交叉数据集中包括训练数据集和验证数据集,所述训练数据集中包括多张第一样本图片,所述验证数据集中包括多张第二样本图片,所述多张第一样本图片和所述多张第二样本图片均选自所述多张样本图片;
通过所述交叉数据集分别对多个初始的验证模型进行训练,获得训练好的多个验证模型;其中,所述训练数据集用于对初始的验证模型中的分类器进行训练,所述验证数据集用于对训练得到的验证模型进行测试。
3.根据权利要求2所述的方法,其特征在于,在所述通过所述交叉数据集分别对多个初始的验证模型进行训练,获得训练好的多个验证模型之后,所述方法还包括:
确定训练好的多个验证模型的准确率和召回率;
根据所述准确率和所述召回率确定所述训练好的多个验证模型的质量评分;
根据所述质量评分对所述训练好的多个验证模型进行优化。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个验证模型输出的验证结果确定每张样本图片对应的标注标签与所述多个标签之间的平均交叉熵,包括:
通过公式:计算每张样本图片对应的标注标签与所述多个标签之间的平均交叉熵;
其中,为第j张样本图片的平均交叉熵,为第i个验证模型输出的第j张样本图片的标签为预设的第个标签的概率,在第j张样本图片对应的标注标签为所述第个标签时为1,在第j张样本图片对应的标注标签不是所述第个标签时为0。
5.根据权利要求1所述的方法,其特征在于,所述根据每张样本图片的平均交叉熵在所述拟合分布中的概率确定每张样本图片对应的标注标签是否为正确标签,包括:
将每张样本图片的平均交叉熵代入所述拟合分布的概率密度函数中,获得每张样本图片的标签为每张样本图片对应的标注标签的概率;
根据每张样本图片的标签为每张样本图片对应的标注标签的概率和预设的概率阈值确定每张样本图片对应的标注标签是否为正确标签。
6.根据权利要求1所述的方法,其特征在于,在所述根据每张样本图片的平均交叉熵在所述拟合分布中的概率确定每张样本图片对应的标注标签是否为正确标签之后,所述方法还包括:
获取目标样本图片;所述目标样本图片对应的标注标签为错误标签;
根据所述多个验证模型输出的所述目标样本图片的验证结果对所述错误标签进行修正。
7.根据权利要求6所述的方法,其特征在于,所述根据所述多个验证模型输出的所述目标样本图片的验证结果对所述错误标签进行修正,包括:
根据所述多个验证模型输出的所述目标样本图片的验证结果计算所述目标样本图片的标签为预设的多个标签中的每个标签的平均概率;
将所述平均概率最大的标签确定为所述目标样本图片对应的正确标签。
8.根据权利要求6所述的方法,其特征在于,所述根据所述多个验证模型输出的所述目标样本图片的验证结果对所述错误标签进行修正,包括:
根据所述多个验证模型输出的所述目标样本图片的验证结果确定所述多个标签中的每个标签的概率为最大的概率的频率;
将所述频率最大的标签确定为所述目标样本图片对应的正确标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都佳华物链云科技有限公司,未经成都佳华物链云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011644826.3/1.html,转载请声明来源钻瓜专利网。