[发明专利]基于云ERP供应链生态圈的生成对抗网络生成数据的方法在审
申请号: | 202210595581.2 | 申请日: | 2022-05-26 |
公开(公告)号: | CN115098674A | 公开(公告)日: | 2022-09-23 |
发明(设计)人: | 廖伟智;黄鹏伟;阎德劲;阴艳超 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 成都启慧金舟知识产权代理事务所(特殊普通合伙) 51299 | 代理人: | 何媛 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 erp 供应 生态 生成 对抗 网络 数据 方法 | ||
本发明公开了一种基于云ERP供应链生态圈的生成对抗网络生成数据的方法,通过进行多模态数据收集;进行主成分分析和文本降噪;进行数据不平衡处理。该方法构建合适的生成对抗网络模型来生成所需的少数类别数据,使生成的数据更加符合真实样本的数据分布,进而合理地解决数据不平衡问题。
技术领域
本发明涉及数据处理技术领域,具体是一种基于云ERP供应链生态圈的生成对抗网络生成数据的方法。
背景技术
企业资源计划(
供应链多企业群业务协同过程中产生的各类大数据与个性化需求,使传统ERP系统已经无法满足供应链企业对海量运营数据的处理以及企业多元化的需求,因此传统ERP系统的转型已成为必然趋势。自云计算概念以来,云计算因其高灵活性、可靠性和性价比及动态可扩展等特点在各个领域得到极大青睐,基于云计算的云ERP也应运而生。云ERP是通过结合大数据、互联网和云计算等新兴技术实现ERP云化应用,是一种全新的技术和服务模式。
云平台模式是服务于实体经济的重要模式,对促进经济转型升级、提高经济发展质量具有重要作用。近年来,随着社会分工细化、信息技术进步,我国供应链发展已进入与互联网、物联网深度融合的新阶段,成为产业及经济的新型组织形态。
数据不平衡是在分类任务所使用的数据集中,存在某些种类的数据量远远高于其他种类,或是某些种类的数据量远远少于其他种类,数据集中种类数量存在严重失衡、不均,导致在后期使用该数据集训练机器学习模型时模型存在过拟合现象。无论是银行、金融机构还是公司,构建一个有效的信用评估模型,不仅要求模型在已有的历史数据上具有很高的准确性,对未知预测时更要有准确的判断。在现实存在的历史数据中违约的情况常常远远少于履约的情况,而违约情况造成的损失往往很严重,因此在建立模型时需要考虑数据集的数据种类分布问题。
目前都没有考虑少数类别样本的整体数据分布或其共同特点。通过采样方法解决数据不平衡问题虽然有一定的效果,但无法解决数据分布问题。
发明内容
本发明的目的在于克服上述背景技术中提出的问题,提供了一种基于云ERP供应链生态圈的生成对抗网络生成数据的方法,该方法构建合适的生成对抗网络模型来生成所需的少数类别数据,使生成的数据更加符合真实样本的数据分布,进而合理地解决数据不平衡问题。
本发明的目的主要通过以下技术方案实现:
基于云ERP供应链生态圈的生成对抗网络生成数据的方法,包括以下步骤:
(1)进行多模态数据收集;
(2)进行主成分分析和文本降噪;
(3)进行数据不平衡处理。
本方法处理流程主要包括多模态数据收集、主成分分析、文本降噪和数据不平衡处理四大部分,其中多模态数据收集用于解决云ERP生态圈数据来源单一、覆盖面窄、静态不全面等问题,主成分分析用于解决财务指标数据之间存在相关性、特征不易提取等问题,文本降噪用于解决文本噪声影响文本语义问题,数据不平衡处理用于解决数据比例失衡引起模型过拟合问题。首先收集相关的财务指标数据和文本评论数据,然后对数据进行预处理,最后用生成对抗网络生成少数类别数据并进行实验验证,为后续的研究提供有效的数据支撑,针对数据集数据数量分布不均、模型产生过拟合,构建生成对抗网络利用生成器生成数据,更加符合实际数据分布,解决数据不平衡问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210595581.2/2.html,转载请声明来源钻瓜专利网。