[发明专利]一种基于线性分析的成长性预测方法和装置在审
| 申请号: | 202210173962.1 | 申请日: | 2022-02-24 |
| 公开(公告)号: | CN114638402A | 公开(公告)日: | 2022-06-17 |
| 发明(设计)人: | 欧中洪;崔兆林;宋美娜;张光卫;鄂海红 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/06;G06K9/62 |
| 代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 杜月 |
| 地址: | 100876 北京市海淀区西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 线性 分析 成长 预测 方法 装置 | ||
本发明公开了一种基于线性分析的成长性预测方法和装置,其中,该方法包括:获取企业多个属性数据;将企业多个属性数据输入训练好的线性成长模型进行企业分析评估,以得到企业成长性评分;其中,线性成长模型是基于分布式训练获得;基于企业成长性评分,得到企业成长性预测结果。本发明可以有效的评估企业自身的成长价值,帮助创业园区的管理者评估待入驻企业的成长性,辅助制定相关的优惠政策。
技术领域
本发明涉及评估预测领域,尤其涉及一种基于线性分析的成长性预测方法和装置。
背景技术
随着大数据和人工智能技术在工业界的兴起,基于人工智能的服务越来越多。拥有海量数据的企业可以建立自己的大数据中台,支撑人工智能技术的研发;而数据量不足的企业通常寻求企业间合作。这些数据量不足的企业,由于日渐严苛的数据隐私限制,常常选择联邦学习框架作为研发人工智能服务的技术支撑。联邦学习是一种具有隐私保护的分布式机器学习框架,能在保护数据隐私和数据安全前提下完成多参与方的联合建模任务。该框架包含一台中心节点和多台本地节点。中心节点负责下发训练任务,收集任务结果并聚合为全局模型;本地节点各自在其隐私数据上训练本地模型,将模型上交给中心节点。该过程中不涉及数据传递,因此具有保护隐私的效果。由于联邦学习为大规模集群设计,量级可到数百万,而企业通常仅拥有百台甚至十几台以内的节点,因此联邦学习框架常在小规模集群中运行。
但传统联邦学习框架在小规模场景下面临拜占庭将军问题。拜占庭将军问题,即中心节点无法判断本地节点上传的模型是否正确的问题,在小规模集群中对全局模型的影响极大。该问题发生于以下两种情况:1.本地节点由于包含恶意程序、具有错误的数据集等,发送了错误模型;2.模型在传输过程中遭遇网络波动,导致信息错误或部分缺失。
针对以上问题,现有方法从中心节点的聚合算法入手,在模型聚合时排除拜占庭模型对最终结果的影响。此类技术主要有以下两种方案:
1.使用辅助数据集的方法。该方法要求中心节点保存一个尽可能无偏的数据集,用于验证每轮迭代中每个本地模型的正确性。对于存在网络波动、具有错误数据的节点具有良好检测效果。此类方法往往直接使用该领域的评价指标,如准确率、召回率等,或相似的其他指标。因此便于理解和模型的迭代研发。
2.使用基于模型相似度的方法。该方法基于切比雪夫大数定理。当本地模型数量足够多时,算法认为每个本地模型属于同一分布的不同观测,较大概率具有较高的相似度。而拜占庭模型具有不同的分布,与其他模型相似度低。此类方法对算力和内存的要求较低,在本地模型较多时更具优势。
以上技术方案仍存在诸多问题。对于方案1,如何构建一个无偏数据集,并辅之以合适的评价指标是一个研究方向。但是企业数据通常为隐私敏感数据,缺乏可公开、脱敏的数据集,构造辅助数据集难度较大,因此不适合作为该领域的解决方案。对于方案2,目前方法的效果与模型数量呈正相关,这与小规模场景矛盾。节点数量过少导致模型面临在迭代过程中持续中毒、聚合信息不足、对超参敏感度高等问题。
基于此,现有的技术方案例如不能很好的帮助创业园区的管理者评估待入驻企业的成长性。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的目的在于提出一种基于线性分析的成长性预测方法,可以帮助创业园区的管理者评估待入驻企业的成长性,辅助制定相关的优惠政策,如资金补贴、技术支持等,帮助管理者节约投资成本、降低投资风险、降低管理门槛。
本发明的另一个目的在于提出一种基于线性分析的成长性预测装置。
为达上述目的,本发明一方面提出了一种基于线性分析的成长性预测方法,包括以下步骤:
获取企业多个属性数据;将所述企业多个属性数据输入训练好的线性成长模型进行企业分析评估,以得到企业成长性评分;其中,所述线性成长模型是基于分布式训练获得;基于所述企业成长性评分,得到企业成长性预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210173962.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





