[发明专利]基于多指标维度模型的企业画像方法及系统在审
申请号: | 201710543364.8 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107464037A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 祁明亮 | 申请(专利权)人: | 九次方大数据信息集团有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06 |
代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙)11367 | 代理人: | 蒋路帆,汤才祥 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 指标 维度 模型 企业 画像 方法 系统 | ||
技术领域
本发明涉及企业画像领域,特别是一种基于多指标维度模型的企业画像方法及系统。
背景技术
企业作为社会经济活动的主体,它涉及社会经济生活的各个方面,由于数据获取方法,评价模型等原因,现有企业画像描述方法多是从企业风险评估、企业信用、企业资质等某个方面或者采用标签的方式对企业进行画像的定性描述,难以全面了解企业的整体情况,不能定量地对企业进行画像描述。
针对企业画像,目前常用的主要有基于标签的企业定性画像以及基于某一特定领域的模型画像;基于标签的企业画像是从大量数据中获取企业特征词库,基于预先构建的领域知识库进行特征词扩展,并进行参数训练,获取目标企业的画像标签,生成企业画像;基于某一特征领域的模型画像是针对企业信用,企业风险等特定领域建立风险指标,并确定不同指标的权重参数,建立企业评价等级,生成企业画像。现有方法一方面缺乏对企业整体特征指标的描述,信息不全面;另一方面也是定性的描述,缺乏可量化的指标或者全面的描述,标签描述粒度较粗,灵敏度较低,难以对企业的各种经营和社会活动进行定量描述,当企业信息发生变化时,不能及时响应并且对企业画像进行相应的变化。
申请号为CN105512245A的发明申请公开了一种基于回归模型建立企业画像的方法,包括从互联网采集企业相关的网络数据并进行预处理,获得各企业的网络文本集及有文本特征词构成的特征词库;基于隐狄雷克雷分布算法从网络文本集中获得各企业网络数据的主体分布概率,及各个特征词属于某一主体的后验概率;基于预先构建的领域知识库进行特征词扩展;根据预先建立的画像标签体系,建立回归模型,并进行参数训练;基于已训练好的回归模型,获取目标企业的画像标签;以上述画像标签为主,上述代表性特征词为辅,生成企业画像。该方法步骤较多,计算较为繁琐,对于海量的互联网数据并没有进行分类,而是采用大量计算来解决问题。
发明内容
为了解决上述问题,本发明提供了一种基于多维度指标的企业画像模型方法,采用大数据方法获取企业投资、生产、分配、消费以及内部管理等多种行为数据,基于神经网络、遗传算法将相关信息具象为不同维度的可量化指标,并且利用柯西分布函数以及Bifactor模型,进行归一化处理,建立一种新型的多维度指标积分模型,实现对企业的全方位特征描述和画像。本发明公开的企业画像评价模型与方法,突破了定性或者片面描述企业特征的问题,建立了一种基于定量积分的企业特征描述方法,能够为政府监管、征信、金融、企事业单位提供根据全面、准确的信息支撑。
本发明的具体技术方案如下:
本发明的第一方面提出了一种基于多指标维度模型的企业画像方法,包括数据源获取,包含以下步骤:
步骤1:多维度指标确定;
步骤2:多维度规则确定;
步骤3:多维度规则的归一化处理;
步骤4:多维度模型的确定;
步骤5:模型参数优化调整。
优选的是,所述数据源获取是指基于技术手段获取企业投资、生产、分配、消费和内部管理中至少一种行为数据,形成多源异构的企业数据源。
在上述方案中优选的是,所述技术手段是指互联网舆情、数据交换和数据ETL中至少一种。
在上述方案中优选的是,所述步骤1是指根据对所述企业数据源的全面分析,结合企业工商,税务,监管,经济行为等特征,确定企业全方位的评价指标,并建立完善的企业指标体系。
在上述方案中优选的是,所述企业指标体系包括指标分层评价体系和指标分级评价体系中至少一种。
在上述方案中优选的是,所述企业指标体系由最细粒度的企业信息逐级汇总而成。
在上述方案中优选的是,所述规则是指在具体指标基础上,由不同的指标根据一定的算法灵活组成。
在上述方案中优选的是,所述规则是针对企业某方面的特征进行进一步的描述和量化,根据企业不同的特征建立灵活的规则。
在上述方案中优选的是,所述步骤3是指采用偏大型柯西分布函数为基准进行归一化计算,实现多维度规则的量化计算。
在上述方案中优选的是,所述归一化计算的计算公式如下:
式中,a,b,α,β待解常数,会根据不同的规则具有不同的赋值。
在上述方案中优选的是,所述步骤4是指在所述规则的基础上,由多种所述规则组成对企业的进一步描述,形成企业的多维度模型。
在上述方案中优选的是,不同所述规则之间采用线性加权的方式实现模型的定量计算和描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于九次方大数据信息集团有限公司,未经九次方大数据信息集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710543364.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种调派资源的方法及其系统
- 下一篇:一种太阳能光伏发电站的设计方法及系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理