[发明专利]一种基于复杂网络的业务部门间数据价值评估的方法在审
申请号: | 201810934690.6 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109189828A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 郑锐韬;李勇波;涂旭平;季统凯 | 申请(专利权)人: | 国云科技股份有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/242 |
代理公司: | 广东莞信律师事务所 44332 | 代理人: | 陈熙 |
地址: | 523808 广东省东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 业务部门 价值评估 复杂网络 业务数据 权重 部门数据 统计分析 业务单位 大数据 构建 统计 流动 分析 交流 | ||
1.一种基于复杂网络的业务部门间数据价值评估的方法,其特征在于:所述的方法包括如下步骤:
步骤1:收集业务部门的业务数据,包括结构化数据及非结构化数据,包括文本数据;
步骤2:构建字典树,把业务数据作为输入,分析获取各业务部门的关键字及出现的次数;
步骤3:整理各业务部门通过字典树分析得出的关键字,对于通用的、无代表性的关键字进行删除,包括“的”、数字;
步骤4:构建复杂网络的各个节点,节点的信息包括:关键字、业务部门、以及关键字次数作为权重;
步骤5:把各业务部门所形成的所有节点,以节点为个体,按关键字作为关联,从而形成复杂网络,各个连接的边,就是各业务部门间的关联度;
步骤6:分析形成的复杂网络,统计各部门间的关键字节点的边的数量,结合各关键字的权重,计算出各部门间的两两数据关联值,形成业务部门之间数据价值量化的评估标准。
2.根据权利要求1所述的方法,其特征在于:所述的方法还包括:
步骤7:在进行数据共享时,业务数据提供部门通过获取要共享的数据,进行关键字获取后,结合业务数据需要的部门,在价值量化评估标准间进行比对,从而得出业务数据共享的量化价值。
3.根据权利要求2所述的方法,其特征在于:所述的方法还包括:
步骤8:通过以上形成的业务数据价值评估标准,在每隔一段时间需重新计算,形成最新的标准内容,以适应各业务部门不断发展的业务数据内容。
4.根据权利要求3所述的方法,其特征在于:所述的字典树即TrieTree算法,实现字符串的出现频率统计,分别将各业务部门中获取的业务数据进行输入计算,获取各业务部门的关键字的出现频率。
5.根据权利要求3所述的方法,其特征在于:所述的步骤3整理业务部门的关键字,主要获取高频出现的关键字;对于单字的关键词,则过滤获取,包括“的”、“得”、“地”等结构助词;获取关键字的频率,可与业务部门进行沟通后获取。
6.根据权利要求4所述的方法,其特征在于:所述的步骤3整理业务部门的关键字,主要获取高频出现的关键字;对于单字的关键词,则过滤获取,包括“的”、“得”、“地”等结构助词;获取关键字的频率,可与业务部门进行沟通后获取。
7.根据权利要求3至6任一项所述的方法,其特征在于:所述的步骤4中,关键字用于各节点的关联的判断;业务部门用于标明关键字的归属;关键字次数用于计算各关键字间的关联重要性。
8.根据权利要求3至6任一项所述的方法,其特征在于:所述的步骤5,如果需要形成的网络数据量大、节点多,可通过基于分布式的计算算法进行实现。
9.根据权利要求7所述的方法,其特征在于:所述的步骤5,如果需要形成的网络数据量大、节点多,可通过基于分布式的计算算法进行实现。
10.根据权利要求3至6任一项所述的方法,其特征在于:所述的步骤6对形成的关键字的复杂网络的计算,分别记录关键字节点两两业务部门的关联关系及各关键字的权重,取两两关键字的权重的平均作为两个关键字的关联值,并把部门间的关系、关键字、关联值进行保存,形成部门间数据共享价值量化的评估标准;
在通过计算各部门间的关键字的关联度的时候,业务部门间可能存在间接关联的情况,此情况需对业务部门进行关联值按半折计算。
11.根据权利要求3至6任一项所述的方法,其特征在于:所述的步骤7从获取的共享数据中按字典树提取出此共享数据的关键字,并结合获取数据的部门,通过形成的评估标准,计算出共享数据的评估价值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国云科技股份有限公司,未经国云科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810934690.6/1.html,转载请声明来源钻瓜专利网。