[发明专利]一种基于互联网的商业智能数据分析系统在审
| 申请号: | 202111311344.0 | 申请日: | 2021-11-08 |
| 公开(公告)号: | CN113986904A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 陈浩名;黄鹏 | 申请(专利权)人: | 深圳赛诺百应科技有限公司 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22;G06F16/2458;G06F16/25;G06F16/26 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 518288 广东省深圳市福田区福田*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 互联网 商业 智能 数据 分析 系统 | ||
1.一种基于互联网的商业智能数据分析系统,该分析系统包括登录模块、数据仓库、数据分析模块、系统管理模块;其特征在于,
所述登录模块根据输入的用户名和密码,验证用户的身份,在身份验证通过后启动系统工作;
所述数据仓库包括ODS层和DW层,数据仓库根据数据仓库内预装的ETL从企业内的业务系统抽取数据存放至数据仓库中的ODS层,数据仓库进行数据清洗操作,包括缺失值清洗、格式内容清洗、逻辑错误清洗、非需求数据清洗和关联性验证,然后进行数据转换,将转换后的数据存入数据仓库中的DW层;
所述数据分析模块对数据进行分析,其过程如下:
1)统计需要分析的指标下的数据,其中指标本月的数据、指标的上一年度本月的数据;
2)将原始数据整理转换为数据表格,通过去噪、数据清洗、提取特征处理后将原始数据变换为可处理模式;
3)选择图表库中的任意一种图表形式,然后通过该图表体现数据的特征,包括今年的数据与往年数据进行对比生成的同比对比分析图和本期数据与上期数据进行对比生成的环比对比分析图;
4)数据分析模块内预设有各项指标月度的最低值标准数据月度的最高值标准数据(),用与进行比较,若<,则说明对应的指标业绩低于标准,用,结果记为,并将指标记入低质量度分析表;若,则说明该指标的业绩在标准范围内;若,则说明该指标的业绩高于标准,用,结果记为,将指标记入高质量度分析表;然后用与和进行比较,若<,用,结果记为,用与进行比较,若<,则将插入低质量度分析表前头,若≥,则将放在低质量度分析表后端,若,则说明该指标的业绩在标准范围内;若,则说明该指标的业绩高于标准,用,结果记为,将指标记入高质量度分析表,用与进行标胶,若>,则将指标插入高质量度分析表前头,若≤,则将指标放在高质量度分析表后端,以此类推对指标进行分析,得到低质量度分析表和高质量度分析表;
所述系统管理模块包括用户管理单元和系统升级单元,所述用户管理单元用于新建用户、删除用户和设置用户的角色,所述系统升级单元在联网状态下自动下载最新版本软件,并在下载后弹出安装更新界面。
2.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述数据仓库中缺失值清洗的步骤为:根据缺失比例和字段重要性确定缺失值范围,去除不需要的字段,然后填充缺失内容,最后重新取数,其中填充缺失内容的方法包括:以业务知识推测填充缺失值;以同一指标的计算结果的均值填充缺失值;以不同指标的计算结果填充缺失值。
3.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述数据仓库中格式内容清洗的项目包括:时间、日期、数值、全半角等显示格式不一致、内容中有不该存在的字符和内容与该字段应有内容不符。
4.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述数据仓库中逻辑错误清洗的方法为:首先取出重复数据,然后去除不合理值,修正矛盾内容。
5.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述数据仓库中数据转换的任务有三个:其一是不一致数据的转换,将不同业务系统的相同类型的数据统一编码;其二是数据粒度的转换,将业务系统中明细的数据按照数据仓库粒度进行聚合;其三是商务规则的计算,根据企业的业务规则,对不同的数据指标进行计算。
6.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述图表库中的图表形式包括折线图、柱状图、饼形图、环形图和面积图。
7.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,所述系统管理模块内预设的用户角色包括:管理员和普通员工,其中管理员的权限包括数据查询、数据分析和管理用户,普通员工的权限为数据查询。
8.根据权利要求1所述的一种基于互联网的商业智能数据分析系统,其特征在于,其步骤如下:
S1:输入的用户名和密码,验证用户的身份,启动系统工作;
S2:从企业内的业务系统抽取数据存放至数据仓库中,并清洗数据清洗和转换;
S21:根据缺失比例和字段重要性确定缺失值范围,去除不需要的字段,然后填充缺失内容,最后重新取数,其中填充缺失内容的方法包括:以业务知识推测填充缺失值;以同一指标的计算结果的均值填充缺失值;以不同指标的计算结果填充缺失值;
S22:格式内容清洗:时间、日期、数值、全半角等显示格式不一致、内容中有不该存在的字符和内容与该字段应有内容不符;
S23:数据仓库中逻辑错误清洗:首先取出重复数据,然后去除不合理值,修正矛盾内容;
S24:数据仓库中数据转换:其一是不一致数据的转换,将不同业务系统的相同类型的数据统一编码;其二是数据粒度的转换,将业务系统中明细的数据按照数据仓库粒度进行聚合;其三是商务规则的计算,根据企业的业务规则,对不同的数据指标进行计算;
S3:对数据进行分析:
S31:统计需要分析的指标下的数据;
S32:将原始数据整理转换为数据表格,通过去噪、数据清洗、提取特征处理后将原始数据变换为可处理模式;
S33:选择图表库中折线图、柱状图、饼形图、环形图和面积图的任意一种图表形式,然后通过该图表体现数据的特征,包括今年的数据与往年数据进行对比生成的同比对比分析图和本期数据与上期数据进行对比生成的环比对比分析图;
S34:数据分析模块内预设有各项指标月度的最低值标准数据月度的最高值标准数据(),用与进行比较,若<,则说明对应的指标业绩低于标准,用,结果记为,并将指标记入低质量度分析表;若,则说明该指标的业绩在标准范围内;若,则说明该指标的业绩高于标准,用,结果记为,将指标记入高质量度分析表;然后用与和进行比较,若<,用,结果记为,用与进行比较,若<,则将插入低质量度分析表前头,若≥,则将放在低质量度分析表后端,若,则说明该指标的业绩在标准范围内;若,则说明该指标的业绩高于标准,用,结果记为,将指标记入高质量度分析表,用与进行标胶,若>,则将指标插入高质量度分析表前头,若≤,则将指标放在高质量度分析表后端,以此类推对指标进行分析,得到低质量度分析表和高质量度分析表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳赛诺百应科技有限公司,未经深圳赛诺百应科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111311344.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于角度校正的AVO反演方法及装置
- 下一篇:一种热压定型用纸塑模具





