[发明专利]数据异常归因分析方法及装置有效
申请号: | 201810456688.2 | 申请日: | 2018-05-14 |
公开(公告)号: | CN108647891B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 张鹏 | 申请(专利权)人: | 口口相传(北京)网络技术有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/04 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;陈翠 |
地址: | 100102 北京市朝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 异常 归因 分析 方法 装置 | ||
本发明公开了一种数据异常归因分析方法及装置。其中方法包括:获取待监测指标的第一数据;利用预设数据模型计算第一数据发生数据异常的异常概率;若异常概率大于或等于预设阈值,获取归因指标数据;基于归因指标数据,利用预设归因算法进行归因分析计算,将归因分析结果发送给处理端,能够大大降低公司或企业对数据异常监控所消耗的人力成本,提高准确度,该方法具有很好的普适性。此外,还大大降低了对业务经验的依赖,而且通过量化异常程度,便于对大量指标进行自动准确监控,提高数据监控效率,减轻分析人员的工作量,通过将归因分析结果发送给处理端,可供处理端进行故障排除,提高排障效率。
技术领域
本发明涉及数据处理技术领域,具体涉及一种数据异常归因分析方法及装置。
背景技术
随着互联网的普及,各行各业的公司每时每刻都在生产沉淀海量的数据。为了利用这些数据,不同公司,依据公司的业务偏好从数据中提炼出了大量的不同的数据指标,用于衡量公司业务发展情况,公司产品质量情况等等。
以电子商务网站为例,衡量公司业务的数据指标包含:日活跃用户数,日浏览量,月活跃用户数,月浏览量,用户点击率,用户交易转化率,用户注册转化率,平均用户浏览量,平均浏览深度,平均停留时长,页面停留时间,着陆页跳出率,页面二跳率,用户复购率,平均复购时间等等。
以口碑平台的O2O业务为例,口碑平台拥有百万级别的线下店铺,每个店铺每天会产出与其相关的交易笔数,交易金额,初级营销笔数,初级营销金额,高级营销笔数,高级营销金额,折扣率,作弊笔数,作弊金额等数据指标。
对于数据指标的监控分析,各行各业都存在着大量的需求,传统的方式是将这些指标整理成表格或者可视化为曲线或柱状图或饼图等,人工查看分析;或者以简单的统计指标监控为主,对数据异常的判断相对简单并依赖主观经验。
这里面存在几个问题:第一,有些公司业务指标数量非常多(例如口碑),靠分析人员逐个观察分析,效率非常低下,而且容易由于疏忽而导致遗漏;第二,分析人员对数据异常的判断主要依靠个人经验,这导致不同分析人员对于数据异常的判断标准不同,也最终会导致分析结果的不同;第三,当某项数据指标异常时,比如电商网站的订单转化率异常下降,当原因非常直接明显单一时,靠分析人员的观察分析可能比较容易得到结论,而当原因错综复杂,而且相对不是很明显时,单单依靠分析人员的经验,往往得不到有效的可量化的归因结论。
以阿里ODPS平台表数据监控为例,ODPS监控平台对表数据的监控仅限于对简单统计量(总数据条数、空值、数据升降百分比等)进行阈值监控(根据业务经验设定)。当需要监控的数据表(字段)相对比较少,业务经验较为充分,并且上述简单统计量能够表现出需要监控的异常时,才能够达到相对较好的效果;而对于如果对大量表(字段)进行监控,并且业务经验相对不足、仅靠简单的统计量无法达到异常监控目的时,则无法进行有效的数据监控(例如口碑平台店铺经营异常的发现任务,由于店铺数量多(百万级别),每个行业的相应指标波动变化不一致,每个店铺交易额的波动规律也不一致,导致人工定制规则比较困难,而且一刀切式的规则也往往经常设定的不合理)。
因此,如何能够对公司或企业关心的数据指标出现异常时能够自动发现,并且给出产生异常可能的原因,辅助分析人员进行分析诊断,是本发明急需解决的问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的数据异常归因分析方法及装置。
根据本发明的一个方面,提供了一种数据异常归因分析方法,包括:
获取待监测指标的第一数据;
利用预设数据模型计算第一数据发生数据异常的异常概率;
若异常概率大于或等于预设阈值,则获取归因指标数据;
基于归因指标数据,利用预设归因算法进行归因分析计算,将归因分析结果发送给处理端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于口口相传(北京)网络技术有限公司,未经口口相传(北京)网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810456688.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种跨省区剩余输电能力评估系统
- 下一篇:一种订单调度方法、装置及电子设备
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置