[发明专利]基于线上大数据智能聚合模式下的数据可靠性评价算法在审
申请号: | 202110287067.8 | 申请日: | 2021-03-17 |
公开(公告)号: | CN113032561A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 谭继军;李阳;蒋华东 | 申请(专利权)人: | 上海数喆数据科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q40/02 |
代理公司: | 成都嘉企源知识产权代理有限公司 51246 | 代理人: | 何朝友 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 线上 数据 智能 聚合 模式 可靠性 评价 算法 | ||
本发明公开了一种基于线上大数据智能聚合模式下的数据可靠性评价算法,包括如下步骤:步骤1,数据源采信的权重赋值:对数据源进行信用评级,决定数据源采信的权重zi;步骤2,数据源可靠性赋值:对同一类型数据基于关键词聚类出现次数进行赋值决定数据采信分值,基于聚类出现次数进行可靠性赋值Si;步骤3,可靠性评价分值计算:取不同结果的基于聚类结果获得可靠性分Si,取这个结果所有数据源中数据源信用评价最高对应的权重系数zi,即可计算该结果可靠性性评价分值Yi=zi*Si。本发明能够自动判断不同数据结果的可靠性,自动实现“去伪存真”的可靠性评价筛选。
技术领域
本发明属于大数据处理技术领域,具体涉及一种基于线上大数据智能聚合模式下的数据可靠性评价算法。
背景技术
目前市面上线上大数据智能聚合服务公司,技术重点偏向线上大数据智能聚合能力、线上数据高效采集管理能力及数据可视化展示能力这类通用能力的建设上,而数据处理重点偏向数据之间的关联性。
由于我司一直聚焦在小微金融大数据风控服务这个业务场景,而风控服务的关键是数据可靠性,所以在我司在传统的线上大数据智能聚合服务的基础上,围绕小微金融大数据风控的场景的特性,重点开发这套基于线上大数据智能聚合模式下的数据可靠性评价算法。
因为只有让聚合数据更可靠,才能让基于线上大数据的风险评价体系更可靠,进而让小微金融的风险更可控,更好助力小微普惠金融的发展。
发明内容
本发明的目的在于提供一种基于线上大数据智能聚合模式下的数据可靠性评价算法,通过一套数据可靠性算法来来自动判断不同数据结果的可靠性,具有自动实现“去伪存真”的可靠性评价筛选的优点。
为解决上述技术问题,本发明所采用的技术方案是:
一种基于线上大数据智能聚合模式下的数据可靠性评价算法,使用基于线上大数据智能聚合模式下的数据可靠性评价终端,具体包括如下步骤:
步骤1,数据源采信的权重赋值:对数据源进行信用评级,决定数据源采信的权重zi;
步骤2,数据源可靠性赋值:对同一类型数据基于关键词聚类出现次数进行赋值决定数据采信分值,基于聚类出现次数进行可靠性赋值Si;
步骤3,可靠性评价分值计算:取不同结果的基于聚类结果获得可靠性分Si,取这个结果所有数据源中数据源信用评价最高对应的权重系数zi,即可计算该结果可靠性性评价分值Yi=zi*Si。
进一步限定,步骤1的具体过程如下:基于数据源网站细分类型领域排名、运营公司背景、数据权威、数据生产方式、以及网站的活跃度,并细分为完全信任、比较信任、一般信任、比较不信任、完全不信任五个层级。
进一步限定,其中,在步骤1中,完全信任的数据源即为白名单网站数据源,在此白名单型数据源中类爬取到数据,即可完全采信,其权重无限大;白名单网站数据源包括“学信网”、“裁判文书网站”。
进一步限定,其中,在步骤1中,完全不信任的数据源即为黑名单网站数据源,在进行数据聚合的过程中自动将此类网站数据源进行排除;完全不信任的数据源包括陌生社交网站。
进一步限定,其中,在步骤1中,比较信任、一般信任和比较不信任的数据源赋予权重系数zi;
比较不信任网站,将其权重系数zi设置为0.8;
一般信任网站,将其权重系数zi设置为1.0;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海数喆数据科技有限公司,未经上海数喆数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110287067.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置