[发明专利]一种根据多数据源防欺诈的方法和系统在审
| 申请号: | 201710415509.6 | 申请日: | 2017-06-05 |
| 公开(公告)号: | CN107330705A | 公开(公告)日: | 2017-11-07 |
| 发明(设计)人: | 王亚博;李莉莉;付春;陈放 | 申请(专利权)人: | 国政通科技股份有限公司 |
| 主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06F17/30 |
| 代理公司: | 北京辰权知识产权代理有限公司11619 | 代理人: | 董李欣 |
| 地址: | 100195 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 根据 多数 据源防 欺诈 方法 系统 | ||
1.一种根据多数据源防欺诈的方法,其包括:
步骤一,采集多维度信息数据;
步骤二,信息聚合整理,将所述多维度信息数据预处理为统一格式的预处理数据;
步骤三,将上述预处理数据代入高维动态协方差矩阵,计算信息匹配度;
步骤四,根据上述计算的结果判断用户行为。
2.如权利要求1所述的根据多数据源防欺诈的方法,其特征在于:步骤一中采用网络爬虫方法进行目标抓取,从而采集所述数据。
3.如权利要求2所述的根据多数据源防欺诈的方法,其特征在于:所述网络爬虫方法包括如下步骤:
(一)、使用杜威十进分类法,在网页特征提取阶段,快速找出网页文本与锚文本关键词主题相近的关键词;
(二)、提取主题候选链接特征文本;
(三)、使用朴素贝叶斯文本分类器对候选链接主题边缘文本进行分类,获取主题相关网页;如果文本属于特定主题,那么相对应的候选链接以分类权值作为优先级值,以优先级的大小顺序插入爬行队列,爬虫优先访问分类值大的链接,如果文本不属于特定主题,则丢弃候选链接;
(四)、对相关网页的Web链接信息用HITS算法计算出其对应的权威度和中心度,综合锚文本、锚文本附近信息、反向网页、反向链接的兄弟链接、URL链接,预判待爬取网页与主题的相关度。
4.如权利要求3所述的根据多数据源防欺诈的方法,其特征在于:所述提取主题候选链接特征文本包括如下步骤:
(1)对网页的锚文本和正文进行分词处理,去掉停用词,得到关键词;
(2)查找关键词的杜威分类号码;
(3)运用杜威十进制分类法的特性并结合二维坐标提取主题候选链接特征文本;把关键词分类号码的长度作为X轴,关键词分类号码作为Y轴,将关键词对应的杜威十进分类号码在二维坐标中绘制相应的点;
(4)提取二维坐标中锚文本关键点以及锚文本周围的关键点对应的关键词作为主题候选链接特征文本。
5.如权利要求1所述的根据多数据源防欺诈的方法,其特征在于:所述信息聚合整理包括如下步骤:
(1)、基于OpenD服务访问相关网站信息;
(2)、根据网站提供的开放式API接口获取网站上的相关用户个性化数据;
(3)、对不同网站获取的用户个性化数据进行预处理;
(4)、基于模糊自适应信任度的值的信息聚合处理;
(5)、基于Mash-up技术根据用户个性化需求进行页面聚合显示。
6.如权利要求5所述的根据多数据源防欺诈的方法,其特征在于:
上述步骤(3)的预处理过程如下:对用户ID进行识别,然后规划出用户的会话路径,采用浏览器本地缓存技术对路径完整性和正确性进行检测,得到完整的正确路径后,根据网站的拓扑结构进行事务分割,生成事务数据文件存储到事务数据库中;根据抽取的日志数据获取用户的频繁路径长度和深度,并且识别用户的最大前向访问路径集MFPS,根据MFPS得到频繁最大前向访问路径集F-MFPS,再由F-MFPS集合搜索得到用户的F-MFPS访问路径的页面标签和资源集合。
7.如权利要求1所述的多数据源防欺诈的方法,其特征在于:
所述信息匹配度为上述矩阵的正定或负定情况。
8.如权利要求7所述的多数据源防欺诈的方法,其特征在于:所述步骤四的具体方法为:若所述高维动态协方差矩阵为正定的,则认为用户正常行为,如果所述结果为非正定的,则认为所述用户行为有欺诈行为,采取相应的限制措施进行防范。
9.一种根据多数据源防欺诈的系统,其特征在于,包括顺序连接的如下模块:
数据采集模块,用于采集多维度信息数据;
信息聚合模块,用于信息聚合整理,将所述多维度信息数据预处理为统一格式的预处理数据;
匹配度计算模块,用于将上述预处理数据代入高维动态协方差矩阵,计算信息匹配度;
判断模块,用于根据上述计算的结果判断用户行为。
10.如权利要求9所述的多数据源防欺诈的系统,其特征在于:
所述信息聚合模块包括顺序连接的如下单元:
访问单元,用于基于OpenD服务访问相关网站信息;
数据获取单元,用于根据网站提供的开放式API接口获取网站上的相关用户个性化数据;
预处理单元,用于对不同网站获取的用户个性化数据进行预处理;
信息聚合单元,用于基于模糊自适应信任度的值的信息聚合处理;
页面聚合显示单元,用于基于Mash-up技术根据用户个性化需求进行页面聚合显示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国政通科技股份有限公司,未经国政通科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710415509.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种隐藏式升降照明机构
- 下一篇:一种高效散热自清洁LED路灯





