[发明专利]一种基于大数据环境下的多源数据聚合抽样系统在审

专利信息
申请号: 201810299499.9 申请日: 2018-04-04
公开(公告)号: CN108470074A 公开(公告)日: 2018-08-31
发明(设计)人: 赵志升;梁俊花;梁俊强;李静;刘洋;张晓 申请(专利权)人: 河北北方学院
主分类号: G06F17/30 分类号: G06F17/30;G06K9/46;G06Q10/06
代理公司: 重庆市信立达专利代理事务所(普通合伙) 50230 代理人: 包晓静
地址: 075000 河北*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明属于信息技术领域,公开了一种基于大数据环境下的多源数据聚合抽样系统,包括:主控模块、数据融合模块、去停词和保留关键词单元、统计词频单元、数值合并单元、数据采集模块、展示模块、抽样深度模块、循环匹对模块、图表模块;所述数据融合模块、数据采集模块、展示模块、抽样深度模块、循环匹对模块、图表模块分别与主控模块相连接。所述数据融合模块分为去停词和保留关键词单元、统计词频单元、数值合并单元。本发明能够围绕决策目标,并基于深度学习及贝叶斯推理技术,将上述多源异构数据进行决策目标导向及场景因素驱动的聚合及推理,以筛选出与场景性决策目标相关的数据样本,为进一步数据分析做准备。
搜索关键词: 数据融合模块 决策目标 聚合 词频 数据采集模块 抽样系统 多源数据 深度模块 数值合并 图表模块 展示模块 主控模块 大数据 推理 抽样 多源异构数据 信息技术领域 场景 数据分析 数据样本 贝叶斯 保留 统计 筛选 驱动 学习
【主权项】:
1.一种基于大数据环境下的多源数据聚合抽样系统,其特征在于,所述基于大数据环境下的多源数据聚合抽样系统设置有主控模块、数据融合模块、去停词和保留关键词单元、统计词频单元、数值合并单元、数据采集模块、展示模块、抽样深度模块、循环匹对模块、图表模块;所述数据融合模块、数据采集模块、展示模块、抽样深度模块、循环匹对模块、图表模块分别与主控模块相连接;所述数据融合模块分为去停词和保留关键词单元、统计词频单元、数值合并单元;所述数据采集模块至少包括关于业务目标的社交媒体、新闻平台、专题网站、专利网站、人才招聘的数据资源;所述数据采集模块的数据形式涉及数字、文本、图像、视频结构化或非结构化数据;数据采集模块的数据处理方法包括:输入图像;提取颜色特征和自适应LBP算子特征;多特征底秩矩阵表示模型;s.t.Xi=XiAi+Ei,i=1,…,K其中α是大于0的系数,用来度量噪声和野点带来的误差;等价为以下模型:输出伪区域并得到最后准确的区域;提取自适应LBP算子特征算法的具体步骤如下:(1)将输入系统的图像转换成灰度图像,对图像{grayv(i,j)}像素灰度值求和,再获取平均值:(2)利用总的纹理特征去除背景,计算图像的像素灰度值与平均像素灰度值的差值的绝对值之和,求其平均值:利用局部纹理特征去除背景,用3×3大小的滑动窗口,遍历图像,求取中心像素灰度值与周边像素灰度值之差,在每一个窗口图像内求取平均值:(3)拟合计算自适应阈值的方法:
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北北方学院,未经河北北方学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810299499.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top