[发明专利]数据挖掘的方法和装置有效

专利信息
申请号: 201410642239.9 申请日: 2014-11-13
公开(公告)号: CN105653538B 公开(公告)日: 2019-12-20
发明(设计)人: 李晓晨;陈川;岳亚丁;易玲玲;贺鹏;管刚;刘婷婷;孔庆超;张育浩;毛文吉 申请(专利权)人: 中国科学院自动化研究所;腾讯科技(深圳)有限公司
主分类号: G06F16/2458 分类号: G06F16/2458
代理公司: 44224 广州华进联合专利商标代理有限公司 代理人: 何平;邓云鹏
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种数据挖掘的方法,包括以下步骤:获取各个用户的行为序列,所述行为序列中包含多条按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。上述方法可挖掘出准确的用户行为频率提升因素。此外,还提供一种数据挖掘的装置。
搜索关键词: 数据 挖掘 方法 装置
【主权项】:
1.一种数据挖掘的方法,包括以下步骤:/n获取各个用户的行为序列,所述行为序列中包含多个按照行为执行时间顺序排列的行为节点,所述行为节点由行为与行为执行时间组成;/n搜索所述行为序列中对应的提升值满足预设的长期提升条件的行为节点作为所述行为序列中的行为频率提升点,所述行为节点对应的提升值为所述行为序列中该行为节点后的行为发生频率与所述行为序列中该行为节点前的行为发生频率的比值;/n获取发生时间满足行为频率提升点相关的时间条件的对应用户发生的事件作为行为频率提升因素。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所;腾讯科技(深圳)有限公司,未经中国科学院自动化研究所;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410642239.9/,转载请声明来源钻瓜专利网。

同类专利
  • 基于大数据处理的反欺诈方法、服务器及计算机可读存储介质-201910881748.X
  • 吴佳翌 - 平安银行股份有限公司
  • 2019-09-18 - 2020-02-14 - G06F16/2458
  • 本发明涉及大数据处理技术,揭露了一种基于大数据处理的反欺诈方法,包括:当接收到数据处理请求时,将申请人地址进行逐级穷举拆分,并提取出地址特征数据,将申请人电话号码进行逐段拆分,并提取出电话号码特征数据;将地址特征数据和电话号码特征数据整合,生成预处理数据;获取并处理申请人在内外部的个人历史数据和关联数据,生成结构化全局数据;将预处理数据和结构化全局数据导入到反欺诈评估模型计算得到申请人的欺诈评分值;根据申请人的欺诈评分值反馈相应的业务处理建议,当评分值超过预设值时,将停止业务办理并生成欺诈提示。本发明还提供一种服务器及计算机可读存储介质,能够提高银行业反欺诈的准确性和实时性。
  • 交通规则数据处理方法、装置、存储介质和计算机设备-201910915409.9
  • 谢真灼 - 腾讯大地通途(北京)科技有限公司;腾讯科技(深圳)有限公司
  • 2019-09-26 - 2020-02-14 - G06F16/2458
  • 本申请涉及一种交通规则数据处理方法、装置、存储介质和计算机设备,该方法包括:获取历史轨迹数据集合,历史轨迹数据集合包括至少一个历史轨迹路线,历史轨迹路线存在对应的导航路线,获取基于路网拓扑关系构建的路网,根据路网确定历史轨迹路线在路网中对应的有序路段集合,将有序路段集合中的相邻路段形成对应的有序路段对,根据历史轨迹路线和导航路线确定有序路段对对应的目标特征组合,将目标特征组合输入至已训练的交通规则预测模型中,得到对应的交通规则异常路段对,根据交通规则异常路段对确定目标交通规则缺失路段。本申请提供的方案能够提高道路交通规则缺失路段挖掘效率。
  • 数据抽取方法及装置-201910956869.6
  • 杨卫乾;陆登强;袁进威;林晓光;马吉甫 - 中国建设银行股份有限公司;建信金融科技有限责任公司
  • 2019-10-10 - 2020-02-14 - G06F16/2458
  • 本发明提供一种数据抽取方法及装置,方法包括:获取目标数据集以及确定该目标数据集对应的目标数据抽取操作规则;基于所述至少两个预设的数据抽取操作步骤对所述目标数据集进行提取处理得到至少两个预设的数据抽取操作步骤各自对应的数据集合;对至少两个预设的数据抽取操作步骤各自对应的数据集合进行集合运算,得到结果数据集,以应用该结果数据集获取对应的数据抽取信息。本发明能够提高数据挖掘的效率,实现复杂的数据的筛选条件以及数据集合的复杂操作;可以选择任意一个或者多个数据抽取操作步骤,以及任意组合多个步骤组成新的数据操作步骤,实现数据的筛选条件的复用,进而提高了数据挖掘的效率,以及提高抽取数据的灵活性。
  • 一种关联数据获取方法、装置、设备及存储介质-201911048147.7
  • 王林;谢永恒;火一莽 - 北京锐安科技有限公司
  • 2019-10-30 - 2020-02-14 - G06F16/2458
  • 本发明公开了一种关联数据获取方法、装置、设备及存储介质。该方法包括:对原始数据进行处理获得有效数据,将有效数据保存在数据仓库中;根据预设参数从数据仓库中抽取出关联数据,其中,预设参数包括关联字段或项目编号。本发明实施方式中通过对原始数据进行处理获得有效数据,并将有效数据保存在数据仓库中,并根据预设参数可以从数据仓库中抽取出关联数据,实现了从大数据中有效获取出关联数据,从而提高了用户的体验效果。
  • 基于模糊匹配的地址标准化方法、系统、设备及介质-201911094604.6
  • 崔晶晶;张建东 - 集奥聚合(北京)人工智能科技有限公司
  • 2019-11-11 - 2020-02-14 - G06F16/2458
  • 本发明提供了一种基于模糊匹配的地址标准化方法、系统、设备及介质,所述方法包括:接收用户定位请求并从用户定位请求中获取地址参数;调用高德API及本地标准化ES库,获取与所述地址参数相似度较高的预设数量的地址节点;计算各所述地址节点与所述地址参数对应经纬度的距离偏移值;选取所述距离偏移值中最小值对应的地址节点作为真实地址并返回给用户。利用本发明实施,在外卖、同城服务、快递等派件互联网服务中实现了地址标准化,提高了企业订单处理效率,降低企业运营成本,增强了企业核心竞争力。
  • 数据处理方法及装置-201710021033.8
  • 张金苗;杨剑;魏明智;武帅;姚海涛 - 北京市天元网络技术股份有限公司
  • 2017-01-11 - 2020-02-14 - G06F16/2458
  • 本发明涉及一种数据处理方法及装置,其中,所述方法包括:接收数据存储请求信息;从预先定义的数据库连接池中获取与所述数据存储请求信息对应的数据库连接节点;更新所述数据库连接节点对应的本地数据库,并生成同步操作信息;将所述同步操作信息发送给网络中的其他节点,以使所述其他节点根据所述同步操作信息更新所述其他节点各自的本地数据库。本发明的数据处理方法及装置,可以解决海量数据处理效率低下的问题,实现优化数据存储,进而可以提升数据查询效率以及容错能力。
  • 表数据查询方法及装置-201610799750.9
  • 秦传瑜 - 华为技术有限公司
  • 2016-08-31 - 2020-02-14 - G06F16/2458
  • 本发明公开了一种表数据查询方法及装置,属于信息技术领域。该方法包括:对应用程序发送的表数据查询请求进行解析;接收应用程序发送的查询参数的参数值;根据多个数据表的查询分区键值,确定多个数据表的查询分区;当多个数据表的查询分区相同时,将表数据查询请求发送至目标数据库;将目标数据库返回的最终查询结果发送至应用程序。本发明根据多个数据表的查询分区键值确定出多个数据表的查询分区相同后,将所接收到的表数据查询请求发送至查询分区所对应的数据库,进而将该数据库所返回的最终查询结果发送至应用程序,该过程中无需对多个数据表进行二次处理,不仅提高了表数据的查询效率,而且减小了传输的数据量,提升了业务性能。
  • 一种法院被执行人隐匿财产估算决策支持系统架构-201910926429.6
  • 林杰;杨兆洁;吴双胜;张振宇;苗润生;周立欣;杨玉舒 - 同济大学
  • 2019-09-27 - 2020-02-11 - G06F16/2458
  • 本发明涉及一种法院被执行人隐匿财产估算决策支持系统架构,该系统架构是一个面向法院的估算被执行人隐匿财产的决策支持系统,该系统在技术上主要实现隐匿涉案财物线索挖掘的被执行人画像模块、财物隐匿案例库构建、隐匿财物行为统一量化模型、隐匿涉案财物识别模型、隐匿财产金额估算等模型在应用平台中的集成和交互,搭建集被执行人个人信息数据、可供执行财产数据、互联网金融信息、直系亲属等信息的存储、分析和利用于一体的执行法官办案辅助支持系统。与现有技术相比,本发明具有降低司法成本,提升执行工作质效,估算精确度高等优点。
  • 异常医保申请检测方法、装置、计算机设备和存储介质-201910971925.3
  • 梁洁;黄越 - 平安医疗健康管理股份有限公司
  • 2019-10-14 - 2020-02-11 - G06F16/2458
  • 本申请涉及智能决策的监测模型领域,具体涉及一种异常医保申请检测方法、装置、计算机设备和存储介质。方法包括:提取待理赔医保申请的药品使用记录;将用药种类数据输入预设孤立森林模型,获取各药品处方中各种药品的用药异常权重值,得到各药品处方的用药异常权重值。统计各个病种下的参保人单次药品总花费,利用箱形图算法,判定是否为异常药品花费;当存在药品处方的用药异常权重值处于异常区域,且单次药品总花费为异常药品花费时,判定待理赔医保申请为异常申请。本申请通过对参保人提交的医保申请中的药品使用是否出现异常以及药品费用是否异常两个角度对医保申请进行检测,综合判定其是否违规,提高了检测医保门诊用药违规的准确性。
  • 数据处理方法及装置、处理器、电子设备及存储介质-201910983537.7
  • 刘光灿;张伟 - 深圳市商汤科技有限公司
  • 2019-10-16 - 2020-02-11 - G06F16/2458
  • 本申请公开了一种数据处理方法及装置、处理器、电子设备及存储介质。该方法包括:获取待处理序列数据,所述待处理序列数据包含多个待处理数据,所述多个待处理数据均包含一个或多个维度的数据;依据所述待处理序列数据中不同维度的数据之间的第一相关性和/或所述待处理序列数据中不同的待处理数据之间的第二相关性,获得目标序列数据。还公开了相应的装置、处理器、电子设备及存储介质。以实现依据待处理序列数据预测获得目标序列数据。
  • 信息查询方法、装置、系统、服务器和客户端-201610608904.1
  • 叶良;祝海峰;胡月军 - 阿里巴巴集团控股有限公司
  • 2016-07-28 - 2020-02-11 - G06F16/2458
  • 本申请实施例公开了一种信息查询方法、装置、系统、服务器和客户端,所述系统包括:信息交互集群和资源搜索集群,资源搜索集群中针对不同语种分别对应设置有不同的索引区间;不同索引区间中的一个分别指向至少一个资源;信息交互集群,用于根据源语种的关键词生成多个查询请求并发送给所述资源搜索集群;多个查询请求中的一个对应一个目标语种;资源搜索集群用于根据所述查询请求的目标语种确定所述查询请求对应的索引区间;将所述查询请求在所述索引区间指向的资源中进行查询;向所述信息交互集群反馈所述查询请求的查询结果;所述信息交互集群,还用于对资源搜索集群返回的不同目标语种的查询结果处理后反馈所述查询结果。可以降低查询成本。
  • 操作数据库的系统和方法-201810750365.4
  • 张满良 - 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
  • 2018-07-10 - 2020-02-07 - G06F16/2458
  • 本发明公开了一种操作数据库的系统和方法,涉及计算机技术领域。该系统的一具体实施方式包括:代理消息传递单元和多个子消息传递单元;所述多个子消息传递单元用于链接不同的数据库;所述代理消息传递单元用于:接收来自应用服务集群的数据库操作命令;根据所述数据库操作命令,从多个子消息传递单元中确定目标消息传递单元;将所述数据库操作命令发送至目标消息传递单元,以实现对数据库的操作。该实施方式能够解决现有技术中的数据库链接数爆炸问题和单点问题,便于扩展与数据库链接的应用服务集群。
  • 一种大数据环境下的数据管理方法及系统-201910811160.7
  • 李卫群;张涛;陆苇;雷厚宇;兰海翔 - 贵州力创科技发展有限公司
  • 2019-08-30 - 2020-02-07 - G06F16/2458
  • 本发明涉及一种大数据环境下的数据管理方法及系统,其方法包括以下步骤,利用ETL工具采集多种数据源的大数据,并进行预处理形成预处理大数据;根据预设需求对所述预处理大数据进行算法分析或/和数据挖掘或/和数据计算或/和数据存储处理,形成基础环境大数据;通过资源调度接口,将所述基础环境大数据对外提供数据可视化服务。本发明提供大数据运行基础技术环境,实现多数据源接入、数据采集处理、数据表管理、文件管理、数据探索和模型建立;能够支持存储TB级数据,很好的支持数据量的爆炸式增长存储需求;提供ETL工具接入数据、分布式计算、流计算、内存计算的应用框架,具备提供大数据技术挖掘能力,具备算法建模能力。
  • 一种基于可离线的SPC数据采集方法及系统-201910899486.X
  • 徐祖峰;丁小果;冯磊 - 南京泰治自动化技术有限公司
  • 2019-09-23 - 2020-02-07 - G06F16/2458
  • 本发明公开一种基于可离线的SPC数据采集方法及系统,首先,操作员在数据采集客户端登录时需要校验是否有使用权限,在与SPC系统连线时能够通过SPC系统在线验证操作员身份和权限,在与SPC系统离线时能够根据最后一次成功登录结果验证身份,或者通过SPC系统下载验证码文件,利用移动存储设备复制到客户端,完成离线登录方式验证身份;然后,数据采集客户端依据设置的样本属性,采集样本数据;最后,将采集到的实时样本数据保存成结构化数据文件,在网络正常场景下通过FTP将文件上传到服务端文件系统;SPC数据接收线程持续扫描与数据采集客户端约定的数据文件上传路径,并从上传路径中移到备份路径。采用本发明能够提高数据采集效率和可靠性。
  • 一种融资融券多维度指标分析和展示方法-201910950464.1
  • 方有伟 - 江苏天鼎证券投资咨询有限公司
  • 2019-10-08 - 2020-02-07 - G06F16/2458
  • 本发明提供一种融资融券多维度指标分析和展示方法,包括以下步骤:S1、通过交易所数据接口获取融资融券数据;S2、通过数据金融特性,挑选因子并列出因子池;S3、通过因子分别与上证指数时间序列做相关性检验,得到皮尔森相关性系数;S4、通过相关性系数判断因子是否有效;S5、通过折线图和柱状图展示有效因子;S6、通过时间周期对数据进行拟合并返回S2;具有分析功能且展示全面性、直观性的优点。
  • 一种树结构的挖掘系统及大型结构数据库-201910966062.0
  • 任薇;周扬 - 西南大学
  • 2019-10-12 - 2020-02-07 - G06F16/2458
  • 本发明属于数据挖掘技术领域,公开了一种树结构的挖掘系统及大型结构数据库。所述树结构的挖掘系统包括:结构数据的预处理模块、结构数据的挖掘模块、规则的解释和可视化模块。所述结构数据的挖掘模块包括:树结构的扩展和生长模块,树结构的剪枝模块。结构数据的预处理模块,利用现在流行的树(图)的规范化技术来获取结构数据和对结构数据预处理。结构数据的挖掘模块,应用树(图)的扩展和生长技术、树(图)的剪枝技术等理论对结构数据挖掘,获得相关的算法。规则的解释和可视化模块,采用统计分析技巧,结构数据挖掘原语,各种可视化技术,对规则进行评价,解释和可视化。
  • 分布式对账处理方法、装置、设备及存储介质-201910995687.X
  • 王俊磊;李鑫 - 京东数字科技控股有限公司
  • 2019-10-18 - 2020-02-07 - G06F16/2458
  • 本申请提供一种分布式对账处理方法、装置、设备及存储介质,该方法包括:接收主服务器发送的对账调度信息,所述对账调度信息包括所述从服务器所负责的目标数据标识;根据所述对账调度信息,获取所述目标数据标识对应的目标源数据;基于所述目标源数据进行对账处理,获得对账结果。由于将源数据进行了切片,调度到多个服务器进行对账处理,有效减少对账等待时间成本,提高对账处理效率,从而提高用户体验。
  • 一种基于大数据处理技术的数据管理方法-201911047290.4
  • 陈兖清 - 陈兖清
  • 2019-10-30 - 2020-02-07 - G06F16/2458
  • 本发明涉及数据处理技术领域,且公开了一种基于大数据处理技术的数据管理方法,包括以下操作步骤:第一步,获取客户信息;第二步,挖掘客户潜在信息;第三步,导出客户信息。直接替代传统的数据处理方法,使得数据在处理过程中,始终保持时效性,确保之前的信息与现在的信息结合在一起,保证数据库内部的储存信息与客户相关,使得企业能充分了解客户的行为习惯,使得企业可以自主选择具有较高价值的潜在客户,从而提升企业的利益,同时通过对数据库内部的低质量信息直接剔除,使得数据库内部保留与客户息息相关的信息,使得数据库内部的价值大大提高,且与现如今的数据信息相联,保证数据的质量,使得数据的时效性大大提高。
  • 一种停车场数据展示方法、系统、计算机设备及存储介质-201911087813.8
  • 周洪峰 - 深圳微品致远信息科技有限公司
  • 2019-11-08 - 2020-02-07 - G06F16/2458
  • 本发明公开了一种停车场数据展示方法、系统、计算机设备及存储介质,通过采用客户端和服务端的前后端数据分离模式,服务端根据客户端发送数据展示请求将停车场数据按多小时段、多分钟段进行拆分并封装,以便客户端对数据进行分类查询并展示,避免了展示数据过多过杂导致地客户端卡顿,使数据看起来更直观快速,方便管理用户了解一段时间内停车场数据情况,为后续用户了解停车高峰期和缴费情况提供了方便。
  • 一种基于智能配电网的故障诊断方法-201911118326.3
  • 王靖淏;牛加威;耿涛 - 王靖淏
  • 2019-11-15 - 2020-02-07 - G06F16/2458
  • 本发明公开了一种基于智能配电网的故障诊断方法,属于配电网故障诊断技术领域,首先以保护、断路器作为条件属性,故障区域作为决策属性,考察各种故障情况并建立原始决策表,然后利用关联规则挖掘进行属性约简,通过修改阈值进行交互式挖掘,直接提取最佳属性约简组合,然后利用最佳属性约简组合形成的约简决策表和关联规则交互式挖掘,针对各种情况的故障信息进行诊断推理,用关联规则挖掘进行属性约简时,通过修改阈值进行交互式挖掘,能直接得到最佳约简事务表,能省去用粗糙集约简属性后再采用基于平均互信息的最佳属性约简组合选择法的计算量,在故障信息准确且完整,算例结果表明仍能迅速得到正确的故障诊断结果,正确率高。
  • 基于Storm的实时关键词近似搜索算法-201710057432.X
  • 汪璟玢;陈远 - 福州大学
  • 2017-01-23 - 2020-02-07 - G06F16/2458
  • 本发明涉及一种基于Storm的实时关键词近似搜索算法,综合使用Redis内存数据库中的Hash、Set和Sorted Set三种数据结构来分门别类地存储RDF数据;结合Storm流式处理框架实现了RDF数据的实时流入和实时近似搜索;同时利用存储在Redis内存数据库集群中的历史数据来加快关键词近似搜索的效率。本发明支持对实例、文本、类和属性的搜索,并且实现对流式数据的实时近似搜索,具有明显的优势。
  • 一种大数据挖掘系统-201710799148.X
  • 白云飞 - 北京海融兴通信息安全技术有限公司
  • 2017-09-07 - 2020-02-07 - G06F16/2458
  • 本发明涉及一种大数据挖掘系统,包括大数据存储模块、数据提取模块、数据检查模块、数据挖掘模块、结果验证模块、数据报告模块和日志模块。数据提取模块从大数据存储模块中提取符合用户需求的数据集,将数据集发送给数据检查模块;数据检查模块检查数据集的完整性并对数据集进行过滤,去除数据集中错误的或不一致的数据,保证了有效数据集的有效性,将过滤后的有效数据集发送给数据挖掘模块;数据挖掘模块采用多种挖掘算法对有效数据集进行挖掘分析,既能够提高大数据挖掘的准确性,又能保护用户隐私信息不被泄露;结果验证模块验证数据挖掘结果的准确性;数据报告模块根据数据挖掘结果生成数据报告;日志模块记录数据挖掘过程中产生的日志数据。
  • 试题高阶属性挖掘方法及系统-201610425977.7
  • 苏喻;张丹;刘青文;邓晓栋;陈志刚;魏思;胡郁 - 科大讯飞股份有限公司
  • 2016-06-14 - 2020-02-07 - G06F16/2458
  • 本发明公开了一种试题高阶属性挖掘方法及系统,该方法包括:获取试题的低阶属性及学生历史答题信息,所述低阶属性包括试题的知识点或技能;对不同低阶属性进行组合,形成预估高阶属性;基于所述低阶属性及学生历史答题信息,确定学生能力;根据所述学生能力和学生历史答题信息,确定各预估高阶属性上的学生能力在每个试题中的权重;统计权重大于设定阈值的学生能力对应的各预估高阶属性的个数;如果所述个数大于设定值,则将对应的预估高阶属性作为试题的高阶属性。利用本发明,可以高效、准确地确定试题的高阶属性。
  • 一种数据分析方法及系统-201910245141.2
  • 张帆;路明奎 - 北京九章云极科技有限公司
  • 2019-03-28 - 2020-02-07 - G06F16/2458
  • 本发明提供了一种数据分析方法及系统,涉及数据分析领域。该数据分析方法,包括:基于待分析的业务数据和/或业务场景获取基本特征,并确定特征衍生方式;根据确定的特征衍生方式对所述基本特征进行衍生,得到衍生特征;根据所述衍生特征创建业务模型,以执行分析处理操作。上述方案,可以提高业务模型与业务场景和业务需求的契合度,提高数据分析的准确度。
  • 用于确定多个变量之间的因果效应的方法、系统和介质-201810738606.3
  • 刘春辰;李伟 - 日本电气株式会社
  • 2018-07-06 - 2020-02-04 - G06F16/2458
  • 本公开的实施例涉及一种用于确定多个变量之间的因果效应的方法。该方法包括确定多个变量中的第一变量的第一潜在结果和多个变量中的第二变量的第二潜在结果;基于第一潜在结果和第二潜在结果,确定用于描述对于第二变量的因果效应的问题公式;基于第一潜在结果、第二潜在结果和混杂变量,建立与因果效应的相关联的第一模型,第一潜在结果和第二潜在结果;以及基于第一模型和问题公式,确定因果效应。此外,本公开还涉及用于确定多个变量之间的因果效应的设备和计算机可读存储介质。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top