[发明专利]基于Agent的分布式海量数据挖掘系统在审

专利信息
申请号: 201711491379.0 申请日: 2017-12-30
公开(公告)号: CN110019412A 公开(公告)日: 2019-07-16
发明(设计)人: 周峻松;徐继峰;祁建明;陈墩金 申请(专利权)人: 广州明领基因科技有限公司
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/83
代理公司: 暂无信息 代理人: 暂无信息
地址: 510610 广东省广州市天河区*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于Agent的分布式海量数据挖掘系统,该系统包括:用户层、系统控制层、数据挖掘层及数据源层;其中,所述用户层负责提供用户与系统交互的接口,主要完成用户身份的验证、用户输入的采集、挖掘的过程以及最终结果的输出;所述系统控制层负责响应所述用户层提交的请求,并控制整个系统的有效运行;所述数据挖掘层由多个移动agent并行完成挖掘任务,负责实现对整个分布式数据环境的透明访问,将访问结果提交给所述系统控制层;所述数据源层负责提供数据查询及格式转换服务,为所述数据挖掘层提供数据支持。本发明方案引入数据挖掘算法,通过运用、扩展数据挖掘语言,有效地实现了对分布的、异构异质数据源的集成和访问。
搜索关键词: 数据挖掘层 系统控制层 用户层 海量数据挖掘 数据源层 挖掘 数据挖掘算法 分布式数据 异质数据源 有效地实现 访问结果 格式转换 扩展数据 数据查询 数据支持 透明访问 系统交互 用户身份 有效运行 最终结果 异构 并行 采集 验证 输出 响应 引入 移动 语言 访问 服务
【主权项】:
1.基于Agent的分布式海量数据挖掘系统,其特征在于,所述系统包括:用户层、系统控制层、数据挖掘层及数据源层;其中,所述用户层负责提供用户与系统交互的接口,主要完成用户身份的验证、用户输入的采集、挖掘的过程以及最终结果的输出;所述系统控制层负责响应所述用户层提交的请求,并控制整个系统的有效运行;所述数据挖掘层由多个移动agent并行完成挖掘任务,负责实现对整个分布式数据环境的透明访问,将访问结果提交给所述系统控制层;所述数据源层负责提供数据查询及格式转换服务,为所述数据挖掘层提供数据支持。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州明领基因科技有限公司,未经广州明领基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711491379.0/,转载请声明来源钻瓜专利网。

同类专利
  • 一种基于行政单元对统计数据进行动态处理的方法及系统-201910567482.1
  • 吕鹏 - 华迪计算机集团有限公司
  • 2019-06-27 - 2019-11-12 - G06F16/2458
  • 本发明公开了一种基于行政单元对统计数据进行动态处理的方法及系统,其中方法包括:建立行政单元的标准地址库,管理不同版本的行政单元的标识信息,以及确认不同版本的行政单元的标识信息的关联关系;按关联关系,将不同版本的行政单元归一为同一标准行政单元;提取统计数据中的行政单元的标识信息的字段,利用字段,将统计数据中的行政单元与标准地址库中的标准行政单元进行匹配;将多个统计数据中的指标数据融合到匹配后的标准行政单元,并对融合后的指标数据进行处理,包括:对融合后的指标数据进行异常核查,识别指标数据中的异常值;通过指定公式对对融合后的缺失的指标数据或指定的统计指标进行数据填充;按需求导出指标数据。
  • 分类统计方法、装置及系统-201910721207.0
  • 王亮 - 普信恒业科技发展(北京)有限公司
  • 2019-08-06 - 2019-11-12 - G06F16/2458
  • 本申请提供一种分类统计方法、装置及系统,其方法包括:从交易数据库确定客户端对应的客户端交易数据;依据当前业务渠道标识确定当前业务渠道,并确定当前业务渠道下的当前产品业务类别集,及,每个当前产品业务类别下的当前产品基础类别集;对客户端交易数据进行产品基础类别的数据汇总,获得与多个产品基础类别一一对应的多个产品基础类别汇总结果;基于每个产品业务类别下的当前产品基础类别集,对多个产品基础类别汇总结果进行产品业务类别的数据汇总,获得与当前产品业务类别集中各个当前产品业务类别对应的各个产品业务类别汇总结果;将各个产品业务类别汇总结果,确定为与投资交易统计请求对应的投资交易统计结果。
  • 涉及区块链的搜索数据处理方法及其装置-201910727584.5
  • 吉建勋;杨慧;田翔 - 北京艾摩瑞策科技有限公司
  • 2019-08-07 - 2019-11-12 - G06F16/2458
  • 本申请公开了涉及区块链的搜索数据处理方法及其装置,所述方法包括:业务节点根据存储在区块链上的搜索数据,生成用户列表;其中,所述用户列表中相同用户地址对应至少一种搜索数据属性,一位用户对应一个用户地址,所述业务节点为区块链系统中处理搜索数据关联关系的区块链节点;所述业务节点对所述用户列表执行上链操作,以便于将所述用户列表存储在区块链上。本申请能够让一个用户与该用户在多个互联网平台上的操作数据关联起来,并将该关联关系存储在区块链上,提升用户体验。
  • 一种数据处理方法及装置-201510164451.3
  • 张哲 - 阿里巴巴集团控股有限公司
  • 2015-04-09 - 2019-11-12 - G06F16/2458
  • 本发明是关于一种数据处理方法及装置,包括:从接收的待处理数据中的数据类型字段中提取出数据类型的标识;查找与数据类型的标识对应的目标运算方式;查找与数据类型的标识对应的目标运算维度;在待处理数据中,从目标维度字段中提取出目标运算维度的内容,并从数据内容字段中提取出目标数据内容;无需对历史记录中的所有数据进行重新统计,只需获取最近一次根据目标运算方式和数据类型的标识对应的数据类型运算得到的、目标运算维度的内容对应的运算结果;按照目标运算方式对目标数据内容和该运算结果进行运算,整个过程只需一次计算即可,减少了统计量,节省了大量时间和内存资源。
  • 一种基于关联规则的重特大交通事故致因识别方法-201611063554.1
  • 徐铖铖;包杰;刘攀;吴家明 - 东南大学
  • 2016-11-28 - 2019-11-12 - G06F16/2458
  • 本发明公开了一种基于关联规则的重特大交通事故致因识别方法,该方法从我国历年道路交通事故年报中提取重特大交通事故数据,并将提取的事故数据划分为人、车、路、环境以及其他因素共五类事故变量。在此基础上,该方法运用关联规则分析,设定重特大事故关联分析中支持度、置信度以及提升度的合理阈值,基于Apriori算法,计算重特大交通事故的二项集、三项集以及四项集规则关联规则,并结合输出规则的支持度、置信度以及提升度进行分析,识别出重特大道路交通事故常见致因和事故发生机理。本发明降低了随机性和决策人员主观判断影响,可以有效进行重特大交通事故致因识别、分析重特大交通事故机理。
  • 一种基于数据挖掘与分析的模型管理工具-201810397566.0
  • 郑菀俪;刘青山 - 北京资采信息技术有限公司
  • 2018-04-28 - 2019-11-08 - G06F16/2458
  • 本发明公开了一种基于数据挖掘与分析的模型管理工具,包括模型管理、算法管理、任务管理、数据源管理、业务源管理模块构成;其核心功能是模型管理、算法管理、任务管理,其他模块都是为这三项核心模块进行提供辅助的模块,使用工作流技术、计算引擎技术、数据存储技术、任务调度等技术的选型,实现自主建模、实时模型训练、实时展示模型计算的输出等效果。有益效果在于:提高了数据挖掘和分析时模型创建的效率,提升了数据挖掘和分析处理的效率,减少了运营人员需求,降低了生产成本。
  • 实时数据采集方法、系统、装置及存储介质-201910526757.7
  • 何建宁 - 深圳壹账通智能科技有限公司
  • 2019-06-18 - 2019-11-08 - G06F16/2458
  • 本发明涉及数据处理技术领域,提供一种实时数据采集方法、系统、装置及存储介质。其中,方法包括:根据系统时间,动态获取要采集的时间单位;读取初始sql模板,将其与本次动态获取的时间单位进行拼接;通过拼接后模板采集数据库中的数据,其中,所述数据库中的数据存储在以包含时间单位命名的表中,且所述表中存储该时间单位段内产生的数据;保存数据采集结果,并保存本次采集的时间单位。采用本发明,能够解决关系型数据库大数据量的查询效率问题,解决现有技术只能对固定表名进行数据采集,不能根据时间单位动态修改表名,导致数据无法正常采集的问题。
  • 基于电网运行信息交互式情报用户需求深度挖掘检索方法-201910541993.6
  • 田年杰;赵倩;代江;王宁;单克 - 贵州电网有限责任公司
  • 2019-06-21 - 2019-11-08 - G06F16/2458
  • 本发明公开了一种基于电网运行信息交互式情报用户需求深度挖掘检索方法,该方法包括获取情报用户信息需求,根据用户需求进行检索,得到检索中间结果集,利用交互式检索环境进行判断,当满足用户需求时输出检索结果,当不满足时采用相关反馈检索模型对情报用户信息需求进行深度挖掘。本发明通过获取电网运行信息需求进行检索,得到检索中间结果集后,利用交互式检索环境与用户进行循环交互,从而对情报用户的信息需求进行迭代优化,提高电网运行信息检索的精确性和效率。
  • 一种单变量与多变量间最大信息系数近似处理方法及系统-201910543901.8
  • 张军英;王月;杨利英 - 西安电子科技大学
  • 2019-06-21 - 2019-11-08 - G06F16/2458
  • 本发明属于数据挖掘技术领域,公开了一种在大数据集中计算单变量与多变量间的最大信息系数的方法及系统,用以计算单个变量Y与m个变量(X1,X2,...,Xm)之间的最大信息系数。该方法在于找寻多维(m+1维)空间的最优网格划分:首先利用单变量和m‑1个变量的最大信息系数算法固定m个变量(X1,X2,...,Xm)的划分,之后再对Y变量进行划分,进而找到对于变量Y与m个变量(X1,X2,...,Xm)较为合适的划分,之后计算归一化后的最大互信息值并作为最大信息系数数值。本发明能够解决现有的计算最大信息系数计算方法无法应用到计算单变量与多变量之间最大信息系数上的问题,本发明所设计的一种单变量与多变量间最大信息系数近似处理方法及系统,能够计算单个变量与多个变量之间的最大信息系数数值。
  • 借助于区块链的共享经济数据共享方法及其系统-201910679593.1
  • 杨慧;吉建勋 - 北京艾摩瑞策科技有限公司
  • 2019-07-26 - 2019-11-08 - G06F16/2458
  • 本申请公开了借助于区块链的共享经济数据共享方法及其系统,所述方法包括:至少一个共享经济服务器每隔预设时间段,发送第一共享经济数据查询请求给区块链节点;至少一个所述共享经济服务器接收所述区块链节点发送的第一共享经济数据;至少一个所述共享经济服务器将所述第一共享经济数据存储在本地数据库中,以便于用户通过客户端访问所述第一共享经济数据。本申请中的方法能够使得用户操作简便,操作一次后,各个相关平台的其他用户都能够查看到该共享经济数据,进而提升了用户体验。
  • 一种区块链跨链数据检索系统-201910705358.7
  • 张绍华;戴炳荣;李顿伟;李超;刘丰源;宋俊典 - 上海计算机软件技术开发中心
  • 2019-08-01 - 2019-11-08 - G06F16/2458
  • 本发明涉及一种基于文本分类的跨链数据检索系统,包括区块链文本分类训练模块、查询文本分类模块和数据查询模块。所述区块链文本分类训练模块用于训练不同区块链业务信息的分类模型,以便于后续查询调用;所述查询文本分类模块用于对用户所查询的信息进行分类,以便于确定初始所查询的区块链;所述数据查询模块用于在区块链内部确定与查询内容最为相近的结果。本发明能够解决现有的区块链浏览器无法提供业务查询、查询效率低等问题。
  • 基于FE工业互联网的数据分析方法及相关产品-201910722499.X
  • 何泰霖;喻勋勋;史玉洁;袁志远;吴恺;陈亮;欧阳少海 - 广东飞企互联科技股份有限公司
  • 2019-08-06 - 2019-11-08 - G06F16/2458
  • 本公开提供一种基于FE工业互联网的数据分析方法及相关产品,该方法包括:智能设备获取工业互联网发送的命令数据以及参数数据;智能设备对该命令数据进行AI分类确定该命令数据对应的第一类别;智能设备生成第一类别的坐标系,将相同时间戳的命令数据以及参数数据生成一个参数点,将所有的参数点映射在该坐标系内,将相邻的参数点通过直线连接起来形成第一类别对应的曲线,确定曲线的递增区间以及递减区间,提取递增区间的递增时间区间以及递减区间的递减时间区间,将递增区间、递减区间、递增时间区间以及递减时间区间生成第一类别的分析结果。本申请提供的技术方案具有用户体验度高的优点。
  • 组织机构相关人员关系的挖掘方法及装置-201910728123.X
  • 吴诚诚;蔡镇 - 吴诚诚;蔡镇
  • 2019-08-10 - 2019-11-08 - G06F16/2458
  • 本发明涉及一种组织机构相关人员关系的挖掘方法及装置。所述方法包括:获取组织机构相关自然人及自然人所属组织机构的各维度数据信息集合;获取根据自然人姓名或其他属性信息聚类后的人员所属组织机构各维度的特征子集合;将同类自然人所属的组织机构进行组合,依据每个组合的相似性特征进行向量转化;根据相似性向量训练同名人分类模型,并使用模型预测分类结果;根据分类结果,合并同一自然人,聚合关联自然人、自然人所属组织机构和关联组织机构数据集合,生成组织机构相关人员关系结构。本发明实施例能够准确而直观的挖掘出不同组织机构相关人员的相互关系,从而满足了在孤立分散的组织机构相关人员间建立联系的需求。
  • 事件显示方法和装置-201810688337.4
  • 王婧;莫海艳;喻友文 - 北京百度网讯科技有限公司
  • 2018-06-28 - 2019-11-08 - G06F16/2458
  • 本发明实施例提出一种事件显示方法和装置。该方法包括:获取各事件的类型;根据各事件的类型为各事件设置对应的颜色;按照各事件的起止时间对各事件进行分组;按照各事件的分组和颜色,显示各事件。本发明实施例可以直观地展现事件类型、事件分布及持续时间;可以帮助用户快速地筛选出有效事件,并且快速地获取事件的有效信息,达到迅速定位故障,发现排查原因的目的。
  • 基于分布式内存的虚拟现实平台数据查询方法-201610055492.3
  • 袁成;倪祺;陈宁;胡为进;谈雪晶;陈锦华;沈保国;田晓声 - 国网上海市电力公司;上海欣能信息科技发展有限公司
  • 2016-01-27 - 2019-11-08 - G06F16/2458
  • 本发明涉及一种基于分布式内存的虚拟现实平台数据查询方法,包括步骤:S1:根据电站或线路的电压等级和所属单位分别在第一索引集合和第二索引集合中检索得到第一id集合和第二id集合,并取得两个id集合的交集;S2:判断两个id集合的交集是否为空集,若为是,则执行步骤S3,若为否,则执行步骤S4;S3:根据电压等级和所属单位在数据库中查询得到电站或线路的台账信息和模型数据,并在第一索引集合和第二索引集合中新建对应的索引条目,以及根据台账信息中的id在分布式内存系统中存储得到的模型数据;S4:根据交集中的id在分布式内存系统中查询并读取对应的模型数据。与现有技术相比,本发明具有查询效率高,使用体验好等优点。
  • 一种确定客户可信联系信息的方法、装置、计算机设备和存储介质-201910534809.5
  • 陈莹莹 - 平安科技(深圳)有限公司
  • 2019-06-20 - 2019-11-05 - G06F16/2458
  • 本发明涉及一种确定客户可信联系信息的方法、装置、计算机设备和存储介质,所述方法包括:根据用户预存联系信息获得所述联系信息的时间分布图;对所述用户预存联系信息的业务触点进行可信度打分,获得可信度打分结果;根据所述可信度打分结果按照可信度分值区间,获得所述业务触点分类等级;根据所述业务触点分类等级优化所述时间分布图;获得观察阈值;根据所述观察阈值,从优化后的时间分布图中获得可信度最大的业务触点;根据所述可信度最大的业务触点,从所述用户预存联系信息中确定所述客户的可信联系信息。达到增加可信度的比较,减少多触点情况下纯粹依靠一维判定方式的误判的效果。
  • 一种基于关联规则的事实证据链构建方法-201910666343.4
  • 柳畅 - 中经柏诚科技(北京)有限责任公司
  • 2019-07-23 - 2019-11-05 - G06F16/2458
  • 本发明公开了一种基于关联规则的事实证据链构建方法,包含以下步骤:步骤1),基于证据链的缺失值归算算法,挖掘每个数据元组中缺失值的所有相关证据,然后结合这些相关证据构建证据链,进一步估计缺失值;步骤2),在置信度和支持度的基础上使用关联规则算法,建立证据关联强规则;包括建立条件小训练集,每条规则主体通过选取条件小训练集进行属性连接,最后用实例覆盖小训练集的每个实例,构建高质量分类器。本发明基于证据链的缺失值归算算法具有较高的计算精度,并且随着缺失值的增加或缺失值的位置变化,其计算精度也得到了保证。
  • 一种大数据处理系统-201910700493.2
  • 何怀文 - 电子科技大学中山学院
  • 2019-07-31 - 2019-11-05 - G06F16/2458
  • 一种大数据处理系统,包括大数据采集模块、大数据预处理模块、大数据处理模块和大数据可视化模块;大数据采集模块用于采集用户行为大数据,并将采集的用户行为大数据传输至大数据预处理模块;数据预处理模块用于接收大数据采集模块采集的用户行为大数据,然后对用户行为大数据预处理,将预处理之后的数据传输至大数据处理模块;大数据处理模块用于根据大数据预处理模块预处理的结果对原始数据进行处理;并将处理的结果传输至大数据可视化模块;大数据可视化模块将大数据处理模块处理得到的结果进行可视化展示。本发明提出一种大数据处理系统,对数据优化和格式处理减小数据占用空间,并大大提高数据处理的速度。
  • 关于区块链上的社区关联数据处理方法及其装置-201910727188.2
  • 吉建勋;田翔;杨慧 - 北京艾摩瑞策科技有限公司
  • 2019-08-07 - 2019-11-05 - G06F16/2458
  • 本申请公开了关于区块链上的社区关联数据处理方法及其装置,所述方法包括:业务节点根据存储在区块链上的社区数据,生成用户列表;其中,所述用户列表中相同用户地址对应至少一种社区数据属性,一位用户对应一个用户地址,所述业务节点为区块链系统中处理社区数据关联关系的区块链节点;所述业务节点对所述用户列表执行上链操作,以便于将所述用户列表存储在区块链上。本申请能够让一个用户与该用户在多个互联网平台上的操作数据关联起来,并将该关联关系存储在区块链上,提升用户体验。
  • 一种基于超图平台的输电线路重要交叉跨越智能统计方法-201910914525.9
  • 胡壮丽;舒应军;曾懿辉;张虎;黄丰;梁健明 - 广东电网有限责任公司佛山供电局
  • 2019-09-26 - 2019-11-05 - G06F16/2458
  • 本发明提供一种基于超图平台的输电线路重要交叉跨越智能统计方法,先获取输电线路含三维坐标的点云数据;根据上述点云数据,提取输电线路杆塔坐标;根据上述杆塔坐标,在超图平台中发布地图服务和数据服务;之后获取数据服务中杆塔坐标;根据杆塔坐标,在地图上展示输电线路每一段杆塔区段画线;最后进行数据对比,自动统计每一段杆塔区段被跨越物信息,将结果输出为表格。本发明实现了输电线路重要交叉跨越区段信息的智能统计。相比于现在全部依靠人工完成输电线路重要交叉跨越区段信息统计维护,本发明极大地提高了工作的及时率和准确率,减少了人工作业量,提高了输电线路运维工作的智能化与自动化水平。
  • iOS设备数据挖掘方法及系统-201610814193.3
  • 刘蛟;刘旭;郑红;赵小云 - 四川长虹电器股份有限公司
  • 2016-09-09 - 2019-11-05 - G06F16/2458
  • 本发明涉及计算机软件技术领域,提供一种iOS设备数据挖掘方法及系统,以收集用户使用App时产生的用户信息和记录。该系统包括收集器和存储器,收集器包括收集器管理中心、定时器、收集工作者和收集模块,存储器包括缓存数据空间、临时数据库、可信数据库和存储模块。本发明提出的技术方案能够对当前iOS系统收集到的用户数据进行本地化存储,在尽可能少的占用主应用程序资源的前提下,在应用后台进行不间断收集用户信息和记录。
  • 数据比对方法、装置及可读存储介质-201710440984.9
  • 王莹 - 平安科技(深圳)有限公司
  • 2017-06-12 - 2019-11-05 - G06F16/2458
  • 本发明公开了一种数据比对方法,包括以下步骤:当检测到数据比对请求时,显示数据比对窗口,以提示用户输入数据比对信息;基于用户输入数据比对信息确定数据比对范围,并比对对应范围包含的数据信息,当检测到数据信息比对完成时,将数据信息比对的结果输出。本发明还对应提出了一种数据比对装置和可读存储介质。本发明通过程序实现不同数据库之间的数据比对,快速准确地得到数据比对结果。
  • 数据对接方法、装置、服务器和存储介质-201710496662.6
  • 李意;吴志祥;杨德草;刘智丹 - 平安科技(深圳)有限公司
  • 2017-06-26 - 2019-11-05 - G06F16/2458
  • 本发明涉及一种数据对接方法、装置、服务器和存储介质,方法包括:接收第一终端发送的数据对接请求,数据对接请求携带了原始数据,原始数据包括多个原始字段名;获取对接配置表,对接配置表中记录了业务字段名和对应的原始字段名;根据业务字段名在原始数据中查询对应的原始字段名;根据查询到的原始字段名将原始数据对应业务字段名记录至业务数据表中。采用本方法只需在数据库中新增对接配置表,即可实现原始数据与业务数据之间的准确对接,能够使得对接后的数据便于保险公司进行业务处理。
  • 基于政务数据的数据分析系统及方法-201910612443.9
  • 杜乐;杜小军 - 武汉东湖大数据交易中心股份有限公司
  • 2019-07-08 - 2019-11-01 - G06F16/2458
  • 本发明公开了一种基于政务数据的数据分析系统及方法,所述数据分析系统包括采集模块、数据处理模块、存储模块、数据查询模块和展示模块;所述采集模块用于采集流动人口的信息数据,所述采集模块与数据处理模块无线连接;所述数据处理模块用于对流动人口的信息数据进行分析处理,得到分析结果记录单,所述数据处理模块分别与数据查询模块、展示模块无线连接;所述数据查询模块与展示模块无线连接;本发明模块设计合理,操作简单便捷,不仅有效实现了流动人口的数据采集和分析,同时通过各项处理的分析处理,操作人员可清晰直观的了解到整个城市的流动人口的变化趋势和状态,有效提升流动人口管理效率和服务水平。
  • 数据处理方法及装置、存储介质、电子装置-201910672954.X
  • 王怀志;张毅然 - 北京明略软件系统有限公司
  • 2019-07-24 - 2019-11-01 - G06F16/2458
  • 本发明提供了一种数据处理方法及装置、存储介质、电子装置,其中,上述方法包括:获取待匹配的数据表的第一关键字段;将所述第一关键字段与数据库中每个标准表的第二关键字段进行比对,得到第一比对结果;在所述第一比对结果指示所述第二关键字段中包括有所述第一关键字段的情况下,获取所述待匹配的数据表的第一非关键字段,并将所述第一非关键字段与第一标准表的第二非关键字段进行比对,得到第二比对结果,其中,所述第一标准表的第二关键字段中包括有所述第一关键字段;根据所述第二比对结果确定与所述待匹配的数据表的相似度超过第一阈值的标准表作为所述待匹配的数据表对应的目标标准表。
  • 一种计算机的用户表示生成方法及装置-201910678358.2
  • 张杰;罗华刚;吴信东 - 北京明略软件系统有限公司
  • 2019-07-25 - 2019-11-01 - G06F16/2458
  • 本发明提供了一种计算机的用户表示生成方法及装置,其中,该方法包括:通过多个数据源获取与目标用户关联的数据,其中,所述数据中携带有数据属性;根据所述数据属性对所述数据进行分类,得到多类数据;分别为所述多类数据创建目标数据模型;对所述多类数据的目标数据模型进行向量化处理,得到所述多类数据的向量;将所述多类数据的向量进行汇总,得到所述目标用户的用户表示,因此,可以解决相关技术中通过打标签的方式确定用户画像,由于标签本身不包含动态变化的过程信息,而是截取某一时间点的行为快照数据做标签加工导致刻画的用户画像不够准确的问题,能够更全面精准的刻画用户,增强了表达能力。
  • 挖掘全局高效用序列模式的方法、装置及计算机存储介质-201910692048.6
  • 林浚玮;李圆法;陈伟;王巨宏 - 哈尔滨工业大学(深圳);腾讯科技(深圳)有限公司
  • 2019-07-26 - 2019-11-01 - G06F16/2458
  • 本公开提供了一种挖掘全局高效用序列模式的方法、装置及计算机可读存储介质。该方法包括:确定序列数据库中的第一类项,其中第一类项是全局序列权重效用值高于第一阈值的项;确定序列数据库中各个序列的效用值链表;根据所确定的第一类项,从序列数据库挖掘至少一个候选的全局高效用序列模式并确定第一集合,其中第一集合包括至少一个候选的全局高效用序列模式、包括各个候选的全局高效用序列模式的序列的标识以及各个候选的全局高效用序列模式在相应序列中的效用值;以及根据各个序列的效用值链表和第一集合,从至少一个候选的全局高效用序列模式中挖掘全局高效用序列模式。
  • 用户意向预测方法、装置、计算机设备及存储介质-201910501838.1
  • 程克喜 - 中国平安财产保险股份有限公司
  • 2019-06-11 - 2019-10-29 - G06F16/2458
  • 本发明公开了一种用户意向预测方法、装置、计算机设备及存储介质,所述方法包括:获取用户历史产品信息,采用大数据技术计算所述用户历史产品信息,得到用户产品因子;对每一所述用户产品因子进行数据变换,得到每一所述用户意向因子;将所述用户意向因子输入到预设的随机森林模型中进行分类,得到每一所述用户对应的分类结果;将每一所述用户对应的分类结果作为自变量输入到逻辑回归模型,获取用户意向预测结果。上述用户意向预测方法对用户历史产品信息采用大数据技术和机器学习技术进行处理,提升了用户意向预测结果的准确率与效率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top