[发明专利]基于节点签名的保留标签信息的异质网络嵌入方法在审

专利信息
申请号: 201910811802.3 申请日: 2019-08-30
公开(公告)号: CN110555139A 公开(公告)日: 2019-12-10
发明(设计)人: 宋春瑶;郭佳雯;袁晓洁 申请(专利权)人: 南开大学
主分类号: G06F16/901 分类号: G06F16/901
代理公司: 12223 天津耀达律师事务所 代理人: 侯力
地址: 300071*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签信息 异质网络 构建 异质 嵌入 网络节点 图数据 映射 高维 质数 机器学习算法 上网络节点 语义 标签类型 后续节点 机器学习 链路预测 签名向量 数据分析 网络表示 网络结构 保留 低维 聚类 邻域 同质 向量 字典 网络 标签 学习 分类
【说明书】:

一种基于节点签名的保留标签信息的异质网络嵌入方法。网络嵌入是将高维的图数据映射到低维向量,以解决高维图数据无法有效利用机器学习算法进行数据分析的一种方法。本发明方法具体包括:对网络中所有标签类型进行质数字典映射;提取网络节点的邻域标签集;构建节点签名向量;构建网络节点表示。本发明旨在综合利用异质图的网络结构、语义和标签信息,以数字签名的思想和质数的特性,构建异质图的网络表示学习框架,实现异质图上网络节点和边标签信息的保留,并根据学习到的异质网络节点表示进行后续节点聚类、分类、链路预测等机器学习任务,能够普适性地对现有同质及异质网络嵌入方法进行扩展和提升。

技术领域

本发明属于图数据处理的技术领域。

背景技术

在当今信息时代,数据在各类应用中常以网络图模型进行表示。有效分析图数据中的结构信息和标签信息有助于发现复杂网络数据的内在关系,进而有助于对图数据中隐含的信息加以有效利用,包括但不限于科学搜索、个性化推荐等。随着人工智能技术的发展,机器学习算法为数据分析和预测提供了通用且有效的手段。

由于图数据具有的特性,在原始图上直接进行数据分析是困难的。一方面,图数据传统的以邻接矩阵存储的方式难以直接作为机器学习算法的输入进行数据的分析和预测;另一方面,由于维度高、体量大,图数据分析的计算复杂度高。因此,网络嵌入技术,这种在保留原始图信息、获得良好推断能力的基础上,将高维图数据降维映射到适用于机器学习的低维向量空间的方法,成为图数据处理领域中一个重要的研究方向。

异质网络在同质网络的基础上包含节点和边标签信息,在现实中广泛存在。很多大型应用场景,如社交媒体用户关系、学术研究论文引用关系、电子商务用户兴趣网络、生物基因演化关系等,都可以用异质网络结构来进行表示。这些标签信息直接表明了节点和边在语义上的类型,对于网络中节点和边的相似性具有非常重要的作用。

近些年来,同质网络嵌入方法已经得到较充分的发展,但现有的异质网络嵌入方法在标签信息的保留上仍具有一定的局限性。一方面,现有的主流异质网络嵌入方法利用节点标签引导随机游走,游走规则的选择依赖数据本身的领域先验知识,并且不同游走策略的选择可能生成具有较大差异的结果;另一方面,现有的异质网络嵌入方法基于边标签依赖节点标签的假设,关注的主要是节点标签,缺乏对边标签独立性的考虑,对下游任务准确度造成影响。

为解决上述问题,满足在下游机器学习任务中提升推断准确性的需求,保留异质网络标签信息的网络嵌入技术成为一项具有重要意义的研究问题。

发明内容

本发明的目的是解决现有的异质网络嵌入方法对于网络数据的专业领域知识依赖、随机游走策略选择的依赖和标签信息独立性考虑不足的问题,并满足提升下游机器学习任务准确度的需求,提出一种基于节点签名的保留标签信息的异质网络嵌入方法。本发明通过对图数据不同标签类型的质数表示以及节点邻域签名的计算,将异质网络数据的拓扑结构信息和标签信息分别压缩在节点基础向量和节点的数字签名向量中,保留了网络结构和标签信息,使得到的节点表示能够支持下游的各项推断预测任务。

本发明的技术方案

基于节点签名的保留标签信息的异质网络嵌入方法,以数字签名思想为基础,构建出的节点签名向量可以在使用现有同质或异质网络嵌入方法保留图拓扑结构信息的基础上进行普适性地扩展和提升,保留原始图上点和边的标签信息,达到提升下游各项通用机器学习任务的准确度的目的;同时,由于边标签质数的独立指派,使节点向量可以保留独立的边标签信息,提升异质网络嵌入中边标签的灵活度,同时能够适应边标签分类的特殊需求;具体步骤如下:

第1、对网络中所有的标签类型进行质数字典映射

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910811802.3/2.html,转载请声明来源钻瓜专利网。

同类专利
  • 一种工业废盐的分类及智能存储系统和方法-201911028711.9
  • 张世达;孙瑾;王星星 - 南京天地环境污染防治研究院
  • 2019-10-28 - 2020-02-14 - G06F16/901
  • 本发明提供一种工业废盐的智能分类存储系统和方法,包括RFID电子标签、RFID射频识别天线和基于RFID物联网技术的信息管理系统,RFID射频识别天线信号连接基于RFID物联网技术的信息管理系统,基于RFID物联网技术的信息管理系统包括采样数据库模块、储存规格清单模块、数据处理模块、储存填埋库位分配模块、储存库容显示模块、验证比对警示模块和装卸作业指令模块以及基于国家《危险废物填埋污染控制标准》(GB18593‑2019)刚性填埋由独立对称的若干填埋单元组成的库容结构和可回收利用的规则。本发明根据废盐的特性和现状,采用比较简便实用的分类分档和物联网智能化精细化的系统和方法,实现了对危险废物的污染防控、规范管理和资源有效利用;同时利用RFID技术实现对废盐和其他危废管理的自动化、信息化、高效化、规范化和精细化。
  • 生成交易流水号的方法、装置、计算设备和介质-201911048395.1
  • 孙彦杰;王凯;朱道彬;张洋 - 中国工商银行股份有限公司
  • 2019-10-29 - 2020-02-14 - G06F16/901
  • 本公开提供了一种生成交易流水号的方法。该方法包括:接收流水号生成请求,流水号生成请求包括目标流水号类型和目标流水号位数;获取与目标流水号类型对应的目标流水号集合;重复执行随机生成操作来生成目标流水号,直至目标流水号未包含在目标流水号集合中;以及将目标流水号存储在目标流水号集合中,并输出目标流水号;其中,随机生成操作包括:根据流水号生成请求中的目标流水号类型和目标流水号位数,随机确定目标流水号每一位上的字符。本公开还提供了一种生成交易流水号的装置、一种计算设备以及一种介质。
  • 一种基于软件聚类的源码功能搜索方法-201610487700.7
  • 吴艳霞;孙彬;王彦璋 - 哈尔滨工程大学
  • 2016-06-28 - 2020-02-14 - G06F16/901
  • 本发明提供的是一种基于软件聚类的源码功能搜索方法。输入源码,对源码进行语法检查和类信息的获取,然后分为两个模块完成搜索过程,所述两个模块为软件聚类模块和功能搜索模块,软件聚类模块从获取的类信息中,筛选实体并且构造实体索引,然后进行提取特征和构造特征向量,再通过层次聚类筛选信息,并将结果存储;功能搜索模块从获取的类信息中,构造输入集且完成主题分析,然后进行索引构造并存储索引。本发明能有效提升软件聚类的结果。在实际的阅读源码、维护系统方面都有很好的指导作用。开发者可以借此方法来指导先期探索,加快理解工程,提升开发效率。进一步的发展,可以借此方法完成功能模块的复用。
  • 一种字典值文件生成方法、系统及相关装置-201910968190.9
  • 张忠伟 - 苏州浪潮智能科技有限公司
  • 2019-10-12 - 2020-02-11 - G06F16/901
  • 本申请提供一种字典值文件的生成方法,包括:根据目标字符串的特征信息生成字典值;利用所述字典值对所述目标字符串进行匹配,确定所述目标字符串的匹配概率;所述匹配概率为匹配次数和执行次数的比值;按照所述匹配概率从大到小的顺序将所述字典值重新排序生成字典值文件;所述字典值文件用于字符串匹配。本申请先根据字符串的特征信息生成字典值,利用字典值对字符串进行匹配,通过计算字符串匹配成功的概率,根据匹配概率生成执行顺序,使得匹配概率较高的字符串在前,利用字典值文件匹配字符串时可以尽快匹配成功,提高字符匹配效率。本申请还提供一种智能字符组合系统、一种计算机可读存储介质和一种终端,具有上述有益效果。
  • 一种企业受益人运算系统及方法-201910878762.4
  • 丁凯;申士海;龙腾;陈青山 - 上海生腾数据科技有限公司
  • 2019-09-18 - 2020-02-07 - G06F16/901
  • 本申请公开了一种企业受益人运算方法,包括如下步骤。步骤S110:根据企业工商信息中的股权数据和高管数据,采用图计算的数据结构构建反映企业的股东投资和高管任职关系的知识图谱。步骤S120:对知识图谱进行分割,得到一个或多个连通子图。步骤S130:在每一个连通子图中,根据表征直接投资关系的第一类边扩展出表征间接投资关系的第三类边。步骤S140:在每一个连通子图中,对每一个企业节点寻找表征企业受益人的目标节点。本申请采用图数据库构建和存储知识图谱,采用图计算的手段运算得到企业受益人,具有直观、高效、快速的特点。
  • 查询区块链数据的方法及装置-201910928164.3
  • 张诚;张勇 - 北京瑞卓喜投科技发展有限公司
  • 2019-09-28 - 2020-02-07 - G06F16/901
  • 本发明提供一种查询区块链数据的方法及装置,所述方法包括:获取待查询资产数据,并生成所述待查询资产数据的查询条件信息;计算所述查询条件信息与各个预存索引信息的相似性;根据相似性阈值确定匹配的预存索引信息;根据所述预存索引信息查询区块链,提取其中保存的资产数据;在提取的资产数据中确定与所述待查询资产数据匹配的资产数据。
  • 一种提高Janusgraph路径探索性能的方法-201910973922.3
  • 解一豪;周庆勇;赵振修 - 浪潮软件股份有限公司
  • 2019-10-14 - 2020-02-07 - G06F16/901
  • 本发明公开了一种提高Janusgraph路径探索性能的方法,属于应用数据挖掘技术的图计算技术领域。本发明的提高Janusgraph路径探索性能的方法使用双向广度优先遍历算法,将从原节点出发逐步向目标节点过度的过程改为从两个节点同时出发进行遍历,所需要遍历的顶点总数变少,减少迭代的次数。该发明的提高Janusgraph路径探索性能的方法能够减少对存储内存资源的消耗,同时降低响应时间,满足大数据量,实时计算,低响应时间的要求,具有很好的推广应用价值。
  • 核心银行系统批量作业路径的检测方法及装置-201610289369.8
  • 王建立;李夏安 - 中国银行股份有限公司
  • 2016-05-04 - 2020-02-07 - G06F16/901
  • 本发明实施例公开了一种核心银行系统批量作业路径的检测方法及装置,涉及核心银行系统技术领域,方法包括:从结束作业节点向开始作业节点方向深度优先遍历,搜索到X条路径,形成一路径集合,并将集合内路径按作业耗时进行降序排列;通过对第一前置作业节点和第二前置作业节点的作业结束时间进行比较,确定是否通过第二前置作业节点继续向开始作业节点方向遍历,搜索集合外路径;之后通过作业耗时的比较,在集合外路径的作业耗时大于集合内作业耗时最短的路径的作业耗时,将集合内作业耗时最短的路径从路径集合中删除,并将集合外路径加入路径集合。从而解决当前检测到核心银行系统批量作业中的TOP X路径需要遍历每一条路径,时间较长的问题。
  • 属性冗余去除-201480055217.0
  • Z·M·王;吴思明 - 甲骨文国际公司
  • 2014-09-16 - 2020-02-07 - G06F16/901
  • 描述了与属性冗余去除关联的系统、方法和其它实施例。在一个实施例中,一种方法包括识别描述两个物品的一组属性中的冗余属性值。该示例性方法还包括产生去除了冗余属性值的一组修剪的属性。至少部分地基于所述一组修剪的属性值计算两个物品的相似性。
  • 一种全域性异构数据的融合系统及融合方法-201910967052.9
  • 徐立中;赵嘉;陈哲;李臣明;李岳衡;汤婧婧;石爱业 - 河海大学
  • 2019-10-12 - 2020-02-04 - G06F16/901
  • 本发明公开了一种全域性异构数据的融合系统及融合方法,融合系统包括接口层:接口层与用户进行交互,为用户提供对维护数据的查询接口和结果显现接口;逻辑控制层:用来实现融合系统主要功能,对全域性异构数据的数据源进行查询和结果呈现;数据访问层:数据访问层用来实现异构数据融合系统中数据源的统一查询服务,包括全局融合模块、文档获取模块;数据源层:就是全域性异构数据的数据源集合,所述的融合系统融合方法包括初始化设置以及实际运行两个步骤,本发明将数据安全与查询同步结合起来,在只增加少量存储的前提下,不但减少了查询结果的处理时间,并且提高了数据的安全保护能力。
  • 一种实现快速同步学生状态数据的方法-201911008724.X
  • 不公告发明人 - 贺中彬
  • 2019-10-23 - 2020-02-04 - G06F16/901
  • 本发明公开了一种实现快速同步学生状态数据的方法,包括:创建用于存储个人信息和学生状态数据的数据库;家长或学生注册个人信息,存储到数据库;老师将学生数据上传到数据库;有权限的个人从数据库获取到学生个人对应数据,系统将数据显示到本地,并生成对应数据的统计图。本发明以数据库为基础,以互联网为载体,通过对学生状态数据的实时传送,解决目前家校沟通中,数据不同步的问题,实现家长和老师对学生学习状态实时同步掌握的目的。
  • 基于二维EBS编码的桥梁全生命周期BIM模型信息库构建方法-201911025275.X
  • 王晓东;杨建喜;沙高岑 - 重庆交通大学;宁夏公路管理中心
  • 2019-10-25 - 2020-02-04 - G06F16/901
  • 本发明公开了基于二维EBS编码的桥梁全生命周期BIM模型信息库构建方法,包括:将目标桥梁按结构进行逐层分解并对分解够的结果进行编码得到结构编码,分解的最下层结果为桥梁构件;基于桥梁构件确定需要记录的信息并对需要记录的信息进行编码得到信息编码;在桥梁工程活动的全生命周期中,基于结构编码及信息编码录入对应的桥梁信息并建立桥梁全生命周期BIM模型信息库。本发明在桥梁全寿命周期内,为BIM技术信息集成提供统一的信息载体,实现各阶段对桥梁构件以及信息的集成管理,二维EBS编码体系能够有效的对信息进行记录并且在BIM模型中进行表达,以属性集信息扩展方式对桥梁二维EBS在BIM模型中进行表达,能全面详细的记录桥梁在全生命周期产生的信息。
  • 一种多图融合方法-201911044229.4
  • 张伟;赵海燕;金芝 - 北京大学
  • 2019-10-30 - 2020-02-04 - G06F16/901
  • 本发明公开了一种多图融合方法,其通过接收一组图作为被融合图,对这组被融合图进行预处理,将其中的每一个被融合图转化为一个节点具有类型、边具有类型、边具有方向的被融合图,作为后继处理活动的输入,采用随机方式生成一组多图融合方案,作为初始父代种群,对于初始父代种群中的多图融合方案,计算多图融合方案的信息熵,多图融合方案的信息熵形成多图融合方案的适应度,对于两个待交叉的多图融合方案,选取两者之间的一条最短编辑路径上的某个点作为这两个融合方案的一个交叉结果,实现同时对多个图进行融合,并提高多图的融合质量。
  • 一种数字化文物安全共享系统-201510751689.6
  • 王健;黄卫星;杨颐;张桂刚 - 中国科学院自动化研究所
  • 2015-11-06 - 2020-02-04 - G06F16/901
  • 本发明公开了一种数字化文物安全共享系统,该系统包括数字化文物数据处理系统、数字化文物数据库、数字化文物数据访问系统;数字化文物数据处理系统用于配置数字化文物的原始数据的分级策略,并依据分级策略对每一个数字化文物的每一个原始数据进行分级和处理,输出不同分级对应的各数字化文物的分级数据;数字化文物数据库用于存储和管理各数字化文物的分级数据;数字化文物数据访问系统用于用户获取数字化文物的分级数据;该系统有效地解决了数字化文物数据的安全共享、防止信息泄露及泄露数据的源头追溯问题。
  • 面向业务实体的全局ID生成方法及装置-201910848935.8
  • 杨凯翔;杨晓辰 - 贝壳技术有限公司
  • 2019-09-09 - 2020-01-31 - G06F16/901
  • 本发明实施方式提供一种面向业务实体的全局ID生成方法,所述生成方法基于SnowFlake算法,其生成的全局ID包括时间戳、机器ID和序列号;所述全局ID还包括业务ID。所述业务ID与业务类型相对应。同时还提供了一种面向业务实体的全局ID生成装置。本发明的上述技术方案通过在现有SnowFlake算法中增设业务ID的方式以生成全局ID,实现了全局ID和实际业务的对应,通过ID能够解析出实际的业务含义,并且在大多数情况下,能够保证生成的ID的有序性,以及局部的绝对有序性。
  • 一种网格数据处理的方法、装置及存储介质-201810690944.4
  • 怀宝兴;李晓森 - 华为技术有限公司
  • 2018-06-28 - 2020-01-24 - G06F16/901
  • 一种网格数据处理的方法、装置及存储介质,所述方法包括:获取初始网格数据;对所述初始网格数据进行关系结构提取和迭代运算,得到k‑派系数据,所述k‑派系数据包括多个实体;对所述k‑派系数据中的实体进行缩点映射;根据连通图策略从缩点映射后的所述k‑派系数据中挖掘出多个社团数据;将所述多个社团数据重叠,得到目标社团数据。通过采用该方案,能够提高k‑派系和极大k‑派系在大数据上的挖掘效率。
  • 一种饲料回收系统及其使用方法-201910895043.3
  • 张京玲;陈可烁;胡建业;王天雷;林家民;聂湛然;林柏诚 - 五邑大学
  • 2019-09-20 - 2020-01-24 - G06F16/901
  • 本发明公开了一种饲料回收系统的使用方法,包括如下步骤:利用定位模块将饲料投放点的投放位置上传到数据库模块进行存储;利用时间模块将饲料投放完成的投放完成时间上传到所述数据库模块进行存储;通过数据处理模块对所述投放完成时间进行处理,得到回收启动时间;利用所述时间模块获取实时时间,对所述回收启动时间与所述实时时间进行对比处理,并将得到的启动信息传送到移动模块;所述移动模块根据所述启动信息和所述投放位置,驱动回收模块沿着回收路径进行饲料回收;能够在饲料投放完成后,自动进行残余饲料的回收操作,大大缩短了饲料回收的时间,且饲料回收的范围广、回收效率高。
  • 全路径计算方法、装置、计算机设备和存储介质-201910915250.0
  • 柴志伟;谢珉 - 宁波深擎信息科技有限公司;上海深擎信息科技有限公司
  • 2019-09-26 - 2020-01-24 - G06F16/901
  • 本申请涉及一种全路径计算方法、装置、计算机设备和存储介质。所述方法包括:获取图中待计算路径的第一节点和第二节点,根据第一节点的第一邻接节点集合和第二节点的第二邻接节点集合取交集,构建第一基本模型,根据第一邻接节点集合和第二邻接节点集合之间的连通节点对,构建第二基本模型,当给定跳数大于3时,将给定跳数的全路径计算转化为第一基本模型和/或第二基本模型,通过计算第一基本模型和/或第二基本模型对给定跳数的全路径进行计算。采用本方法能够减少计算机内存占用。
  • 一种产品信息数据库的制作方法-201910937814.0
  • 吴斌 - 水站买(上海)供应链管理有限公司
  • 2019-09-30 - 2020-01-24 - G06F16/901
  • 本发明公开了具有包含具有价格信息与用户ID绑定关系的产品信息数据库的制作方法,建立产品价格模型的标准化方法,产品价格库模型系统以及相关装置,产品价格数据库方便商户,根据自己客户群体不同需求选择特定客户信息设置不同的优惠价格,商户能够独立设定每个消费者用户对应的调整价格数值,包括授权其他的人开通此权限对消费者进行设置优惠价格,设置后保存的产品价格数据库,客户可以在平台按照设置好的优惠价格进行消费,通过该与用户ID信息绑定的价格信息方案,能够灵活的制定针对不同的消费者类型设定价格梯度方案,能够更灵活的满足各类企业和商户的不同需求,便于建立稳定的业务合作模式。
  • 有向无环图的获取方法、装置、电子设备和存储介质-201910945920.3
  • 王翰琦;王志清;崔轩 - 北京百度网讯科技有限公司
  • 2019-09-30 - 2020-01-24 - G06F16/901
  • 本申请公开了一种有向无环图的获取方法、装置、电子设备和存储介质,涉及计算机技术领域。该方法中服务器接收终端设备的有向无环图DAG请求,DAG请求指示服务器返回执行标签的任务的各节点的层级关系;服务器根据标签的DAG信息,建立邻接表,邻接表表征各节点的出入度关系、邻接关系;服务器根据各节点的出入度关系、邻接关系,建立各节点的层级关系;服务器将各节点的层级关系和邻接关系发送给终端设备,以使终端设备根据层级关系和邻接关系渲染标签的DAG。该方法中采用标签的DAG信息获取执行该标签的任务的各节点的层级关系,终端设备可以根据该层级关系能够确定各节点的空间相对位置,提高了DAG的准确性。
  • 图数据库中元组和边的功能性等价-201780091814.2
  • S·M·梅耶;A·J·卡特;A·罗德里格斯;W·E·M·穆斯塔法 - 微软技术许可有限责任公司
  • 2017-12-21 - 2020-01-21 - G06F16/901
  • 所公开的实施例提供了一种用于处理对图数据库的查询的系统。在操作期间,系统执行用于处理对存储图的图数据库的查询的一组过程,其中,该图包括一组节点、节点对之间的边、和一组谓语。接下来,系统获得包含第一元组的第一查询以及包含边的第一子集的第二查询。系统将第一元组转换成边的第二子集,并将边的第一子集转换成第二元组。最后,系统使用边的第二子集来生成第一查询的第一结果,并使用第二元组来生成第二查询的第二结果,并且在对第一查询的第一响应中提供第一结果并在对第二查询的第二响应中提供第二结果。
  • 基于关联数据的区块链分离存储系统-201810742783.9
  • 杨振;蔡鸿明;叶聪聪;姜丽红;步丰林 - 上海交通大学
  • 2018-07-09 - 2020-01-17 - G06F16/901
  • 一种基于关联数据的区块链分离存储系统,包括:用于生成数据对象ID的注册模块、用于生成交易记录并绑定数据对象ID的交易生成模块、用于存储交易记录RDF模型的外部存储模块、用于生成区块信息的区块链存储模块和用于区块信息查询的应用交互模块,本发明通过基于本体的语义关系和关联数据技术建立了去中心化分布式存储,使得交易记录信息数据大部分存储在外部,只将通过关联数据技术生成的交易记录URI以及与其相关联的数据对象ID值存储在区块链上。
  • 一种数据管理方法、装置及电子设备和存储介质-201910854802.1
  • 刘潇木 - 苏州浪潮智能科技有限公司
  • 2019-09-10 - 2020-01-17 - G06F16/901
  • 本申请公开了一种数据管理方法、装置及一种电子设备和计算机可读存储介质,该方法包括:确定第一模块至第二模块的映射方向,并在第一模块和第二模块之间建立目标模块;其中,第一模块的数据数量大于第二模块的数据数量;当第二模块需要第一模块中的第一目标数据时,基于第一目标数据的索引在第一模块中查询第一目标数据;将第一目标数据记录至目标模块中,以便第二模块从目标模块中获取第一目标数据。由此可见,本申请提供的数据管理方法,通过m2o的方式,将不同模块间的数据通过m2o方式进行关联,实现模块间数据的传递,降低了模块间的耦合度,既方便了数据的高效管理,也避免了因频繁的数据遍历而降低系统的性能。
  • 基于图嵌入的员工离职行为预测方法及装置-201910864727.7
  • 尚家兴;蔡昕均;刘飞逸;江林丽;朱倩雯;李旭 - 重庆大学
  • 2019-09-12 - 2020-01-17 - G06F16/901
  • 本发明公开了一种结合动态图嵌入方法的员工离职行为预测方法,包括将员工的历史工作信息表示为员工节点与公司节点之间相连的二部图;通过有偏随机游走的方式,随机或有序选择相邻顶点来构造序列;对所述序列进行处理,以学习二部图的低维向量表示;对员工的基本属性与所述低维向量选择机器学习方法进行训练;利用训练的结果进行员工离职预测。本发明可以获得的特征能够更好地解决员工离职预测问题,同时比没有时间信息的其他图嵌入方法更有效。
  • 分布式图计算系统和分布式图计算方法-201910924175.4
  • 武永卫;陈康;姜进磊;李雪;章明星 - 清华大学
  • 2019-09-27 - 2020-01-17 - G06F16/901
  • 分布式图计算系统和方法,系统包括多个计算机和数据库,每台计算机上具有一个或多个计算结点,首先进行初始化,各个计算结点分别从数据库中读取不相交的原图的一部分边;主体计算流程,采用以子图为中心的迭代化计算方法,同时加入图缩减和重新划分过程以加速收敛,其中每轮迭代包含以下步骤:重新划分步骤,在每轮迭代的开始,首先对当前计算的图进行重新划分;本地计算步骤;缩减步骤,每个计算结点本地计算完成后,删除被判定无用的部分点/边,对原图进行重构;判断剩下的所有边是否能够存储在单个计算结点,为是的情况下,迭代结束,否则返回到重新划分步骤。本发明图计算方技术可以有效减少算法收敛所需的迭代轮数,提高计算效率。
  • 一种移动计划的更新方法及装置-201910936747.0
  • 徐鹏飞;崔晓峰 - 杭州数梦工场科技有限公司
  • 2019-09-29 - 2020-01-17 - G06F16/901
  • 本申请提供一种移动计划的更新方法及装置,包括:获取全局移动计划集合,全局移动计划集合中的每条移动计划包含检查点及移动对象在检查点处的通过时刻;以全局移动计划集合中的至少一部分检查点作为计算节点、以移动对象在各个检查点之间的移动方向作为有向边,构造有向图;各个计算节点并行地执行更新操作。通过本申请的技术方案能够提高对移动计划更新过程的计算效率和计算性能。
  • 数据标准化方法、装置、电子设备及可读存储介质-201910959141.9
  • 李月 - 北京东软望海科技有限公司
  • 2019-10-10 - 2020-01-17 - G06F16/901
  • 本申请实施例提供了一种数据标准化方法、装置、电子设备及可读存储介质。该方法包括:确定至少两个待处理数据分别与预设数据之间的第一处理结果,至少两个待处理数据为具有树结构的数据,若第一处理结果满足第一预设条件,对第一处理结果对应的待处理数据进行第一数据标准化处理,若第一处理结果不满足第一预设条件,确定各个父节点数据对应的第二处理结果,父节点数据为待处理数据对应的已经过数据标准化处理的父节点数据,若父节点数据对应的第二处理结果满足第二预设条件,对第二处理结果对应父节点数据的待处理数据进行第二数据标准化处理。本申请实施例实现了自动对数据进行标准化处理,减少人力成本与时间成本,同时提高数据标准化的召回率。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top