[发明专利]逐边学习属性图表示在审

专利信息
申请号: 201980080282.1 申请日: 2019-10-18
公开(公告)号: CN113168576A 公开(公告)日: 2021-07-23
发明(设计)人: R·帕特拉;S·洪;J·金;D·希洛林;D·巴托里尼;H·查菲 申请(专利权)人: 甲骨文国际公司
主分类号: G06N5/02 分类号: G06N5/02
代理公司: 中国贸促会专利商标事务所有限公司 11038 代理人: 冯薇
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 学习 属性 图表
【说明书】:

描述了用于逐边学习属性图表示的技术。输入图包括多个顶点和多个边缘。多个顶点中的每个顶点与相应顶点的顶点属性相关联。生成顶点到属性的映射,该映射将每个顶点映射到多个顶点属性签名中的顶点属性签名。生成多个边缘单词。每个边缘单词对应于一个或多个边缘,每个边缘起始于具有多个顶点属性签名中的特定顶点属性签名的第一顶点,并且终止于具有多个顶点属性签名中的特定顶点属性签名的第二顶点。生成多个句子,每个句子包括沿着输入图中的多个路径中的路径连接的边缘单词。文档向量化模型用于生成表示输入图的机器学习向量。

技术领域

发明涉及基于学习到的(learned)图表示的图处理和机器学习技术。

背景技术

本部分中描述的方法是可以实行的方法,但不一定是先前已经设想或实行的方法。因此,除非另有说明,否则不应仅由于本部分中所述的任何方法包括在本部分中而认为本部分中所述的任何方法都有资格作为现有技术。

属性图(property graph)的重要能力是它们对图中的潜在关系建模并捕获其它数据模型无法捕获的链接信息(即,实体关系)的能力。在任何属性图中,节点(即,实体)和边(即,实体之间的链接关系)都与一些属性相关联,这些属性是键,值对,例如label:customer(标签:客户)或label:employee(标签:雇员)。

同时,机器学习技术在多个领域中被采用,以通过从数据中的模式和趋势学习来发现“隐藏的见解(hidden insights)”。属性图用于各种任务,比如链接预测(例如,友谊推荐)、分类(例如,欺诈检测)、排名(例如,节点重要性)或相似性搜索(例如,搜索相似的化合物)。这样的任务带来了将各种机器学习技术应用于属性图的可能性。

图表示学习已经使得能够平滑地集成机器学习技术和属性图。图表示学习的目标是找到与任务无关的方式来表示图结构(在低维空间中),使得可以将经典的机器学习模型用于采用学习到的表示的多个应用。特征化图结构的一种方法是图内核(graph kernel),其主要采用手工制作的特征,例如最短路径、小图(graphlet)、页面排名得分。但是,神经嵌入为图表示学习提供了新的方向:将机器学习的成功结合到属性图中。

表示学习的一种类型是顶点级表示学习,其将接近节点(其中紧密度可以是结构接近度或面向属性的接近度)表示为表示向量空间中相似的向量。这种学习目的有益于顶点级任务,诸如顶点分类或顶点聚类。传统上,机器学习技术依靠手工制作的用户定义特征(例如,集中性测量)对图中关于顶点的结构信息进行编码。但是,另一种方法是通过采用随机游走(将顶点作为学习单元)来学习嵌入,随后是skipgram模型来学习顶点表示。随机游走(random walk)的变体通过采用偏向随机游走探索不同邻域来最大化保留节点的邻域的可能性。

与顶点级别表示相比,一些任务可能需要图的更高粒度,即,整个图的表示。图表示可以使多个任务受益,比如图分类任务(欺诈或异常模式)、在图的数据库上进行相似性搜索(例如,药物)、或者甚至进行指纹识别。与顶点表示类似,存在手工制作的用户定义的特征来对图(例如,子图)的结构信息进行编码的选项。另一种方法将整个图视为文档,并将围绕该图中的每个节点的生根子图视为构成该文档的单词,但不考虑单词(即,子图)之间的任何排序。

但是,这两种表示都有其缺点,因为当与各种机器学习模型一起使用时,这两种表示都不是最佳的。

本文讨论了用于提高基于图的机器学习结果的质量的方法。

本部分中描述的方法是可以实行的方法,但不一定是先前已经设想或实行的方法。因此,除非另有说明,否则不应仅由于本部分中所述的任何方法包括在本部分中而认为本部分中所述的任何方法都有资格作为现有技术。

附图说明

在附图中:

图1图示了具有每个顶点的相关联属性的属性图。

图2图示了边缘单词生成图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于甲骨文国际公司,未经甲骨文国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201980080282.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top