[发明专利]基于拓扑关系图的实体网页链接的获取技术在审
| 申请号: | 201810516375.1 | 申请日: | 2018-05-25 |
| 公开(公告)号: | CN110598073A | 公开(公告)日: | 2019-12-20 |
| 发明(设计)人: | 苏柏;马超;周长海;华抒军;陆掾;文宁 | 申请(专利权)人: | 微软技术许可有限责任公司 |
| 主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/955;G06F16/958 |
| 代理公司: | 11353 北京市惠诚律师事务所 | 代理人: | 逯博 |
| 地址: | 美国华*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网页 拓扑关系图 候选实体 准确度 关联关系 网页链接 链接 权重 主语 挖掘 概率 | ||
本文公开的基于拓扑关系图的实体网页链接的获取技术,基于网页间的拓扑关系图来确定候选实体网页的权重值,能够充分挖掘候选实体网页与主语实体网页间的关联关系,从而提高找到值链接的概率以及准确度。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开放信息组织能力,为互联网时代的知识化组织和智能应用奠定了基础。知识图谱用于描述实体(Entity)以及实体之间的关系。随着人工智能的技术发展和应用,知识图谱作为人工智能的关键技术之一,已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。
发明内容
提供本发明实施例内容是为了以精简的形式介绍将在以下详细描述中进一步描述的一些概念。本发明内容并不旨在标识所要求保护主题的关键特征或必要特征,也不旨在用于限制所要求保护主题的范围。
本文公开的基于拓扑关系图的实体网页链接的获取技术,基于网页间的拓扑关系图来确定候选实体网页的权重值,能够充分挖掘候选实体网页与主语实体网页间的关联关系,从而提高找到值链接的概率以及准确度。
上述说明仅是本公开技术方案的概述,为了能够更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为了让本公开的上述和其它目的、特征和优点能够更明显易懂,以下特举本公开的具体实施方式。
附图说明
图1为描绘应用本文实体网页链接的获取技术的示例环境之一的框图。
图2为正向拓扑关系图的示例结构框图;
图3为基于正向拓扑关系图进行第一轮随机游走的示例框图;
图4为基于正向拓扑关系图进行第二轮随机游走的示例框图;
图5为基于正向拓扑关系图的随机游走结果的示例框图;
图6为反向拓扑关系图的示例结构之一的框图;
图7为反向拓扑关系图的示例结构之二的框图;
图8为基于图6的反向拓扑关系图进行第一轮随机游走的示例框图;
图9为基于图6的反向拓扑关系图进行第二轮随机游走的示例框图;
图10为基于图7的反向拓扑关系图进行第一轮随机游走的示例框图;
图11为基于图7的反向拓扑关系图进行第二轮随机游走的示例框图;
图12为描绘本文的实体网页链接的获取方法的流程示意图;
图13为示例性的具有可移动性的电子设备的结构框图;
图14为示例性的计算设备的结构框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本文中,术语“技术”、“机制”可以指代例如(一个或多个)系统、(一个或多个)方法、计算机可读指令、(一个或多个)模块、算法、硬件逻辑(例如,现场可编程门阵列(FPGA))、专用集成电路(ASIC)、专用标准产品(ASSP)、片上系统(SOC)、复杂可编程逻辑设备(CPLD)和/或上述上下文以及在本文档通篇中所允许的(一项或多项)其它技术。
概览
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810516375.1/2.html,转载请声明来源钻瓜专利网。





