[发明专利]社交网络分类中的头衔消歧在审
申请号: | 201810306438.0 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108694228A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | U.默哈夫;D.沙查姆;A.姜;S.C.麦克朗 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27;G06Q50/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 王兴秋;申屠伟进 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据结构 矢量 深度表示 社交网络 成员简档 多个目标 函数应用 目标函数 聚类 消歧 推断 模糊 输出 分类 共享 技能 角色 | ||
在示例实施例中,形成深度表示数据结构,该深度表示数据结构具有在该深度表示数据结构中被表示为坐标的表示来自社交网络数据结构的头衔的第一矢量和表示来自社交网络数据结构的技能的第二矢量。将一个或多个目标函数应用于在深度表示数据结构中的第一矢量和第二矢量的至少一个组合,使得得到针对所述至少一个组合中的每一个的目标函数输出。将所述组合中的矢量的一个或多个坐标聚类成职业群,其中所述职业群中的每个职业群中的每个坐标共享职业。标识每个职业群的群代表。然后,群代表可以用来推断具有模糊角色的第一成员简档的职业。
技术领域
本公开总体上涉及用于解决在分析社交网络中的分类数据中的技术挑战的计算机技术。更具体地,本公开涉及社交网络分类的嵌入式深度表示。
背景技术
互联网的兴起引起了两个迥然不同的现象:社交网络的存在和对于大量的人可见的其对应的成员简档在增长,以及使用这些社交网络来执行对人和公司的搜索在增长。基于各种分类中的实体来标准化成员(例如,个人或公司)简档的各种属性是常见的。例如,一个行业可能被列入公司,其中该行业从行业分类(即由社交联网服务维护的数据结构)中的多个条目中选择。该行业分类可以包括可能行业的分层组织。例如,行业分类中的“信息技术”的行业类别可以具有“计算机软件”、“计算机硬件”和“计算机联网”的子类别。该行业分类可以将子类别组织为对应于“信息技术”的父节点的子。该行业分类中可能有很多层类别和子类别。
行业当然只是可以指派给分类中的实体的成员属性的一个示例。其他示例包括职称、学校、技能等等。
尽管在封闭状态中考虑属性时将属性纯粹地标准化到分类实体中运行良好,但是当涉及属性之间的关系时,这种类型的组织技术创建了技术挑战。分类典型地是由对实体驻留在分类中的位置做出主观决定的人创建和管理的。尽管分类的分层本质确实允许在实体之间建立一些关系,但这种关系是静态的和标准化的。例如,在位置分类中,“洛杉矶”、“硅谷”和“西雅图”可以被认为是“西海岸”类别的一部分,从而使得“洛杉矶”节点、“硅谷”节点和“西雅图”节点都是“西海岸”节点的子节点,其中每个子节点与其他节点等距,因此无法捕获子节点之间的关系。这些关系可能是动态的,并且可以根据期望的分析而变化。例如,在一些分析中,位置之间的物理距离可能是相关的,而在一些分析中,城市之间的其他细微关系可能是相关的。例如,在距离上,洛杉矶比西雅图更靠近硅谷,但是如果某人试图预测居住在硅谷的一位计算机程序员将迁入的可能城市,西雅图可能比洛杉矶具有高得多的可能性(因此对于这种分析可能具有更紧密的关系)。裸分类架构没有一种机制来捕获实体之间的这些类型的动态和细微关系。
实际上,分类中的标准化数据通常是分类别的并且稀疏地同现,这限制了它们对于预测性任务的有用性。创建单个统一的分类的尝试可能因某些类型的条目的模糊性而复杂化。例如,社交网络的许多成员使用含糊头衔(例如“经理”)或模糊头衔(例如“建筑师”)进行自我描述。
附图说明
在附图的图中,通过示例而非限制的方式图示出了本技术的一些实施例。
图1是图示出根据示例实施例的客户端-服务器系统的框图。
图2是示出符合本公开的一些实施例的社交联网服务的功能组件的框图,该社交联网服务包括在本文中被称为搜索引擎的数据处理模块,用于生成和提供搜索查询的搜索结果。
图3是更详细地图示出根据示例实施例的应用服务器模块的框图。
图4是更详细地图示出根据示例实施例的机器学习组件的框图。
图5是图示出根据示例实施例的用于创建社交网络实体的深度嵌入式表示的方法的流程图。
图6是图示出根据示例实施例的头衔和技能的深度表示的示例的图。
图7是在更深的层次上(即,放大地)图示出来自图6的深度表示的示例的图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810306438.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于自动云资源供应的标签
- 下一篇:串数据分析装置以及串数据分析方法