[发明专利]一种隐式标签同现的预测方法及装置在审
申请号: | 201810374955.1 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108874868A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 陈晋鹏;张佩;傅湘玲;管皓;孙艺;牛琨;高慧;吴国仕 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 朱亲林 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 预测 网络拓扑结构 权重路径 权重 隐式 逻辑回归模型 标签网络 关系构建 获取信息 连接路径 相关信息 信息网络 预测模型 网络 挖掘 概率 申请 | ||
本发明公开了一种隐式标签同现的预测方法,包括:获取信息网络中与标签相关的实体,基于不同实体之间的关系构建权重网络元结构并得到信息网络对应的网络拓扑结构;分别针对不同的实体,相应计算得到不同实体的权重并添加到所述网络拓扑结构中;针对待预测的两个标签,在所述网络拓扑结构中获取两个标签之间的权重路径;其中,所述权重路径为待预测的两个标签之间连接路径;将所述权重路径作为输入,采用逻辑回归模型作为预测模型,计算待预测的两个标签同现的概率。本申请能够对标签网络中隐藏更深的标签关系是否能够同现进行准确预测,进而挖掘得到更深层次的相关信息。
技术领域
本发明涉及标签同现预测相关技术领域,特别是指一种隐式标签同现的预测方法及装置。
背景技术
近年来,社会标注系统(如Flickr、YouTube等)得到了很多研究者的关注。这些系统中的用户通过加标签来标注自己感兴趣的内容,通过构建他们的朋友网络来和其他的用户形成社会关系。当前,许多研究者基于用户标记产生的标记内容、形成的社会关系等做了一系列的研究工作。在这些研究工作中,标签同现是一个热门的研究话题。比如,标签同现可以定义标签的相似性、通过标签同现可以学习用户的标记行为。同时,标签同现在一定程度上可以起到语义扩展的作用。比如,通过同现标签“北京”、“长城”,我们可以知道长城是北京一个景点;通过标签“跑步”、“阿迪达斯”,我们可以知道一个用户喜欢跑步这项运动并且喜欢用阿迪达斯这个牌子的运动装备。
通常,标签使用频率以及标签同现频率都服从幂律分布。例如:一些研究者指出,在一家用标签系统管理内容的网站del.icio.us标注系统中标签的使用频率服从幂律分布,也即标签的选择是高度集中的。最流行的标签被使用的次数高达180,000。也有一些研究者阐明所有标签中的55%只被使用一次,并且同现标签也服从幂律分布。这样,标签同现在扩展语义方面受到了限制。
因此,在实现本申请的过程中发明人发现现有技术至少存在以下缺陷:当前基于已知标签同现关系的研究依旧存在限制,导致无法对网络中更深层次的关联关系进行预测,也即无法预知未知两个标签是否可能出现同现关系。
发明内容
有鉴于此,本发明的目的在于提出一种隐式标签同现的预测方法及装置,能够对标签网络中隐藏更深的标签关系是否能够同现进行准确预测,进而得到更深层次的相关信息。
基于上述目的本发明提供的一种隐式标签同现的预测方法,包括:
获取信息网络中与标签相关的实体,基于不同实体之间的关系构建权重网络元结构并得到信息网络对应的网络拓扑结构;其中,所述权重网络元结构用于表述不同实体之间的连接关系以及权重大小;所述网络拓扑结构包含多个权重网络元结构;
分别针对不同的实体,相应计算得到不同实体的权重并添加到所述网络拓扑结构中;
针对待预测的两个标签,在所述网络拓扑结构中获取两个标签之间的权重路径;其中,所述权重路径为待预测的两个标签之间连接路径;
将所述权重路径作为输入,采用逻辑回归模型作为预测模型,计算待预测的两个标签同现的概率。
可选的,所述实体包括图片、标签、用户以及组;其中,图片与用户之间的链路隐含着“上传”和“被上传”信息,图片与标签之间的链路隐含着“添加”和“被添加”信息,图片与组之间的链路隐含着“包含”和“被包含”信息。
可选的,所述计算得到不同实体的权重包括:
基于图片中的标签序列,计算得到标签的序列权重,计算公式如下:
其中,i为标签在标签序列中的序号,n为预设的临界值,wseq(txi)为标签txi的序列权重;
基于标签所属的组的数目,计算得到标签的概念权重,计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810374955.1/2.html,转载请声明来源钻瓜专利网。