[发明专利]一种隐式标签同现的预测方法及装置在审
申请号: | 201810374955.1 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108874868A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 陈晋鹏;张佩;傅湘玲;管皓;孙艺;牛琨;高慧;吴国仕 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 朱亲林 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标签 预测 网络拓扑结构 权重路径 权重 隐式 逻辑回归模型 标签网络 关系构建 获取信息 连接路径 相关信息 信息网络 预测模型 网络 挖掘 概率 申请 | ||
1.一种隐式标签同现的预测方法,其特征在于,包括:
获取信息网络中与标签相关的实体,基于不同实体之间的关系构建权重网络元结构并得到信息网络对应的网络拓扑结构;其中,所述权重网络元结构用于表述不同实体之间的连接关系以及权重大小;所述网络拓扑结构包含多个权重网络元结构;
分别针对不同的实体,相应计算得到不同实体的权重并添加到所述网络拓扑结构中;
针对待预测的两个标签,在所述网络拓扑结构中获取两个标签之间的权重路径;其中,所述权重路径为待预测的两个标签之间连接路径;
将所述权重路径作为输入,采用逻辑回归模型作为预测模型,计算待预测的两个标签同现的概率。
2.根据权利要求1所述的方法,其特征在于,所述实体包括图片、标签、用户以及组;其中,图片与用户之间的链路隐含着“上传”和“被上传”信息,图片与标签之间的链路隐含着“添加”和“被添加”信息,图片与组之间的链路隐含着“包含”和“被包含“信息。
3.根据权利要求2所述的方法,其特征在于,所述计算得到不同实体的权重包括:
基于图片中的标签序列,计算得到标签的序列权重,计算公式如下:
其中,i为标签在标签序列中的序号,n为预设的临界值,wseq(txi)为标签txi的序列权重;
基于标签所属的组的数目,计算得到标签的概念权重,计算公式如下:
其中,N是标签txi所属的组的数目,wcon(txi)为标签txi的概念权重;
将序列权重与概念权重与对应的系数相乘后相加得到基于用户的标签权重,如下:
wu(txi)=α*wsep(txi)+(1-α)*wcon(txi);
其中,α(α∈[0,1])为可调参数,wu(txi)为基于用户的标签权重;
基于使用了同一个标签的所有用户集合,进行标签权重求和,进而得到标签txi的权重,算法如下:
其中,u为用户;Utxi为使用标签txi的用户集合;w(txi)为标签txi的权重;
基于标签权重以及当前用户具有的标签,通过如下公式计算得到用户权重:
其中,w(txi)为标签txi的权重;Tu为用户具有的标签集合,CTu为用户指派的候选标签集合;δ为预设的阈值;w(u)为用户权重;
基于用户权重以及组中所具有的用户,通过如下公式计算得到组权重:
其中,gxi为某一个组;w(u)为用户权重;
基于标签权重通过如下算法计算得到图片权重;
其中,w(txi)为标签txi的权重;w(ix)为图片权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810374955.1/1.html,转载请声明来源钻瓜专利网。