[发明专利]一种隐式标签同现的预测方法及装置在审

专利信息
申请号: 201810374955.1 申请日: 2018-04-24
公开(公告)号: CN108874868A 公开(公告)日: 2018-11-23
发明(设计)人: 陈晋鹏;张佩;傅湘玲;管皓;孙艺;牛琨;高慧;吴国仕 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京风雅颂专利代理有限公司 11403 代理人: 朱亲林
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 标签 预测 网络拓扑结构 权重路径 权重 隐式 逻辑回归模型 标签网络 关系构建 获取信息 连接路径 相关信息 信息网络 预测模型 网络 挖掘 概率 申请
【权利要求书】:

1.一种隐式标签同现的预测方法,其特征在于,包括:

获取信息网络中与标签相关的实体,基于不同实体之间的关系构建权重网络元结构并得到信息网络对应的网络拓扑结构;其中,所述权重网络元结构用于表述不同实体之间的连接关系以及权重大小;所述网络拓扑结构包含多个权重网络元结构;

分别针对不同的实体,相应计算得到不同实体的权重并添加到所述网络拓扑结构中;

针对待预测的两个标签,在所述网络拓扑结构中获取两个标签之间的权重路径;其中,所述权重路径为待预测的两个标签之间连接路径;

将所述权重路径作为输入,采用逻辑回归模型作为预测模型,计算待预测的两个标签同现的概率。

2.根据权利要求1所述的方法,其特征在于,所述实体包括图片、标签、用户以及组;其中,图片与用户之间的链路隐含着“上传”和“被上传”信息,图片与标签之间的链路隐含着“添加”和“被添加”信息,图片与组之间的链路隐含着“包含”和“被包含“信息。

3.根据权利要求2所述的方法,其特征在于,所述计算得到不同实体的权重包括:

基于图片中的标签序列,计算得到标签的序列权重,计算公式如下:

其中,i为标签在标签序列中的序号,n为预设的临界值,wseq(txi)为标签txi的序列权重;

基于标签所属的组的数目,计算得到标签的概念权重,计算公式如下:

其中,N是标签txi所属的组的数目,wcon(txi)为标签txi的概念权重;

将序列权重与概念权重与对应的系数相乘后相加得到基于用户的标签权重,如下:

wu(txi)=α*wsep(txi)+(1-α)*wcon(txi);

其中,α(α∈[0,1])为可调参数,wu(txi)为基于用户的标签权重;

基于使用了同一个标签的所有用户集合,进行标签权重求和,进而得到标签txi的权重,算法如下:

其中,u为用户;Utxi为使用标签txi的用户集合;w(txi)为标签txi的权重;

基于标签权重以及当前用户具有的标签,通过如下公式计算得到用户权重:

其中,w(txi)为标签txi的权重;Tu为用户具有的标签集合,CTu为用户指派的候选标签集合;δ为预设的阈值;w(u)为用户权重;

基于用户权重以及组中所具有的用户,通过如下公式计算得到组权重:

其中,gxi为某一个组;w(u)为用户权重;

基于标签权重通过如下算法计算得到图片权重;

其中,w(txi)为标签txi的权重;w(ix)为图片权重。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810374955.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top