[发明专利]基于注意力流网络模型的互联网站点影响力的定量评估方法有效
申请号: | 202011266716.8 | 申请日: | 2020-11-13 |
公开(公告)号: | CN112380465B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 李勇;薛向军;张小康;火胤 | 申请(专利权)人: | 兰州七度数聚技术有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/958;H04L43/106 |
代理公司: | 兰州中科华西专利代理有限公司 62002 | 代理人: | 马小瑞 |
地址: | 730070 甘肃省兰州市安宁区万新*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意力 流网 模型 互联网 站点 影响力 定量 评估 方法 | ||
本发明公开了一种基于注意力流网络模型的互联网站点影响力的定量评估方法,包括对海量群体用户的在线点击流数据进行数据清洗,得到群体用户的注意力转换序列;构建群体注意力流网络;计算注意力流矩阵M、概率转移矩阵P、注意力耗散矩阵Q和基本矩阵U;计算互联网站点影响力Ci。本发明提出的群体注意力流网络模型和传统站点排名的超链接PageRank算法等模型相比较,超链接模型需要将流网络数据迭代计算超过近百次才能得到最终结果,本发明提出的群体注意力流网络模型站点影响力计算方法仅需要计算一次,与传统计算方法相比本发明具有较大优势,性能远优于超链接模型。
技术领域
本发明涉及互联网技术领域,具体的说是一种基于注意力流网络模型的互联网站点影响力的定量评估方法。
背景技术
近年来,随着HTML5标准的建立与移动端软件的需求不断增长,越来越多的软件基于B/S架构开发。B/S架构的软件爆炸式发展累积了大量的在线点击流数据,通过互联网站点评估方法不仅能够揭示Web站点的演化过程,为Web站点的良性发展提供可靠的理论指导,而且能够为互联网在线广告等商业领域提供智能化的解决方案,实现利益最大化。然而,传统互联网站点的评估大多是通过超链接方法分析其结构以及站点的影响力。超链接分析方法有其局限性,许多互联网站点没有对外的超链接,使得超链接分析方法难以展示互联网站点与用户之间丰富的交互模式。
发明内容
为了克服超连接分析的局限性,本发明的目的是提供一种互联网站点影响力评估方法,利用群体用户注意力流机制,结合用户在网络中注意力的转移特征,表征用户行为与互联网站点协同演化的机制,基于注意力流网络模型定义变量,从而定量计算互联网站点的影响力。
为实现上述目的,本发明所提供的技术方案为:
基于注意力流网络模型的互联网站点影响力的定量评估方法,包括对海量群体用户的在线点击流数据进行数据清洗,得到群体用户的注意力转移序列;构建群体注意力流网络;计算注意力流矩阵M、概率转移矩阵P、注意力耗散矩阵Q和基本矩阵U;计算互联网站点影响力Ci;通过以下步骤实现:
1)数据预处理:
逐一提取海量群体用户在线点击流数据中每个用户的浏览器进程记录,保存每个用户点击流数据记录中存在的统一资源定位器URL和时间戳;从所保存的统一资源定位器URL中抽取出域名信息,将时间戳转换为对应的点击时间,得到清洗后的数据,清洗后的数据包括统一资源定位器URL对应的域名信息和点击时间;
2)加权有向注意力流网络的构建:
2.1)逐一读取数据预处理过程中得到的每个用户点击流数据序列,建立一个虚拟节点Source表示注意力流的“源”,从虚拟节点Source向第1条点击记录的域名引出1条有向边;
2.2)判断下一条点击记录与上一条点击记录的时间差,如果超过30分钟,则以上一条点击记录的域名为节点,引出1条有向边到一个虚拟节点Sink,虚拟节点Sink表示注意力流的“汇”;从虚拟节点Source向下一条点击记录中的域名为节点引出1条有向边,同时更新上一条记录的域名停留时间,如果没有超过30分钟,则执行步骤2.3);
2.3)判断下一条点击记录与上一条点击记录的域名是否相同,如果相同,则更新该域名的停留时间,如果不同,则以上一条点击记录的域名为节点向下一条点击记录的域名为节点引出1条有向边,同时更新上一条点击记录中域名的停留时间;
2.4)重复2.1)到2.3)直到所有点击记录被读取,即可构建加权有向注意力流网络G:G=(V,E,T,W),其中V为节点集,即记录中存在的所有域名与虚拟节点Source和虚拟节点Sink构成的节点集合;E为边集,即记录不同域名之间跳转的边集合;T为域名停留时间集,表示群体用户在一个域名上停留的总时间;W为边集E的权重,记录不同域名之间跳转关系发生次数的集合;
3)由步骤2)构建的加权有向注意力流网络G,计算得出注意力流矩阵M,计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于兰州七度数聚技术有限公司,未经兰州七度数聚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011266716.8/2.html,转载请声明来源钻瓜专利网。