[发明专利]基于主题交互的社区发现方法有效

申请号：	201510390683.0	申请日：	2015-07-06
公开（公告）号：	CN105159911B	公开（公告）日：	2018-07-10
发明（设计）人：	王柱;於志文;冯斌;郭斌	申请（专利权）人：	西北工业大学
主分类号：	G06F17/30	分类号：	G06F17/30;G06Q50/00;G06K9/62
代理公司：	西北工业大学专利中心 61204	代理人：	王鲜凯
地址：	710072 ***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于主题交互的社区发现方法，用于解决现有社区发现方法对社区描述准确度差的技术问题。技术方案是提取某一时间段内网络中文本、照片等的主题信息，根据网络中的每一次交互建立超图模型。对于超图模型按照用户熵以及主题熵计算超边的权值，选取用户中的种子节点，并根据超边权值计算不同节点的子图贡献度。迭代计算不同节点的贡献度，得到密集子图。以层次聚类方法对密集子图进行不同程度的聚合，得到不同层次下的社区。由于以种子节点出发构建初始子图，并根据超边权值计算不同节点的子图贡献度，然后迭代计算不同节点的贡献度，得到密集子图，对密集子图进行不同程度的聚合，得到不同主题节点对社区的贡献值，准确地描述社区。
搜索关键词：	贡献度社区发现超图模型迭代计算权值计算种子节点社区聚合层次聚类主题节点主题信息准确度时间段构建网络中文
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于主题交互的社区发现方法，其特征在于包括以下步骤：步骤一、采用LDA提取微博网络中文本的主题信息，根据微博网络中用户的每一次交互信息建立超图模型；超图模型中包括用户节点以及主题节点；每一次发布行为构成一条发布边u‑t，其中u表示用户，t表示主题，每一次转发行为构成一条转发边u1‑t1‑u2，暨用户u1从用户u2处转发了主题为t1的微博文本；步骤二、计算用户集合U中不同用户有关不同主题的用户熵，同时计算主题集合T中不同主题有关不同用户的主题熵；采用计算发布边的权重，其中C_ut表示u‑t边出现的次数，e_vu表示用户熵，e_vt表示主题熵；采用表示发布边的权值大小；步骤三、在将网络映射为超图模型后，用表示子图V＇的密度，其中s表示子图中的所有边，w_s表示边的权值，s_i表示边s的第i个相关节点；表示s_i节点对整个子图的贡献程度；若子图V＇是密集子图，则f(x)达到最大值；在超图中进行社区发现的问题采用以下公式表达：其中w(v1,…vk)表示包含节点v1,…vk的边的权值，所有节点对社区的最大贡献为1/ε,暨ε用来控制社区的初始大小；计算网络中的每一个用户节点的邻居节点的数目|Nu|，其中Nu表示用户u的邻居节点集合，表示用户u的邻居节点u_i的邻居节点数，表示用户u的所有邻居节点的平均邻居节点数；选取|N_u|＞avg(N_u)的用户节点作为种子节点；从种子节点出发，选取与种子节点相关的节点构成初始子图；在初始子图中，根据节点所在超边的权重计算节点的权重比例p(i)＝(∑w(1,…k‑1,i))/(∑w(1,…,k))，其中i表示节点，w(1,…,k)表示初始子图中的超边的权值，w(1,…k‑1,i)表示初始子图中包含节点i的超边的权值；设暨对avg(N_u)向上取整；根据节点的权重比例,以及x_i＜ε计算不同节点对密集子图的初始贡献度x_i；步骤四、采用拉格朗日公式进行问题求解；同时，对节点进行分类V_u(x)＝{i|x_i∈(0,ε]}，V_d(x)＝{i|x_i∈[0,ε)}，表示f(x)关于x_i的偏导数；对公式进行推导，根据组合优化的KKT条件，根据公式迭代的计算节点x_m对密集子图的贡献程度，其中i表示Vu中g_i(x)最大的节点，j表示Vd中g_i(x)最小的节点，l表示迭代次数；其中g_ij(x)表示x的两阶导；迭代终止条件为：节点贡献度不在变化或社区大小小于ε；得到社区的密集子图；步骤五、对于得到的密集子图，采用Jaccard系数作为相似度进行度量，以层次聚类的方式得到不同程度下的社区。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于西北工业大学，未经西北工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201510390683.0/，转载请声明来源钻瓜专利网。

上一篇：一种素材处理、编辑、回迁方法及装置
下一篇：用于存储和查询数据的方法和系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于主题交互的社区发现方法有效

专利文献下载