[发明专利]一种改进的基于概念格的论坛人物跟踪方法无效

专利信息
申请号: 201210559851.0 申请日: 2012-12-21
公开(公告)号: CN103226555A 公开(公告)日: 2013-07-31
发明(设计)人: 张玲;朱洪亮;李伟;谢康;李星;韩耀明 申请(专利权)人: 北京邮电大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 改进 基于 概念 论坛 人物 跟踪 方法
【说明书】:

技术领域

发明涉及搜索引擎技术,特别涉及一种人物跟踪的方法。 

背景技术

随着云计算和物联网时代的到来,网络交流飞快成长,网络社区文化形成,网络交流已经成为新一代网民必不可少的交流方式。各种网上交流社区层出不穷,如百度贴吧,天涯社区,各大高校论坛等,使网民的网络交流更加通畅,但是这给舆情信息管控造成很大难度。 

目前现有技术只有搜索引擎对于敏感信息的过滤,并没有深入到人物跟踪的程度。 

发明内容

本发明实施例提供的一种改进的论坛人物跟踪方法,用以解决论坛人物跟踪的问题,并且提高搜索的效率。 

对原始数据建立知识库,通过粗糙集约简算法简化庞大的数据集合。 

通过概念格的批生成算法,在既定关键字的前提下通过批处理生成算法生成概念格,得出形式概念,并根据形式概念区分论坛人物,以达到人物跟踪效果。使用概念格形式化模型,具有完整的表达数据库中知识的特点,而且知识表达形式清晰,易于求解。 

本发明实施例在得出形式概念之后,可得出人物归类,再扩加IP地址以及其他分析,跟踪论坛用户,对敏感用户实施特殊关注,达到管控效果。 

附图说明

图1是本发明实施例提供的流程示意图; 

图2是本发明实施例提供的粗糙集算法约简流程图; 

图3是本发明实施例提供的批处理算法流程图。 

具体实施方式

针对现有论坛舆情存在的用户监控,舆情管控困难的问题,本发明实施例在已有数据前提下,通过概念格的批生成算法,在既定关键字的前提下生成概念格,得出形式概念,并根据形式概念区分论坛人物类别或者具体人物,以达到人物跟踪效果。 

如图1所示,本发明实施例提供的基于概念格的论坛人物跟踪包括:网页信息采集服务器分布式爬取网络信息,经过分词等预处理将信息存入数据库等待处理。人工设定关键字集合,并对数据库中知识进行批量处理,得到概念格,重复以上步骤,实时更新概念格。在最终得到的形式概念中区分出敏感用户,进行重点关注,得到跟踪效果。 

产生的等价关系U/Ri,i=1,2,…n,如果删除该属性xi,使得POS(p/xi)(Q)=POS(p)(Q),则说明属性xi,是不必要的,从决策表中删除属性xi所在列并将重复的行进行合并;否则,说明属性xi是必要的,不能删除。 

如图2所示,本发明实施例提供的粗糙集约简算法包括下列步骤: 

步骤201、初始化知识库K=(U,S); 

步骤202、生成等价关系类U/Ri,i=1,2,…n; 

步骤203、对于每个属性xi,删除该属性xi; 

步骤204、使得POS(p/xi)(Q)=POS(p)(Q),则说明属性xi,是不必要的,否则,说明属性xi是必要的,不能删除; 

步骤205、重复(2)-(3),直到i=n; 

如图3所示,本发明实施例提供的改进的概念格批处理算法包括下列步骤: 

步骤301、初始化格L={(G),f(G)}; 

步骤302、对于队列F中的一个概念C,产生出它的每个子概念Cc; 

步骤303、如果某个子概念Cc以前没有产生过,则加入到L中; 

步骤304、增加概念C和其子概念Cc的链接关系; 

步骤305、反复(3)-(5),直至队列F为空; 

步骤306、输出概念格L,得到形式概念。 

其中G是对象集合,即论坛人物集合,M是属性集合,即自定义的关键字敏感词集合。是G与M之间的一个二元关系。若则对象g具有属性m。 

从上述实施例中可以看出:本发明实施例通过粗糙集约简算法,对批量的数据集合进行约简计算,然后通过概念格的批生成算法,在既定关键字的前提下通过批处理生成算法生成概念格,得出形式概念,并根据形式概念区分论坛人物,以达到人物快速跟踪的效果。使用改进的概念格形式化模型,具有精简数据库的优点,提高了搜索的速度,具有完整的表达数据库中知识的特点,而且知识表达形式清晰,易于求解。 

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210559851.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top