[发明专利]基于分布式多级聚类的话题检测装置及方法无效
申请号: | 201210274779.7 | 申请日: | 2012-08-03 |
公开(公告)号: | CN102831193A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 杨青;李德聪 | 申请(专利权)人: | 人民搜索网络股份公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 刘淑敏 |
地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于分布式多级聚类的话题检测装置及方法,该装置主要包括新闻采集模块、新闻分类模块、话题检测模块和话题整合模块以及话题展示模块;该方法包括:题检测方法,其特征在于,该方法包括:A、对新闻进行采集的步骤;B、对所述新采集的新闻进行分类的步骤;C、对各频道并行地进行多级聚类的步骤;D、计算所有话题的热度,筛选出全系统内的热点话题和每个频道内的热点话题。采用本发明,能够解决在互联网环境中大量文档快速更新的条件下,话题检测面临的检测效果与时间开销的尖锐矛盾。 | ||
搜索关键词: | 基于 分布式 多级 话题 检测 装置 方法 | ||
【主权项】:
一种基于分布式多级聚类的话题检测装置,其特征在于,该装置主要包括:新闻采集模块,用于实时采集网络新闻,并抽取出结构化信息;新闻分类模块,用于对采集的新闻按主题类别进行分类,分发到各个频道;话题检测模块,分为多个彼此独立的模块,每个频道对应一个模块,采用并行方式在各频道内进行多级聚类,计算各话题热度,并筛选出频道热门话题;话题整合模块,用于综合各频道热门话题,筛选出全系统的热门话题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民搜索网络股份公司,未经人民搜索网络股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210274779.7/,转载请声明来源钻瓜专利网。