[发明专利]一种资讯智能聚合方法、设备及存储介质在审
| 申请号: | 202111675792.9 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN114398544A | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 吕永 | 申请(专利权)人: | 上海聚均科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/242;G06F16/2455 |
| 代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 胡晶 |
| 地址: | 200135 上海市浦东新区中国*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 资讯 智能 聚合 方法 设备 存储 介质 | ||
本发明提供了一种资讯智能聚合方法、设备及存储介质,其中一种资讯智能聚合方法,包括以下步骤:基于所需资讯类型创建正式关键词集合,为每一所述关键词设置一初始权重值,设定正式关键词集合中的所有关键词的总初始权重值为一常数,设置候选关键词集合,且所述候选关键词集合初始状态为空集,周期性获取资讯组成资讯集合,利用正式关键词集合筛选提取资讯子集,根据资讯子集关注总量,计算资讯子集中每一资讯的资讯关注度;对资讯子集的每篇资讯进行加工处理,重新分配关键词权重,获得新的正式关键词集合与新的候选关键词集合。无需人工维护,节省人力,同时形成客观的关键词集合。能够自动更新。
技术领域
本发明涉及术新闻整合领域,具体地,涉及一种资讯智能聚合方法、设备及存储介质。
背景技术
现有的资讯频道,主要靠人工去挑选相关主题的资讯加入频道。部分频道会由人工维护一个关键词集合,通过计算机程序去筛选包含相关关键词的资讯加入频道。缺点是这个关键词集合本身是否合理,是否存在遗漏,取决于维护人的水平,具有很大的随机性,不可靠。同时一个主题会不断演变出新的关键词,这些新的关键词靠人工添加往往会相当滞后,导致频道主题经常会错过最新的相关资讯。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种资讯智能聚合方法,本发明的技术方案如下:
一种资讯智能聚合方法,包括以下步骤:
基于所需资讯类型创建正式关键词集合,为每一所述关键词设置一初始权重值,设定正式关键词集合中的所有关键词的总初始权重值为一常数,设置候选关键词集合,且所述候选关键词集合初始状态为空集;
周期性获取资讯组成资讯集合,将含有关利用正式关键词集合筛选提取资讯子集,根据资讯子集关注总量,计算资讯子集中每一资讯的资讯关注度;
对资讯子集进行加工处理,获得新关键词集合与新候选关键词集合。
在上述技术方案基础上并且作为上述技术方案的优选方案:资讯子集的筛选步骤包括:
对资讯子集中的每一资讯进行分词,并提取每一资讯的核心关键词,将每一资讯的核心词组成核心关键词集合,为资讯子集中每一资讯中的核心关键词分配一单篇资讯关注度;
基于每一核心关键词的单篇资讯关注度为核心关键词集合中的每一核心关键词计算一核心关键词关注度;
将核心关键词集合、正式关键词集合与候选关键词集合并集组成新关键词集合,并分配新关键词集合中的每一关键词权重值;
设置第一阈值与第二阈值,其中第一阈值大于第二阈值,将新关键词集合中每一关键词的权重值与第一阈值和第二阈值进行对比,获得新正式关键词集合、新候选关键词集合与回收关键词集合;
每增加一周期资讯,叠加进行资讯子集筛选操作,替换新初始关键集合、新候选关键词集合与回收关键词集合。
在上述技术方案基础上并且作为上述技术方案的优选方案:当新关键词集合中关键词的权重值不小于第一阈值时,把新关键词集合中不小于第一阈值的关键词组成集合替换所述正式关键词集合。
在上述技术方案基础上并且作为上述技术方案的优选方案:当新关键词集合中关键词的权重值不小于第二阈值但小于第一阈值时,把新关键词集合中不小于第二阈值但小于第一阈值的关键词组合并入候选关键词集合中。
在上述技术方案基础上并且作为上述技术方案的优选方案:当新关键词集合中关键词的权重值小于第二阈值时,把新关键词集合中小于第二阈值的关键词组成回收关键词集合。
在上述技术方案基础上并且作为上述技术方案的优选方案:新关键词集合中每一关键词的权重值分配方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海聚均科技有限公司,未经上海聚均科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111675792.9/2.html,转载请声明来源钻瓜专利网。





