[发明专利]一种舆情分析的热点识别方法有效

专利信息
申请号: 201811328243.2 申请日: 2018-11-08
公开(公告)号: CN109446329B 公开(公告)日: 2022-02-22
发明(设计)人: 童友俊 申请(专利权)人: 大连瀚闻资讯有限公司
主分类号: G06F16/35 分类号: G06F16/35;G06F16/332
代理公司: 大连东方专利代理有限责任公司 21212 代理人: 李馨
地址: 116000 辽宁省大连市高*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种舆情分析的热点识别方法。本发明包括:通过计算文本中各词向量集群间的距离,得到各词向量间的关系赋值;根据关系赋值计算其他词与原向量间的关系的相似概率模型,进而得到热点话题词组,对各个热词的tf‑idf值进行排列,将每个热点话题词组下的热词进行真实热度排序,根据热词话题的词数进行回溯文本监测计算,计算后若无法获得聚类下热词对应的热点话题,则根据热度排序减少热词数量直至获得包含全部热词聚类的热点话题。本发明不依赖常见热点识别模型中对舆情的评论量、转发量等热度直接参考指标,舆情热点识别的效率与效果都大大增强。
搜索关键词: 一种 舆情 分析 热点 识别 方法
【主权项】:
1.一种舆情分析的热点识别方法,其特征在于,包括如下步骤:S1、通过计算文本中各词向量集群间的距离,得到各词向量间的关系赋值;S2、将各词与其所在文本进行多维向量降维处理,根据关系赋值计算其他词与原向量间的关系的相似概率模型,通过所述相似概率模型将各词向量集合聚类,得到高维向量聚合,即热点话题词组;S3、根据模型生成的热点话题词组,对各个热词的tf‑idf值进行排列,将每个热点话题词组下的热词进行真实热度排序,根据热词话题的词数进行回溯文本监测计算,计算后若无法获得聚类下热词对应的热点话题,则根据热度排序减少热词数量直至获得包含全部热词聚类的热点话题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连瀚闻资讯有限公司,未经大连瀚闻资讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201811328243.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top