[发明专利]一种舆情分析的热点识别方法有效
申请号: | 201811328243.2 | 申请日: | 2018-11-08 |
公开(公告)号: | CN109446329B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 童友俊 | 申请(专利权)人: | 大连瀚闻资讯有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/332 |
代理公司: | 大连东方专利代理有限责任公司 21212 | 代理人: | 李馨 |
地址: | 116000 辽宁省大连市高*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种舆情分析的热点识别方法。本发明包括:通过计算文本中各词向量集群间的距离,得到各词向量间的关系赋值;根据关系赋值计算其他词与原向量间的关系的相似概率模型,进而得到热点话题词组,对各个热词的tf‑idf值进行排列,将每个热点话题词组下的热词进行真实热度排序,根据热词话题的词数进行回溯文本监测计算,计算后若无法获得聚类下热词对应的热点话题,则根据热度排序减少热词数量直至获得包含全部热词聚类的热点话题。本发明不依赖常见热点识别模型中对舆情的评论量、转发量等热度直接参考指标,舆情热点识别的效率与效果都大大增强。 | ||
搜索关键词: | 一种 舆情 分析 热点 识别 方法 | ||
【主权项】:
1.一种舆情分析的热点识别方法,其特征在于,包括如下步骤:S1、通过计算文本中各词向量集群间的距离,得到各词向量间的关系赋值;S2、将各词与其所在文本进行多维向量降维处理,根据关系赋值计算其他词与原向量间的关系的相似概率模型,通过所述相似概率模型将各词向量集合聚类,得到高维向量聚合,即热点话题词组;S3、根据模型生成的热点话题词组,对各个热词的tf‑idf值进行排列,将每个热点话题词组下的热词进行真实热度排序,根据热词话题的词数进行回溯文本监测计算,计算后若无法获得聚类下热词对应的热点话题,则根据热度排序减少热词数量直至获得包含全部热词聚类的热点话题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连瀚闻资讯有限公司,未经大连瀚闻资讯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811328243.2/,转载请声明来源钻瓜专利网。