[发明专利]网络舆情监控方法、装置和设备在审
申请号: | 201910777712.7 | 申请日: | 2019-08-22 |
公开(公告)号: | CN110659436A | 公开(公告)日: | 2020-01-07 |
发明(设计)人: | 张琳;温祖杰;欧代慧;王雅芳;龙翀 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 11258 北京东方亿思知识产权代理有限责任公司 | 代理人: | 彭琼 |
地址: | 开曼群岛*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监控网络 舆情信息 语义特征 向量 网络舆情 网络舆情信息 监控模型 业务类 预设 相似度 参考 触发条件 监控 | ||
本说明书实施例提供一种网络舆情监控方法、装置和设备。在一个实施例中,该方法包括:获取待监控网络舆情信息;对于每个网络舆情监控模型,执行以下步骤:将待监控网络舆情信息和网络舆情监控模型对应的业务类目下的预设参考网络舆情信息作为网络舆情监控模型的输入;提取待监控网络舆情信息的N个第一语义特征向量和预设参考网络舆情信息的N个第二语义特征向量;对于每个第一语义特征向量,计算至少一个第二语义特征向量分别与该第一语义特征向量之间的距离;基于所计算的距离,得到待监控网络舆情信息与预设参考网络舆情信息之间的相似度;以及若所得到的相似度满足未知业务类目触发条件,则将待监控网络舆情信息划分至未知业务类目。
技术领域
本说明书一个或多个实施例涉及计算机领域,尤其涉及一种网络舆情监控方法、装置和设备。
背景技术
随着移动互联网、物联网等新技术的迅速发展,人类进入数据时代。数据时代带来的信息风暴正改变着我们的生活、工作和思维方式,对网络舆情管理也带来深刻影响。网络舆情是指在一定的社会空间内,通过网络传播的公众对现实生活中某些焦点问题所持有的倾向性的言论和观点。新舆情时代的到来呼唤有责任的商业组织在密切关注舆情风险的同时,能够深入挖掘舆情大数据的价值,倾听社会、市场和用户的广泛声音,反哺商业机会。
若依赖人工每天从上百万的数据中监控网络舆情信息,则会大大降低网络舆情监控的效率。目前可以利用一些固有规则对网络舆情信息进行筛选。例如,固有规则为设定关键词,通过预先设定的关键词筛选网络舆情信息,以实现对用户所关心的舆情信息进行监控。但是,目前的网络舆情信息的监控方法在对网络舆情信息进行筛选时,很容易将一些新型的网络舆情信息漏掉,降低了网络舆情监控的准确度。
发明内容
本说明书一个或多个实施例提供一种网络舆情监控方法、装置和设备,提高了对网络舆情监控的准确度。
本说明书一个或多个实施例提供的技术方案如下:
第一方面,提供一种网络舆情监控方法,包括:
获取待监控网络舆情信息;
对于网络舆情监控系统包括的至少一个网络舆情监控模型中的每个网络舆情监控模型,执行以下步骤:
将待监控网络舆情信息和网络舆情监控模型对应的业务类目下的预设参考网络舆情信息作为网络舆情监控模型的输入;
提取待监控网络舆情信息的N个第一语义特征向量和预设参考网络舆情信息的N个第二语义特征向量;其中,N为大于等于1的整数;
对于N个第一语义特征向量中的每个第一语义特征向量,计算N个第二语义特征向量中的至少一个第二语义特征向量分别与该第一语义特征向量之间的距离;
基于所计算的距离,得到待监控网络舆情信息与预设参考网络舆情信息之间的相似度;
若所得到的相似度满足未知业务类目触发条件,则将待监控网络舆情信息划分至未知业务类目。
第二方面,提供一种网络舆情监控装置,包括:
网络舆情信息获取模块,用于获取待监控网络舆情信息;
相似度确定模块,用于对于网络舆情监控系统包括的至少一个网络舆情监控模型中的每个网络舆情监控模型,执行以下步骤:
将待监控网络舆情信息和网络舆情监控模型对应的业务类目下的预设参考网络舆情信息作为网络舆情监控模型的输入;
提取待监控网络舆情信息的N个第一语义特征向量和预设参考网络舆情信息的N个第二语义特征向量;其中,N为大于等于1的整数;
对于N个第一语义特征向量中的每个第一语义特征向量,计算N个第二语义特征向量中的至少一个第二语义特征向量分别与该第一语义特征向量之间的距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910777712.7/2.html,转载请声明来源钻瓜专利网。