[发明专利]舆情事件实体的分析方法及装置有效
申请号: | 201610037682.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN106991090B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06F40/216 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 事件 实体 分析 方法 装置 | ||
本发明公开了一种舆情事件实体的分析方法及装置,涉及互联网技术领域,目的在于解决舆情监控系统不能准确分析出该舆情事件所涉及的人物和机构,导致用户不能通过舆情监控系统准确定位舆情事件产生的源头,从而导致不能及时确定解决该舆情事件的最佳引导方式的问题。本发明的技术方案包括:获取信息集合,并对信息集合进行分词;提取分词后的信息集合中的人物实体及机构实体;分别统计共同提及次数、人物实体提及次数以及机构实体提及次数;根据共同提及次数确定人物实体与机构实体之间的关联关系;根据人物实体提及次数和/或机构实体提及次数、人物实体与机构实体之间的关联关系确定舆情事件实体及实体关系。本发明应用于监控舆情事件的过程中。
技术领域
本发明涉及互联网技术领域,特别是涉及一种舆情事件实体的分析方法及装置。
背景技术
舆情是舆论情况的简称,是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。在实际应用中,常通过舆情监控系统对舆情进行监控。
舆情监控系统对舆情进行监控的具体过程如下:获取互联网海量信息,对该海量信息进行分类聚类、按词通计、专题聚焦等操作,形成简报、报告、图表等分析结果;实现用户的互联网舆情监测和新闻专题追踪等信息需求,为用户全面掌握网民的思想动态,做出正确舆论引导,提供分析依据。
目前,舆情监控系统在对舆情进行分析时,能够分析出该舆情属于什么事件、该舆情事件的发展趋势、该舆情事件涉及的地域等信息,少数舆情监控系统还能分析出网民对该舆情事件所持有的态度;而人物和机构绝大多数情况下是舆情事件产生的主体,但是,舆情监控系统不能准确分析出该舆情事件所涉及的人物和机构,导致用户不能通过舆情监控系统准确定位舆情事件产生的源头,从而导致不能及时确定解决该舆情事件的最佳引导方式。
发明内容
有鉴于此,本发明提供的一种舆情事件实体的分析方法及装置,主要目的在于解决舆情监控系统不能准确分析出该舆情事件所涉及的人物和机构,导致用户不能通过舆情监控系统准确定位舆情事件产生的源头,从而 导致不能及时确定解决该舆情事件的最佳引导方式的问题。
为了解决上述问题,本发明主要提供如下技术方案:
一方面,本发明提供了一种舆情事件实体的分析方法,该方法包括:
获取信息集合,并对所述信息集合进行分词;所述信息集合由N个句子组成,其中,N为大于0的整数;
提取分词后的所述信息集合中的人物实体及机构实体;
分别统计共同提及次数、人物实体提及次数以及机构实体提及次数,其中,所述共同提及次数为在同一个句子中共同提及人物实体与机构实体的次数;
根据所述共同提及次数确定所述人物实体与机构实体之间的关联关系;
根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件实体及实体关系。
另一方面,本发明还提供一种舆情事件实体的分析装置,该装置包括:
第一获取单元,用于获取信息集合;所述信息集合由N个句子组成,其中,N为大于0的整数;
分词单元,用于对所述第一获取单元获取的所述信息集合进行分词;
提取单元,用于提取所述分词单元分词后的所述信息集合中的人物实体及机构实体;
统计单元,用于分别统计所述提取单元提取的共同提及次数、人物实体提及次数以及机构实体提及次数,其中,所述共同提及次数为在同一个句子中共同提及所述人物实体与机构实体的次数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610037682.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种缺失里程桩的自动生成方法和装置
- 下一篇:页面选项的处理方法及装置