[发明专利]舆情事件实体的分析方法及装置有效
申请号: | 201610037682.2 | 申请日: | 2016-01-20 |
公开(公告)号: | CN106991090B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 冯鸳鹤 | 申请(专利权)人: | 北京国双科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F40/289;G06F40/216 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 王伟锋;刘铁生 |
地址: | 100083 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 舆情 事件 实体 分析 方法 装置 | ||
1.一种舆情事件实体的分析方法,其特征在于,包括:
获取信息集合,并对所述信息集合进行分词;所述信息集合由N个句子组成,其中,N为大于0的整数;
提取分词后的所述信息集合中的人物实体及机构实体;
分别统计共同提及次数、人物实体提及次数以及机构实体提及次数,其中,所述共同提及次数为在同一个句子中共同提及人物实体与机构实体的次数;
根据所述共同提及次数确定所述人物实体与机构实体之间的关联关系;
根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件实体及实体关系;
所述根据所述共同提及次数确定所述人物实体与机构实体之间的关联关系包括:
将获取的共同提及次数进行降序排列,获取共同提及次数最多的人物实体与机构实体,并确定所述人物实体与机构实体之间关联关系;
所述根据所述人物实体提及次数和/或所述机构实体提及次数、所述人物实体与机构实体之间的关联关系确定舆情事件的实体及实体关系包括:
获取所述人物实体提及次数及机构实体提及次数,并分别对所述人物实体提及次数及机构实体提及次数进行降序排列;
确定第一最大值与第二最大值,并将所述第一最大值与所述第二最大值进行比对;其中,所述第一最大值为所述人物实体提及次数的最大值,所述第二最大值为所述机构实体提及次数的最大值;
若所述第一最大值大于或者等于所述第二最大值,则根据所述第一最大值对应的所述人物实体确定所述人物实体与机构实体之间的关联关系;
将所述人物实体确定为所述舆情事件实体,将确定的所述人物实体与机构实体之间的关联关系确定为所述舆情事件的实体关系。
2.根据权利要求1所述的方法,其特征在于,根据所述共同提及次数确定人物实体与机构实体之间的关联关系包括:
获取各人物实体与机构实体对应的共同提及次数,并对所述共同提及次数进行降序排列;
确定所述共同提及次数最多的人物实体与机构实体,并确定所述人物实体与机构实体之间的关联关系。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若所述第一最大值小于所述第二最大值,则根据所述第二最大值对应的所述机构实体确定所述人物实体与机构实体之间的关联关系;
将所述机构实体确定为所述舆情事件实体,将确定的所述人物实体与机构实体之间的关联关系确定为所述舆情事件的实体关系。
4.根据权利要求1-3中任一项所述的方法,其特征在于,在提取分词后的所述信息集合中的人物实体及机构实体之后,所述方法还包括:
获取预设人物机构数据库;所述预设人物机构数据库用于存储人物实体及机构实体;
基于所述预设人物机构数据库对提取的人物实体及机构实体进行校验。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国双科技有限公司,未经北京国双科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610037682.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种缺失里程桩的自动生成方法和装置
- 下一篇:页面选项的处理方法及装置