[发明专利]一种从新闻中提取事件的方法在审
申请号: | 201810054183.3 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108197112A | 公开(公告)日: | 2018-06-22 |
发明(设计)人: | 范艳艳;李源 | 申请(专利权)人: | 成都睿码科技有限责任公司;杭州数峰科技有限公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 王记明 |
地址: | 610000 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种从新闻中提取事件的方法,通过提取新闻中的摘要信息作为所属事件,并将新闻文本进行数值化转换获得文本的向量表示,利用聚类方法计算新闻的相似度,基于相似度快速按所属事件对新闻进行分类,能够简单、有效地将属于相同事件的新闻聚类在一起,并获得新闻的热度,便于后续的舆情监控。该方法能够简单、快速、有效对海量新闻信息进行分类,为舆情分析提供指导,进一步提高了舆情的监控力度,并能及时作出决策支持和舆情引导。 | ||
搜索关键词: | 所属事件 提取事件 相似度 聚类 监控力度 决策支持 向量表示 新闻文本 新闻信息 舆情分析 摘要信息 数值化 有效地 分类 热度 文本 监控 转换 | ||
【主权项】:
1.一种从新闻中提取事件的方法,其特征在于,包括:步骤一、获取与目标话题相关的原始新闻数据集;步骤二、提取新闻的摘要作为所属事件,并分别将新闻文本进行数值化转换;步骤三、设置一个新闻箱,确定新闻箱中是否有新闻,若没有,则将该新闻所属事件作为新事件加入新闻箱中,并将该新闻放入此事件下;反之,则执行步骤四;步骤四、计算该新闻与新闻箱中已有新闻的相似度,根据相似度确定该新闻在新闻箱中的所属事件;步骤五、确定新闻箱中是否包含全部新闻及其所属事件,若是,则结束;反之,则返回步骤一。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都睿码科技有限责任公司;杭州数峰科技有限公司,未经成都睿码科技有限责任公司;杭州数峰科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810054183.3/,转载请声明来源钻瓜专利网。