[发明专利]一种提取关键词的方法及设备有效
申请号: | 201810005975.1 | 申请日: | 2018-01-03 |
公开(公告)号: | CN108241613B | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 徐常亮;花京华;刘军宁 | 申请(专利权)人: | 新华智云科技有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F16/33;G06F16/335 |
代理公司: | 上海百一领御专利代理事务所(普通合伙) 31243 | 代理人: | 陈贞健;邵栋 |
地址: | 310012 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供了一种提取关键词的方法及设备,该方案首先对待抽取文档进行分词,获取候选词语,然后根据所述候选词语的词向量,对所述候选词语进行核密度估计,确定所述候选词语的核密度,进而根据所述候选词语的核密度和所述候选词语的IDF值,确定所述候选词语的关键词分值,最终可以基于所述关键词分值,从所述候选词语中选取关键词,由于将词向量加入到关键词的评判中可以通过词语在全局中的相似性来增强其类似词语作为关键词的得分,同时该方案结合了词语的IDF特征,避免了将常用词作为关键词,保证选取的关键词对文档有较强的归纳能力,提高了关键词提取结果准确性。 | ||
搜索关键词: | 一种 提取 关键词 方法 设备 | ||
【主权项】:
1.一种提取关键词的方法,其中,该方法包括:对待抽取文档进行分词,获取候选词语;根据所述候选词语的词向量,对所述候选词语进行核密度估计,确定所述候选词语的核密度;根据所述候选词语的核密度和IDF值,确定所述候选词语的关键词分值;基于所述关键词分值,从所述候选词语中选取关键词。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华智云科技有限公司,未经新华智云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810005975.1/,转载请声明来源钻瓜专利网。
- 上一篇:标点符号处理方法和装置
- 下一篇:信息处理方法和装置、用于信息处理的装置