[发明专利]一种基于主题语义感知的特征关键词提取方法有效
申请号: | 202011017875.4 | 申请日: | 2020-09-24 |
公开(公告)号: | CN112100317B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 戴华;姜莹莹;戴雪龙;周倩;杨庚;黄海平 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F40/279;G06F40/30 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于主题语义感知的特征关键词提取方法,具体包括如下过程:首先,利用关键词与文档主题之间的语义相关度的量化方法,计算关键词集合中每一个关键词的信息增益得分,并计算文档中每一个关键词的主题频率‑逆主题频率(TF‑ITF)得分;然后,选取信息增益得分最大的前κ个关键词,构成信息增益特征关键词集合;并分别针对每个文档,选取该文档中主题相关度得分最大的前λ个关键词,进而构成全局主题信息特征关键词集合;最终,对全局信息增益特征关键词集合和全局主题信息特征关键词集合进行合并,生成最终的特征关键词集合。本发明综合考虑关键词之间以及关键词和文档之间的主题语义关系,实现表征文档主题语义信息的特征关键词提取。 | ||
搜索关键词: | 一种 基于 主题 语义 感知 特征 关键词 提取 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011017875.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种两轮电动车换电柜
- 下一篇:一种用于矿井水处理的适度分步协同预处理工艺