[发明专利]从文本集中提取主题标签的方法、电子设备在审
申请号: | 202111409911.6 | 申请日: | 2021-11-25 |
公开(公告)号: | CN114117045A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 简仁贤;马永宁;任钊立 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 衡滔 |
地址: | 200030 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请提供一种从文本集中提取主题标签的方法、电子设备,该方法包括:将文本集中的每个文本转换为文本向量;将每个文本向量作为最底层的簇,执行自底向上的层级聚类,并确定每一层簇的主题标签;针对任一词语,根据主题标签中包含词汇的簇,获得词语对应的簇集合;簇集合包括至少一个簇,每个簇包含至少一个文本;根据不同词语对应的簇集合以及待提取的关键词,找出关键词映射的目标簇集合;根据目标簇集合中每个簇对应的主题标签,得到从文本集中提取的与关键词相关的主题标签。该方案主题标签的提取更加简便。 | ||
搜索关键词: | 文本 集中 提取 主题 标签 方法 电子设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111409911.6/,转载请声明来源钻瓜专利网。