[发明专利]文本聚类方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 201911331054.5 | 申请日: | 2019-12-20 |
| 公开(公告)号: | CN113010668A | 公开(公告)日: | 2021-06-22 |
| 发明(设计)人: | 胡玉兰 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
| 代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请提供了一种文本聚类方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取指定领域的多个待聚类文本;基于预置神经网络模型和多个所述待聚类文本,获取每个所述待聚类文本对应的文本向量表征;重复从多个所述文本向量表征中随机选取设定个数的文本向量表征,得到多个文本向量子集;采用随机梯度下降算法对多个文本向量子集进行处理,计算得到隶属度矩阵;基于粗糙集理论和所述隶属度矩阵,确定每个所述文本向量子集对应的上近似集和下近似集;基于每个所述文本向量子集对应的上近似集和下近似集,输出多个所述待聚类文本对应的文本聚类结果。本申请可以提高聚类方法对大规模复杂数据的处理能力和运行效率。 | ||
| 搜索关键词: | 文本 方法 装置 电子设备 计算机 可读 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911331054.5/,转载请声明来源钻瓜专利网。





