[发明专利]一种文本聚类方法、文本聚类装置及终端设备在审
申请号: | 201811495672.9 | 申请日: | 2018-12-07 |
公开(公告)号: | CN109766437A | 公开(公告)日: | 2019-05-17 |
发明(设计)人: | 刘志勇;吴又奎;任晓德 | 申请(专利权)人: | 中科恒运股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F17/27 |
代理公司: | 石家庄国为知识产权事务所 13120 | 代理人: | 秦敏华 |
地址: | 050090 河北省石家庄市新石*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请适用于深度学习技术领域,提供了一种文本聚类方法、文本聚类装置及终端设备,包括:获取至少两个待聚类文本,并分别对每个待聚类文本进行分词预处理得到多个文本特征词;利用Word2vec分别将每个文本特征词转换成词向量,并将所述待聚类文本中的所有词向量进行叠加得到所述待聚类文本的文本向量;利用预设的聚类模型对所述待聚类文本的文本向量进行聚类,得到聚类结果。通过上述方法,有效提高了文本聚类的准确率。 | ||
搜索关键词: | 聚类 文本聚类 文本 文本特征 文本向量 终端设备 词向量 分词预处理 聚类结果 聚类模型 词转换 准确率 预设 叠加 申请 学习 | ||
【主权项】:
1.一种文本聚类方法,其特征在于,包括:获取至少两个待聚类文本,并分别对每个待聚类文本进行分词预处理得到多个文本特征词;利用Word2vec分别将每个文本特征词转换成词向量,并将所述待聚类文本中的所有词向量进行叠加得到所述待聚类文本的文本向量;利用预设的聚类模型对所述待聚类文本的文本向量进行聚类,得到聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科恒运股份有限公司,未经中科恒运股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811495672.9/,转载请声明来源钻瓜专利网。