|
钻瓜专利网为您找到相关结果 1061065个,建议您 升级VIP下载更多相关专利
- [发明专利]文本聚类的方法及系统-CN201610830223.X有效
-
李贤;陈振安;王鹏
-
广州视源电子科技股份有限公司
-
2016-09-18
-
2020-02-07
-
G06F16/35
- 本发明涉及一种文本聚类的方法及系统,一种文本聚类的方法,包括以下步骤:在接收到待分类文本时,提取待分类文本的关键词;根据获取的最终词袋中的关键词,对待分类文本的关键词进行匹配,得到待分类文本的类型标签;最终词袋为根据预设的选取规则对各类标词袋中的关键词进行排序和筛选后得到的;类标词袋为对各类型标签分别对应的各文本进行关键词提取后生成的关键词的集合。本发明通过已有标签的记录来提取每个标签对应的核心词,得到最终词袋,然后通过最终词袋中的核心词来分类每个待分类的文本,对于噪音数据有着很好的适应性,不会出现在有较多噪音情况下,准确率大幅下降的情况;通过质心大范围阈值化
- 文本方法系统
|