|
钻瓜专利网为您找到相关结果 982109个,建议您 升级VIP下载更多相关专利
- [发明专利]云计算平台驱动的网页大数据内容聚类方法-CN202310482703.1在审
-
岳阳;王军
-
岳阳
-
2023-05-02
-
2023-07-14
-
G06F16/906
- 本申请提出一种云计算平台驱动的网页大数据内容聚类方法,对K均值聚类算法在K值需要人工确定、算法局部最优而非全局最优以及并行化处理三个方面进行优化改进,针对网页数据的半结构化特征对特征项的权重计算方法进行改进,采用K均值网页聚类算法,在基于近似簇和二分K均值网页聚类的基础上,提出“簇内误差乘方和”和“极限点收敛规则”,并构建云计算K均值网页聚类优化改进算法;通过算法改进实现高效准确的海量网页内容聚类,而且当数据量进一步扩大时实验表明优化后的云计算K均值网页聚类算法聚类结果、加速比、可拓展性方面性能上都有较大程度的提高。
- 计算平台驱动网页数据内容方法
|