在大数据量时,K-means算法和层次聚类算法谁更有优势?为什么?

如题所述

举报该问题

推荐答案 2012-11-30

这个问题其实是无解的，数据不同，算法的分类效果、实际运行时间也是不同。
若单从运算速度而言，k-means比层次更快。
原因是K-means是找中心，然后计算距离；层次是逐个样本逐层合并，层次的算法复杂度更高。
更重要的是，在大数量下，K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/IvYN3Y3N8.html

第1个回答 2013-09-10

birch吧,层次聚类算法,为大数据而生

相似回答

在大数据量时,K-means算法和层次聚类算法谁更有优势答：若单从运算速度而言，k-means比层次更快。原因是K-means是找中心，然后计算距离；层次是逐个样本逐层合并，层次的算法复杂度更高。更重要的是，在大数量下，K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。

kmeans聚类算法优缺点答：1、优点 k-平均算法是解决聚类问题的一种经典算法，算法简单、快速。对处理大数据集，该算法是相对可伸缩的和高效率的，因为它的复杂度大约是O(nkt) O(nkt)O(nkt)，其中n是所有对象的数目，k是簇的数目，t是迭代的次数。通常k<<n。这个算法经常以局部最优结束。算法尝试找出使平方误差函数值最小...

大数据十大经典算法之k-means答：K均值算法的优点:如果变量很大,K均值比层次聚类的计算速度较快(如果K很小);与层次聚类相比,K均值可以得到更紧密的簇,尤其是对于球状簇;对于大数据集,是可伸缩和高效率的;算法尝试找出使平方误差函数值最小的k个划分。当结果簇是密集的,而簇与簇之间区别明显的时候,效果较好。K均值算法缺点:最后结果受初始值的影...

k-means聚类算法的优缺点答：2、聚类效果较优。3、主要需要调参的参数仅仅是簇数K。4、算法的可解释度比较强。5、算法快速、简单。6、对大数据集有较高的效率并且是可伸缩性的。缺点：1、采用迭代方法，聚类结果往往收敛于局部最优而得不到全局最优解。2、对非凸形状的类簇识别效果差。3、易受噪声和异常点的影响。4、K值的...

用于数据挖掘的聚类算法有哪些,各有何优势?答：在数据挖掘的世界里，各种聚类算法犹如璀璨繁星，各有其独特的魅力和优势。要深入了解这些算法，首先得明白它们是如何在数据的海洋中绘制出清晰的轮廓：相似性衡量的智慧</聚类算法的第一步是确定数据间的相似度。直接法如Minkowski距离（L1/L2/Euclidean等）精准测量距离，而间接法如距离系数、核函数（如...

大数据最常用的算法有哪些答：聚类算法则是将数据集中的对象按照其相似性进行分组，使得同一组内的对象尽可能相似，而不同组间的对象尽可能不同。常见的聚类算法包括K-means、层次聚类、DBSCAN等。例如，在电商网站中，聚类算法可以将用户按照其购物行为和兴趣偏好划分为不同的用户群体，从而为用户提供更加精准的推荐服务。回归算法则是...

聚类k-means++、k-means参数、Mini Batch K-Means答：2.对大数据集有较高的效率并且是可伸缩性的;3.时间复杂度近于线性，而且适合挖掘大规模数据集。K-Means聚类算法的时间复杂度是O(n×k×t) ,其中n代表数据集中对象的数量，t代表着算法迭代的次数，k代表着簇的数目　。计算复杂度在最坏的情况下为 O(n^(k+2/p))，其中n是样本量，p是特征个...

大家正在搜

K均值算法聚类结果优化 K—means算法 K均值聚类算法 K均值聚类算法实现 K-means K均值算法 K均值算法应用 K均值算法的缺点 K均值聚类的基本思想

在大数据量时，K-means算法和层次聚类算法谁更有优势

大数据进行kmeans聚类在hadoop2上怎么实现

k-means聚类可用于大数据挖掘吗

支持向量机，决策树，朴素贝叶斯分类，k-means聚类哪些算...

大数据进行kmeans聚类在hadoop2上怎么实现