77问答网
所有问题
在大数据量时,K-means算法和层次聚类算法谁更有优势?为什么?
如题所述
举报该问题
推荐答案 2012-11-30
这个问题其实是无解的,数据不同,算法的分类效果、实际运行时间也是不同。
若单从运算速度而言,k-means比层次更快。
原因是K-means是找中心,然后计算距离;层次是逐个样本逐层合并,层次的算法复杂度更高。
更重要的是,在大数量下,K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。
温馨提示:答案为网友推荐,仅供参考
当前网址:
http://77.wendadaohang.com/zd/IvYN3Y3N8.html
其他回答
第1个回答 2013-09-10
birch吧,层次聚类算法,为大数据而生
相似回答
在大数据量时,K-means算法和层次聚类算法谁更有优势
答:
若单从运算速度而言,k-means比层次更快
。原因是K-means是找中心,然后计算距离;层次是逐个样本逐层合并,
层次的算法复杂度更高
。更重要的是,在大数量下,K-means算法和层次聚类算法的分类效果真的只能用见仁见智来形容了。
kmeans聚类算法
优缺点
答:
1、优点 k-平均算法是解决聚类问题的一种经典算法,算法简单、快速
。对处理大数据集,该算法是相对可伸缩的和高效率的,因为它的复杂度大约是O(nkt) O(nkt)O(nkt),其中n是所有对象的数目,k是簇的数目,t是迭代的次数。通常k<<n。这个算法经常以局部最优结束。算法尝试找出使平方误差函数值最小...
大数据
十大经典
算法
之
k-means
答:
K均值算法的优点:如果变量很大,K均值比层次聚类的计算速度较快(如果K很小)
;与层次聚类相比,K均值可以得到更紧密的簇,尤其是对于球状簇;对于大数据集,是可伸缩和高效率的;算法尝试找出使平方误差函数值最小的k个划分。当结果簇是密集的,而簇与簇之间区别明显的时候,效果较好。K均值算法缺点:最后结果受初始值的影...
k-means聚类算法
的优缺点
答:
2、聚类效果较优
。3、主要需要调参的参数仅仅是簇数K。4、算法的可解释度比较强。5、算法快速、简单。6、对大数据集有较高的效率并且是可伸缩性的。缺点:1、采用迭代方法,聚类结果往往收敛于局部最优而得不到全局最优解。2、对非凸形状的类簇识别效果差。3、易受噪声和异常点的影响。4、K值的...
用于
数据
挖掘的
聚类算法有
哪些,各有何
优势?
答:
在数据挖掘的世界里,各种
聚类算法
犹如璀璨繁星,各有其独特的魅力
和优势
。要深入了解这些
算法,
首先得明白它们是如何
在数据
的海洋中绘制出清晰的轮廓:相似性衡量的智慧</聚类算法的第一步是确定数据间的相似度。直接法如Minkowski距离(L1/L2/Euclidean等)精准测量距离,而间接法如距离系数、核函数(如...
大数据
最常用的
算法有
哪些
答:
聚类算法则是将数据集中的对象按照其相似性进行分组,使得同一组内的对象尽可能相似,而不同组间的对象尽可能不同。常见的聚类算法包括
K-means
、
层次聚类
、DBSCAN等。例如,在电商网站中
,聚类算法
可以将用户按照其购物行为和兴趣偏好划分为不同的用户群体,从而为用户提供更加精准的推荐服务。回归算法则是...
聚类k-means
++、k-means参数、Mini Batch
K-Means
答:
2.对
大数据
集有较高的效率并且是可伸缩性的;3.时间复杂度近于线性,而且适合挖掘大规模数据集。
K-Means聚类算法
的时间复杂度是O(n×k×t) ,其中n代表数据集中对象的数量,t代表着算法迭代的次数
,k
代表着簇的数目 。计算复杂度在最坏的情况下为 O(n^(k+2/p)),其中n是样本量,p是特征个...
大家正在搜
K均值算法聚类结果优化
K—means算法
K均值聚类算法
K均值聚类算法实现
K-means
K均值算法
K均值算法应用
K均值算法的缺点
K均值聚类的基本思想
相关问题
在大数据量时,K-means算法和层次聚类算法谁更有优势
大数据进行kmeans聚类在hadoop2上怎么实现
k-means聚类可用于大数据挖掘吗
支持向量机,决策树,朴素贝叶斯分类,k-means聚类哪些算...
大数据进行kmeans聚类在hadoop2上怎么实现