kmeans是有监督还是无监督

如题所述

kmeans是无监督。

K-Means是一种无监督学习方法,用于将无标签的数据集进行聚类。其中K指集群的数量,Means表示寻找集群中心点的手段。人们研究处理无标签数据集的方法。面对无标签的数据集,我们期望从数据中找出一定的规律。一种最简单也最快速的聚类算法应运而生K-Means。

核心思想很简单:物以类聚。随便选择K个中心点。把距离它足够近的数据聚成K个集群。各组织内部重新选择中心点,选择标准是按照距离取均值作为中心点。重复2、3步骤直到组织成员相对稳定。

K的选择

惯性指标。K-Means的惯性计算方式是,每个样本与最接近的集群中心点的均方距离的总和。以上代码中即K-Means方法中的惯性指标。一般地,惯性越小模型越好,但伴随K值的增大,惯性下降的速度变的很慢,因此我们选择“肘部”的K值,作为最优的K值选择。

轮廓系数指标。K-Means的轮廓系数计算方式是,与集群内其他样本的平均距离记为a,与外部集群样本的平均距离记为b,轮廓系数(b-a)/max(a,b)。

以上代码中方法可取得K-Means的轮廓系数值。一般地,轮廓系数指标越大越好,我们可以看到当K为2、3时均可取得不错的聚类效果。

温馨提示:答案为网友推荐,仅供参考
相似回答