kmeans算法用Python怎么实现

如题所述

举报该问题

推荐答案 2017-10-10

K-means算法是集简单和经典于一身的基于距离的聚类算法

采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。

该算法认为类簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。

核心思想

通过迭代寻找k个类簇的一种划分方案，使得用这k个类簇的均值来代表相应各类样本时所得的总体误差最小。

k个聚类具有以下特点：各聚类本身尽可能的紧凑，而各聚类之间尽可能的分开。

k-means算法的基础是最小误差平方和准则,

各类簇内的样本越相似，其与该类均值间的误差平方越小，对所有类所得到的误差平方求和，即可验证分为k类时，各聚类是否是最优的。

上式的代价函数无法用解析的方法最小化，只能有迭代的方法。

3、算法步骤图解

下图展示了对n个样本点进行K-means聚类的效果，这里k取2。

4、算法实现步骤

k-means算法是将样本聚类成 k个簇（cluster），其中k是用户给定的，其求解过程非常直观简单，具体算法描述如下：

1) 随机选取 k个聚类质心点

2) 重复下面过程直到收敛 {

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/GNvNNpWpqqWN8GGG3Yv.html

第1个回答 2017-10-09

参考 http://www.cnblogs.com/ahu-lichang/p/7161613.html

相似回答

...聚类算法——K-Means原理详解和实操应用(R&Python)答：在Python中，利用scikit-learn库的KMeans，我们可以轻松实现算法。例如，设置n_clusters为3，通过肘部法则确定最佳聚类数，然后构建模型并获取聚类结果、中心点、SSE等信息。可视化结果，如鸢尾花数据集的花瓣长度和宽度分布，有助于理解聚类效果。通过R语言的kmeans包，我们同样能分析usarrests数据，观察K=4...

kmeans算法用Python怎么实现答：1.随机找K个特征向量 2.将测试集分配给上面的特征向量(根据相似系数的差距),最后得出K个集合 3.求出K个集合的均值，得到K个新的特征向量 4.重复2,3直到K个集合不再变化或者达到迭代上限 5.最后就得出K个聚类集合了 Get

kmeans算法用Python怎么实现答：5、利用这k个初始的聚类中心来运行标准的k-means算法 假定数据点集合X有n个数据点，依次用X(1)、X(2)、……、X(n)表示，那么，在第2步中依次计算每个数据点与最近的种子点（聚类中心）的距离，依次得到D(1)、D(2)、……、D(n)构成的集合D。在D中，为了避免噪声，不能直接选取值最大的元...

聚类(K-means、K-均值)算法的基础、原理、Python实现和应用答：3. 工程实践：Python实战与评估在Python中，我们可以通过sklearn库轻松实现K-means。特征工程时，要注意类别数据和大数值可能影响结果。评估K-means的效果，SSE越小表明聚类效果越好，轮廓系数则衡量组内紧凑度和组间分离度。结合两者，我们可以更全面地审视聚类质量。4. 应用实例：数据探索与用户分析 ...

kmeans算法用Python怎么实现答：用的是欧几里得距离def distEclud(vecA, vecB): return sqrt(sum(power(vecA - vecB, 2)))#随机生成初始的质心（ng的课说的初始方式是随机选K个点） def randCent(dataSet, k): n = shape(dataSet)[1] centroids = mat(zeros((k,n))) for j in range(n): minJ =...

kmeans算法用Python怎么实现答：方法/步骤 1、首先下载安装python，建议安装2.7版本以上，3.0版本以下，由于3.0版本以上不向下兼容，体验较差。2、打开文本编辑器，推荐editplus，notepad等，将文件保存成 .py格式，editplus和notepad支持识别python语法。脚本第一行一定要写上 #!usr/bin/python 表示该脚本文件是可执行python脚本如果...

减法聚类如何用Python实现答：下面是一个k-means聚类算法在python2.7.5上面的具体实现，你需要先安装Numpy和Matplotlib：from numpy import import time import matplotlib.pyplot as plt calculate Euclidean distance def euclDistance(vector1, vector2):return sqrt(sum(power(vector2 - vector1, 2)))init centroids with random ...

大家正在搜

kmeanssklearn实现 pythonkmeans算法 kmeans算法 r语言实现 kmeans算法实现图片分类 kmeans算法应用 r语言kmeans算法实例 kmeans算法基本步骤 kmeans算法原理 kmeans算法例题

kmeans算法用Python怎么实现

k-means聚类算法python实现，导入的数据集有什么要...

kmeans算法用Python怎么实现

用python2.7做kmeans聚类算法怎么导入数据

用python2.7做kmeans聚类算法怎么把数据导进去

kmeans算法怎么输入数据

python代码如何应用系统聚类和K-means聚类法进行聚...

kmeans算法用Python怎么实现