kmeans算法用Python怎么实现

如题所述

推荐答案 2017-07-19

第一种: 引用scikit-learn包

from sklearn.cluster import KMeans

k = 10 # Kmeans的k值
model = Kmeans(n_clusters=k)
X = [[1, 2], [1, 3], [2, 1], ....] # 改成你的数据
model.fit(X)
# 然后就训练好了, 可以查看model的属性
model.cluster_centers
model.labels_

第二种: 自己写代码实现

import numpy as np
import random
data = [[1, 1, 1], [1, 1, 3], [1, 2, 1], [5, 1, 1], [5, 1, 2], [5, 2, 1], [5, 5, 5], [5, 5, 4], [5, 4, 4]]
data = np.array(data)

k = 4  # kmeans的k
n_iteration = 500  # 最大迭代次数

# 求初始化的k个质心(这k个质心必须包含在k个点的凸空间内)
center = np.matrix(np.zeros((k, len(data[0]))))
center_after = np.matrix(np.zeros((k, len(data[0]))))
for i in range(len(data[0])):
    center[:, i] = min(data[:, i]) + (max(data[:, i]) - min(data[:, i])) * np.random.rand(k, 1)

def calc_distance(x, y, distance='eucidean'):
    x, y = np.array(x), np.array(y)
    if distance == 'eucidean':
        return np.sqrt(np.sum((y - x)**2))

n = 0
while 1:
    n += 1
    print('第%s次迭代' % n)
    # 计算所有点到每个质心的距离, 将每个点分到距离最近的那个点那一类
    # 9个点里哪个质心最近, 就分到第几个类
    label = np.argmin(np.array([calc_distance(x, y) for x in data for y in center]).reshape(len(data), k), axis=1)
    print(label)
    # 重新计算质心
    for i in range(k):
        center_after[i] = np.mean(np.array([data[j] for j in range(len(data)) if label[j] == i]), axis=0)
    if np.sum(np.abs(center_after - center)) < 0.01:
        # print(np.sum(np.abs(center_after - center)))
        print('相邻两次迭代改变甚小, 迭代结束')
        break
    if n > n_iteration:
        print('迭代次数已达上限, 迭代结束')
        break
    center = center_after

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/GpvGpIN3YY8pGIGqY3N.html

相似回答

...聚类算法——K-Means原理详解和实操应用(R&Python)答：在Python中，利用scikit-learn库的KMeans，我们可以轻松实现算法。例如，设置n_clusters为3，通过肘部法则确定最佳聚类数，然后构建模型并获取聚类结果、中心点、SSE等信息。可视化结果，如鸢尾花数据集的花瓣长度和宽度分布，有助于理解聚类效果。通过R语言的kmeans包，我们同样能分析usarrests数据，观察K=4...

kmeans算法用Python怎么实现答：第一种: 引用scikit-learn包 from sklearn.cluster import KMeansk = 10 # Kmeans的k值model = Kmeans(n_clusters=k)X = [[1, 2], [1, 3], [2, 1], ...] # 改成你的数据model.fit(X)# 然后就训练好了, 可以查看model的属性model.cluster_centersmodel.labels_第二种: 自己...

kmeans算法用Python怎么实现答：1) 随机选取 k个聚类质心点 2) 重复下面过程直到收敛 {

kmeans算法用Python怎么实现答：用的是欧几里得距离def distEclud(vecA, vecB): return sqrt(sum(power(vecA - vecB, 2)))#随机生成初始的质心（ng的课说的初始方式是随机选K个点） def randCent(dataSet, k): n = shape(dataSet)[1] centroids = mat(zeros((k,n))) for j in range(n): minJ =...

kmeans算法用Python怎么实现答：方法/步骤 1、首先下载安装python，建议安装2.7版本以上，3.0版本以下，由于3.0版本以上不向下兼容，体验较差。2、打开文本编辑器，推荐editplus，notepad等，将文件保存成 .py格式，editplus和notepad支持识别python语法。脚本第一行一定要写上 #!usr/bin/python 表示该脚本文件是可执行python脚本如果...

kmeans算法用Python怎么实现答：3、python版本的kmeans++ 在http://rosettacode.org/wiki/K-means%2B%2B_clustering 中能找到多种编程语言版本的Kmeans++实现。下面的内容是基于python的实现（中文注释是笔者添加的）：复制代码代码如下:from math import pi, sin, cos from collections import namedtuple from random import random, ...

kmeans算法用Python怎么实现答：1.随机找K个特征向量 2.将测试集分配给上面的特征向量(根据相似系数的差距),最后得出K个集合 3.求出K个集合的均值，得到K个新的特征向量 4.重复2,3直到K个集合不再变化或者达到迭代上限 5.最后就得出K个聚类集合了 Get

大家正在搜

kmeanssklearn实现 pythonkmeans算法 kmeans算法 r语言实现 kmeans算法实现图片分类 kmeans算法应用 r语言kmeans算法实例 kmeans算法基本步骤 kmeans算法原理 kmeans算法例题