关于K均值聚类分析,可以进行多维分析吗?怎么判断其有效性。还有K值的选择可以随意定吗

如题所述

回答:
1、k均值聚类的数据的维数是没有限制的,可以是一维的标量,也可以是多维的向量,只要数据是数值形式的就可以了。
2、你说的有效性有些模糊,是聚类结果的好坏么?如果是的话,可以通过判断迭代收敛后的目标函数值,函数值越小说明效果越好。这是因为k均值容易陷入局部极值得到次优解,对于不同的初始化中心结果可能会不同。因此,可以可以多行几次不同出始化中心的k均值,选择具有最优目标函数值的(最小的那个)作为相对较好的一个结果。至于,能否达到最好的目标函数值,至今没有特别好的方法,一些方法可以部分的避免陷入局部最优解,比如比较著名与简单的是global k-means,还有利用函数逼近的一些方法就比较麻烦了。
3、k值是你自己指定的,没有限制,当让了不能少于2也不能大于数据个数。
以上回答,全为手打,请给分!!!
温馨提示:答案为网友推荐,仅供参考
相似回答