K-均值聚类K值如何自动选取

最近在研究K均值算法,将其用于一个数据集的分类。但是,K均值缺点限制了有效利用。我对我要处理的数据集并不知道能够分几类,也就是K值未知,我不想手动输入K值进行分类。我打算用其他算法改进,不知道如何入手。大家可以探讨一下啊!

聚类数的确定没有个确切方法。K值可以先用系统聚类法,看谱系图然后得出大致分几类。然后试多几个k值,确定个最好的。我是这么做的,有些牛人的方法我就看不懂了。不过你可以研究一下。我可以发些资料给你。《聚类分析中类数估计方法的实验比较》《Ward系统聚类法在多变量分层抽样技术中的运用》
温馨提示:答案为网友推荐,仅供参考
第1个回答  2013-12-29
貌似有人提出了计算轮廓系数的方法,进行反复迭代,找到合适的k值
相似回答