怎样对数据进行聚类分析?

如题所述

聚类分析用于将样本进行分类处理,通常是以定量数据作为分类标准;用户可自行设置聚类数量,如果不进行设置,系统会提供默认建议;通常情况下,建议用户设置聚类数量介于3~6个之间。

SPSSAU操作如下:

聚类个数:聚类个数设置为几类主要以研究者的研究思路为标准,如果不进行设置,SPSSAU默认聚类个数为3,通常情况下,建议设置聚类数量介于3~6个之间。

标准化:聚类算法是根据距离进行判断类别,因此一般需要在聚类之前进行标准化处理,SPSSAU默认是选中进行标准化处理。数据标准化之后,数据的相对大小意义还在(比如数字越大GDP越高),但是实际意义消失了。

保存类别:分析选择保存‘保存类别’,SPSSAU会生成新标题用于标识,也可以右上角“我的数据”处查看到分析后的“聚类类别”。

新标题类似如下:Cluster_********。

使用聚类分析对样本进行分类,使用Kmeans聚类分析方法,从上表可以看出:最终聚类得到4类群体,此4类群体的占比分别是20.00%, 30.00%, 20.00%, 30.00%。整体来看, 4类人群分布较为均匀,整体说明聚类效果较好。

使用方差分析去探索各个类别的差异特征,从上表可知:聚类类别群体对于所有研究项均呈现出显著性(p<0.05),意味着聚类分析得到的4类群体,他们在研究项上的特征具有明显的差异性,具体差异性可通过平均值进行对比,并且最终结合实际情况,对聚类类别进行命名处理。

从上述结果看,所有研究项均呈现出显著性,说明不同类别之间的特征有明显的区别,聚类的效果较好。

温馨提示:答案为网友推荐,仅供参考
第1个回答  2022-09-30

步骤如下:

操作设备:戴尔电脑

操作系统:win10

1、首先通过快捷方式打开SPSS分析工具,默认显示数据视图。

2、切换到变量视图,然后添加六个变量,分别为姓名、M、C、E、S和R,其中姓名是字符串类型,其他都是数字类型。

3、返回到数据视图,向六个变量列插入对应的数据。

4、点击分析菜单,然后依次选择分类--->系统聚类。

5、打开系统聚类分析窗口,将变量M和变量C移到变量框中。

6、点击右侧统计按钮,打开系统聚类分析:统计窗口,选择集中计划,接着点击继续。

7、单击图按钮,打开图设置窗口,勾选谱系图,然后点击继续。

8、接着点击方法按钮,打开系统聚类分析:方法窗口,聚类方法选择瓦尔德法,然后单击继续。

9、最后点击系统聚类分析窗口中的确定按钮,然后生成系统聚类分析结果和图形展示。

相似回答