聚類分析(用spss實現)
來源:酷知科普網 1.01W
聚類分析指將物理或抽象物件的集合分組為由類似的物件組成的多個類的分析過程。
操作方法
(01)聚類分析的描述
(02)【分析】-【分類】-【k-平均值聚類】,進行相關引數的設定
(03)結果顯示:spss從中挑選了幾個個例5個聚類中心選擇了5個原始案例
(04)針對存在的問題,進行相關引數的設定,增加迭代次數。。足夠的迭代後,已經收斂,但還存在一個問題是:各聚類的效果不明顯
(05)主要是原始資料中差別有點大
(06)所以要對資料進行標準化,得到標準化後的結果。
(07)利用標準化後的資料進行聚類分析
(08)結果看起來比較彆扭
(09)接著進行【分析】,【比較平均值】3395個樣本中有443個1,2,3,4,5類各具有特點
(10)結果
(11)對變數做聚類分析
(12)結果:第二張圖中的橫軸“25”對應“凝聚計劃”表係數(距離)中的最大值233.297依次換算即可這個聚類結果不太合理----------------------換方法
(13)換方法結果合理!
(14)個案聚類,這個過程會自動處理缺失值,使得整體資料更加服從適用條件,也就是【兩步聚類】
(15)結果被 聚為兩類
(16)需要注意的事項:資料預處理:許多變數有強的共線性可以提取公因子,個別變數有共線性可以刪除其中一個次要的變數,或者把它倆相加或平均組合成一個次要的。兩步聚類可以自動處理異常值,把異常值單獨歸為一類。
(17)其他方面