Phân tích cụm
Phân tích cụm là phương pháp phân loại các biến theo đặc tính của chúng để nhóm thành một nhóm
biểu rõ chung nội dung nó phản ánh.
Trong phân tích cụm có 2 phương pháp là phân cụm thứ bậc và phân cụm không thứ bậc. Ta có thể
chọn một trong hai cách để thực hiện.
Trong phân tích cụm, chúng ta không có một khái niệm chắc chắn nào về cách phân tích cụm, thế nên
muốn có thể chắc chắn hơn về kết quả với số cụm đạt được, ta cũng có thể tiến hành cả 2 cách phân
cụm. Thường thì ta sẽ chạy phân cụm thứ bậc trước, phân tích xem nó được bao nhiêu cụm, kiểm
định sự phù hợp của nó. Sau đó ta lấy số cụm đó thực hiện phân tích cụm không thứ bậc. Các cụm
nào không phù hợp thì sẽ bị loại dần trong phân cụm này. Ta sẽ dựa vào độ phù hợp của chúng để
biết khi nào dừng lại hoặc khi số cụm chỉ còn lại là 2 thì ta cũng sẽ dừng lại. Kiểm định sự phù hợp
của chúng, sau đó so sánh kết quả với phân tích cụm thứ bậc để đưa ra kết quả cuối cùng.
Sau đây, chúng ta sẽ tiến hành phân cụm thứ bậc.
Chọn Analyze → Classify → Hierarchical Cluster…
Trong bảng Agglomeration Schedule, cột cần để ý là Coefficients - khoảng cách giữa các biến.
Khoảng cách này sẽ tăng dần, ta sẽ xem xét xem rằng có sự tăng đột biến về khoảng cách giữa các
biến hay không. Từ đó ta có thể xác định được số cụm cần phân tích.
Do bảng số liệu có tới 200 biến, chúng ta rất khó có thể thấy được tại biến nào có khoảng cách tăng
đột biến, do quá nhiều con số và rất dài. Nên có một cách đơn giản hơn là ta có thể vẽ biểu đồ Line
cho cột Coefficients.
Agglomeration Schedule
Stage
Cluster Combined
Cluster 1
Coefficients
Cluster 2
Stage Cluster First Appears
Cluster 1
Next Stage
Cluster 2
1
194
195
.000
0
0
2
2
193
194
.000
0
1
110
3
119
124
.025
0
0
63
4
97
107
.080
0
0
36
5
98
99
.147
0
0
13
6
144
185
.224
0
0
14
7
53
80
.305
0
0
50
8
155
159
.389
0
0
41
9
109
112
.487
0
0
16
10
182
198
.585
0
0
111
11
3
48
.690
0
0
19
12
57
96
.807
0
0
27
13
98
132
.928
5
0
52
14
144
184
1.055
6
0
30
15
178
191
1.186
0
0
73
16
109
115
1.323
9
0
52
17
100
111
1.470
0
0
34
18
168
187
1.618
0
0
38
19
3
26
1.768
11
0
77
20
101
136
1.933
0
0
56
21
13
40
2.100
0
0
79
22
114
125
2.270
0
0
39
23
64
90
2.443
0
0
65
24
172
177
2.623
0
0
73
25
18
50
2.803
0
0
51
26
153
189
2.986
0
0
45
27
57
79
3.173
12
0
46
28
19
47
3.368
0
0
137
29
137
163
3.569
0
0
57
30
144
190
3.774
14
0
114
31
6
27
3.980
0
0
59
32
93
95
4.188
0
0
50
33
83
94
4.400
0
0
49
34
100
108
4.621
17
0
133
35
34
44
4.843
0
0
54
36
97
105
5.070
4
0
43
37
151
176
5.302
0
0
72
38
160
168
5.538
0
18
44
39
110
114
5.778
0
22
89
40
1
2
6.018
0
0
99
41
155
186
6.260
8
0
42
42
155
181
6.506
41
0
140
43
97
106
6.758
36
0
153
44
160
169
7.010
38
0
83
45
153
197
7.263
26
0
66
46
57
91
7.523
27
0
70
47
77
81
7.787
0
0
91
48
156
166
8.062
0
0
74
49
75
83
8.358
0
33
88
50
53
93
8.656
7
32
85
51
18
24
8.958
25
0
62
52
98
109
9.262
13
16
102
53
11
12
9.572
0
0
82
54
20
34
9.885
0
35
116
55
51
67
10.197
0
0
67
56
101
121
10.510
20
0
90
57
137
161
10.828
29
0
111
58
60
70
11.153
0
0
132
59
6
38
11.480
31
0
77
60
56
86
11.807
0
0
103
61
52
55
12.142
0
0
131
62
15
18
12.478
0
51
86
63
119
128
12.823
3
0
165
64
174
183
13.171
0
0
114
65
64
87
13.522
23
0
98
66
153
192
13.883
45
0
125
67
51
62
14.249
55
0
121
68
71
88
14.621
0
0
119
69
21
28
15.000
0
0
122
70
57
59
15.379
46
0
132
71
8
16
15.776
0
0
99
72
151
188
16.174
37
0
112
73
172
178
16.573
24
15
125
74
156
179
16.974
48
0
110
75
102
103
17.377
0
0
104
76
4
42
17.796
0
0
122
77
3
6
18.219
19
59
101
78
142
196
18.651
0
0
165
79
13
37
19.085
21
0
97
80
33
36
19.520
0
0
93
81
129
135
19.960
0
0
134
82
11
23
20.404
53
0
126
83
152
160
20.849
0
44
95
84
154
180
21.303
0
0
129
85
53
54
21.766
50
0
98
86
7
15
22.232
0
62
124
87
69
76
22.701
0
0
115
88
73
75
23.172
0
49
100
89
110
123
23.647
39
0
105
90
101
134
24.122
56
0
133
91
63
77
24.599
0
47
146
92
5
14
25.080
0
0
108
93
33
39
25.561
80
0
116
94
65
72
26.048
0
0
159
95
149
152
26.540
0
83
129
96
171
175
27.039
0
0
136
97
13
43
27.549
79
0
150
98
53
64
28.073
85
65
121
99
1
8
28.598
40
71
173
100
73
84
29.136
88
0
142
101
3
29
29.678
77
0
124
102
98
120
30.227
52
0
138
103
56
92
30.796
60
0
152
104
102
130
31.368
75
0
153
105
110
126
31.941
89
0
138
106
32
49
32.520
0
0
169
107
31
122
33.099
0
0
150
108
5
45
33.684
92
0
173
109
138
157
34.269
0
0
127
110
156
193
34.872
74
2
135
111
137
182
35.480
57
10
172
112
151
170
36.098
72
0
144
113
17
41
36.719
0
0
120
114
144
174
37.348
30
64
135
115
68
69
37.985
0
87
148
116
20
33
38.633
54
93
143
117
104
131
39.298
0
0
176
118
35
46
39.965
0
0
166
119
66
71
40.633
0
68
159
120
10
17
41.326
0
113
137
121
51
53
42.019
67
98
146
122
4
21
42.747
76
69
158
123
147
158
43.486
0
0
154
124
3
7
44.233
101
86
166
125
153
172
44.993
66
73
151
126
11
25
45.754
82
0
164
127
138
145
46.518
109
0
141
128
61
89
47.284
0
0
162
129
149
154
48.063
95
84
155
130
140
164
48.855
0
0
144
131
52
82
49.654
61
0
142
132
57
60
50.468
70
58
152
133
100
101
51.307
34
90
185
134
113
129
52.190
0
81
163
135
144
156
53.081
114
110
168
136
85
171
53.978
0
96
147
137
10
19
54.898
120
28
177
138
98
110
55.830
102
105
163
139
58
78
56.764
0
0
148
140
155
165
57.765
42
0
178
141
138
150
58.783
127
0
180
142
52
73
59.806
131
100
167
143
9
20
60.842
0
116
157
144
140
151
61.880
130
112
172
145
118
127
62.930
0
0
160
146
51
63
63.991
121
91
174
147
85
139
65.081
136
0
171
148
58
68
66.189
139
115
162
149
116
117
67.334
0
0
187
150
13
31
68.484
97
107
164
151
146
153
69.697
0
125
168
152
56
57
70.928
103
132
174
153
97
102
72.160
43
104
185
154
74
147
73.416
0
123
161
155
149
173
74.774
129
0
171
156
162
167
76.196
0
0
178
157
9
22
77.618
143
0
186
158
4
30
79.059
122
0
176
159
65
66
80.504
94
119
183
160
118
133
81.961
145
0
181
161
74
141
83.450
154
0
191
162
58
61
84.963
148
128
179
163
98
113
86.478
138
134
181
164
11
13
88.039
126
150
169
165
119
142
89.609
63
78
180
166
3
35
91.222
124
118
175
167
52
143
92.844
142
0
179
168
144
146
94.473
135
151
170
169
11
32
96.151
164
106
188
170
144
148
97.845
168
0
182
171
85
149
99.552
147
155
184
172
137
140
101.332
111
144
189
173
1
5
103.131
99
108
175
174
51
56
104.932
146
152
183
175
1
3
107.221
173
166
177
176
4
104
109.537
158
117
188
177
1
10
111.937
175
137
190
178
155
162
114.356
140
156
182
179
52
58
116.797
167
162
191
180
119
138
119.429
165
141
184
181
98
118
122.103
163
160
187
182
144
155
124.951
170
178
195
183
51
65
128.314
174
159
186
184
85
119
131.764
171
180
189
185
97
100
135.281
153
133
192
186
9
51
138.930
157
183
190
187
98
116
143.133
181
149
192
188
4
11
147.398
176
169
194
189
85
137
152.048
184
172
193
190
1
9
159.088
177
186
194
191
52
74
166.165
179
161
193
192
97
98
174.499
185
187
197
193
52
85
185.680
191
189
195
194
1
4
199.669
190
188
196
195
52
144
215.192
193
182
196
196
1
52
262.252
194
195
197
197
1
97
340.614
196
192
0
Từ biểu đồ Line này, rất dễ để thấy rằng, có sự tăng đột biến về khoảng cách từ biến 191. Đễ rõ rang hơn, ta sẽ
đối chiếu giá trị của các biến trên cột coefficirnts của bảng Agglomeration. Chúng ta chỉ để tâm đến các biến từ
191 trở đi. Tới đây ta có thể thấy rằng giữa biến thứ 192 và biến 193, giữa biến 195 và 196 đều có sự tăng đột
biến về khoảng cách. Chúng không thể gộp chung thành một cụm với nhau được. Vậy ta tìm thêm được 2 cụm
mới. Tổng cộng là sẽ có 4 cụm phân tích.
Muốn biết biến nào thuộc cụm nào, ta sẽ tiến hành chạy phân tích cụm thứ bậc một lần nữa. Trong statistics,
Cluster membership ta sẽ không chọn None nữa mà sẽ chọn min là 2 max là 4. Click save, tương tự ta cũng chọn
min max cho số cụm.
Kết quả thu được cũng giống kết quả chạy lần đầu, nhưng sẽ xuất hiện thêm bảng Cluster membership. Nếu để
ý, chúng ta sẽ thấy trong Data View và Variable View được thêm 3 biến mới là CLU4_1, CLU3_1, CLU2_1.
Do chúng ta đang chọn số cụm là 4 nên sẽ tập trung vào cột CLU4_1, nhìn vào cột này ta sẽ biết biến nào thuộc
cụm số mấy.
Cluster Membership
Case
4 Clusters
3 Clusters
2 Clusters
1:Case 3
1
1
1
2:Case 4
1
1
1
3:Case 5
1
1
1
4:Case 6
1
1
1
5:Case 7
1
1
1
6:Case 8
1
1
1
7:Case 9
1
1
1
8:Case 10
1
1
1
9:Case 11
1
1
1
10:Case 12
1
1
1
11:Case 13
1
1
1
12:Case 14
1
1
1
13:Case 15
1
1
1
14:Case 16
1
1
1
15:Case 17
1
1
1
16:Case 18
1
1
1
17:Case 19
1
1
1
18:Case 20
1
1
1
19:Case 21
1
1
1
20:Case 22
1
1
1
21:Case 23
1
1
1
22:Case 24
1
1
1
23:Case 25
1
1
1
24:Case 26
1
1
1
25:Case 27
1
1
1
26:Case 28
1
1
1
27:Case 29
1
1
1
28:Case 30
1
1
1
29:Case 31
1
1
1
30:Case 32
1
1
1
31:Case 33
1
1
1
32:Case 34
1
1
1
33:Case 35
1
1
1
34:Case 36
1
1
1
35:Case 37
1
1
1
36:Case 38
1
1
1
37:Case 39
1
1
1
38:Case 40
1
1
1
39:Case 41
1
1
1
40:Case 42
1
1
1
41:Case 43
1
1
1
42:Case 44
1
1
1
43:Case 45
1
1
1
44:Case 46
1
1
1
45:Case 47
1
1
1
46:Case 48
1
1
1
47:Case 49
1
1
1
48:Case 50
1
1
1
49:Case 51
1
1
1
50:Case 52
1
1
1
51:Case 53
1
1
1
52:Case 54
2
2
1
53:Case 55
1
1
1
54:Case 56
1
1
1
55:Case 57
2
2
1
56:Case 58
1
1
1
57:Case 59
1
1
1
58:Case 60
2
2
1
59:Case 61
1
1
1
60:Case 62
1
1
1
61:Case 63
2
2
1
62:Case 64
1
1
1
63:Case 65
1
1
1
64:Case 66
1
1
1
65:Case 67
1
1
1
66:Case 68
1
1
1
67:Case 69
1
1
1
68:Case 70
2
2
1
69:Case 71
2
2
1
70:Case 72
1
1
1
71:Case 73
1
1
1
72:Case 74
1
1
1
73:Case 75
2
2
1
74:Case 76
2
2
1
75:Case 77
2
2
1
76:Case 78
2
2
1
77:Case 79
1
1
1
78:Case 80
2
2
1
79:Case 81
1
1
1
80:Case 82
1
1
1
81:Case 83
1
1
1
82:Case 84
2
2
1
83:Case 85
2
2
1
84:Case 86
2
2
1
85:Case 87
2
2
1
86:Case 88
1
1
1
87:Case 89
1
1
1
88:Case 90
1
1
1
89:Case 91
2
2
1
90:Case 92
1
1
1
91:Case 93
1
1
1
92:Case 94
1
1
1
93:Case 95
1
1
1
94:Case 96
2
2
1
95:Case 97
1
1
1
96:Case 98
1
1
1
97:Case 99
3
3
2
98:Case 100
3
3
2
99:Case 101
3
3
2
100:Case 102
3
3
2
101:Case 103
3
3
2
102:Case 104
3
3
2
103:Case 105
3
3
2
104:Case 106
1
1
1
105:Case 107
3
3
2
106:Case 108
3
3
2
107:Case 109
3
3
2
108:Case 110
3
3
2
109:Case 111
3
3
2
110:Case 112
3
3
2
111:Case 113
3
3
2
112:Case 114
3
3
2
113:Case 115
3
3
2
114:Case 116
3
3
2
115:Case 117
3
3
2
116:Case 118
3
3
2
117:Case 119
3
3
2
118:Case 120
3
3
2
119:Case 121
2
2
1
120:Case 122
3
3
2
121:Case 123
3
3
2
122:Case 124
1
1
1
123:Case 125
3
3
2
124:Case 126
2
2
1
125:Case 127
3
3
2
126:Case 128
3
3
2
127:Case 129
3
3
2
128:Case 130
2
2
1
129:Case 131
3
3
2
130:Case 132
3
3
2
131:Case 133
1
1
1
132:Case 134
3
3
2
133:Case 135
3
3
2
134:Case 136
3
3
2
135:Case 137
3
3
2
136:Case 138
3
3
2
137:Case 139
2
2
1
138:Case 140
2
2
1
139:Case 141
2
2
1
140:Case 142
2
2
1
141:Case 143
2
2
1
142:Case 144
2
2
1
143:Case 145
2
2
1
144:Case 146
4
2
1
145:Case 147
2
2
1
146:Case 148
4
2
1
147:Case 149
2
2
1
148:Case 150
4
2
1
149:Case 151
2
2
1
150:Case 152
2
2
1
151:Case 153
2
2
1
152:Case 154
2
2
1
153:Case 155
4
2
1
154:Case 156
2
2
1
155:Case 157
4
2
1
156:Case 158
4
2
1
157:Case 159
2
2
1
158:Case 160
2
2
1
159:Case 161
4
2
1
160:Case 162
2
2
1
161:Case 163
2
2
1
162:Case 164
4
2
1
163:Case 165
2
2
1
164:Case 166
2
2
1
165:Case 167
4
2
1
166:Case 168
4
2
1
167:Case 169
4
2
1
168:Case 170
2
2
1
169:Case 171
2
2
1
170:Case 172
2
2
1
171:Case 173
2
2
1
172:Case 174
4
2
1
173:Case 175
2
2
1
174:Case 176
4
2
1
175:Case 177
2
2
1
176:Case 178
2
2
1
177:Case 179
4
2
1
178:Case 180
4
2
1
179:Case 181
4
2
1
180:Case 182
2
2
1
181:Case 183
4
2
1
182:Case 184
2
2
1
183:Case 185
4
2
1
184:Case 186
4
2
1
185:Case 187
4
2
1
186:Case 188
4
2
1
187:Case 189
2
2
1
188:Case 190
2
2
1
189:Case 191
4
2
1
190:Case 192
4
2
1
191:Case 193
4
2
1
192:Case 194
4
2
1
193:Case 195
4
2
1
194:Case 196
4
2
1
195:Case 197
4
2
1
196:Case 198
2
2
1
197:Case 199
4
2
1
198:Case 200
2
2
1
Ở trên chúng ta chạy mô hình theo số quan sát để biết quan sát nào thuộc cụm nào, bây giờ sẽ tiến hành đưa vào
25 biến chính thức của phân tích.
Chọn Data → Split File… → chọn Compare Groups, đưa CLU4_1 vào → Oke. Chúng ta sẽ so sánh theo từng
cụm của 25 biến này.
Tiếp tục chọn Analyze → Discriptive Statistics… → Discriptive, đưa 25 biến vào → oke. Sau đó tắt Split.
Do bảng kết quả dài, khó nhìn và khó so sánh giá trị trung bình của các biến giữa các cụm, nên có thể đưa về
excel, sắp xếp cho dễ nhìn. Ta được bảng:
Cụm 1
Cụm 2
Cụm 3
Cụm 4
Mong ??i nh??ng ch?
8.85
7.53
5.24
8.62
Mong ??i x?p hàng tr?t t? lên xe
8.52
7.23
5.06
8.48
Mong ??i xe s?ch s?, không rác
8.96
7.30
4.76
9.14
Mong ??i an toàn tài s?n
9.32
8.19
4.47
9.34
Mong ??i thái ?? nhân viên tích
c?c
Mong ??i xe yên l?ng, tr?t t?
9.13
8.08
4.59
9.17
9.11
7.64
4.47
8.86
Mong ??i xe không mùi l?
9.46
7.70
4.74
9.24
Mong ??i an toàn thân th?
9.71
8.19
4.94
9.21
C?m nh?n v? nh??ng ch?
6.24
7.26
4.41
8.10
C?m nh?n x?p hàng tr?t t? lên xe
4.73
7.34
4.41
7.31
C?m nh?n xe s?ch s?, không rác
4.80
7.26
4.41
7.93
C?m nh?n an toàn tài s?n
4.83
7.83
4.47
7.69
C?m nh?n thái ?? nhân viên tích
c?c
C?m nh?n xe yên l?ng, tr?t t?
4.83
7.57
4.59
7.52
4.78
7.68
4.35
7.69
C?m nh?n xe không mùi l?
4.72
7.58
4.24
7.55
C?m nh?n an toàn thân th?
4.80
8.00
4.44
7.97
Hình ?nh v? thái ?? ph?c v?
5.24
5.57
3.74
7.45
Hình ?nh v? vi?c nh??ng ch?
5.88
6.17
3.97
8.10
Hình ?nh v? gi? v? sinh chung
5.34
6.04
3.59
8.31
Hình ?nh v? gi? tr?t t? trên bus
5.32
5.96
3.53
8.48
Hình ?nh v? x?p hàng lên xu?ng
xe
Hình ?nh v? an toàn tài s?n
4.62
6.21
3.41
8.34
4.59
5.72
3.26
7.93
Hình ?nh v? an toàn thân th?
4.96
5.94
3.79
8.52
Hình ?nh v? ho?t ??ng lên/ xu?ng
xe
Hình ?nh v? gi?u gìn tài s?n
chung
4.85
5.85
3.85
8.41
5.02
5.40
4.15
8.07
Sau khi chọn được 4 cụm rồi, chúng ta sẽ hỏi, liệu kết quả này có phù hợp hay không? Để giải đáp điều này, ta
sẽ tiến hành chạy ANOVA kiểm định sự phù hợp của các biến với mức ý nghĩa 5%.
ANOVA
Sum of Squares
Mong ??i nh??ng ch?
Mong ??i x?p hàng tr?t t? lên
xe
Mong ??i xe s?ch s?, không
rác
Mong ??i an toàn tài s?n
tích c?c
Mong ??i xe yên l?ng, tr?t t?
Mong ??i xe không mùi l?
Mong ??i an toàn thân th?
Mean Square
Between Groups
337.750
3
112.583
Within Groups
608.397
194
3.136
Total
946.146
197
Between Groups
319.506
3
106.502
Within Groups
664.858
194
3.427
Total
984.364
197
Between Groups
489.187
3
163.062
Within Groups
467.626
194
2.410
Total
956.813
197
Between Groups
613.194
3
204.398
Within Groups
402.892
194
2.077
1016.086
197
Between Groups
540.268
3
180.089
Within Groups
459.596
194
2.369
Total
999.864
197
Between Groups
550.209
3
183.403
Within Groups
360.120
194
1.856
Total
910.328
197
Between Groups
583.264
3
194.421
Within Groups
329.488
194
1.698
Total
912.753
197
Between Groups
568.134
3
189.378
Within Groups
383.730
194
1.978
Total
951.864
197
Total
Mong ??i thái ?? nhân viên
df
F
Sig.
35.900
.000
31.076
.000
67.648
.000
98.422
.000
76.018
.000
98.801
.000
114.474
.000
95.743
.000
C?m nh?n v? nh??ng ch?
C?m nh?n x?p hàng tr?t t?
lên xe
C?m nh?n xe s?ch s?, không
rác
C?m nh?n an toàn tài s?n
Between Groups
259.025
3
86.342
Within Groups
728.349
194
3.754
Total
987.374
197
Between Groups
350.447
3
116.816
Within Groups
772.427
194
3.982
1122.874
197
Between Groups
391.475
3
130.492
Within Groups
625.277
194
3.223
1016.753
197
Between Groups
452.221
3
150.740
Within Groups
719.759
194
3.710
1171.980
197
Between Groups
375.435
3
125.145
Within Groups
712.105
194
3.671
1087.540
197
444.796
3
148.265
691.568
194
3.565
1136.364
197
Between Groups
436.748
3
145.583
Within Groups
716.707
194
3.694
1153.455
197
Between Groups
523.047
3
174.349
Within Groups
638.226
194
3.290
1161.273
197
Between Groups
219.342
3
73.114
Within Groups
685.931
194
3.536
Total
905.273
197
Between Groups
270.678
3
90.226
693.912
194
3.577
Total
964.591
197
Between Groups
365.523
3
121.841
Within Groups
634.806
194
3.272
1000.328
197
Between Groups
399.860
3
133.287
Within Groups
603.393
194
3.110
1003.253
197
Between Groups
470.044
3
156.681
Within Groups
590.784
194
3.045
1060.828
197
Between Groups
388.318
3
129.439
Within Groups
827.137
194
4.264
1215.455
197
396.570
3
132.190
708.521
194
3.652
1105.091
197
Total
Total
Total
C?m nh?n thái ?? nhân viên
tích c?c
Total
Between Groups
C?m nh?n xe yên l?ng, tr?t t? Within Groups
Total
C?m nh?n xe không mùi l?
Total
C?m nh?n an toàn thân th?
Total
Hình ?nh v? thái ?? ph?c v?
Hình ?nh v? vi?c nh??ng ch? Within Groups
Hình ?nh v? gi? v? sinh
chung
Hình ?nh v? gi? tr?t t? trên
bus
Hình ?nh v? x?p hàng lên
xu?ng xe
Hình ?nh v? an toàn tài s?n
Total
Total
Total
Total
Between Groups
Hình ?nh v? an toàn thân th? Within Groups
Total
22.998
.000
29.339
.000
40.487
.000
40.630
.000
34.093
.000
41.592
.000
39.407
.000
52.996
.000
20.679
.000
25.225
.000
37.235
.000
42.854
.000
51.451
.000
30.359
.000
36.195
.000
Hình ?nh v? ho?t ??ng lên/
xu?ng xe
Between Groups
378.983
3
126.328
Within Groups
662.336
194
3.414
1041.318
197
Between Groups
271.450
3
90.483
Within Groups
808.757
194
4.169
1080.207
197
Total
Hình ?nh v? gi?u gìn tài s?n
chung
Total
37.002
.000
21.705
.000
Từ bảng ANOVA, ta thấy rằng các giá trị F rất lớn, hơn nữa sig. của các biến đều bằng 0.00, nên ta có thể kết
luận rằng kết quả chia 4 cụm hoàn toàn phù hợp, với mức ý nghĩa 5%.
Bước tiếp theo chúng ta cần làm đó là phân tích cụm không thứ bậc. Như đã nói từ đầu, chúng ta có thể dựa vào
số cụm của phân tích thứ bậc để lấy số cụm cho phân tích không thứ bậc, vậy thì ta mới dễ dàng so sánh được.
Tiến hành chạy phân tích cụm không thứ bậc, ta được các bảng kết quả. Ở đây, chúng ta quan tâm đến 2 bảng là
bảng Cluster membership và bảng ANOVA.
Cluster Membership
Case Number
Cluster
Distance
1
.
.
2
.
.
3
3
7.724
4
3
7.903
5
3
5.489
6
3
10.058
7
3
8.257
8
3
5.750
9
3
6.551
10
3
8.570
11
3
11.858
12
3
7.681
13
3
8.655
14
3
7.471
15
3
11.632
16
3
9.589
17
3
8.067
18
3
7.593
19
3
9.587
20
3
5.254
21
3
8.859
22
3
6.526
23
3
8.541
24
3
11.800
25
3
8.280
26
3
8.231
27
3
10.021
28
3
4.965
29
3
6.462
30
3
7.222
31
3
7.349
32
3
13.028
33
3
12.272
34
3
10.225
35
3
7.040
36
3
5.765
37
3
11.248
38
3
8.024
39
3
9.161
40
3
5.290
41
3
8.039
42
3
10.409
43
3
8.998
44
3
9.425
45
3
11.790
46
3
4.486
47
3
9.990
48
3
9.851
49
3
6.377
50
3
3.221
51
2
9.684
52
3
6.544
53
3
7.937
54
1
6.278
55
3
7.326
56
3
10.124
57
3
7.169
58
3
9.088
59
1
10.473
60
1
7.998
61
3
9.632
62
3
5.808
63
3
10.229
64
3
10.816
65
1
7.488
66
3
8.485
67
1
8.772
68
3
12.081
69
1
8.084
70
3
7.333
71
3
5.831
72
1
8.500
73
3
7.028
74
3
6.937
75
3
9.080
76
3
5.947
77
3
6.107
78
3
9.890
79
3
6.272
80
3
6.759
81
3
6.021
82
2
11.297
83
2
13.209
84
2
12.572
85
4
5.011
86
4
8.072
87
3
10.005
88
4
9.127
89
4
8.548
90
3
9.927
91
4
6.650
92
4
10.980
93
4
6.739
94
3
10.673
95
3
10.385
96
4
9.385
97
3
6.649
98
4
7.016
99
1
10.972
100
3
11.268
101
3
6.965
102
4
6.772
103
4
7.118
104
4
9.634
105
1
6.913
106
1
8.952
107
1
12.030
108
1
11.512
109
4
15.658
110
4
9.495
111
4
13.105
112
3
14.008
113
1
11.786
114
1
8.124
115
4
11.747
116
1
9.771
117
1
8.190
118
1
8.203
119
1
10.758
120
1
12.638
121
1
4.711
122
1
6.944
123
1
5.805
124
1
10.121
125
1
4.487
126
1
6.315
127
1
10.200
128
1
8.630
129
1
11.167
130
1
7.900
131
1
8.749
132
1
7.864
133
1
6.045
134
1
4.020
135
1
10.470
136
4
13.123
137
1
7.807
138
1
4.074
139
1
11.335
140
1
12.249
141
1
5.663
142
1
9.319
143
1
6.522
144
1
10.267
145
1
12.315
146
1
9.746
147
1
7.183
148
1
12.125
149
1
7.056
150
1
6.270
151
1
8.376
152
1
6.938
153
1
6.790
154
1
8.820
155
1
7.419
156
1
2.587
157
1
2.917
158
1
8.734
159
1
4.903
160
1
4.583
161
1
7.847
162
1
7.833
163
1
5.415
164
1
5.415
165
1
5.415
166
1
6.193
167
2
6.781
168
4
5.375
169
4
4.401
170
2
4.566
171
2
7.851
172
2
9.145
173
2
8.417
174
2
9.978
175
2
9.153
176
2
5.957
177
2
4.455
178
2
5.222
179
2
6.881
180
2
4.358
181
2
5.263
182
2
9.702
183
2
7.530
184
2
6.233
185
2
14.562
186
2
15.376
187
4
10.980
188
4
7.984
189
2
9.331
190
4
9.192
191
2
6.341
192
2
8.323
193
4
9.991
194
4
4.722
195
2
9.732
196
4
5.171
197
4
13.292
198
2
6.380
199
4
9.516
200
2
4.043
Từ bảng Cluster membership này, cho biết quan sát nào thuộc cụm nào và khoảng cách giữa từng quan sát với
trung tâm của nó (distance). Ta nhận thấy rằng kết quả ở bảng này (không thứ bậc) và bảng ở trên (thứ bậc) có sự
khác biệt. Khoảng cách giữa các cụm trong phương án phân cụm cuối cùng cho thấy các cặp cụm được phân
tách rất rõ.
Đối với bảng ANOVA,giả thiết H0 : Sự khác biệt giữa các cụm chỉ là ngẫu nhiên, thì giả thiết đối H1: Sự khác
biệt giữa các cụm là có cơ sở, với mức ý nghĩa 5%. Nếu nó có sự khác biệt, tức là bác bỏ H 0 thì kết quả này có
thể sử dụng được, ta có thể hiểu cũng tương tự như trong phân cụm thứ bậc, chúng ta cũng cần kiểm định
AVONA về sự phù hợp của mô hình.
Kết quả trong bảng này thấy rõ rằng, tất cả các giá trị F đều rất lớn, giá trị sig. đều rất nhỏ (0.00) nên ta có thể
bác bỏ H0 ở mức ý nghĩa 5%. Vậy giữa các cụm có sự khác biệt có ý nghĩa và ta hoàn toàn có thể sử dụng kết
quả này.
ANOVA
Cluster
Mean Square
Mong ??i nh??ng ch?
Error
df
Mean Square
F
Sig.
df
122.067
3
2.989
194
40.833
.000
97.044
3
3.573
194
27.158
.000
166.483
3
2.358
194
70.617
.000
233.522
3
1.626
194
143.583
.000
199.728
3
2.065
194
96.704
.000
Mong ??i xe yên l?ng, tr?t t?
154.313
3
2.306
194
66.914
.000
Mong ??i xe không mùi l?
171.892
3
2.047
194
83.982
.000
Mong ??i an toàn thân th?
183.248
3
2.073
194
88.407
.000
C?m nh?n v? nh??ng ch?
128.491
3
3.103
194
41.414
.000
113.915
3
4.026
194
28.292
.000
146.165
3
2.981
194
49.037
.000
158.667
3
3.588
194
44.227
.000
149.606
3
3.292
194
45.440
.000
190.305
3
2.915
194
65.292
.000
C?m nh?n xe không mùi l?
201.210
3
2.834
194
70.995
.000
C?m nh?n an toàn thân th?
165.500
3
3.427
194
48.297
.000
Hình ?nh v? thái ?? ph?c v?
95.204
3
3.194
194
29.806
.000
127.505
3
3.000
194
42.496
.000
134.987
3
3.069
194
43.986
.000
128.922
3
3.178
194
40.570
.000
111.056
3
3.751
194
29.609
.000
137.468
3
4.139
194
33.209
.000
Mong ??i x?p hàng tr?t t?
lên xe
Mong ??i xe s?ch s?, không
rác
Mong ??i an toàn tài s?n
Mong ??i thái ?? nhân viên
tích c?c
C?m nh?n x?p hàng tr?t t?
lên xe
C?m nh?n xe s?ch s?,
không rác
C?m nh?n an toàn tài s?n
C?m nh?n thái ?? nhân viên
tích c?c
C?m nh?n xe yên l?ng, tr?t
t?
Hình ?nh v? vi?c nh??ng
ch?
Hình ?nh v? gi? v? sinh
chung
Hình ?nh v? gi? tr?t t? trên
bus
Hình ?nh v? x?p hàng lên
xu?ng xe
Hình ?nh v? an toàn tài s?n
Hình ?nh v? an toàn thân
th?
Hình ?nh v? ho?t ??ng lên/
xu?ng xe
Hình ?nh v? gi?u gìn tài s?n
chung
137.377
3
3.572
194
38.460
.000
107.295
3
3.708
194
28.933
.000
88.338
3
4.202
194
21.023
.000
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize the
differences among cases in different clusters. The observed significance levels are not corrected for this and thus
cannot be interpreted as tests of the hypothesis that the cluster means are equal.
Dưới đây chính là kết quả cuối cùng của phân tích cụm thứ bậc
Number of Cases in each
Cluster
Cluster
1
64.000
2
28.000
3
79.000
4
27.000
Valid
Missing
198.000
2.000
Từ kết quả của cả 2 phương pháp, ta thấy rằng, số cụm trong cả 2 phương pháp tương đồng nhau tuy số quan sát
trong từng cụm là khác nhau nhưng chúng đều có ý nghĩa, sự khác nhau ở đây có thể là do các dữ liệu nhân khẩu
học tác động. Nếu muốn phân tích đi sâu hơn nữa, rõ hơn nữa đặc trưng của từng cụm thì ta có thể dung Custorm
Table để phân tích.