Các bước phân tích số liệu với
Stata 8.0
Chương: Chiến lược phân tích số liệu
Trang 84
Các bước phân tích số liệu
•
Mở tập tin
–
File :: Open
•
Liệt kê các biến số và xác định số bản ghi (số
đối tượng) bằng F3
•
Xác định mục tiêu nghiên cứu, các biến số và
phân loại biến số, kế hoạch phân tích
Các bước phân tích số liệu
•
Mục tiêu:
Đánh giá tác động của cao huyết áp trong thai kì
và tuổi thai lên trọng lượng thai
•
Biến số
Biến số phụ thuộc: trọng lượng thai
Biến số độc lập: tuổi thai và cao huyết áp
Biến số gây nhiễu: tuổi mẹ, giới tính
•
Thống kê: kiểm định t và hồi quy
Các bước phân tích số liệu
•
Biên tập số liệu
•
Mô tả số liệu
1. Biên tập số liệu (data processing):
–
Phát hiện sai sót bằng
•
Sum: tìm số liệu khuyết và giá trị bất thường
•
bảng tần suất của biến số định tính
trung bình, ĐLC hay tổ chức đồ của biến số định lượng
(xem N, số tối đa, tối thiểu, trung bình, độ lệch chuẩn)
•
Kiểm tra tính phù hợp: giới tính và số lần mang thai,
trọng lượng và chiều cao
–
Sai sót phát hiện được kiểm tra số liệu gốc
•
Lưu (Save) số liệu với một tên mới
0 .1 .2 .3 .4
Fraction
0.0 5.0 10.0 15.0
TG truoc dieu tri
338
67
223
120
295
326
28
275
218
228
247229
337
246
15
35
31
118
207
161
306 47
249
121
119 260
151
134
302
130
239
267
157
236
195
226
36
231
201
30 258
155 327
200
204
198
132
199
325
329
165
41
220
154272
266158
159
37
164
122
113
280
167
248
311
323
32
156
232
44
163
238
254
101
153
203
328
192
235
336
26
115
252
100
255
316
324
339
340
114
234129
75
124
334
197
276
24462
116
211
131104
240
219
117
251
331
202
210 126 262
221
69
208
277
196
74
125 227
68242274
25 128
152
273
162 332
264
46
160 253
103
42
61
96233
270
39
322
38
320
237
66
206
321
342
263
217
34
222
81
194
330
205
80
102
319 224
71
209
259
214
213
70
72
333
341
335
265
269
193
271
45
230
63 241
225
166
216
127
73
257
91
215
250
64
212
245
123
40
43
261
33
279
8
29
278
0.0 1.0 2.0 3.0 4.0
HDL truoc dieu tri
2.00 4.00 6.00 8.00 10.00
TC truoc dieu tri
40 60 80 100
Can nang
1.40 1.50 1.60 1.70 1.80
cao
•
Kiểm tra
–
ID: 368, 375, 401
–
ID: 15, 130, 134, 246, 263, 206
–
ID: 253, 252
–
ID: 266 (SGPT tăng cao sau điều trị)
Mô tả số liệu
•
Đảm bảo số liệu đầy đủ và đại điện cho dân số
mục tiêu
•
Có cảm giác về số liệu
•
Cần biên tập số liệu riêng cho từng nhóm
–
Nhóm can thiệp và không can thiệp hoặc
–
Nhóm bệnh và nhóm chứng
•
Nếu số liệu không phải nhập từ Epi-data cần
phải dán nhãn cho số liệu để dễ dọc
![]()
![]()
Các bước phân tích số liệu
•
(Cần sử dụng log và cmdlog)
•
Phân tích số liệu: thống kê mô tả
–
bảng tần suất của biến số định tính
–
trung bình, ĐLC của biến số định lượng
–
Vẽ biểu đồ, đồ thị
Phân loại biến số
•
Biến phụ thuộc (biến kết cuộc – outcome)
•
Biến độc lập (biến phơi nhiễm hay biến giải
thích – exposure )
•
Biến gây nhiễu (biến có khả năng tác động đến
biến kết cuộc nhưng tác động này không phải
là mục tiêu của nghiên cứu)
•
Nếu nghiên cứu có 2 biến số độc lập thì biến số
độc lập này là biến số gây nhiễu cho biến số độc
lập còn lại
Rút gọn số liệu
•
Cần rút gọn cho các biến số định lượng hay biến
số định tính có nhiều nhóm
•
Với biến phụ thuộc (outcome):
–
Nên chia làm 2 nhóm
•
Với biến độc lập (biến giải thích)
–
Nên chia làm 4-5 nhóm để đánh giá mối quan hệ
liều lượng đáp ứng
•
Với biến gây nhiễu:
–
Nên chia làm 2 hay 3 nhóm (trừ khi đây là biến gây
nhiễu mạnh)
Đo lường tác động
•
Biến kết cuộc là định lượng: (hiệu số, mức độ
thay đổi)
–
Huyết áp
–
Cholesterol toàn phần
•
Biến kết cuộc là định tính (nhồi máu, tử vong)
–
nghiên cứu đoàn hệ (RR hay IRR)
–
nghiên cứu bệnh chứng (OR)
–
Nghiên cứu cắt ngang (RR hay OR)
Phân tích đơn biến
•
Biến kết cuộc là định lượng:
–
Nếu có 2 nhóm:
•
T-test không bắt cặp (nếu thiết kế song song)
•
T-test bắt cặp (nếu thiết kế bắt chéo, trước sau)
–
So sánh nhiều nhóm: oneway ANOVA
•
Biến kết cuộc là định tính (nhồi máu, tử vong)
–
So sánh 2 nhóm
•
nghiên cứu đoàn hệ: lệnh cs
•
nghiên cứu bệnh chứng : lệnh cc
•
Nghiên cứu cắt ngang: lệnh cs hay cc
–
So sánh nhiều nhóm
•
Chi bình phương
•
Chi bình phương khuynh hướng
Kiểm soát yếu tố gây nhiễu
•
Biến kết cuộc là định lượng:
–
Hồi quy tuyến tính:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu
•
Biến kết cuộc là định tính (nhồi máu, tử vong)
–
Hồi quy logistic:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu
1. Có 2. Không
1. Có 2. Không
1. Có 2. Không
1. Có 2. Không
•
gen hcch=(( c31==1) + (c32==1) + (c33==1) +
(c34==1)+ (c35==1))>=3
•
sdtest hq1a, by( hcch )
•
ttest hq1a, by(hcch)
•
gen giamtc= hq1b- hq1a
•
ttest giamtc == 0
•
ttest giamtc, by(hcch)
•
drop if c1>=3
•
ttest giamtc, by(c1)