Tải bản đầy đủ (.ppt) (20 trang)

Các bước phân tích số liệu với Stata 8.0

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (524.63 KB, 20 trang )

Các bước phân tích số liệu với
Stata 8.0
Chương: Chiến lược phân tích số liệu
Trang 84
Các bước phân tích số liệu

Mở tập tin

File :: Open

Liệt kê các biến số và xác định số bản ghi (số
đối tượng) bằng F3

Xác định mục tiêu nghiên cứu, các biến số và
phân loại biến số, kế hoạch phân tích
Các bước phân tích số liệu

Mục tiêu:
Đánh giá tác động của cao huyết áp trong thai kì
và tuổi thai lên trọng lượng thai

Biến số
Biến số phụ thuộc: trọng lượng thai
Biến số độc lập: tuổi thai và cao huyết áp
Biến số gây nhiễu: tuổi mẹ, giới tính

Thống kê: kiểm định t và hồi quy
Các bước phân tích số liệu

Biên tập số liệu


Mô tả số liệu
1. Biên tập số liệu (data processing):

Phát hiện sai sót bằng

Sum: tìm số liệu khuyết và giá trị bất thường

bảng tần suất của biến số định tính
trung bình, ĐLC hay tổ chức đồ của biến số định lượng
(xem N, số tối đa, tối thiểu, trung bình, độ lệch chuẩn)

Kiểm tra tính phù hợp: giới tính và số lần mang thai,
trọng lượng và chiều cao

Sai sót phát hiện được kiểm tra số liệu gốc

Lưu (Save) số liệu với một tên mới
0 .1 .2 .3 .4
Fraction
0.0 5.0 10.0 15.0
TG truoc dieu tri
338
67
223
120
295
326
28
275
218

228
247229
337
246
15
35
31
118
207
161
306 47
249
121
119 260
151
134
302
130
239
267
157
236
195
226
36
231
201
30 258
155 327
200

204
198
132
199
325
329
165
41
220
154272
266158
159
37
164
122
113
280
167
248
311
323
32
156
232
44
163
238
254
101
153

203
328
192
235
336
26
115
252
100
255
316
324
339
340
114
234129
75
124
334
197
276
24462
116
211
131104
240
219
117
251
331

202
210 126 262
221
69
208
277
196
74
125 227
68242274
25 128
152
273
162 332
264
46
160 253
103
42
61
96233
270
39
322
38
320
237
66
206
321

342
263
217
34
222
81
194
330
205
80
102
319 224
71
209
259
214
213
70
72
333
341
335
265
269
193
271
45
230
63 241
225

166
216
127
73
257
91
215
250
64
212
245
123
40
43
261
33
279
8
29
278
0.0 1.0 2.0 3.0 4.0
HDL truoc dieu tri
2.00 4.00 6.00 8.00 10.00
TC truoc dieu tri
40 60 80 100
Can nang
1.40 1.50 1.60 1.70 1.80
cao

Kiểm tra


ID: 368, 375, 401

ID: 15, 130, 134, 246, 263, 206

ID: 253, 252

ID: 266 (SGPT tăng cao sau điều trị)
Mô tả số liệu

Đảm bảo số liệu đầy đủ và đại điện cho dân số
mục tiêu

Có cảm giác về số liệu

Cần biên tập số liệu riêng cho từng nhóm

Nhóm can thiệp và không can thiệp hoặc

Nhóm bệnh và nhóm chứng

Nếu số liệu không phải nhập từ Epi-data cần
phải dán nhãn cho số liệu để dễ dọc
Các bước phân tích số liệu

(Cần sử dụng log và cmdlog)

Phân tích số liệu: thống kê mô tả


bảng tần suất của biến số định tính

trung bình, ĐLC của biến số định lượng

Vẽ biểu đồ, đồ thị
Phân loại biến số

Biến phụ thuộc (biến kết cuộc – outcome)

Biến độc lập (biến phơi nhiễm hay biến giải
thích – exposure )

Biến gây nhiễu (biến có khả năng tác động đến
biến kết cuộc nhưng tác động này không phải
là mục tiêu của nghiên cứu)

Nếu nghiên cứu có 2 biến số độc lập thì biến số
độc lập này là biến số gây nhiễu cho biến số độc
lập còn lại
Rút gọn số liệu

Cần rút gọn cho các biến số định lượng hay biến
số định tính có nhiều nhóm

Với biến phụ thuộc (outcome):

Nên chia làm 2 nhóm

Với biến độc lập (biến giải thích)


Nên chia làm 4-5 nhóm để đánh giá mối quan hệ
liều lượng đáp ứng

Với biến gây nhiễu:

Nên chia làm 2 hay 3 nhóm (trừ khi đây là biến gây
nhiễu mạnh)
Đo lường tác động

Biến kết cuộc là định lượng: (hiệu số, mức độ
thay đổi)

Huyết áp

Cholesterol toàn phần

Biến kết cuộc là định tính (nhồi máu, tử vong)

nghiên cứu đoàn hệ (RR hay IRR)

nghiên cứu bệnh chứng (OR)

Nghiên cứu cắt ngang (RR hay OR)
Phân tích đơn biến

Biến kết cuộc là định lượng:

Nếu có 2 nhóm:


T-test không bắt cặp (nếu thiết kế song song)

T-test bắt cặp (nếu thiết kế bắt chéo, trước sau)

So sánh nhiều nhóm: oneway ANOVA

Biến kết cuộc là định tính (nhồi máu, tử vong)

So sánh 2 nhóm

nghiên cứu đoàn hệ: lệnh cs

nghiên cứu bệnh chứng : lệnh cc

Nghiên cứu cắt ngang: lệnh cs hay cc

So sánh nhiều nhóm

Chi bình phương

Chi bình phương khuynh hướng
Kiểm soát yếu tố gây nhiễu

Biến kết cuộc là định lượng:

Hồi quy tuyến tính:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu

Biến kết cuộc là định tính (nhồi máu, tử vong)


Hồi quy logistic:
Biến phụ thuộc ~ biến độc lập + biến gây nhiễu
1. Có 2. Không
1. Có 2. Không
1. Có 2. Không
1. Có 2. Không

gen hcch=(( c31==1) + (c32==1) + (c33==1) +
(c34==1)+ (c35==1))>=3

sdtest hq1a, by( hcch )

ttest hq1a, by(hcch)

gen giamtc= hq1b- hq1a

ttest giamtc == 0

ttest giamtc, by(hcch)

drop if c1>=3

ttest giamtc, by(c1)

×