TIN HỌC ỨNG DỤNG
KIỂM ĐỊNH TRUNG BÌNH
TRƯỜNG ĐẠI HỌC Y DƯỢC HUẾ
BỘ MÔN THỐNG KÊ – DÂN SỐ - SỨC KHỎE SINH SẢN
1
Mục tiêu
1.
Chọn lựa được kiểm định thống kê phù hợp cho các yêu cầu phân tích.
2.
Hiểu được các lý do và các giả định liên quan đến các kiểm định thống kê.
3.
Sử dụng được SPSS để thực hiện các kiểm định thống kê.
4.
Phiên giải được các kết quả phân tích số liệu.
2
Phân loại
So sánh TB mẫu và TB quần thể:
T-test 1 mẫu (One-sample T test)
So sánh TB ở hai nhóm độc lập:
T-test 2 mẫu độc lập (Independent-Samples T Test)
So sánh TB ở hai thời điểm khác nhau trên cùng một nhóm:
T-test ghép cặp (Paired-Samples T Test)
So sánh TB ở nhiều nhóm độc lập:
ANOVA một chiều (One-way ANOVA)
3
Các bước tiến hành
Đặt giả thuyết phân tích
Giả thuyết Ho
Đối thuyết H1
Chọn lựa kiểm định
Thực hiện kiểm định
Kiểm tra các giả định
Xem xét kết quả
Phiên giải kết quả và kết luận
4
So sánh TB mẫu và TB quần thể
Ví dụ:
Sử dụng bộ số liệu SXH.sav, so sánh sự khác biệt giữa TB cân nặng ở nghiên cứu này (cannang) với TB cân
nặng trên quần thể là 50kg, độ tin cậy 95%.
Giả thuyết:
Ho: TB cân nặng nghiên cứu = TB cân nặng quần thể.
H1: TB cân nặng nghiên cứu ≠ TB cân nặng quần thể.
Lựa chọn kiểm định:
So sánh TB mẫu và TB quần thể Kiểm định T một mẫu.
Kiểm tra giả định:
Cân nặng có phân phối chuẩn?
5
So sánh TB mẫu và TB quần thể
Thực hành trên SPSS:
Analyze Compare means One-sample T Test
Đưa biến cân nặng (cannang) vào Test Variable.
Nhấn OK.
Nhập cân nặng của quần thể (50kg) vào Test Value.
Ở mục Options ta có thể chỉnh khoảng tin cậy của hiệu số giữa 2 giá trị trung bình này (95%, 99%...), nhấn
Continue.
6
So sánh TB mẫu và TB quần thể
Phiên giải:
Mô tả đặc tính của biến số định lượng trong nghiên cứu:
Nghiên cứu này được thực hiện trên 210 người, TB cân nặng: 51,49Kg, độ lệch chuẩn: 9,894Kg.
Đọc kết quả so sánh:
So với TB cân nặng của quần thể (50Kg), TB câng nặng trong nghiên cứu này cao hơn 1,49Kg (KTC 95%: 0,14 - 2,84Kg). Sự khác
biệt có ý nghĩa thống kê (p=0,03 < 0,05) với độ tin cậy 95%.
7
So sánh TB ở hai nhóm độc lập
Ví dụ:
Từ bộ số liệu SXH.sav, so sánh sự khác biệt giữa TB cân nặng ở nghiên cứu này (cannang) theo giới tính, độ tin
cậy 95%.
Giả thuyết:
Ho: TB cân nặng của nam = TB cân nặng của nữ
H1: TB cân nặng của nam ≠ TB cân nặng củg nữ
Lựa chọn kiểm định:
So sánh TB của biến định lượng quan sát trên 2 nhóm độc lập
Kiểm định T cho 2 mẫu độc lập.
Kiểm tra giả định:
GĐ1: Biến số định lượng ở 2 nhóm có phân phối chuẩn?
GĐ2: Phương sai 2 nhóm có bằng nhau?
8
So sánh TB ở hai nhóm độc lập
Thực hành trên SPSS:
Analyze Compare means Independent-samples T Test
Đưa biến cân nặng (cannang) vào Test Variable.
Đưa biến giới tính (gioi) vào Grouping Variable.
Nhấn Define Groups, Group 1 nhập 1 mã hóa cho nam, Group 2 nhập 2 mã hóa cho nữ, nhấn Continue.
Ở mục Options ta có thể chỉnh khoảng tin cậy của hiệu số giữa 2 giá trị trung bình này (95%, 99%...)
Nhấn OK.
9
So sánh TB ở hai nhóm độc lập
Phiên giải:
Mơ tả đặc tính của biến số định lượng theo 2 nhóm:
Trong nghiên cứu này có tổng số nam là 113 người với TB cân nặng: 51,73Kg, độ lệch chuẩn: 10,667Kg.
Tổng số nữ là 97 người với TB cân nặng: 51,21Kg, độ lệch chuẩn: 8,957Kg.
10
So sánh TB ở hai nhóm độc lập
Phiên giải (tt):
Đọc kết quả kiểm định Levene’ test
So sánh phương sai giữa 2 nhóm (giả định 2): phương sai 2 nhóm khơng bằng nhau (p=0,032<0,05)
Đọc kết quả kiểm định T Test
Từ kết quả của kiểm định Levene, đọc kết quả T test ở hàng thứ 2 cho trường hợp phương sai 2 nhóm khơng bằng nhau.
Khơng có sự khác biệt về TB cân nặng giữa 2 nhóm nam và nữ
(p=0,697 > 0,05) với độ tin cậy 95%.
11
So sánh TB ở hai thời điểm khác nhau trên cùng một nhóm
Ví dụ:
Từ bộ số liệu THA.sav, so sánh sự khác biệt giữa TB huyết áp tâm thu vào viện (hatthu1) và khi ra viện (hatthu2)
của bệnh nhân từ 60 tuổi trở lên với độ tin cậy 99%.
Giả thuyết:
Ho: TB HATT vào viện = TB HATT ra viện
H1: TB HATT vào viện ≠ TB HATT ra viện
Lựa chọn kiểm định:
HATT được đo lường lặp lại trên cùng đối tượng tại 2 thời điểm khác nhau (khi vào viện và khi ra viện) Kiểm
định T ghép cặp.
Kiểm tra giả định:
Sự khác biệt giữa HATT vào viện và HATT ra viện có phân bố chuẩn?
12
So sánh TB ở hai thời điểm khác nhau trên cùng một nhóm
Thực hành trên SPSS:
Analyze Compare means Paired-Samples T Test
Đưa lần lượt biến HATT vào viện và HATT ra viện vào Paired Variables
Ở mục Options ta có thể chỉnh khoảng tin cậy của hiệu số giữa 2 giá trị trung bình này (95%, 99%...), nhấn Continue.
Nhấn OK.
13
So sánh TB ở hai thời điểm khác nhau trên cùng một nhóm
Phiên giải:
Mơ tả đặc tính của biến số HATT theo 2 thời điểm:
Nghiên cứu này được thực hiện trên 220 người.
TB HATT vào viện là 113,64mmHg, độ lệch chuẩn: 27,636mmHg.
TB HATT ra viện là 110,38mmHg, độ lệch chuẩn: 28,459mmHg.
Đọc kết quả so sánh:
TB HATT vào viện cao hơn TB HATT ra viện là 3,255 mmHg.
(KTC99%: 1,417 – 5,092 mmHg).
Sự khác biệt có ý nghĩa thống kê với p=0,0001 < 0,01, độ tin cậy 99%.
14
So sánh TB ở nhiều nhóm độc lập
Ví dụ:
Dựa vào bộ số liệu SXH.sav, so sánh sự khác biệt giữa TB chiều cao ở nghiên cứu này (chieucao) theo nơi ở
(noio), độ tin cậy 95%.
Giả thuyết:
Ho: TB chiều cao ở các nhóm nơi ở là như nhau.
H1: Có ít nhất TB chiều cao ở một nhóm nơi ở khác với TB chiều cao các nhóm cịn lại.
Lựa chọn kiểm định:
So sánh TB biến định lượng liên tục (chiều cao) theo biến định danh (nơi ở) có 4 nhóm Phân tích phương sai
ANOVA.
Kiểm tra giả định:
GĐ1: Biến số định lượng trong các nhóm có phân phối chuẩn?
GĐ2: Phương sai giữa các nhóm có bằng nhau?
15
So sánh TB ở nhiều nhóm độc lập
Thực hành trên SPSS:
Analyze Compare means One-way ANOVA
Đưa biến chiều cao (chieucao) vào Dependent List.
Đưa biến nơi ở (noio) vào Factor.
Nhấn Post Hoc, tích chọn LSD và Dunnett’s T3, nhấn Continue.
Nhấn Options, tích chọn Desciptive và Homogeneity of Variance test, nhấn Continue.
Nhấn OK.
16
So sánh TB ở nhiều nhóm độc lập
17
So sánh TB ở nhiều nhóm độc lập
Phiên giải:
Mơ tả đặc tính của biến số định lượng theo các nhóm:
Mơ tả tần số, trung bình, độ lệch chuẩn của chiều cao theo các nhóm nơi ở.
Đọc kết quả kiểm định Levene:
So sánh phương sai giữa các nhóm (giả định 2): phương sai các nhóm bằng nhau (p=0,176 > 0,05).
Đọc kết quả kiểm định ANOVA:
Khơng có sự khác biệt về TB chiều cao theo nơi ở (p=0,094 >0,05) với độ tin cậy 95%.
So sánh từng cặp giá trị: ( thường sử dụng để kết luận bổ sung cho kết quả kiểm định Anova, chọn những kết quả
ngược để bổ sung).
Dựa vào kết quả kiểm định Levene:
Phương sai các nhóm bằng nhau, chọn bảng LSD.
Phương sai các nhóm khơng bằng nhau, chọn bảng Dunnett’s T3.
Xem xét sự khác biệt về trung bình chiều cao theo từng cặp.
•
•
18
So sánh TB ở nhiều nhóm độc lập
19
Phân biệt các kiểm định
Kiểm định 1 giá trị trung bình: Bài tốn ln cho biết một giá trị Xo trung bình cho trước.
Kiểm định 2 giá trị trung bình: Biến độc lập/phân loại luôn luôn là biến nhị phân
Kiểm định t ghép cặp: Luôn xét đến thời điểm nghiên cứu trên cùng mẫu NC.
Kiểm định trung bình nhiều nhóm độc lập: Biến độc lập thường có 3 phân nhóm trở lên.
Lưu ý:
Đối với bài toán kiểm định từ 2 giá trị tb trở lên bên cạnh đi tìm ngưỡng ý nghĩa p value, cần xem xét đến
phương sai của mẫu NC.
20
Bài tập
Câu 1: Khoảng tin cậy 95% trong các ví dụ trên có ý nghĩa gì?
Dựa vào bộ số liệu Sốt xuất huyết (SXH.sav) trả lời câu 2 đến câu 4.
Câu 2: Trung bình chiều cao (chieucao) của đối tượng nghiên cứu là nam có khác so với chiều cao trên lý
thuyết là 165cm với độ tin cậy 99%?
Câu 3: Tính chỉ số BMI của đối tượng nghiên cứu là nữ dựa vào cân nặng (cannang) và chiều cao (chieucao).
Cho biết chỉ số BMI trung bình, độ lệch chuẩn, sai số chuẩn của giá trị BMI theo nơi ở (noio).
Hỏi trung bình BMI của 2 nhóm tuổi (tuoi) < 40 và nhóm tuổi ≥ 40 có khác biệt với độ tin cậy 95%?
21
Câu 4: Chia trình độ học vấn (trinhdo) thành 3 nhóm:
Nhom1: Từ cấp 2 trở xuống
Nhom2: Cấp 3
Nhom3: CĐ, ĐH, SĐH
•
•
•
So sánh trung bình độ tuổi (tuoi) theo 3 nhóm học vấn trên với độ tin cậy 95%.
Câu 5: Dựa vào bộ số liệu tăng huyết áp (THA.sav) so sánh sự khác biệt giữa TB huyết áp tâm
trương vào viện (hattr1) và khi ra viện (hattr2) của bệnh nhân nam từ 65 tuổi trở lên với độ tin cậy
99%.
22