Chương 7 Kiểm ñịnh một phân phối và bảng tương liên
105
nhất của các ñám ñông (tức là các ñám ñông có cùng tỷ lệ phân chia), hay còn gọi là kiểm
ñịnh các tỷ lệ.
Ví dụ 7.3: Từ một ñàn trước khi cho tiếp xúc với nguồn bệnh, chọn ra 295 ñộng vât thí
nghiệm (tiêm vắc xin) và 55 ñộng vật ñối chứng (không tiêm vắc xin). Số ñộng vật này sau
khi cho tiếp xúc với nguồn bệnh ta thu ñược kết quả như trong bảng sau. Liệu vắc xin có làm
giảm tỷ lệ chết hay không?
Kết quả
Thuốc Sống Chết Tổng hàng
Vắc xin 120 175 295
ðối chứng 30 25 55
Tổng cột 150 200 350
Ở ñây có thể coi hàng là các lớp của biến thuốc X (có 2 lớp A, B), cột là là các lớp của biến
kết quả Y (có 2 lớp: sống và chết). Cũng có thể coi hàng là các ñám ñông: “những ñộng vật
tiêm vắc xin” và “những ñộng vật không tiêm vắc xin”. Cột là sự phân chia mỗi ñám ñông
thành 2 nhóm sống và chết.
Bảng tần số lý thuyết:
Kết quả
Thuốc Sống Chết Tổng hàng
Vắc xin
4,126
350
150295
=
×
6,168
350
200295
=
×
295
ðối chứng
6,23
350
15055
=
×
4,31
350
20055
=
×
55
Tổng cột 150 200 350
χ
2
TN
=
(
)
64,3
4,31
)4,3125(
6,23
)6,2330(
6,168
)6,168175(
4,126
4,126120
222
2
=
−
+
−
+
−
+
−
Bậc tự do df = (2-1)(2-1) = 1. Giá trị tới hạn χ
2
(0,05,1) = 3,84
Kết luận: Vì “χ
2
TN
= 3,64 < χ
2
(0,05,1) = 3,84, ta chưa có ñủ bằng chứng ñể bác bỏ H
0
. Hay
nói một cách khác vắc xin ñã không làm giảm ñược tỷ lệ chết.
Ví dụ 7.4: Nghiên cứu ảnh hưởng của việc thiến ñến sự xuất hiện bệnh tiểu ñường ở chuột.
Từ 100 chuột thí nghiệm, chia ngẫu nhiên về 1 trong 2 cách xử lý thiến và không thiến. Số
chuột ở 2 lô thí nghiệm ñược theo dõi cho ñến 140 ngày tuổi và tiến hành lấy mẫu nghiên cứu
từ 42 ngày tuổi. Bệnh tiểu ñường ñược xác ñịnh ñối với chuột có hàm lượng ñường trong máu
lớn hơn 200 mg/ dl. Kết quả thí nghiệm ñược ghi lại ở bảng sau:
Thiết kế thí nghiệm
106
Cách xử lý Kết quả
Mắc bệnh Không mắc bệnh Tổng
Thiến 26 24 50
Không thiến 12 38 50
Tổng số 38 62 100
Tần suất lý thuyết
Cách xử lý Kết quả
Mắc bệnh Không mắc bệnh Tổng
Thiến
19
100
3850
=
×
31
100
6250
=
×
50
Không thiến
19
100
3850
=
×
31
100
6250
=
×
50
Tổng số 38 62 100
=
−
+
−
+
−
+
−
=
31
)3138(
31
)3124(
19
)1912(
19
)1926(
2222
2
TN
χ
8,32
ðối với trường hợp bảng tương liên 4 ô
a b
c d
Có thể tính χ
2
TN
theo công thức
))()()((
)(
2
2
dbcadcba
bcad
n
TN
++++
−
×=
χ
= 32,8
62
38
50
50
)24123826(
100
2
=
×××
×−×
×
Bậc tự do df = (2-1)(2-1) = 1. Giá trị tới hạn χ
2
(0,05;1) = 3,84
Kết luận: Vì χ
2
TN
= 8,32 > χ
2
(0,05;1) = 3,84 nên giả thiết H
0
bị bác bỏ. Chứng tỏ, tỷ lệ chuột
sau khi thiến mắc bệnh ñái ñường cao hơn so với chuột không bị thiến.
Hiệu chỉnh Yates
( )( )( )( )
dcdbcaba
n
n
bcad
++++
−−
=
2
2
2
χ
V
ớ
i ví d
ụ
trên ta có giá tr
ị
χ² hi
ệ
u ch
ỉ
nh là:
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên
107
( )( )( )( )
17,7
3812382412262426
100
2
100
12243826
2
2
=
++++
×
−×−×
=
χ
K
ế
t lu
ậ
n: V
ớ
i hi
ệ
u ch
ỉ
nh Yate, giá tr
ị
χ² th
ự
c nghi
ệ
m bé h
ơ
n (χ² = 7,17) so v
ớ
i tr
ướ
c khi hiêu
ch
ỉ
nh (χ² = 8,32). Tuy nhiên giá tr
ị
c² th
ự
c nghi
ệ
m v
ẫ
n l
ớ
n h
ơ
n giá tr
ị
t
ớ
i h
ạ
n, nên ta có k
ế
t
lu
ậ
n t
ươ
ng t
ự
v
ề
b
ệ
nh ti
ể
u
ñườ
ng c
ủ
a chu
ộ
t nh
ư
ñ
ã nêu
ở
ph
ầ
n trên.
Lưu ý:
H
ệ
s
ố
ñ
i
ề
u ch
ỉ
nh c
ủ
a Yate trong ki
ể
m
ñị
nh m
ộ
t phân ph
ố
i có 2 l
ớ
p và trong b
ả
ng t
ươ
ng liên
2× 2.
a) Kiểm ñịnh một phân phối có 2 lớp
Tính tr
ạ
ng nghiên c
ứ
u Lo
ạ
i 1 Lo
ạ
i 2 T
ổ
ng
T
ầ
n s
ố
th
ự
c t
ế
m
1
m
2
N
T
ầ
n s
ố
lý thuy
ế
t
t
1
=N×p
1
/(p
1
+p
2
) t
2
=N×p
2
/(p
1
+p
2
)
N
ðể
ki
ể
m
ñị
nh gi
ả
thi
ế
t H
0
: “Hai l
ớ
p nói trên phân ph
ố
i theo t
ỷ
l
ệ
p
1
:p
2
“có th
ể
s
ử
d
ụ
ng ph
ươ
ng
pháp χ
2
v
ớ
i n
ộ
i dung:
Tính
2
2
22
1
2
11
2
)()(
t
tm
t
tm
tn
−
+
−
=χ
So χ
2
TN
v
ớ
i giá tr
ị
t
ớ
i h
ạ
n χ
2
v
ớ
i m
ứ
c ý ngh
ĩ
a α và b
ậ
c t
ự
do b
ằ
ng 1. N
ế
u χ
2
TN
≤ χ
2
(α,1)
thì
ch
ấ
p nh
ậ
n H
0
, n
ế
u χ
2
tn
> χ
2
(α,1) thì bác b
ỏ
H
0
.
Bài toán ki
ể
m
ñị
nh này t
ươ
ng
ñươ
ng v
ớ
i bài toán ki
ể
m
ñị
nh m
ộ
t xác su
ấ
t, vi
ệ
c tính toán d
ự
a
trên cách tính x
ấ
p x
ỉ
phân ph
ố
i nh
ị
th
ứ
c b
ằ
ng phân ph
ố
i chu
ẩ
n, t
ừ
ñ
ó suy ra χ
2
TN
x
ấ
p x
ỉ
phân
ph
ố
i χ
2
(là m
ộ
t phân ph
ố
i liên t
ụ
c suy ra t
ừ
phân ph
ố
i chu
ẩ
n). Tr
ườ
ng h
ợ
p N < 100 phép x
ấ
p
x
ỉ
không th
ậ
t t
ố
t, th
ườ
ng cho χ
2
TN
h
ơ
i to do
ñ
ó Yate
ñề
nghi
ñ
i
ề
u ch
ỉ
nh l
ạ
i χ
2
TN
theo h
ướ
ng
làm nh
ỏ
b
ớ
t χ
2
TN
,
ñ
i
ề
u ch
ỉ
nh này th
ườ
ng g
ọ
i là
ñ
i
ề
u ch
ỉ
nh do tính liên t
ụ
c.
Công th
ứ
c tính χ
2
TN
ñ
i
ề
u
ch
ỉ
nh nh
ư
sau:
2
2
22
1
2
11
2
)5,0()5,0(
t
tm
t
tm
tn
−−
+
−−
=χ
b) Bảng tương liên 4 ô (2 x 2)
Tính tr
ạ
ng B Tính tr
ạ
ng A
L
ớ
p B1 L
ớ
p B2 T
ổ
ng hàng
Lo
ạ
i A1 a b a+b
Lo
ạ
i A2 c d c+d
T
ổ
ng c
ộ
t a+c b+d N=a+b+c+d
Thiết kế thí nghiệm
108
ðể
ki
ể
m
ñị
nh gi
ả
thi
ế
t H
0
: “Hai tính tr
ạ
ng A và B
ñộ
c l
ậ
p” có th
ể
dùng ph
ươ
ng pháp χ
2
v
ớ
i
các n
ộ
i dung sau:
+ Tính các s
ố
lý thuy
ế
t
N
caba
a
))((
ˆ
+
+
=
N
dbba
b
))((
ˆ
+
+
=
N
cadc
c
))((
ˆ
+
+
=
N
dbdc
d
))((
ˆ
+
+
=
+ Tính χ²
TN
d
dd
c
cc
b
bb
a
aa
ˆ
)
ˆ
(
ˆ
)
ˆ
(
ˆ
)
ˆ
(
ˆ
)
ˆ
(
2222
−
+
−
+
−
+
−
=
Có th
ể
tính χ
2
TN
b
ằ
ng công th
ứ
c sau:
))()()((
)(
2
2
dbdccaba
Nbcad
tn
++++
×−
=
χ
+ So v
ớ
i giá tr
ị
t
ớ
i h
ạ
n χ
2
v
ớ
i m
ứ
c ý ngh
ĩ
a α và b
ậ
c t
ự
do b
ằ
ng 1. N
ế
u χ
2
TN
≤ χ
2
(α,1) thì ch
ấ
p
nh
ậ
n H
0
, n
ế
u χ
2
TN
> χ
2
(α,1) thì bác b
ỏ
H
0
.
Bài toán này t
ươ
ng
ñươ
ng v
ớ
i bài toán so sánh hai xác su
ấ
t, vi
ệ
c tính toán d
ự
a trên cách tính
x
ấ
p x
ỉ
phân ph
ố
i nh
ị
th
ứ
c b
ằ
ng phân ph
ố
i chu
ẩ
n, t
ừ
ñ
ó suy ra χ
2
TN
x
ấ
p x
ỉ
phân ph
ố
i χ
2
.
Khi N nh
ỏ
vi
ệ
c x
ấ
p x
ỉ
không t
ố
t do
ñ
ó có m
ộ
t s
ố
h
ướ
ng d
ẫ
n nh
ư
sau:
+ N
ế
u N ≤ 20 thì không nên dùng ph
ư
ong pháp χ
2
TN
+ N
ế
u 20 < N ≤ 40 và có ô có s
ố
lý thuy
ế
t bé < 5 thì c
ũ
ng không nên dùng ph
ươ
ng pháp χ
2
TN
C
ả
hai tr
ườ
ng h
ợ
p này nên dùng ph
ươ
ng pháp chính xác Fisher (xem ph
ầ
n 7.3)
N
ế
u N ≥ 100 thì có th
ể
dùng ph
ươ
ng pháp χ
2
.
N
ế
u N < 100 và không r
ơ
i vào 2 tr
ườ
ng h
ợ
p
ñầ
u thì nên
ñư
a thêm
ñ
i
ề
u ch
ỉ
nh do tính liên t
ụ
c
Yate nh
ằ
m làm nh
ỏ
b
ớ
t χ
2
TN
nh
ư
sau:
))()()((
)5,0(
2
2
dbdccaba
NNbcad
tn
++++
×−−
=
χ
7.3. Kiểm ñịnh chính xác của Fisher ñối với bảng tương liên 2
×
××
×
2
Khi các giá tr
ị
ướ
c tính (Ei) trong b
ả
ng t
ươ
ng liên 2×2 r
ấ
t bé (Ei < 5) thì vi
ệ
c s
ử
d
ụ
ng phép
ki
ể
m
ñị
nh χ² không còn
ñả
m b
ả
o
ñượ
c
ñộ
chính xác. Tr
ườ
ng h
ợ
p này hay g
ặ
p trong nghiên
c
ứ
u d
ị
ch t
ễ
h
ọ
c và phép ki
ể
m
ñị
nh chính xác c
ủ
a Fisher
ñượ
c s
ử
d
ụ
ng. Phép ki
ể
m
ñị
nh này
cho ta m
ộ
t xác su
ấ
t tr
ự
c ti
ế
p và chính xác thay vì
ñ
i tìm giá tr
ị
xác su
ấ
t t
ừ
b
ả
ng.
N
ế
u ta có b
ả
ng t
ươ
ng liên 2×2
a b a + b
c d c + d
a + c b + d n
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên
109
Fisher d
ự
a trên phân ph
ố
i siêu hình h
ọ
c (hypergeometric distribution)
ñể
tính xác su
ấ
t c
ủ
a
phép th
ử
theo công th
ứ
c.
p =
(
)
(
)
(
)
(
)
!
!
!
!
!!!!
d
c
b
a
dbcadcba
+
+
+
+
Các b
ướ
c th
ự
c hi
ệ
n:
1) Tính p
1
v
ớ
i b
ả
ng s
ố
li
ệ
u
ñ
ã cho
2) Tính ad – bc.
+ N
ế
u ad – bc > 0 thì t
ă
ng a và d, gi
ả
m b và c b
ằ
ng 1
ñơ
n v
ị
r
ồ
i tính xác su
ấ
t p
2
; làm t
ươ
ng t
ự
cho
ñế
n khi a b
ằ
ng min c
ủ
a (a+b) ho
ặ
c (a+c)
+ N
ế
u ad – bc < 0 thì gi
ả
m a và d, t
ă
ng b và c r
ồ
i tính xác su
ấ
t p
2
; làm t
ươ
ng t
ự
cho
ñế
n khi a
b
ằ
ng 0
3) Tính P = 2×(p1 + p2 + + pn)
4) N
ế
u xác su
ấ
t P < 0,05 thì k
ế
t lu
ậ
n bác b
ỏ
H
0
.
Ví dụ 7.5:
T
ừ
m
ộ
t
ñ
àn tr
ướ
c khi cho ti
ế
p xúc v
ớ
i ngu
ồ
n b
ệ
nh, ch
ọ
n ra 10
ñộ
ng vât thí nghi
ệ
m
(tiêm v
ắ
c xin) và 10
ñộ
ng v
ậ
t
ñố
i ch
ứ
ng (không tiêm v
ắ
c xin). S
ố
ñộ
ng v
ậ
t này sau khi cho
ti
ế
p xúc v
ớ
i ngu
ồ
n b
ệ
nh ta thu
ñượ
c k
ế
t qu
ả
nh
ư
trong b
ả
ng sau. Li
ệ
u v
ắ
c xin có làm gi
ả
m t
ỷ
l
ệ
ch
ế
t hay không?
K
ế
t qu
ả
Thu
ố
c S
ố
ng Ch
ế
t T
ổ
ng hàng
V
ắ
c xin 9 1 10
ðố
i ch
ứ
ng 2 8 10
T
ổ
ng c
ộ
t 11 9 20
1) p
1
=
(
)
(
)
(
)
(
)
!
!
!
!
!
!!!!
n
d
c
b
a
dbcadcba
+
+
+
+
=
002679,0
!
20
!
8
!
2
!
1
!
9
!9!11!10!10
=
2) ad – bc = 9×8 - 1×2 = 70 > 0
T
ă
ng a, d và gi
ả
m b, c b
ằ
ng 1
ñơ
n v
ị
ta có
9 +1 2 -1 11 10 1 11
1 - 1 8 + 1
0 9
10 10
p
2
=
850000595379,0
!
20
!
9
!
1
!
0
!
10
!9!11!10!10
=
3) P = 2×(p1 + p2 + + pn) = 2×(0,002679 + 0,000059537985) = 0,005477076
4) V
ớ
i xác su
ấ
t này, gi
ả
thi
ế
t H
0
b
ị
bác b
ỏ
.
ð
i
ề
u này ch
ứ
ng t
ỏ
v
ắ
c xin
ñ
ã làm gi
ả
m t
ỷ
l
ệ
ch
ế
t.
Thiết kế thí nghiệm
110
Ví dụ 7.6:
T
ươ
ng t
ự
nh
ư
ví d
ụ
7.5 t
ừ
15
ñộ
ng vât thí nghi
ệ
m (tiêm v
ắ
c xin) có 2
ñộ
ng v
ậ
t m
ắ
c
b
ệ
nh và t
ừ
13
ñộ
ng v
ậ
t
ñố
i ch
ứ
ng (không tiêm v
ắ
c xin) có 10
ñộ
ng v
ậ
t m
ắ
c b
ệ
nh. Li
ệ
u v
ắ
c
xin có làm gi
ả
m t
ỷ
l
ệ
m
ắ
c b
ệ
nh hay không?
K
ế
t qu
ả
Thu
ố
c M
ắ
c b
ệ
nh Không T
ổ
ng hàng
V
ắ
c xin 2 13 15
ðố
i ch
ứ
ng 10 3 13
T
ổ
ng c
ộ
t 12 16 28
1) p
1
=
(
)
(
)
(
)
(
)
!
!
!
!
!
!!!!
n
d
c
b
a
dbcadcba
+
+
+
+
=
00098712,0
!
28
!
3
!
10
!
13
!
2
!16!12!13!15
=
2) ad – bc = 2×3 - 13×10 = -124 < 0
Gi
ả
m a, d và t
ă
ng b, c b
ằ
ng 1
ñơ
n v
ị
ta có
2 -1 13 + 1 15 1 14 15
10 + 1 3 - 1 13
11 2 13
12 16 28 12 16 28
p
2
=
00003846,0
!
28
!
2
!
11
!
14
!
1
!16!12!13!15
=
Gi
ả
m a, d và t
ă
ng b, c b
ằ
ng 1
ñơ
n v
ị
ta có
1 - 1 14 + 1 15 0 15 15
11 + 1 2 - 1 13
12 1 13
12 16 28 12 16 28
p
3
=
0000004273,0
!
28
!
1
!
12
!
15
!
0
!16!12!13!15
=
3) P = 2×(p1 + p2 + + pn) = 2×(0,00098712 + 0,00003846 + 0,0000004273) = 0,00205202
4) V
ớ
i xác su
ấ
t này, gi
ả
thi
ế
t H
0
b
ị
bác b
ỏ
.
ð
i
ề
u này ch
ứ
ng t
ỏ
v
ắ
c xin
ñ
ã làm gi
ả
m t
ỷ
l
ệ
m
ắ
c
b
ệ
nh.
Cochran khuy
ế
n cáo nên s
ử
d
ụ
ng phép th
ử
chính xác c
ủ
a Fisher n
ế
u trong thí nghi
ệ
m n < 20
ho
ặ
c 20 < n <40 và d
ự
ñ
oán bé nh
ấ
t nh
ỏ
h
ơ
n 5.
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên
111
7.4. Xác ñịnh mức liên kết trong dịch tễ học bằng kiểm ñịnh
χ
χχ
χ
²
Trong d
ị
ch t
ễ
h
ọ
c, t
ầ
m quan tr
ọ
ng c
ủ
a s
ự
liên k
ế
t gi
ữ
a hàng và c
ộ
t trong b
ả
ng t
ươ
ng liên còn
ñượ
c xem xét b
ở
i: 1) nguy c
ơ
t
ươ
ng
ñố
i (RR) và 2) t
ỷ
su
ấ
t chênh (OR).
N
ế
u ta có b
ả
ng t
ươ
ng liên 2×2 nh
ư
sau:
B
ệ
nh T
ổ
ng s
ố
Nhân t
ố
+ -
+ a b a + b
- c d c + d
T
ổ
ng s
ố
a + c b + d n
Ta có:
OR =
bc
ad
dc
ba
=
/
/
RR =
d
c
c
ba
a
+
+
7.4.1. Nghiên cứu cắt ngang (cross sectional studies)
M
ụ
c
ñ
ích c
ủ
a nghiên c
ứ
u c
ắ
t ngang là tìm ra m
ố
i liên h
ệ
gi
ữ
a y
ế
u t
ố
nguy c
ơ
và b
ệ
nh; t
ứ
c là
so sánh t
ầ
n su
ấ
t m
ắ
c b
ệ
nh c
ủ
a nhóm có ti
ế
p xúc và không ti
ế
p xúc. Trong nghiên c
ứ
u này
toàn b
ộ
các phép
ñ
o ph
ả
i th
ự
c hi
ệ
n trong th
ờ
i
ñ
i
ể
m nh
ấ
t
ñị
nh.
Ví dụ 7.7:
T
ỷ
l
ệ
bò m
ắ
c b
ệ
nh viêm vú gi
ữ
a 2 tr
ạ
i (A và B) có s
ự
sai khác có ý ngh
ĩ
a hay
không? Bi
ế
t r
ằ
ng sau khi ki
ể
m tra 96 bò
ở
tr
ạ
i A và 72 bò
ở
tr
ạ
i B trong 1 ngày th
ấ
y s
ố
l
ượ
ng
bò m
ắ
c b
ệ
nh viêm vú t
ươ
ng
ứ
ng là 36 và 10.
Gi
ả
thi
ế
t H
0
: T
ỷ
l
ệ
bò m
ắ
c b
ệ
nh viêm vú
ở
hai tr
ạ
i là nh
ư
nhau v
ớ
i
ñố
i thi
ế
t H
1
: T
ỷ
l
ệ
bò m
ắ
c
b
ệ
nh viêm vú
ở
2 tr
ạ
i là khác nhau.
N
ế
u s
ử
d
ụ
ng phép th
ử
χ² ta
ñượ
c giá tr
ị
χ²
TN
= 11,535; giá tr
ị
χ²
(0,05; 1)
= 3,841.
K
ế
t lu
ậ
n:
Vì χ²
TN
> χ² t
ớ
i h
ạ
n nên có th
ể
k
ế
t lu
ậ
n r
ằ
ng t
ỷ
l
ệ
bò m
ắ
c b
ệ
nh viêm vú
ở
hai tr
ạ
i là khác
nhau. M
ặ
t khác ta có t
ỷ
su
ấ
t chênh OR = (36×62)/(60×10) = 3,72; t
ứ
c là s
ố
bò m
ắ
c b
ệ
nh viêm
vú
ở
tr
ạ
i A cao g
ấ
p 3,72 l
ầ
n so v
ớ
i s
ố
bò m
ắ
c b
ệ
nh
ở
tr
ạ
i B.
7.4.2. Tiến cứu (cohort studies)
Trong nghiên c
ứ
u này
ñộ
ng v
ậ
t
ñượ
c chia thành 2 nhóm; m
ộ
t trong hai nhóm s
ẽ
ti
ế
p xúc v
ớ
i
y
ế
u t
ố
nguy c
ơ
c
ủ
a b
ệ
nh, nhóm còn l
ạ
i là
ñố
i ch
ứ
ng. Theo dõi trong m
ộ
t th
ờ
i gian
ñể
xác
ñị
nh
s
ự
xu
ấ
t hi
ệ
n b
ệ
nh
ở
hai nhóm. C
ă
n c
ứ
vào k
ế
t qu
ả
thu
ñượ
c
ñể
k
ế
t lu
ậ
n gi
ữ
a y
ế
u t
ố
nguy c
ơ
và t
ỷ
l
ệ
m
ắ
c b
ệ
nh. Chính vì v
ậ
y nghiên c
ứ
u này
ñượ
c g
ọ
i là ti
ế
n c
ứ
u (cohort studies).
Thiết kế thí nghiệm
112
Ví dụ 7.8:
Xem xét ví d
ụ
7.5, t
ừ
m
ộ
t
ñ
àn tr
ướ
c khi cho ti
ế
p xúc v
ớ
i ngu
ồ
n b
ệ
nh, ch
ọ
n ra 10
ñộ
ng vât thí nghi
ệ
m (tiêm v
ắ
c xin) và 10
ñộ
ng v
ậ
t
ñố
i ch
ứ
ng (không tiêm v
ắ
c xin). S
ố
ñộ
ng
v
ậ
t này sau khi cho ti
ế
p xúc v
ớ
i ngu
ồ
n b
ệ
nh ta thu
ñượ
c k
ế
t qu
ả
nh
ư
trong b
ả
ng sau. Li
ệ
u v
ắ
c
xin có làm gi
ả
m t
ỷ
l
ệ
ch
ế
t hay không?
K
ế
t qu
ả
Thu
ố
c S
ố
ng Ch
ế
t T
ổ
ng hàng
V
ắ
c xin 9 1 10
ðố
i ch
ứ
ng 2 8 10
T
ổ
ng c
ộ
t 11 9 20
N
ế
u s
ử
d
ụ
ng phép th
ử
chính xác c
ủ
a Fisher ta có xác su
ấ
t P = 0,005477076
K
ế
t lu
ậ
n: V
ớ
i xác su
ấ
t này, gi
ả
thi
ế
t H
0
b
ị
bác b
ỏ
.
ð
i
ề
u này ch
ứ
ng t
ỏ
v
ắ
c xin
ñ
ã làm gi
ả
m t
ỷ
l
ệ
ch
ế
t. Bên c
ạ
nh
ñ
ó, nguy c
ơ
t
ươ
ng
ñố
i RR = (9/10)/(2/10) = 4,5. Hay nói m
ộ
t cách khác
ñộ
ng v
ậ
t s
ử
d
ụ
ng v
ắ
c xin m
ứ
c
ñộ
s
ố
ng sót g
ấ
p 4,5 l
ầ
n so v
ớ
i
ñộ
ng v
ậ
t không dùng v
ắ
c xin.
7.4.3. Nghiên cứu - bệnh chứng
hay
hồi cứu (case-control studies)
Trong nghiên c
ứ
u b
ệ
nh - ch
ứ
ng hay h
ồ
i c
ứ
u, các nhóm
ñộ
ng v
ậ
t nhi
ễ
m b
ệ
nh và không nhi
ễ
m
b
ệ
nh
ñượ
c ch
ọ
n ra, sau
ñ
ó ta
ñ
ánh giá trong quá kh
ứ
ñộ
ng v
ậ
t
ñ
ã ti
ế
p xúc v
ớ
i y
ế
u t
ố
nguy c
ơ
nh
ư
th
ế
nào. Vì v
ậ
y nghiên c
ứ
u b
ệ
nh - ch
ứ
ng mang ý ngh
ĩ
a c
ủ
a m
ộ
t h
ồ
i c
ứ
u.
Ví dụ 7.9:
Trong m
ộ
t nghiên c
ứ
u, có 62 bò s
ữ
a
ñượ
c ch
ẩ
n
ñ
oán ung th
ư
bi
ể
u mô m
ắ
t và 124
không m
ắ
c
ñượ
c ch
ọ
n ng
ẫ
u nhiên t
ừ
qu
ầ
n th
ể
. Có m
ố
i liên h
ệ
nào gi
ữ
a gi
ố
ng bò và t
ỷ
l
ệ
m
ắ
c
b
ệ
nh ung th
ư
bi
ể
u mô m
ắ
t hay không? N
ế
u s
ố
li
ệ
u thu th
ậ
p
ñượ
c nh
ư
sau:
Gi
ố
ng M
ắ
c b
ệ
nh Không m
ắ
c b
ệ
nh T
ổ
ng s
ố
Hereford 44 63 107
Gi
ố
ng khác 18 61 79
T
ổ
ng s
ố
62 124 186
Gi
ả
thi
ế
t H
0
: Không có m
ố
i liên h
ệ
gi
ữ
a gi
ố
ng và t
ỷ
l
ệ
m
ắ
c b
ệ
nh v
ớ
i
ñố
i thi
ế
t H
1
: Có m
ố
i liên
h
ệ
gi
ữ
a b
ệ
nh và gi
ố
ng
S
ử
d
ụ
ng phép th
ử
χ², ta có χ²
TN
= 6,876 và χ² (0,05;1) = 3,841.
K
ế
t lu
ậ
n:
Vì χ²
TN
> χ² t
ớ
i h
ạ
n nên ta bác b
ỏ
H
0
ch
ấ
p nh
ậ
n H
1
; ch
ứ
ng t
ỏ
có m
ố
i liên h
ệ
gi
ữ
a gi
ố
ng và
b
ệ
nh. T
ỷ
su
ấ
t chênh OR = (44×61)/(18×63) = 2,37. Hay nói cách khác gi
ố
ng Hereford m
ắ
c
b
ệ
nh ung th
ư
bi
ể
u mô m
ắ
t cao h
ơ
n 2,37 l
ầ
n so v
ớ
i các gi
ố
ng khác.
Chương 7 Kiểm ñịnh một phân phối và bảng tương liên
113
7.5. Bài tập
7.5.1
M
ộ
t trung tâm thu tinh nhân t
ạ
o ti
ế
n hành th
ử
nghi
ệ
m 3 ph
ươ
ng pháp th
ụ
tinh nhân t
ạ
o khác
nhau. T
ỷ
l
ệ
ph
ố
i có ch
ử
a
ở
3 ph
ươ
ng pháp thu
ñượ
c nh
ư
sau:
ở
ph
ươ
ng pháp I, có 275 bò có
ch
ử
a t
ừ
353 bò tham gia thí nghi
ệ
m; t
ươ
ng t
ự
ở
ph
ươ
ng pháp II, các con s
ố
này l
ầ
n l
ượ
t là
192 và 256 con, ph
ươ
ng pháp III là 261 và 384 con. T
ỷ
l
ệ
th
ụ
tinh thành công
ở
3 ph
ươ
ng
pháp này có khác nhau hay không?
7.5.2
Ch
ọ
n m
ẫ
u ng
ẫ
u nhiên th
ế
h
ệ
con c
ủ
a bò lang Shorthorn thu
ñượ
c k
ế
t qu
ả
sau
ñ
ây: 82 con màu
lông
ñỏ
, 209 con lang và 89 con tr
ắ
ng. Phân b
ố
màu lông c
ủ
a bò có tuân theo gi
ả
thi
ế
t r
ằ
ng
màu lông
ñượ
c xác
ñị
nh b
ở
i m
ộ
t c
ặ
p allen tr
ộ
i không hoàn toàn? Bi
ế
t r
ằ
ng tr
ộ
i không hoàn
toàn là tr
ườ
ng h
ợ
p có m
ộ
t allen tr
ộ
i và d
ị
h
ợ
p t
ử
th
ể
hi
ệ
n s
ự
ả
nh h
ưở
ng c
ủ
a
ñồ
ng th
ờ
i c
ả
2
allen.
7.5.3
M
ộ
t thí nghi
ệ
m
ñượ
c ti
ế
n hành nh
ằ
m
ñ
ánh giá s
ự
liên h
ệ
gi
ữ
a t
ỷ
l
ệ
viêm n
ộ
i m
ạ
c t
ử
cung và
gi
ố
ng. Trong t
ổ
ng s
ố
700 bò s
ữ
a trong nghiên c
ứ
u thu
ầ
n t
ậ
p (cohort studies), có 500 con
gi
ố
ng Holstein Friesian và 200 con gi
ố
ng Jersey. K
ế
t qu
ả
nghiên c
ứ
u thu
ñượ
c nh
ư
sau:
Viêm n
ộ
i m
ạ
c t
ử
cung T
ổ
ng s
ố
Có Không
Gi
ố
ng Holstein 100 400 500
Jersey 10 190 200
T
ổ
ng s
ố
110 590 700
Có s
ự
liên h
ệ
gi
ữ
a t
ỷ
viêm n
ộ
i m
ạ
c t
ử
cung và các gi
ố
ng hay không?
PHỤ LỤC
Một số thuật ngữ dùng trong giáo trình
Thuật ngữ
Tiếng Anh
Trang
Bảng tương liên Contigency table 101
Bậc tự do Degree of freedom 29
Biến ngẫu nhiên Random variable 8
Các số ñặc trưng của mẫu Statistics,Statistical measures,
Characteristics of a sample
10
Công thức Bayes Bayes rule 6
Công thức xác suất toàn phần Total probability formula 6
Chỉnh hợp Arrangement 5
Chỉnh hợp lặp Arrangement with repetition 5
Chấp nhận hay bác bỏ giả thiết Accept and reject hypothesis 18
Phân phối xác suất của biến rời rạc,
bảng (dãy) phân phối
Discrete probability distribution,
frequency array
6
Dung lượng mẫu (kích thước mẫu) Size of sample 40
Dự báo Prediction, forecasting 39
Dữ liệu ñịnh lượng Quantative data 8
Dữ liệu ñịnh tính Qualitative data 8
ðộ lệch chuẩn Standard deviation 13
ðộc lập Independent 22
ðộ nhọn Kurtosis 14
ðộ lệch, ñộ bất ñối xứng Skewness 14
ðộ tin cậy Degree of confidence 19
Giả thiết thống kê Statistical hypothesis 18
Giả thiết và ñối thiết Hypothesis and
alternative hypothesis
18
Giả thiết không (H
0
) Null hypothesis 18
Hàm phân phối Distribution function 6
Hàm mật ñộ xác suất Probability density function 6
Hiệp phương sai Covariance 89
Phụ lục
115
Thuật ngữ
Tiếng Anh
Trang
Hệ số góc Slope 93
Hoán vị Permutation 5
Hồi quy tuyến tính Linear regression 88
Kiểm ñịnh giả thiết Tests of hypotheses
Testing hypothesis
18
Kiểm ñịnh một phân phối Goodness of fit test 101
Kiểm ñịnh hai phía Two tailed test 18
ðối thiết hai phía Two side alternative 18
Kỳ vọng toán học Mathematical expectation 6
Mẫu quan sát Sample 40
Mod Mode 12
Nguyên tắc bình phương bé nhất Method(principle) of least squares 94
Nhật ñồ, tổ chức ñồ Histogram 15
Phân phối χ
2
Chi-square distribution 101
Phân phối chuẩn Normal distribution
Gaussian distribution
7
Phân phối chuẩn tắc Standard normal distribution 7
Phân phối hình học Geometric distribution 7
Phân phối Fisher Snedecor Fisher Snedecor distribution
F distribution
30
Phân phối liên tục Continuos distribution 7
Phân phối rời rạc Discrete distribution 6
Phân phối nhị thức Binomial distribution 6
Phân phối Poátxông Poisson distribution 7
Phân phối siêu bội Hypergeometric distribution 6
Phân phối Student Student distribution
t distribution
21
Phần trăm Percentage 15
Phép thử Experiment 18
Phương sai Variance (dispersion) 13
Quy tắc cộng xác suất Additive rule of probability 5
Quy tắc nhân xác suất Multiplicative rule 5
Rủi so (Sai lầm ) loại I và II Type I and II risk (error) 18
Sai số chuẩn Standard error 14
Thiết kế thí nghiệm
116
Thuật ngữ
Tiếng Anh
Trang
So sánh trung bình lấy mẫu theo cặp Paired comparaison for means 22
Sự kiện Event 5
Sự kiện cơ bản Element 5
Tương quan Correlation 88
Hệ số tương quan Correlation coeficient 89
Tần số Frequency 101
Thống kê mô tả Descriptive Statistics 10
Thiết kế hoàn toàn ngẫu nhiên Completely randomized design 46
Thiết kế khối ngẫu nhiên ñầy ñủ Radomized completely block design 54
Thiết kế kiểu chéo nhau Crossed design 71
Thiết kế kiểu phân cấp hay chia ổ Hierachical Nested design 76
Thiết kế kiểu chia ô Split plot design 80
Tổ hợp Combination 5
Tổng thể Population 9
Tứ phân vị Quartile 12
Trung bình cộng Mean, sample mean,
arithmetic mean, average
10
Trung vị Median 12
Tung ñộ gốc Intercept 93
Xác suất Probability 5
Ước lương, ước lượng tham số Estimate, estimation of parameters 19
Ước lượng ñiểm Point estimate
Ước lượng khoảng Interval estimate 19
Ước lượng khoảng của kỳ vọng
(Khoảng tin cậy của kỳ vọng)
Interval estimation of mean
(Confidence interval for mean)
19
Ước lượng khoảng của xác suất
(khoảng tin cậy của xác suất)
Interval estimation of Probability
(Confidence interval for p)
27
Phụ lục
117
Bảng các chữ viết tắt
Tên ñầy ñủ Viết tắt Trang
Phương sai của tổng thể
σ²
19
ðộ lệch chuẩn của mẫu quan sát s 13
Hệ số biến ñộng Cv% 14
Hệ số góc của ñường hồi quy tuyến tính b 93
Hệ số tương quan của mẫu r 89
Hệ số tương quan của tổng thể
ρ
96
Khoảng tin cậy CI 19
Mức sai cho phép, mức ý nghĩa
α (α = 1- P)
18
Mức tin cậy P 18
Mode Mod 12
Ngưỡng χ
2
ở mức α, bậc tự do df χ
2
(α,df)
102
Ngưỡng F ở mức α, bậc tự do dft, dfm F(α, dft, dfm)
30
Ngưỡng t ở mức α, bậc tự do df t(α,df)
21
Ngưỡng Z của phân phối chuẩn ở mức α Z(α)
19
Phân phối chuẩn
N(µ,σ
2
); X ~ N(µ,σ
2
)
7
Phương sai của sai số trong phân tích phương sai msE se
2
29
Phương sai của tổng thể
σ
2
19
Phương sai mẫu ñã ñiều chỉnh s
2
P
13
Phương sai s
2
13
Sai số chuẩn của hiệu số SED SE(D) 23
Sai số chuẩn
SE, se(
x
),
x
s
,
m
s
,
SE mean
14
Sai số của một quan sát trong phân tích phương sai
và trong phân tích hồi quy
se 29
Trung bình cộng
x
xtb
10
Trung bình của tổng thể
µ m
19
Trung vị Median Me 12
Tung ñộ gốc của ñường hồi quy tuyến tính a 93
Xác suất của tổng thể p 5
Tần suất trong mẫu f hay k 102