12/15/14
1
CHN MU V C MU TRONG
NGHIấN CU Y HC
PGS.TS. Lu Ngc Hot
Vin T YHDP v Y t Cụng cng
i hc Y H Ni
Mc tiờu bi hc
Kt thỳc khúa hc, hc viờn cú kh nng:
1. Phõn bit c cỏc phng phỏp chn mu c
bn ỏp dng trong nghiờn cu khoa hc;
2. Nu c u, nhc im ca tng phng
phỏp chn mu v ch nh ỏp dng trong tng
nghiờn cu c th;
3. Phõn bit c cỏc loi cụng thc tớnh c mu
thng ỏp dng v cỏc thnh phn c bn nờu
trong cụng thc tớnh c mu.
4. La chn c cụng thc tớnh c mu thớch hp
cho mt nghiờn cu c th.
Quần thể
Mẫu!
Lựa chọn
ngẫu nhiên!
Ngoại suy
ra quần thể
thông qua
các tham
số mẫu!
Quần thể!
Mẫu!
Lựa chọn
có chủ
đích!
Kết luận về
quần thể
thông qua ý
kiến của các
đối t%ợng NC!
Định l"ợng Định tính
(Bao nhiêu? Bằng nào?) Cái gì? Nh" thế nào? Tại sao?
Khác nhau về chọn mẫu
QUN TH CH
Qun th
nghiờn cu
Mu
Tham s qun th
(à, , P
)
Mu xỏc sut
Ngu nhiờn n
Ngu nhiờn h thng
Mu phõn tng
Mu chựm
Mu nhiu bc
Mu khụng xỏc sut
Mu kinh nghim
Mu thun tin
Mu ch tiờu
Mu cú mc ớch.
Chn
mu
c lng
im
Khong
Kim nh
gi thuyt
Suy lun
thng
kờ
(ch ỏp
dng cho
mu xỏc
sut vi
c mu
ln)
Kt lun ngoi suy
Cỏc test
thng kờ
Gớa tr p
La chn
Mụ t cỏc tham s mu
(
trỡnh by kt qu nghiờn cu)
Tham s mu
( , s, p )
Bin s
Thng kờ
mụ t
Thng kờ suy lun
Vai trũ ca chn mu v c mu trong NC
12/15/14
2
Mẫu trong nghiên cứu định tính
Quần thể!
Vấn đề!
Mẫu 1! Mẫu 4!
Mẫu 2! Mẫu 3!
Kiểm tra chéo
để hiểu sâu
sắc về vấn đề
và ý kiến của
các đối t%ợng!
Tại sao?!
Kim tra chộo thụng tin bng cỏc phng
phỏp thu thp s liu khỏc nhau
Quần thể!
1 vấn đề!
Phng!
vn!
Vẽ bản đồ!
Quan sát!
Thảo luận!
Kiểm tra tính
trung thực của
thông tin!
Tại sao?!
Các khái niệm liên quan đến quần thể
và mẫu.
" Quần thể đích.
" Quần thể nghiên cứu. !
" Mẫu nghiên cứu. !
" Đơn vị mẫu.
" Đơn vị nghiên cứu.!
" Khung mẫu.
" Một số khái niệm khác.!
Quần thể !
Là 1 tập hợp của nhiều đơn vị hay nhiều
cá thể có cùng 1 đặc tr"ng nào đó
Quần thể đích!
Là quần thể mà ng"ời nghiên cứu muốn
kết luận cho kết quả nghiên cứu của mình
Quần thể nghiên cứu!
Là quần thể mà từ đó 1 mẫu nghiên cứu
đ"ợc lấy ra.
12/15/14
3
Mẫu nghiên cứu!
Là 1 tập hợp con của 1 quần thể nghiên
cứu.
Có các đặc điểm đại diện cho quần thể
nghiên cứu !
Một mẫu tốt là mẫu có thể cho phép ngoại
suy ("ớc l"ợng) các đặc điểm cần quan tâm
của quần thể từ mẫu với độ chính xác và tính
kinh tế cao nhất.
Đơn vị mẫu!
Là 1 tập hợp hay 1 cá thể thuộc quần thể
nghiên cứu mà là cơ sở cho việc chọn mẫu.
Đơn vị nghiên cứu:!
Là chủ thể mà các đo l"ờng, nghiên cứu
triển khai trên chủ thể đó.
Khung mẫu!
Là 1 tập hợp các đơn vị mẫu.
Nó có thể là 1 danh sách hay 1 bản đồ.
đ"ợc chuẩn bị tr"ớc cho một số kỹ thuật
chọn mẫu.
Bốn yêu cầu khi lấy mẫu nghiên cứu.!
Tính đại diện.!
Thực hiện nhanh
Thực thi đ"ợc.!
Kinh tế!
!
Thiết kế chọn mẫu nghiên cứu!
Bốn tiêu chuẩn khi lấy mẫu nghiên cứu.!
!
Mỗi đơn vị hay cá thể trong quần thể có
cùng cơ hội nh" nhau đ"ợc chọn vào
mẫu (same opportunity).
Phng phỏp chn mu cú th mụ t
c (describable).
Ph"ơng pháp ít có sai số (unbiased).!
Thích hợp với thiết kế nghiên cứu
(appropriate).
12/15/14
4
Hai thiết kế chọn mẫu cơ bản.!
Mẫu xác suất,
Mẫu không xác suất
PP chọn mẫu xác suất chủ yếu:!
1. Ngẫu nhiên đơn.
2. Ngẫu nhiên hệ thống.
3. Ngẫu nhiên phân tầng.
4. Ngẫu nhiên theo chùm.
5. Ngẫu nhiên nhiều giai đoạn
Chọn mẫu theo ph$ơng pháp PPS
(Probability Proportionate to Size)
Phân biệt chọn mẫu và phân bổ mẫu
Quần thể
nghiên cứu
(10,000)
Mẫu NC
(500)
Chọn
mẫu
Mẫu NC
(500)
Nhóm
NC (250)
Chứng
(250)
Phân
bổ mẫu
Bi$tp$
" Mt$ngi$nghiờn$cu$mun$iu$tra$tỡnh$
trng$dinh$dng$ca$tr$em$di$5$tui$ti$
huyn$A$m$ti$ú$cú$2$th$trn$mt$s$xó$
min$nỳi,$mt$s$xó$ng$bng,$mt$s$xó$
ven$bin.$
Hi:$Theo$Anh/Ch$cỏch$chn$mu$no$l$thớch$
hp$nht?$Ti$sao?$
1. Mẫu ngẫu nhiên đơn (simple random sampling)
Là mẫu mà mỗi cá thể trong quần thể có cùng cơ hội
nh" nhau đ"ợc chọn vào mẫu.
Ph"ơng pháp:
Quyết định đơn vị mẫu là gì?
Lập danh sách đơn vị mẫu (khung mẫu) và
đánh số từng đơn vị mẫu .
Xác định số đơn vị mẫu cần có.
Xác định một số ngẫu nhiên (= PP ngẫu nhiên)
Lấy đơn vị mẫu có số trùng số ngẫu nhiên
vào mẫu.
Chọn mẫu xác xuất !
12/15/14
5
Sơ đồ chọn mẫu ngẫu nhiên đơn!
!
!
!
!
!
!
!
Chọn ngẫu nhiên!
Quần thể với cỡ N!
Mẫu với cỡ n
p
s
P!
à
!
!
X
Vớ d v bng s ngu nhiờn
1. Mẫu ngẫu nhiên đơn (tiếp)
Ưu điểm:
Đơn giản, dễ làm.
Có tính ngẫu nhiên và đại diện cao.
Là kỹ thuật chọn mẫu xác suất cơ bản sử
dụng ở các kỹ thuật chọn mẫu khác.
Hạn chế:
Cn cú khung mu v n v mu
n v mu phõn tỏn nờn phi i li nhiu
Do yu t may ri nờn nhiu khi s cỏ th
chn vo mu khụng i din cho dõn s
2. Mẫu hệ thống!
Đơn vị mẫu đầu đ"ợc chọn ngẫu nhiên. Đơn vị
mẫu tiếp theo đ"ợc chọn có hệ thống (một khoảng
hằng định theo sau 1 sự bắt đầu ngẫu nhiên)
Ph"ơng pháp:
Xác định và đánh số đơn vị mẫu (khung mẫu)
Khoảng cách mẫu k, k = Số cá thể trong quần thể
N/ cỡ mẫu n, (k= N/n).
Đơn vị mẫu đầu tiên (i) nằm giữa 1 và k bằng PP
ngẫu nhiên đơn.
Đơn vị mẫu tiếp theo: Cộng k với đơn vị mẫu đầu
tiên, tiếp tục cho đến khi đủ số mẫu:
i + 1k; i + 2k; i + 3k
12/15/14
6
Sơ đồ chọn mẫu ngẫu nhiên hệ thống!
!
!
!
!
!
!
!
Số ngẫu nhiên đ"ợc
chọn giữa 1 và k
i
i + k
i + 2k
i + 3k
i + (n-1)k
k k k k k k
2. Mẫu hệ thống (tiếp)!
Ưu điểm:
Nhanh và dễ áp dụng.
Không cần có khung mẫu tr"ớc.
Đơn giản trong điều kiện thực địa
Hạn chế:
Số liệu có tính chu kỳ, "ớc tính sẽ hạn
chế.
Đơn vị mẫu không xếp ngẫu nhiên hoặc
trùng với k, thiếu đại diện.
3. Chọn mẫu ngẫu nhiên phân tầng!
Chia cá thể từ quần thể thành các nhóm đ"ợc
gọi là tầng (strata) hay lớp (layer) có chung
các đặc điểm và chọn 1 mẫu ngẫu nhiên
trong mỗi tầng.
Ph"ơng pháp:
Phân quần thể thành tầng đồng nhất tùy đặc
điểm.
Chọn đơn vị mẫu trong mỗi tầng bằng PP
ngẫu nhiên đơn.
Sơ đồ chọn mẫu phân tầng!
!
!
!
!
!
!
!
Tất cả
bệnh viện!
B/V lớn! B/V vừa!
B/V nhỏ!
n
1
n
2
n
3
12/15/14
7
3. Chọn mẫu ngẫu nhiên phân tầng (tiếp)!
Ưu điểm:
Dễ phân các tầng với các yếu tố đồng nhất.
Tham số mẫu dễ tính
Có tính đại diện cao
Hạn chế:
Thiếu chính xác khi đơn vị mẫu ít ở mỗi
tầng.
Phải có tr"ớc danh sách cá thể mỗi tầng.
4. Mẫu ngẫu nhiên theo chùm!
Một quần thể đã đ"ợc nhóm thành các chùm theo các
tiêu thức khác nhau, đơn vị mẫu là chùm, từ đó N/C
trên cá thể của chùm đã đ"ợc chọn ngẫu nhiên.
Ph"ơng pháp
Xác định chùm thích hợp.
Lập danh sách chùm (khung mẫu).
Chọn chùm ngẫu nghiên từ danh sách.
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có danh sách)
của các chùm (chùm 1 bậc)!
- Lập danh sách, chọn cá thể bằng PP ngẫu
nhiên đơn hoặc hệ thống (chùm 2 bậc).!
!
Sơ đồ chọn mẫu chùm!
n
1
n
2
n
3
4. Mẫu ngẫu nhiên theo chùm (tiếp) !
u im:
Có thể điều tra phạm vi rộng, phân tán, không
có đ"ợc danh sách các đơn vị nghiên cứu.
Khung mẫu đơn giản (danh sách các chùm),
dễ lập.
điều tra dễ & nhanh vì đối t"ợng nghiên cứu
đ"ợc nhóm lại theo cụm.
Có hiệu quả kinh tế (kinh phí, thời gian).
WHO khuyến cáo dùng trong TCMR, CDD,
lao và sốt rét.
12/15/14
8
4. Mẫu ngẫu nhiên theo chùm (tiếp) !
!
Hạn chế:
Tính chính xác và tính đại diện thấp
Cỡ chùm lớn tính đại diện thấp, đặc biệt
bệnh hiếm.
Số chùm > 30 là tốt nhất.
Khó xác định mối quan hệ căn nguyên
Không phù hợp trong đo l"ờng thay đổi về
tình trạng SK, dịch vụ y tế, nguồn lực
Ph"ơng pháp WHO khuyến nghị (PPS)
áp dụng trong N/C cộng đồng khi P lớn và không đều.
1. Chọn huyện
Liệt kê đơn vị huyện cần nghiên cứu.
Chọn huyện = PP ngẫu nhiên hoặc không ngẫu nhiên.
2. Chọn xã
Danh sách và dân số xã của huyện đã chọn.
Tính dân số cộng dồn (tích lũy) của các xã.
Tính khoảng cách mẫu (k) = Dân số / 30 chùm.
Chọn 1 số ngẫu nhiên (i) nằm từ 1 đến (k), (i < k).
Chọn xã chứa chùm thứ nhất có dân số cộng dồn i.
Xã chứa chùm thứ 2 có dân số cộng dồn (i) + (k).
Xã chứa chùm tiếp theo bằng cách cộng liên tiếp
i + 2k; i + 3k; ) đến khi đạt 30 chùm.
Phng phỏp PPS (tip)
3. Chọn cá thể.!
Xác định số cá thể cần cho mỗi chùm =
Cỡ mẫu/ 30
Chọn các cá thể bằng 2 cách:
- Lấy tất cả các cá thể (nếu không có
danh sách) của các chùm!
- Lập danh sách, chọn cá thể bằng PP
ngẫu nhiên đơn hoặc hệ thống.!
5. Mẫu ngẫu nhiên nhiều giai đọan!
!
Nhóm tất cả các đơn vị mẫu trong quần thể
thành các nhóm có thứ bậc.
Ví dụ: Các hộ gia đình, các thôn, các huyện,
các tỉnh
Lấy ra: %1 mẫu tỉnh
1 mẫu huyện
1 mẫu thôn,
1 mẫu hộ gia đình,
1 mẫu các cá thể.
12/15/14
9
II/ C mu v cỏch c tớnh c mu
cho mt nghiờn cu c th
Yếu tố ảnh h"ởng đến cỡ mẫu
" Loại thiết kế nghiên cứu, nghiên cứu dọc hay ngang.
" Cách chọn mẫu: mẫu chùm có cỡ mẫu lớn hơn.
" Vấn đề nghiên cứu càng hiếm thì cỡ mẫu càng lớn.
" Số liệu càng phân tán thì cỡ mẫu càng lớn.
" Mức độ sai lệch cho phép giữa tham số mẫu và
tham số quần thể càng nhỏ thì cỡ mẫu càng lớn.
" Phân tích đa biến, phân tích tầng cần mẫu lớn hơn.
" Khả năng thực thi của nghiên cứu:
Một số nguyên tắc tính cỡ mẫu
" Cỡ mẫu chỉ tính cho biến phụ thuộc, trừ
nghiên cứu bệnh chứng.
" Khi 1 nghiên cứu có nhiều biến phụ thuộc
thì phải tính cỡ mẫu cho tất cả các biến,
sau đó chọn cỡ mẫu lớn nhất.
Cỡ mẫu "ớc l"ợng 1 tỷ lệ
n: Cỡ mẫu nghiên cứu cần có!
p: Tỷ lệ đối t"ợng có bệnh (từ NC tr"ớc hoặc NC thử)
(1-p): Tỷ lệ đối t"ợng không có bệnh
: Khoảng sai lệch mong muốn giữa tham số mẫu
và tham số quần thể.!
: Mức ý nghĩa thống kê th"ờng là 0,05 hoặc 0,01.!
Giá trị Z thu đ"ợc từ bảng Z ứng với giá trị .
Mức chính xác t"ơng đối
hoặc
12/15/14
10
Cỡ mẫu "ớc l"ợng 1 giá trị trung bình
n: Cỡ mẫu nghiên cứu cần có!
s: Độ lệch chuẩn (từ NC tr"ớc hoặc NC thử)!
: Khoảng sai lệch mong muốn giữa tham số mẫu
và tham số quần thể.!
: Mức ý nghĩa thống kê th"ờng là 0,05 hoặc 0,01.!
Giá trị Z thu đ"ợc từ bảng Z ứng với giá trị .
Giá trị trung bình (từ NC tr"ớc hoặc NC thử)
Mức chính xác t"ơng đối
hoặc
n
1
= n
2
= n: Cỡ mẫu nghiên cứu cần có!
p
1
,p
2
: Tỷ lệ mắc bệnh t"ơng tự nh" nhóm 1 và 2
(theo NC tr"ớc hoặc nghiên cứu thử)
: Khoảng sai lệch mong muốn giữa 2 tham số quần
thể (P
1
P
2
)!
: Mức ý nghĩa thống kê th"ờng là 0,05 hoặc 0,01.!
Mức sai lầm loại 2 cho phép
Giá trị Z thu đ"ợc từ bảng Z ứng với giá trị
Cỡ mẫu kiểm định 2 tỷ lệ
hoặc
Cỡ mẫu kiểm định 2 giá trị trung bình
n
1
=n
2
=n: Cỡ mẫu nghiên cứu cần có!
s: Độ lệch chuẩn từ NC tr"ớc hoặc NC thử = [(s
1
+s
2
)/2]!
: Khoảng sai lệch mong muốn giữa 2 tham số quần
thể!
: Mức ý nghĩa thống kê th"ờng là 0,05 hoặc 0,01.!
Mức sai lầm loại 2 cho phép
Giá trị Z thu đ"ợc từ bảng Z ứng với giá trị
hoặc
iu chnh c mu vi QT hu hn
" Cn lu ý rng, c mu tớnh c t cỏc cụng thc
nờu trờn l c mu tớnh cho cỏc nghiờn cu khi
qun th nghiờn cu ln (cũn gi l qun th vụ
hn). Trong trng hp c mu ny vt quỏ 5%
kớch thc ca qun th thỡ khi ú qun th c
gi l hu hn v c mu trờn cn c iu chnh
cho hp lý hn.
" Cụng thc iu chnh nh sau:
"
Trong ú:
nf = (n*N)/(n+N)
n
f
: C mu iu chnh cho qun th hu hn
N: Kớch thc ca qun th hu hn
n: C mu tớnh theo cụng thc
12/15/14
11
Cỡ mẫu trong nghiên cứu bệnh chứng
- p
1
: Tỷ lệ phơi nhiễm với yếu tố nguy cơ đ"ợc "ớc l"ợng
cho nhóm bệnh.
- p
0
: Tỷ lệ phơi nhiễm với yếu tố nguy cơ đ"ợc "ớc l"ợng
cho nhóm chứng (p
1
và p
0
đ"ợc lấy từ kết quả của
nghiên cứu tr"ớc hoặc nghiên cứu thử).
-
: %Mức độ chính xác mong muốn (chênh lệch cho phép
giữa tỷ suất chênh (OR) thực của quần thể OR thu
đ"ợc từ mẫu).
Cỡ mẫu trong nghiên cứu thuần tập
p
1
: Tỷ lệ mắc bệnh đ"ợc "ớc l"ợng trong nhóm tiếp
xúc với yếu tố nguy cơ
p
0
: Tỷ lệ mắc bệnh đ"ợc "ớc l"ợng cho nhóm không
tiếp xúc với yếu tố nguy cơ. Tỷ lệ p
1
và p
0
đ"ợc lấy
từ kết quả của NC tr"ớc hoặc NC thử.
: Mức độ chính xác mong muốn (chênh lệch cho
phép giữa nguy cơ t"ơng đối (RR) thực của quần
thể và RR thu đ"ợc từ mẫu).