Chương VIII
ĐIỀU TRA CHỌN MẪU
NỘI DUNG CHÍNH
I.Những vấn đề chung của điều tra chọn mẫu (ĐTCM)
II.Điều tra chọn mẫu ngẫu nhiên
- Khái niệm, phân loại, ưu nhược điểm
- Tổng thể chung và tổng thể mẫu
- Chọn một lần và nhiều lần
- Sai số chọn mẫu và các nhân tố ảnh hưởng
- Sai số bình quân chọn mẫu và phạm vi sai số chọn mẫu
- Suy rộng kết quả điều tra chọn mẫu
- Các phương pháp chọn mẫu ngẫu nhiên thường dùng
III. Điều tra chọn mẫu phi ngẫu nhiên
I.Những vấn đề chung của ĐTCM
1.Khái niệm.
ĐTCM là điều tra thống kê không toàn bộ trong đó một số đơn vị
được chọn ra đủ lớn để điều tra thực tế rồi dựa vào kết quả điều tra
đó để tính toán suy rộng (ước lượng) cho toàn bộ hiện tượng.
Hai vấn đề cơ bản DTCM:
Quy tắc lựa chọn các đơn vị sao cho đại diện được cho toàn bộ tổng
thể.
Dùng công thức suy rộng thành các đặc điểm của tổng thể.
2. Phân loại
ĐTCM ngẫu nhiên: Các đơn vị tổng thể được chọn vào một
cách ngẫu nhiên không phụ thuộc vào ý muốn chủ quan của
người chọn, tức là khả năng được chọn của các đơn vị là như
nhau.
ĐTCM phi ngẫu nhiên: Lựa chọn dựa trên kinh nghiêm, sự
hiểu biết của người nghiên cứu về tổng thể hoặc chọn theo quy
định đặt ra.
3. Ưu điểm và nhược điểm
Ưu điểm:
Tiết kiệm do số đơn vị điều tra ít.
Nhanh gọn đáp ứng kịp thời nhu cầu thông tin.
Chất lượng tài liệu có độ chính xác cao.
Có thể mở rộng nội dung điều tra, đi sâu vào nhiều
mặt của hiện tượng.
Nhược điểm:
Không thể kết hợp nghiên cứu tổng thể và bộ
phận, đơn vị.
Kết quả suy rộng từ mẫu bao giờ cũng phát sinh
sai số.
Các trường hợp sử dụng ĐTCM
Dùng thay thế điều tra toàn bộ trong trường hợp
cần thiết.
Dùng để kiểm tra kết quả ĐTTB hoặc mở rộng
nội dung ĐTTB.
Dùng trong việc kiểm định giả thuyết thống kê
II. Điều tra chọn mẫu ngẫu nhiên
1.Tổng thể chung và tổng thể mẫu
Tổng thể chung (N)
Tổng thể mẫu (n)
2. Chọn hoàn lại và không hoàn lại
Chọn hoàn lại (chọn lặp)
Chọn không hoàn lại (chọn không lặp)
Theo cách nào thì mức độ đại diện cao hơn?
3. Sai số chọn mẫu
Sai số chọn mẫu là chênh lệch giữa mức độ được tính ra từ
tổng thể mẫu và mức độ tương ứng của tổng thể chung.
Sai số chọn mẫu phụ thuộc các yếu tố sau:
Số lượng đơn vị tổng thể mẫu.
Mức độ đồng đều về lượng biến của các tiêu thức nghiên cứu
trong tổng thể.
Phương pháp tổ chức chọn mẫu.
4. Sai số bình quân chọn mẫu
Cùng một hiện tượng và một quy mô mẫu nếu tiến
hành điều tra nhiều lần với các cách chọn mẫu
khác nhau sẽ có sai số chọn mẫu khác nhau.
Vậy giá trị đại diện cho tất cả các giá trị sai số
chọn mẫu gọi là sai số bình quân chọn mẫu.
Công thức tính sai số bình quân chọn mẫu.
Phương
pháp chọn
Suy rộng bình quân
σ2
σx=
n
Chọn hoàn lại
Chọn không
hoàn lại
Trong đó
σ2
hoặc
σ 02
σx=
n−1
Suy rộng tỷ lệ
p(1 − p)
σf =
n
σ2 n
σ 02 n σ = p(1 − p) 1 −
σx =
1 − hoặc σ x =
1− f
n
n N
n − 1 N
và
σ02 và
p
hoặc
σf=
f (1 − f )
n− 1
n
f (1 − f )
; σf=
1−
N
n−1
lần lượt là phương sai và tỷ lệ của tổng thể chung
f lần lượt là phương sai và tỷ lệ tổng thể mẫu
n
N
5. Phạm vi sai số chọn mẫu
Phạm vi sai số chọn mẫu là phạm vi chênh lệch giữa các chỉ tiêu tính
được từ tổng thể mẫu so với các chỉ tiêu tương ứng với tổng thể
chung tương ứng với một trình độ tin cậy nhất định.
∆ = t.σ
Trong đó: t là hệ số tin cậy ứng với trình độ tin cậy nhất định
∆ là phạm vi sai số chọn mẫu
σ
là sai số bình quân chọn mẫu
Ví dụ 1
Trong một DN gồm 1000 công nhân, chọn ra 100 công nhân theo
phương pháp chọn ngẫu nhiên đơn thuần (không trả lại) để điều tra
năng suất lao động. Kết quả:
Năng suất lao
động
Số công nhân
40-50
50-60
60-70
70-80
80-90
10
25
45
15
5
Yêu cầu: 1.Tính sai số bình quân chọn mẫu về năng suất lao động
bình quân
2.Tính phạm vi sai số chọn mẫu về tiền lương bình quân với
trình độ tin cậy là 0,9545
Ba bài toán cơ bản về điều tra chọn mẫu
Bài toán 1: Suy rộng tài liệu điều tra chọn mẫu
Điều kiện: Cho trước xác suất (độ tin cậy suy rộng tài
liệu)
Suy rộng bình quân:
Suy rộng tỷ lệ:
x− ∆x ≤ µ ≤ x+ ∆x
f − ∆ f ≤ p≤ f + ∆ f
Ví dụ 2
Địa phương có 1000 hộ, chọn ngẫu nhiên 200 hộ theo cách chọn
không lặp để điều tra về thu nhập bình quân hàng tháng của một
nhân khẩu của hộ:
Thu nhập BQ
Số hộ
Dưới 150
150 -200
200 – 250
250 – 300
300 – 350
350 – 400
Từ 400 trở lên
14
26
34
40
36
30
20
Tổng
200
a. Tính thu nhập bình quân hàng
tháng một nhân khẩu của địa
phương với xác suất (độ tin
cậy) 0,9544?
b. Xác định tỷ lệ số hộ có thu
nhập bình quân hàng tháng
một nhân khẩu dưới 200
nghìn đồng của địa phương
trên?
Thu nhập BQ
Số hộ fi
xi
xifi
x2fi
Dưới 150
150 -200
200 – 250
250 – 300
300 – 350
350 – 400
Từ 400 trở lên
14
26
34
40
36
30
20
125
175
225
275
325
375
425
1.750
4.550
7.650
11.000
11.700
11.250
8.500
218.750
796.250
1.721.250
3.025.000
3.802.500
4.218.750
3.612.500
Tổng
200
56.400
17.395.000
()
2
17.395.000
2
2
2
56.400
σ
=
x
−
x
=
−
282
= 7.451
x=
= 282 0
200
200
a. Thu nhập bình quân hàng tháng một nhân khẩu của địa
phương:
x− ∆x ≤ µ ≤ x+ ∆x
Trong đó: Độ tin cậy là 0,9544 nên t = 2
7.451
200
σx =
(1 −
) = 5,473 ∆ x = t.σ x = 2.5,473 ≈ 11
200 − 1
1000
Vậy:
282 − 11 ≤ µ ≤ 282 + 11
271 ≤ µ ≤293
Nghìn đồng
b. Tỷ lệ số hộ có thu nhập bình quân hàng tháng một nhân
khẩu dưới 200 nghìn đồng:
f −∆f ≤ p≤ f +∆ f
Với:
14 + 26
f =
= 0,2
200
σf =
f (1 − f )
n
0,2(1 − 0,2)
200
(1 − ) =
(1 −
) = 0,0253
n−1
N
200 − 1
1000
∆ f = 2.0,0253 = 0,0506
Do đó:
0,1494 ≤ p ≤ 0,2506
Bài toán 2: Tính xác suất (độ tin cậy) khi suy rộng tài
liệu
Điều kiện: Cho trước phạm vi sai số chọn mẫu ( ∆ )
Suy rộng bình quân:
∆
t=
Suy rộng tỷ lệ:
t=
x
σx
∆f
σf
⇒
Xác suất
⇒
Xác suất
Xét ví dụ 2:
c. Tính xác suất khi suy rộng tài liệu về thu nhập bình quân
một nhân khẩu của địa phương với phạm vi sai số không vượt
quá 16,42 nghìn đồng.
∆ x 16,42
t=
=
= 3⇒
σ x 5,473
Xác suất suy rộng tài liệu là 99,74%
d. Tính xác suất khi suy rộng tài liệu về tỷ lệ số hộ của địa
phương có thu nhập bình quân hàng tháng một nhân khẩu
dưới 200 nghìn đồng với phạm vi sai số không vượt quá
7,59%
∆ f 0,0759
t=
=
= 3 ⇒ Xác suất suy rộng tài liệu là 99,74%
σ f 0,0253
Bài toán 3: Tính số lượng đơn vị tổng thể mẫu (Giáo trình)