Chương 5
CHỌN MẪU VÀ PHÂN PHỐI MẪU
1. Chọn mẫu từ một tổng thể
1.1 Tổng thể
Tổng thể là tập hợp tất cả các đối tương mà ta quan tâm nghiên cứu trong một vấn đề nào
đó. Số phần tử của tổng thể được ký hiệu là N.
- Nếu N là số hữu hạn ta có tổng thể hữu hạn
- Nếu N là số vô hạn ta có tổng thể vô hạn
1.2 Mẫu
Mẫu là tập hợp con của tổng thể. Số phần tử của mẫu ký hiệu là n (cỡ mẫu).
1.2.1 Mẫu ngẫu nhiên
Mẫu được gọi là mẫu ngẫu nhiên nếu nó được chọn một cách nào đó để đảm bảo tính
khách quan, ngẫu nhiên.
1.2.2 Phân loại mẫu theo phương pháp chọn mẫu
1.2.2.1 Mẫu không hoàn lại: Là mẫu được chọn bằng cách phần tử đã lấy ra quan
sát thì loại khỏi tổng thể rồi mới lấy phần tử tiếp theo
1.2.2.2 Mẫu hoàn lại: Là mẫu được chọn bằng cách phần tử đã lấy ra quan sát được
bỏ trở lại tổng thể rồi mới lấy phần tử tiếp theo
Ví dụ 1: Khi nghiên cứu về số cá trong một ao cá thì số cá trong ao là kích thước của tổng
thể.
Nếu từ ao ta bắt lên 5 con cá thì ta được một mẫu không hoàn lại, kích thước 5
Nếu từ ao ta bắt lên một con cá sau đó thả xuống ao mới bắt tiếp con khác, tiến hành như
vậy 5 lần thì ta được một mẫu có hoàn lại, kích thước 5.
1.2.3 Phân loại mẫu theo mục đích nghiên cứu
1.2.3.1 Mẫu định tính: Là mẫu mà ta chỉ quan tâm đến các phần tử của nó có một
tính chất A nào đó không
1.2.3.2 Mẫu định lượng: Là mẫu mà ta quan tâm đến một yếu tố về lượng của các
phần tử như khối lượng, chiều dài, nhiệt độ,…
2. Chọn mẫu ngẫu nhiên đơn giản
Đó là cách chọn n phần tử từ tập hợp chính gồm N phần tử sao cho mỗi tổ hợp trong
n
N
C
tổ
hợp đều có cùng khả năng được chọn như nhau. Kết quả của việc chọn này cho ta các mẫu
ngẫu nhiên (random sample).
1
Ví dụ 2: Một kệ chứa các đĩa nhạc với giá như sau
Giá ( ngàn VNĐ) 20 25 30 35 40
Số đĩa 35 10 25 17 13
Xét tổng thể về mặt định lượng:
*Lấy ngẫu nhiên 1 đĩa nhạc trong kệ
Gọi X là giá của đĩa nhạc này. Ta thấy X có quy luật ppxs như sau:
X 20 25 30 35 40
P 0.35 0.10 0.25 0.17 0.13
* Lấy ngẫu nhiên ( có hoàn lại) 4 đĩa nhạc từ trong kệ
Gọi X
i
là giá của đĩa nhạc thứ i lấy được i=1,…,4
Ta thấy các X
i
độc lập và có cùng quy luật ppxs giống như X
Lập W
X
= ( X
1
, X
2
, X
3
, X
4
), gọi là mẫu ngẫu nhiên.
3. Phân phối mẫu
Các mẫu đều có các đặc trưng thống kê của mẫu như số trung bình
X
, phương sai
2
X
S
Phân phối xác suất của các đặc trưng thống kê của mẫu được gọi là phân phối mẫu
4. Phân phối mẫu của trung bình mẫu
Phân phối mẫu của số trung bình của mẫu là phân phối xác suất của đại lượng
X
.
4.1 Kỳ vọng của số trung bình mẫu
Là giá trị trung bình của tổng thể
X
µ
. Nói cách khác, phân phối mẫu của
X
có số trung bình
là
X
µ
.
X
E(X) = µ
Với trung bình
N
i
i 1
X
X
N
=
µ =
∑
và phương sai
N
i
2
i 1
X
(X )
N
=
−µ
σ =
∑
Ví dụ 3: Giả sử tập hợp chính gồm 5 học sinh có số tuổi là 2, 4, 6, 8 và 10. Trong trường
hợp này số trung bình của tập hợp chính sẽ là
X
µ
= 1/5(2+4+6+8+10) = 6.
Giả sử lấy mẫu ngẫu nhiên không hoàn lại với cỡ mẫu là 2. Ta sẽ có
2
5
C
= 10 mẫu khác nhau
(với cỡ mẫu là 2). Và mỗi mẫu sẽ có số trung bình của mẫu
X
như sau :
Mẫu 2,4 2,6 2,8 2,10 4,6 4,8 4,10 6,8 6,10 8,10
X
3 4 5 6 5 6 7 7 8 9
Phân phối mẫu của số trung bình
X
là :
(Phân phối xác suất của đặc trưng thống kê của mẫu
X
)
Mẫu 3 4 5 6 7 8 9 10
X
0.1 0.1 0.2 0.2 0.2 0.1 0.1 0.1
2
Kỳ vọng của
X
là
X
E(X) 6= µ =
4.2 Phương sai của số trung bình mẫu
a) Trường hợp tổng thể vô hạn
Phương sai của số trung bình mẫu
X
được ký hiệu là
2
X
σ
2
2
X
X
Var(X)=
n
σ
σ =
b) Trường hợp tổng thể hữu hạn
Với
2
X
σ
là phương sai của tập hợp chính, n là cỡ mẫu.
2
2
X
X
N n
Var(X)=
n N 1
σ −
σ =
−
Ví dụ 4: Tính phương sai của
X
trong Ví dụ 3
4.3 Độ lệch chuẩn của số trung bình mẫu
Độ lệch chuẩn của
X
được ký hiệu
( )
X
σ
X
X X
n
σ
σ = σ =
Đối với tổng thể vô hạn
Hay
X
X
N n
N 1
n
σ
−
σ =
−
Đối với tổng thể hữu hạn
4.4 Lấy mẫu từ tổng thể tuân theo phân phối chuẩn
4.4.1 Luật phân phối của số trung bình mẫu
Nếu tổng thể của biến X tuân theo phân phối chuẩn với số trung bình là
X
µ
và
phương sai
X
σ
thì số trung bình mẫu
X
sẽ tuân theo phân phối chuẩn với số trung bình là
X
µ
và phương sai là
2
X
/ nσ
.
2
2
X
X X X
X ~ N( , ) X ~ N( , )
n
σ
µ σ ⇒ µ
4.4.2 Chuẩn hóa số trung bình mẫu
Đặt
X
X
X
Z
−µ
=
σ
Nếu
X
có số trung bình là
X
µ
và phương sai là
2
X
σ
thì Z có số trung bình là 0 và
phương sai là 1.
Nếu
2
X
X
X ~ N( , ) Z ~ N(0,1)µ σ ⇒
3
4.4.3 Định lý giới hạn trung tâm
Khi n lớn thì
X
X
X
Z
/ n
−µ
=
σ
sẽ gần đúng phân phối chuẩn chuẩn hóa hay
X
có phân
phối chuẩn với số trung bình là
X
µ
và phương sai là
2
X
/ nσ
Khi n lớn
2
X
X
Z ~ N(0,1)hay X ~ N ,
n
σ
⇒ µ
Ví dụ 5: Chiều dài của các cây thước kẻ trong dây chuyền sản xuất thước tuân theo phân
phối chuẩn với
µ
= 30cm. Độ lệch chuẩn xung quanh số trung trung bình là
σ
= 0,1cm.
Nhân viên thanh tra lấy mẫu với cỡ mẫu n = 4 và nhận thấy số trung bình của mẫu là X =
29875 cm. Tìm xác suất để số trung bình của mẫu nhỏ hơn hoặc bằng 29875cm.
Ví dụ 6: Một nhà sản xuất phụ tùng xe ôtô cho biết tuổi thọ của phụ tùng xe tuân theo luật
phân phối chuẩn với số trung bình là 36.000 dặm và độ lệch chuẩn là 4.000 dặm. Đối với
một mẫu được chọn một cách ngẫu nhiên với cỡ mẫu là 16 thì tuổi thọ trung bình của mẫu là
34.500 dặm. Nếu nhà sản xuất nói đúng thì xác suất để số trung bình mẫu nhỏ hơn hoặc
bằng giá trị của mẫu đã đo là bao nhiêu.
5. Phân phối mẫu của phương sai mẫu
5.1 Kỳ vọng của phương sai mẫu
Phương sai mẫu ký hiệu là
2
X
S
n
2 2
X i
i 1
1
S (X X)
N 1
=
= −
−
∑
Kỳ vọng của phương sai mẫu
( )
2
X
E S
chính là phương sai của tổng thể
2
X
σ
. Nói cách khác,
phân phối mẫu của
2
X
S
có số trung bình là
2
X
σ
.
( )
2 2
X X
E S = σ
Điều kiện: n <<N
5.2 Phương sai của phương sai mẫu
Phương sai của phương sai mẫu được ký hiệu Var(
2
X
S
).Var(
2
X
S
) tùy thuộc vào luật phân
phối của tổng thể. Nếu tổng thể tuân theo phân phối chuẩn thì
Var(
2
X
S
)
4
X
2
n 1
σ
=
−
5.3 Luật phân phối của
2
2
X
2
X
(n 1)S
(n 1)
−
= χ −
σ
Nếu tổng thể có phân phối chuẩn thì ta có
4
2
n
2
X
i
2 2
i 1
X X
(n 1)S 1
(X X) ~ (n 1).
=
−
= − χ −
σ σ
∑
Ví dụ 7: Một nhà sản xuất sữa hộp muốn trọng lượng trung bình của các hộp sữa sản xuất
ra phải gần bằng trọng lượng đã được quảng cáo. Giả sử phân phối trọng lượng của tập hợp
chính tuân theo phân phối chuẩn. Nếu lấy ngẫu nhiên 20 hộp đem đi kiểm tra. Tìm 2 số K
1
và K
2
sao cho :
a)
2
X
1
2
X
S
P K 0,05
< =
σ
b)
2
X
2
2
X
S
P K 0,05
> =
σ
6. Phân phối mẫu của tỷ lệ mẫu
6.1 Tỷ lệ mẫu
Gọi f là tỷ lệ mẫu thì ta có f = m/n
n: cỡ mẫu
m: số phần tử có tính chất A quan tâm trong mẫu
6.2 Kỳ vọng và phương sai của tỷ lệ mẫu
Giả sử F là tỉ lệ mẫu tổng quát, đặt X
i
=1 nếu phần tử thứ i có tính chất A và 0 nếu trái lại.
Nếu tổng thể có tỷ lệ p thì E(F)= p và Var(F) =
pq
n
.
6.3 Luật phân phối của tỷ lệ mẫu
Phân phối mẫu của tỷ lệ mẫu có thể được xẩp xỉ bởi phân phối chuẩn khi cỡ mẫu là đủ lớn
*np 5
*n(1 p) 5
≥
− ≥
pq
F ~ N p,
n
5