PHẦN II. THỐNG KÊ
§1. Khái niệm về phương pháp mẫu
1.1. Mẫu và đám đông
Chương VII. LÝ THUYẾT MẪU
+ Tập hợp tất cả các phần tử mà ta cần quan tâ
m
đến một (hay một vài) dấu hiệu chung về lượn
g
(hay chất) của các phần tử được gọi là đám đông.
Dấu hiệu nà
y
tha
y
đổi qua các phần tử tạo nên đạ
i
lượng ngẫu nhiên X.
+ Các đặc trưn
g
của X là các đặc trưn
g
của đá
m
đông.
+ Xét về lượn
g
, ta quan tâm đến 2 đặc trưn
g
sau
Trung bình đám đông
M(X)m=
,
Phương sai đám đông
2
D(X)s=
.
+ Xét về chất, ta quan tâm đến tỉ lệ p của các phầ
n
tử có tính chất A nào đó và X = {0; 1}.
+ Tập hợp nhỏ n phần tử được chọn ra từ đám đôn
g
để quan sát gọi là mẫu.
1.2. Phương pháp mẫu
Phương pháp mẫu là chọn ra n phần tử đại diện cho
đám đôn
g
, sau khi n
g
hiên cứu n phần tử nà
y
bằn
g
các công cụ thống kê ta rút ra kết luận cho toàn thể
đám đông.
+ Ta chỉ xét các kết quả quan sát độc lập.
1.3. Mẫu tổng quát và mẫu cụ thể
+ Mẫu gồm n phần tử quan sát độc lập (X
1
,X
2
,…,X
n
)
là mẫu tổng quát (mẫu ngẫu nhiên) với kích thước
mẫu là n.
+ Tiến hành quan sát, ta được các
g
iá trò cụ thể
jj
Xx, j1,n==
thì (x
1
,x
2
,…,x
n
) là mẫu cụ thể.
+ Khi xét l
y
ù thu
y
ết ta dùn
g
mẫu tổn
g
quát, thực
nghiệm thì ta dùng mẫu cụ thể.
+ Xác suất nghiên cứu đám đông để hiểu về mẫu
còn thống kê thì ngược lại.
1.4. Sắp xếp số liệu thực nghiệm
1.4.1. Sắp xếp theo các giá trò khác nhau
Giả sử mẫu (X
1
,X
2
,…,X
n
) có k quan sát khác nhau là
X
1
,X
2
,…,X
k
(
kn£
) và X
i
có tần số n
i
với
12 k
nn n n+++=
.
VD Kieồm tra n
g
aóu nhieõn 50 sinh vieõn, keỏt quaỷ
X 2 4 5 6 7 8 9 10
n
i
4 6 20 10 5 2 2 1
1.4.1. Sắp xếp dưới dạng khoảng
Nếu mẫu (X
1
,X
2
,…,X
n
) có nhiều quan sát khác
nhau, khoảng cách giữa các quan sát khôn
g
đồn
g
đều hoặc các X
i
khác nhau rất ít thì ta sắp xếp
chúng dưới dạng khoảng.
+ Xét khoảng
(
)
xx
min max
,
chứa toàn bộ quan sát
X
i
. Chia
(
)
xx
min max
,
thành các khoảng bằng nhau
(hay lớp ).
+ Số khoảng tối ưu là 1 + 3,322lgn, độ dài khoảng
là
xx
h
13322n
max min
,lg
-
=
+
.
VD Đo chiều cao của 100 thanh niên, ta có bảng
Tần suất
i
n
n
Lớp (khoảng)
Tần số
n
i
148 – 152
152 – 156
156 – 160
160 – 164
164 – 168
5
20
35
25
15
0,05
0,2
0,35
0,25
0,15
§2. CÁC ĐẶC TRƯNG CỦA ĐÁM ĐÔNG
VÀ MẪU
2.1. Các đặc trưng tương ứng (xem bảng tr. 119)
Chú ý Tỉ lệ mẫu
1n
n
XX
F
n
++
=
và trung
bình mẫu
1n
n
XX
X
n
++
=
khác nhau ở chỗ
trong F
n
, các X
n
chỉ có phân phối Bernoulli:
i
0
X
,
ì
ï
ï
ï
=
í
ï
ï
ï
ỵ
nếu phần tử không co ùtính chất A
1, nếu phần tử co ùtính chất A
2.2. Liên hệ giữa đặc trưng của mẫu
và đám đông
Khi cỡ mẫu n khá lớn (cỡ hàn
g
chục trở lên) thì các
đặc trưn
g
mẫu xấp xỉ các đặc trưn
g
tươn
g
ứn
g
của
đám đông
2
22 2
n
n
X Fp S S,, ,»m » »s »s
$
.
Trong thực nghiệm
2
22 2
n
n
x fp s s,, ,»m » »s »s
$
.
2.3. Kỳ vọng và phương sai các đặc trưng mẫu
2.3.1. Tỉ lệ mẫu F
n
()
()
1n
n
XX
MF M p
n
++
==
,
(kỳ vọng của tỉ lệ mẫu bằng tỉ lệ đám đông).
()
()
1n
n
XXpq
DF D
nn
++
==
,
(các X
i
có phân phối Bernoulli).
2.3.2. Trung bình mẫu
(
)
n
MX MX()=m=
.
()
2
n
DX
DX
nn
()s
==
.
2.3.3. Kỳ vọng của phương sai mẫu
()
2
2
n1
MS
n
-
=s
$
.
Mẫu có hiệu chỉnh
(
)
22
MS =s
(sử dụng khi xét ước lượng không chệch).
§3. PHÂN PHỐI CỦA CÁC ĐẶC TRƯNG MẪU
3.1. Phân phối của tỉ lệ mẫu F
n
Với n khá lớn thì
(
)
n
pq
FNp
n
,.Ỵ
3.2. Phân phối của trung bình mẫu
a/ Với
2
n30 ,³s
đã biết thì
2
n
XN
n
,
ỉ
ư
s
÷
ç
Ỵm
÷
ç
÷
ç
è
ø
b/ Với
2
n30 ,³s
chưa biết thì
2
n
S
XN
n
,
ỉ
ư
÷
ç
Ỵm
÷
ç
÷
ç
è
ø
Với n < 30, ta chỉ xét X và X
i
có phân phối chuẩn
c/
2
s
đã biết thì
2
n
XN
n
,
ỉ
ư
s
÷
ç
Ỵm
÷
ç
÷
ç
è
ø
.
d/
2
s
chưa biết thì ta xét
n
n1
X
T
S
n
-
-
m
=
có phân phối Student với n – 1 bậc tự do.
Cho bieỏt
a
vaứ n ta tớnh ủửụùc
n1
t
-
a
sao cho
[]
n1
n1
PT t
-
-a
>=a
[]
n1
n1
PT t 1 .
-
-a
Ê=-a
VD Cho n = 9,
005,a=
[]
91 91
91 005 005
P T t 0 05 t 2 306
,,
,,
-
>=ị=
.
3.3. Phân phối của phương sai mẫu
Giả sử đám đông
(
)
2
XN,Ỵms
, khi đó
()
n
2
2
2
n
i
222
i1
nn11
SS XX
=
-
== -
sss
å
$
sẽ có phân phối
2
n1-
c
.
§4. THỰC HÀNH TÍNH
CÁC ĐẶC TRƯNG MẪU CỤ THỂ
+ Trong mẫu có m phần tử có tính chất A mà ta
quan tâm thì
n
m
f
n
.=
+ Phương sai mẫu có hiệu chỉnh
()
n
2
2
2
n
i
i1
1n
SXXS
n1 n1
.
=
=-=
å
$
4.1. Tớnh
n
x
12 n
n
xx x
x
n
.
+++
=
a/ Neỏu x
j
laởp laùi n
j
lan thỡ
n
n
j
j
j1
1
xxn
n
.
=
=
ồ
b/ Nếu trừ tất cả x
j
cho x
0
nào đó để được các giá
trò mới
j
0
j
xxx
,
=-
thì
n
12
00
xx x
xxx x
n
,,
,
,
.
+++
=+= +
c/ Sau khi trừ ta lại chia tất cả cho h nào đó để được
j
0
j
xx
x
h
,,
-
=
, lấy giá trò trung bình
n
j
j1
1
xx
n
,,
,,
=
=
å
0
xhx x
,,
Þ= +
VD Ta coự 10 keỏt quaỷ quan saựt sau
102, 102, 202, 202, 202, 302, 302, 302, 302, 402.
Ta coự
1
x 102 2 202 3 302 4 402 1
10
(. . . .)=+++
.
ẹaởt
j
j
xx2
,
=-
1
x 100 2 200 3 300 4 400 1
10
,
(. . . .)ị= + + +
.
Ñaët
j
j
x2
x
100
,,
-
=
1
x1223344124
10
,,
(. . . .) ,Þ= +++ =
x 100 x 2 100 2 4 2 242
,,
,.Þ = += +=
4.2. Tính
2
s
$
()
2
22
sx x=-
$
trong ñoù
()
n
22 2 2
2
12 n j
j1
11
xxx x x
nn
=
=+++=
å
'
jj
22
0
s(x') s(x), x x x.== -
$$
22
j0
'''' 2
j
s(x) s(x).h
xx
, x .
h
=
-
=
$$
Chú ý
+ Nếu x là rời rạc thì x
0
= x
j
ứng với n
j
lớn nhất,
nếu x được chia thành lớp thì khi tính toán ta tính
các giá trò ở giữa các lớp đó.
+ h là khoảng cách giữa các x
j
.