Chương IV
MẪU THỐNG K Ê VÀ ư ớ c LƯỢNG THAM s ố
§4.1. M Ẫ U T H Ố N G KÊ VÀ P H Â N PHÔÌ THỤC N G H IỆM
4.1.1. T óm tắt lý thuyết
1.
N h iệ m vụ thống kê toán là phâìì liclì s ấ ìiệii (gồm ihu thập
và xử lý) n h ằm thu nhận các thông tin chân thực về một đại
lượng nào đó và rút ra các kết luận hợp lý có giá trị khoa học và
thực tiễn. G iáo trình sẽ giới hạn trong việc giới thiệu một sô
phương phấp xử lý số liệu.
Khái niệm cơ sở củ a thống kê toán là tập mẫ u, gọi tắt là mẫu;
đó là tập các đối tượng cùng bản chất được chọn một cách ngẫu
nhiên. T ậ p lìân được gọi là tập bao gồm mọi đối tượng cùng bản
chất nào đó, nơi m à chúng ta tiến h à n h việc chọn ra mẫu. DiiiiíỊ
lượng niẫii là số lượng các đối tượng có trong tập mẫu. Mẫu sẽ
được gọi là k h ô n g hoàn lại nếu đối tượng c h ọ n không bị Iiá lai
trước khi chọn đối tượng tiếp theo và c ó hoàn lại nếu k h ô n s làm
n h ư thế. T h ô n g thường mẫu được gọi là bé nếu dung lượng của
nó kh ô n g vượt quá 23 - 30 phần tử.
Tập m ẫu được xét trong giáo trình sẽ là tập các số - giá tri
của m ộl biến ngẫu nhiên X nào đó ở những phép thử khác nhau.
Sau
độc
các
c ho
102
này để cho đơn eiản ta giả sử c h ú n g được thu thập mộl cácli
lập; và khi đ ó về mặt lý thuyết có thể coi m ẫu như là mộl tập
biến ngẫu nhiên độc lập có cùng m ột phân phối (điổu này
phép chứng m in h các tính chất thống kê của các đặc írưng
mâu để ihấy lính hợp lý cùa việc sử dụng chúng cả về lý ihuyếl
và thực hành). Còn troiiíi các bài tập lính toán, m ẫ u đơn giản là
một dãy số thực như ta vẫn thường gặp trong toán nói chung.
2.
Khi nghiên cứu một inẫii có dung lượng //, kh ố n g loại irừ
khả nãng một giá trị nào xuất hiện nhiều lần trong mảu. Bằng
việc gộp các giá trị bằng nhau lại. ta có thể biểu diễn m ẫu bằng
b ã n s sau đây:
ỉỉ 1
//
trong đó
//,
chính là
tthỉ
X,
-V;
■\'l
2
n^
là số lần xuất hiện giá trị
.V,
( /
=
1, 2 ,
.vô’ của các giá trị lương ứng và //j +
Ả). Các
ỈỈ2 + . . . +
riị
/ỉ^ = /?.
Đồ ý rằng nếu tất cả các /í, đều bằng 1, ta sẽ có giá trị m ẫu khác
nhau và trong Irường hợp đó k - ỉỉ (dung lượng mẫu).
Tỷ số giữa tần số và dung lượng mẫu được gọi là tán s uất của
{i = 1, 2,.., k). Có
siá trị tương ứng và được ký hiệu là
Ihể chứng lỏ dễ dàng:
Ì 'V , = Ẻ
i=i
i=i
n
n
n
Bảng số sau đây thiết lập mối quan hệ tương hỗ giưa các giá trị
mẫu và tần suất c ủa chúng:
X
( 1 . 1)
^'2
và cho c h ú n g ta một bức tranh nào đó về hán chất xác suất c ủa
biến ngẫu nhiên X cảm sinh ra mẫu; vì vậy bảng s ố này h a y được
gọi là pliâìỉ p h ố i íỉìực lìịỊlìiệni (hoặc phân p h ố i m ẫ u) củ a biến X.
Nó có dạng rất giống bảng phân phối xác suất của b iến ngẫu
nhiên rời rạc (xcm mục 2.1). Đôi khi irong bảng (1.1) các giá trị
103
mẫu được cho kh ô n g phải b ằ n g số, m à bằng m ột k h o ả n g trên
trục số; sau này khi tính toán, th ô n g thường ta thay k h o ả n g số
bằng giá trị nằm giữa khoảng (như là tru n g bình c ủa khoảng).
Ngoài bảng (1.1) người ta còn xây d ự n g h à m p h á n p h ố i x ác
suất thực nghi ệm của biến ngẫu n h iên c ả m sinh ra mẫu; cách tìm
một hàm n h ư vậy giống như cách làm trong m ục 2.2 b ằ n g c á c h
coi ( 1.1) như là m ột bảng phân phối xác suất và các M’, là các xác
suất. N h ư vậy việc xác định h à m phân phối thực n g h iệ m sẽ c h ín h
là quá trình tìm tần suất tích luỹ (và kh i đ ó trong bảng (1.1) các
số liệu phải được sắp theo thứ tự tăn g d ầ n c ủ a giá trị).
Bây giờ có thể xác định c á c đ ặ c t r ư n g m ẫ u c ơ bản:
* Trưng bình mẫu
A" = —V /7 ,x ,
«tí
x=—
hoặc
'
( 1. 2)
» /=1
* P h ư ơ n g s a i mẫii
= -Y n,{x^-xf
” ,=1
hoặc
s2
(a . - x ) " .
(1.3)
« ,=1
Phươn g sai m ầ n hi ệu chỉnh
ụ .-x Ỵ .
hoặc
(1.4)
Dễ thấy
/ 7
- 1
* H à m p h â n p h ố i mẫu: G iả s ử t r o n g (1 .1 )
0
k h i
< X 2 < ...< Xị.
X < X , ,
h
t a
c
ó
F„U) =
k h i
/=^1
k h i
(1.5)
104
< X < ^ /,+ 1,
X > X
k•
( / /
=
1 , 2 . . . , ,
k -
1 )
Ngoài ra có thể xác định các đặc trưng mâu khác như trung vị
mẫu, m ô-m en m ẫ u ... Việc tính theo (1.2) - (1.4) sẽ xét ở mục 4.3.
3.
T rong thống kê m ỏ tả, để biểu diẻn quy luật phán phối xác
suất người ta còn dùng phương pháp đổ thị, chẳng hạn:
* Đư ờn g gấp k húc p h â n p h ố i là đường nối các điểm (X|, M’|),
(^ 2 , Wj),
(x^., vvj; hoặc các điểm (.V/, «/),
* T ổ chức đ ồ trên hệ toạ độ
X ị^
( a',
và giả sử chúng cách đều
v); trục hoành là toạ độ
h =
~ A',.
^ 2,
X j,
Ta dựng các hình
(hoặc M',) và chiều rộng bằng Ìì với
chữ nhật có chiều cao bằng
điểm giữa đáy chính là các
//<).
X ị . ..
4.1.2. C ác bài giải mẫu
B ài 1. Khi đo độ dài của 30 chi tiết chọn ngẫu nhiên của một
loại sản phẩm , người ta thu được số liệu sau đây:
39
41
40
43
41
40 44
42
41
43
41 42
39
40
42
43
41
41
42
39
42 42
41
42
40
41 43
41
39
40
X ây dựng; a) Bảng
phân
phối thực nghiệm và
hàm phân phối
m ẫu tương ứng; b) Đ ư ờng c o n g g ấ p kh úc phân phối c ủa độ dài
chi tiết đã đo.
Giải: S ố liệu đã c h o c ần tậ p hợ p lại vào bảng số sau đây:
X
39
40
41
42
43
44
n
4
5
9
7
4
1
a) Bảng p h â n phối thực n g h i ệ m của bộ số liệu gốc sẽ là:
X
w
39
40
7.
1
15
6
41
10
42
43
44
7
?
1
30
15
30
105
Từ b ả n g số trên bằng cách tìm các tần su ấ t tích luỹ (x e m c ô n g
thức (1.5) )ta có hàm phân phối m ẫu:
0
15
3
10
3
5
5
khi
X
< 39.
khi
39 < A- < 40,
khi
40
khi
41 <
khi
A 2 < x < 43,
khi
43 <
khi
A' > 44.
X
< 42,
6
30
1
X
< 44,
N ếu b iểu diễn trên đồ thị đây
là m ột h à m bậc thang.
b)
Đ ư ờng gấp khúc phân
phối c h o bởi hình 4.1: trục
tung ta ch ọ n đơn vị là r tị - tần
s ố củ a giá trị
A',
Hình 4.1
tương ứng .
B à i 2. Đ o đ ộ lệch của kích thước sả n p h ẩ m so với c h u ẩ n ta
được b ộ số liệu sau:
0,17
0,02
0,17
0,13
0,05
0,11
0 ,1 7
0,05
0,03
0,11
0,0 4
0 ,1 4
0,10
0,11
0,13
0 ,1 4
0 ,1 6
0,04
0,13
0.0 4
0,03
0,15
0,11
0,06
0,10
0,15
0 ,1 6
0,06
0,14
0 ,0 6
0,04
0,08
0,14
0,08
0,08
0 ,1 4
0 ,1 3
0,07
0,16
0,08
106
0 ,0 2
0,1 0 0,16
0 ,0 4
0,09
0,15
0,12
0,07
0,17
0,16
0 ,0 4
0,0 6 0,17
0,0 3 0,04
0,04
0,11 0,15
0,15
0,17
0,0 5
0,07 0,0 4
0,11 0,05
0,08
0,10 0,06
0,06
0,09
0,0 3
0,06 0,02
0 ,1 7
0,17
0,09
0,09 0,12
0,07
0,10
0 ,0 6
0,11 0,09
0 ,1 4 0 ,1 4
0,1 0
0,08 0,10
0,11
0,09
0,0 8
0,12 0,10
0 ,1 0 0,1 0
0,02
0,07 0,06
0,12
0,10
X á c đ ịn h b ả n g p h â n phối thực n g h iệ m và xây dựng tổ chức đồ
tương ứng.
Giải: Đ ộ lệch bé n h ấ t là 0,0 2 còn lớn nhất là 0,17; vì vậy
ta c h ia m ẫu th à n h 8 k h o ả n g với độ dài 0,02. B ản g phân phối
thực n g h i ệ m sẽ có d ạ n g {n - 100):
0,02-
0,04-
0,0 6 -
0,08-
0,10-
0,02-
0,14-
0,16-
0,0 4
0,06
0,08
0 ,1 0
0,12
0,14
0,16
0,18
0,08
0,13
0 ,1 4
0,13
0,19
0,08
0,12
0,13
X
T ố chức đ ồ của độ lệch cho bởi h ìn h 4.2
(')
0,20
0,10
0,02
0,06
0,10
0,14
0,18
X
Hình 4. 2
107
B ài 3. Cho bộ số liệu g ồ m 79 giá trị n h ư salu:
43
52
53
54
45
54
59
54
48
40
56
53
59
42
43
49
51
51
44
57
51
4 5 -. 50
42
51
56
57
50
50
51
55
50
53
48
46
47
51
51
57
52
48
5Í
50
47
53
57
55
50
50
49
52
48
51
60
48
53
62
51
49
61
42
50
51
60
51
50
57
55
49
53
56
49
46
55
56
47
50
47
54
X ây dựng b ả n g phân phối x ác suất thực n g h iệ m .
Giải: Kết quả cho bởi bảng sau đây: Cột 1 là các n h ó m số
liệu, cột 2 và 3 là tần s ố và tần số tích luỹ, cột 4 vẵ 5 là tần suất
và tần suất tích luỹ.
Nhóm
T ần số
Tần số
tíc h luỹ
T ần suất
T ần su ấ t
t c h lu ỹ (% )
40 - < 44
6
6
7,59
7,5 9
44 - < 48
9
15
11,39
18,99
48 - < 52
31
46
39,24
5 8 ,2 3
5 2 - < 56
17
63
21,52
7 9 ,7 5
56 - < 60
12
75
15,19
9 4 ,9 4
60 - < 64
4
79
5,06
100 ,0 0
Đ ể ý rằng cột 4 cho ta một hình ảnh xấp xi về híiĩi phân phối
mẫu. Cách xây dựng bảng phân phối thực nghiệm cưới d ạ n g cột
thường rất phổ biến trong các tài liệu của Mỹ - Anh.
Bài 4. Đ o độ dài của 30 chốt khoá của m ột loạ' sản p h ẩ m ta
đươc:
108
3.39
3,39
3,38
3,41
3,42 3,40
3,41 3,39
3,44
3,43
3,38
3,4 0
3,37
3,41
3,40 3,41
3,38
3.42
3,43
3,39
3.40
3,41
3.46
3,39
3,37 3,42
3,41 3,40
3,38
3,41
M ô tá d ã y số liệu đó bằng biểu đồ chấm , sau đó xác định bảng
phân phối thực nghiệm .
Giải-. Biểu đồ c h ấ m có thể xây dựng n h ư sau đây và tương
ứng với b iể u đồ là bảng phân phối thực ng h iệm
•
•
•
•
•
•
•
•
1—------ 1— ----- 1--3,37
3,38 3,39
X
•
•
•
1
3,40
•
•
•
•
•
•
•
•
3,41
3,42
3,43
•
•
1 ■ -i---------1
3,44 3,45 ,3,46
3,37
3,38
3,39
3,40
3,41
3,42
3,43
3,44
3,46
]
2
1
1
7
1
1
1
1
15
15
6
6
30
10
15
30
30
Đ ể ý rằng ngoài tổ chức đồ và biểu đổ chấm , còn có nhiều cách
m ô tả số liệu khác, chẳng hạn sơ đồ kiểu cây - lá, kỉểu hình tròn
v.v... M ục đích chung đều là tạo đồ thị để bằng trực giác xác
dinh dê d à n g các tần suất lớn nhó khác nhau ứng với các giá trị
tương ứng .
Bài 5. Cho m ộ t bảng phân phối thực n g h iê m n h ư sau:
1
9
3
4
0,4
0.1
0,3
0,2
l'ìin h à m phân phối m ẫu và vẽ đồ thị của nó.
Giải: T h e o c ô n g thức (1.5) ta có:
109
1 ^
f,,w =
n
n,=- - 1
n
'0
khi
X<1,
0,4
khi
1
0,5
khi
2 < X < 3,
0,8
khi
3 < a- < 4 ,
1
khi
a' >
biểu diễn
trên hình 4.3
4.
1
05
1
4.1.3. Bài tập
1. Cho bộ số liệu sau đây:
2
3
4
1Hình
lĩ_ • 4.
A3
X
-1,54
1,71
-0,59
-1,08
-1,18
-0,08
0,46
0,46
0,82
0,80
0,69
-1,41
-0,87
-0,27
0,08
-0,81
1,47
0,11
1,60
-0,42
0,98
0,90
-0,48
-0,48
0,25
-0,62
-0,81
-0,36
1,45
-0,13
0,78
1,33
0,03
-1,32
-0,09
0,17
0,47
-0,45
0,34
-0,72
-0,47
0,93
0,89
0,35
0,22
-1,92
0,20
-0,34
-1,05
2,18
-0,60
-0,91
-0,23
-1,50
0,47
0,41
-0,77
0,70
1,10
-1,31
0,79
-0,39
-1,16
-0,50
-0,60
-2,51
-0,73
-1,24
1,35
0,32
-0,21
0,29
0,07
1,00
0,28
1,56
0,43
1,41
0,04
0,05
0,88
0,12
-1,13
1,09
-1,04
-0,92
-0,63
0,30
0,08
0,30
1,89
0,05
1,50
0,84
1,92
0,11
0,71
1,78
110
-
1,08
-
-
-
0,68
-
Xác định bảng phân phối thực nghiệm, sau đó tìm đường gấp
khúc phân phối tương ứng.
2. Sau đây là giá c ủa m ột loại bất độ n g sản ở m ột huyện:
180
165
151
148
145
121
110
110
105
100
100
100
100
98
95
95
90
90
90
85
84
83
82
80
80
75
72
72
68
65
61
61
60
60
60
58
57
56
55
55
54
54
53
52
51
50
50
50
50
50
50
49
46
45
45
41
41
4 0 , 40
38
38
36
35
35
Xác định bảng phân phối thực nghiệm (lấy độ dài bằng 30 và bắt
đầu từ giá trị 30), sau đó vẽ tổ chức đồ và đường gấp khúc phân
phối của tần suất tích luỹ.
3.
T ừ m ộ t bộ s ố liệu về đ ộ dài, người ta đã xây dựng được
sơ đồ d ạ n g “ cây l á ” n h ư sau:
2,0 II 49, 39, 73, 30, 40, 23, 46, 94, 88, 65, 03, 20, 39, 65
2 , 1 II 65, 23, 54, 63, 68, 12, 92, 19, 71, 54,19,
13, 80,93, 94
2,2 |Ị 87, 74, 11, 25, 03, 02, 42, 97, 22, 54, 95, 89, 71, 75, 90,48
2,311 4 8 , 7 4 ,4 4 , 7 9 ,8 1 ,7 8
2.4 II 43, 24, 60, 26, 55, 73,07
2.5 II 09, 37,46, 39 ,0 3 , 11
2.6 II 4 2 , 4 3 , 2 2 , 9 9 , 64, 15,49
2.7 II 28,00, 38
2.8 II 29, 96, 60, 73, 14, 64
2.9
6 5 ,1 1 ,2 5 ,8 4 ,7 9 ,5 9
111
Trong sơ đồ này cây c h ín h là bộ s ố trước dấu , c ò n lá là các
số còn lại; để ý lá là các phần c h ữ số c ủ a phần th ậ p phân
(hàng chục và h à n g trăm, tức là chí số phần trăm và phần vạn
của số đo tương ứng; c h ẳ n g h ạ n ứng với cây 2,7 ta có các sỏ'
liệu gốc là 2,728; 2,700 và 2 ,7 3 8 ). H ã y xác định b ả n g phân
phối thực n g h iệ m ứng với sơ đ ổ c â y - lá này.
4. Q u a n sát m ột biến n g ẫ u n h i ê n 25 lần ta có bộ s ố liệu:
2
5
7
Ỉ
2
3
7
6
3
9
4
10
8
5
5
3
9
6
8
8
10
6
6
7
6
Xác định bảng phân phối thực n g h i ệ m và đ ư ờ ng gấp k h ú c phân
phối tương ứng.
5. Người ta chọn ra 65 lô h à n g của 2 tháng liên tiếp của cùng
mộl nhà m áy đem đi thử nghiệm , số lượng các phế phẩm là;
0 1 1 3 0 1 0 0 1 2 1 0 1
1 1 0 0 3 1 2 2 4
2 1 1 1 0 2 0 0 0 1 1 1 2 2 1 0 1
1 1 2 0 1
1 2 1 2 2 2 0 1 0 1 1 0 2 2 1 1 2 1 1 0 0
và
1 2 2 1 2 3 1 0 2 4 0 0 2 3 4 4 1
41
6 2 2 0 4 2 2 2 2 1
1 2 1 3
1 2 3 2 5
3 3 0 1
1 3 2 2 3 2 2 2 2 2 1 6 4 0 4 1 2 2 1
10
12
Xây dựng các đường gấp khúc p h â n phối tương ứng \'à c h o biết
chấl lượng của hai bộ lỗ h à n g của hai tháng đó có giống nhau
không? tại sao?
6. Số liệu sau đây là sô' k ỹ s ư đ ế n thực tập tại m ộ t h ã n g
trong vòng nửa n ă m tại các xí n g h i ệ p k h á c nhau:
112
59
70 79 73 79 45
71 67 61
69 61 59
73 71 67
69
6159 75 71 67
61 59 85
90 87 44
46 85 54
76
77 68 77 79 51 59 67 54
57 75 69
66 60 74
64
74 66 86 75 59
69 59 61
64 71 72
71 72 76
Hãy xá c đ ịn h bảng phân phối thực nghiệm . Sau đó vẽ các
đường gấp k h ú c p h â n phối và tổ chức đồ (ch ọ n độ dài khoảng
cách b ằ n g 10).
7. Đ i ể m s ố của sinh viên ở m ộ t lớp là (đ iể m tối đa là 100);
42 48
44
34 45 77 81 80 80
83 79 77
76 75
81
81 75
80 32
39 48
77 33 57
27 46 49
76 74
77
85 79
42
32 46 49 56 45 39
53 32 50
44 53
47
38 46
48
42 33 39 39 40 33
72 83 82
75 76
85
Xác đ ị n h b ả n g phân phối thực n g h i ệ m và đườ ng gấp k h ú c phân
phối. C ho n h ậ n xét về s in h viên lớp đ ó dựa vào đồ thị xác định
ở trên.
8. Cho b ản g phân phối thực n g h i ệ m có dạng:
Mhóm g iá trị
2 0 đến - 1 5
T ầ n suất (% )
3
- 1 , 5 đ ế n -1 ,0
13
-1 ,0 đ ế n -0 ,5
16
-
0,5 đ ế n 0,0
X á c định hàm phân
tương ứng và
vẽ đồ thị.
15
0,0 đ ế n 0,5
25
0,5 đến 1,0
14
113
1,0
đến 1,5
7
1,5
đến 2,0
7
9. T rọ n g lượng c ủ a các sản p h ẩ m c ủ a m ột lô h à n g là:
99,8
99,3 99,7
99,5 99,5
100,1 100.0 100,5
99.7
99,3 99,8
99,9 99,8
99,9
98,5
97,9 98,7
99,2 98,2
100,9
98.7
99.1 100,5 100,7 101.1 99.6
100.1
99,2
100.4 100,2
100.2
100,1
101,1 102,2
98 .6
97,0
100,2 100.3
9 9 ,8
99.2
Xác định bảng phán phối thực nghiêm và đường gấp khúc phân
phối. Sau đó tìm hàm phân phối m ẫu và đồ thị cùa nó.
§ 4 .2 , C Á C P H Â N PHỐI HAY D Ù N G T R O N G T H ố N G K Ê
4.2.1. Tóm tắt lý thuyết
1. Pliáìì p h ố i ciìitẩiì. ở chương II ta đã làm q u e n với biến
ngẫu nhiên có phân phối chuẩn và ký hiệu X ~ưi \ a , ơ ’) với a =
£X, ơ ■ = vx. Đ â y là phân phối l ất thường gặp trong thực t ế và
trong các điều kiện c ủa các bài tập sau này.
N ếu Y ~ ư ị \ 0 , ỉ ) ta nói rằng b iến n g ẫ u nhiên Y có p h â n phôi
c h uẩ n rút gọn ( h a y chu ẩn 0 - 1). Có ih ể c hứ ng tỏ r ằ n g nếu X
ơ ' ) thì:
z = ^ ~ „ r(o ,i).
114
A" - a
Phép biên đổi
được gọi là phép riìl gọn (hay qu y c h u ẩn
ơ
iheo nghĩa đưa inột biến ngẫu nhiên vé d ạ n g có kỳ vọ n g 0 và
phương sai bằng 1).
Bàv giờ
n
ế
u
ta có lì biến
n
g
ẫ
u
n
h
i
ê
i
đ ộ c lập
i
, V | ,
. V
, , . . . ,
A„
có
c ù n g pliân phối ch u ẩn C>r(a,cr“), thì có thể chứng m in h rằng
V = —(.V| + AS + ... + x„) cũ n g có phân phối c h u ẩ n
lĩ
ưi
a.
ơ
lỉ
có nghia là phương sai bé hơn fi lần phương sai c ủ a các biến
th àn h phần. Ta có thổ rút gọn X như Irên;
( 2. 1)
ưi (o a ).
ơ
Đ ế ý rằng tổ hợp lu y ến lính cửa các b iến ngẫu n h iên c h u ẩ n
tiế p lục là biến ngẫu n h iê n chuẩn.
2,
Flìúiỉ phổi klìi bìỉilì phiíơng, Nếu ta có ìì biến ngẫu n h iên
độc lập có cùno phân phối chuẩn ơi (0, 1) thì biến sau:
n
(2.2)
/--1
sc có phân phôi khi bình phương vứi n bậc tự do và k ý hiệu
n h ư sau X ~ ỵ~ (n). Việc lính loán xác suất liên quan đ ế n phân
phoi x~ i u) dược liến h à n h bằng bảng sò (xcni phụ lục A). Có
ihể tổng quát hoá kết q u á (2.2) nhu' sau; N ếu ta có ìì b iê n độ c
láp .V,, .V,___ V,, có phân phối c h u ẩ n (t,
ơ:
.V
ơ
I
~
c
'
( ‘(í/,, ơ ,’ )) thì:
X (n).
J
115
.V,
N gư ời ta đã tìm được kết q u ả sau rất có ích khi chứ ng
m inh các q u y tắc th ố n g kê: nếu ta có n b iến ngẫu n h iên V, (/■ =
1, 2 , . . . ,
n)
c ó c ù n g ph ân p h ố i c h u ẩ n n h ư n g k h ô n g b iết k ỳ v ọ n g
thì:
Xị ~ ư i '
- L x ( x ,- x f
^
(2.3)
i=ì
với X là tru n g b ìn h cộ n g c ủ a c á c b iế n
X,
ở trên.
3. P hân p h ố i Stin-đơn {plìân p h ố i t). Tỷ số giữa một biến
ngẫu nhiên z ~ơi'^{0, 1) và VÃVÃ?, trong đó X ~
(ii) sẽ là m ột
biến ngẫu nhiên có phân phối Stiu-đơn với n bậc tự do, ký hiệu:
-7 = ~
Giống n h ư phân phối chuẩn 0 - 1, phân phối r đối xứng qua gốc 0
(tức là có trung bình bằng 0). Khi n bé thì phân phối t có đường
cong mật độ “m ậ p ” hơn đường m ật độ tyí "(0,1), nhưng khi n k h á
lớn nó rất gần với chuẩn rút gọn, hay còn gọi là tiệm cận chuẩn.
Trong thực t ế nếu n > 30 thì đã có ihể coi phân phối / và c h u ẩn
rúl gọn là n h ư nhau.
Tổng quát hơn nếu ta có n biến ngẫu nhiên độc lập X có cùng
p h â n p h ố i c h u ẩ n n h ư n g k h ô n g b iế t p h ư ơ n g s a i, th ì:
/(«-!)
(2.4)
í
tro n g đ ó s~ được xác định th e o c ò n g thức (1.4)
4. Pliâtì p h ố i Pìii-sơ {phân p h ố i F). Nếu ta có hai biến ngẫu
nhiên có phân phối
:X ~
('') ''à Y ~
có phân phối F với hai bậc tự do là n và /??:
116
(m) thì ĩỷ s ố sau
Ằ//;
ị
—------ /• \n.m).
Y/m
’
.
Đ ường cong mật độ phân phối F , giống như với phân phối
!
không đối xứng và chi khác 0 với các giá trị dương. Cũng giống
n h ư phân phối
và /, việc tính toán với biến ngẫu nhiên có
phân phối F phải nhờ tới các bảng số (xem phụ lục A).
Một kết quả sau này ta hay dùng: Nếu ta có X|,
Vị,
}-2 , ■■■,}'><,
(các
và
là c á c b i ế n n g ẫ u n h i ê n đ ộ c lậ p , c ó p h â n p h ố i c h u ẩ n
c ó c ù n g p h â n p h ố i c h u ẩ n , c á c V, c ũ n g v ậ y ) ; k h i đ ó n ế u t a
xác định sf và theo công thức giống như (1.4), thì
2
sr
F { n ị - ],IÌ2
-l)
^'2
(2.5)
Chú ý bảng số chỉ xây dựng cho các giá trị Sị > s ỉ .
4.2.2. C á c bài giải m ẫ u
Bài 1. Cho biến ngẫu nhiên X c ó phân phối
suất
p[x
>
+ 4 (ký hiệu
(4, 1). Tim xác
là biến có phân phối
với 9
bậc tự do).
Giải: Ta tìm c ác h biến đổi biểu thức X >
+ 4 về dạng
c ó phân phối xác đ ịn h (ở đẳ y 2 ’g là biến ngẫu n h iê n có phân
p h ố i ỵ - với 9 bậc tự do). Đ ể làm điều ấy ta biến đổi bất đẳng
thức trẽn:
117
A(X-4 ) > ^
—> ^
} 1 9
2/3
2
Keo m e o
=
X-4
dễ thấy z ~ ol ( 0 ,l) và
.
Từ đó xác suất cần tìm có d ạ n g
P{T > 3),
với T = Z / ^ ỵ l / 9 ~ / ( 9 ). D ù n g b ả n g số chi tiết hoặ c p h ầ n m ề m
m áy tính tương ứng sẽ lìm được
p {r
> 3 ) = 0,0075 .
B ài 2. Cho À’ là biến ngẫu n h iê n ~
(9). Tìm xác suất để X
k h ô n g vượt q u á giá trị 2,7.
Giải: Ta phải tìm p { x < 2 , 1 ). Theo bảng phân phối
(xem phụ lục A) ở giao điểm của hàng n = 9 với cột a = 0,975 ta
có giá trị 2,7; điều đó có nghĩa là: P{T > 2 , 7 ) = 0,9 7 5 .T ừ đó xác
suất cần tìm là 0,025.
Bài 3- T ìm xác suất đ ể b iế n n g ẫ u n h iên T - í (17) có giá
trị; a) k h ô n g bé hơn 2,11; b) k h ô n g bé hơn - 2,11.
Giài\ a) T a phải tìm P{T > 2 , 1 1). Tra bảng phân phối /, lìm
giao điểm c ủ a h à n g /7 = 17 với cột a = 0,05 ta có giá trị 2,11;
vậy xác suất c ầ n tìm là 0 , 5 / 2 = 0,025 (xem phụ lục A).
b) Do tínli đối xúiig của phân phối t, P (í> - 2,11) = 1 - 0,025 = 0,975
(và bằng P{T>-2A 1)). Chú ý rằiig /'{7’| > 2 ,1 1) = 0,05 theo báng Stiu-đơn
(tìm/(17; 0,05)-2,11).
B ài 4. Cường độ chịu lực của một loại vật liệu xây d ự n g tuân
Iheo phân phối
118
(22); còn áp lực lên loại vật liệu đó sau khi xây
dựníz c ó luật J “ (9). Tìm xác suất dể vật liộu đó chịu được áp lực
đã biết.
Giải\ Trên thực tế ta phải tìm xác suất để cirờiig độ chịu lực
. Để
cúa vậl liệu phái bé hơn áp lực đã biết, tức là tìm p
xh
f ’ sẽ có phân phối F (9 ,2 2 ). xem (2.5). Tra
ý tỷ số
^22 / 2 2
bảng phân phối F với a - 0,05, giao điểm của hàng
«1
= 9 và
79
côt
= 22 cho ta kết quả 2,34 ^ ~
í
P [F >
2 ,3 4
->
)^ p
^
=p
>1
yX ịl
j
. Điều đó có nghĩa là
/
9 /9
/ ả /2 2
^ 22
= l \ F > 2 ,3 4 ),
9 ^
Suy ra x á c suất
> 1
p
0,05;
X 22
từ đó \ á c suất cần tìm là 1 — 0,03 = 0,95.
4.2.3. lìài tậ p
1. N ăng suất lúa của một vùng là biến ngẫu nhiên chuẩn X
~o ) ( í / , ơ ‘ ) với a = 50 tạlììíi và ơ = 3,5. Tim xác suất để khi gặt
ngầu nhiên một thửa ruộng ở \'ùna dó thì năng suất lúa sẽ:
a) K h ô n g vượt quá 40 tạ/ììíi:
h) Sai lệch so với nãnp, suíú truim bình chuna không vượt quá
lO^r.
2. Ngưòi ta kicin ira chất iượng 1000 sán phám và biết rằng
xác suất để sán phám đạt yêu cáu là 0,92. Hãy lìm với xác suất
119
0,954 xem số sản phẩm đạt yêu cầu nằm trong khoảng n à o (chọn
khoảng đối xứng với tâm đối xứng là 92 0 sản phẩm)?
3. Tim xác suất để biến ngẫu nhiên X ~ r (15) nhận giá trị: a)
không bé hơn 2,6; b) nằm giữa - 2 , 6 và 2,6; c) nằm giữa 0 và 2,6.
4. Lần thử nghiệm đầu tiên kết quả là một đại lượng tuân
theo l u ậ t / “ (4), còn lần thứ hai - tuân theo l u ậ t / " ( 6 ) . Tìm xác
suất để đại lượng của lần thử nghiệm thứ hai ít nhất lớn gấp 3 lần
đại lượng của lần thứ nhất.
5. Cường độ chịu lực của một loại vật liệu là biến ngẫu nhiên
tuân theo luật khi bình phương X ~ / “ (9) (với cường độ trung
bình là 9). Tim xác suất để loại vật liệu đó chịu được áp lực
không quá 19.
6. Cho X|, Xị,..., X, và F|, ^ 2 ,..., r , , là các biến ngẫu nhiên
độc lập có phân phối chuẩn với kỳ vọng 0, nhưng các Xị có
phương sai - và các y, có phương sai —. Tính
3
4
í
5
11
>
2
p
i
V
i=l
1=1
i =l
1=1
y
7. C h o X ~ j ' ( 3 ) , Y ~ / " ( 4 ) và X độc lập với Y. T im xác suất
â ể z
= x + Y
lớn hơn giá trị 16.
8. Cho X ~ ưí \ 6 A ) . Tim xác suất để trong hai phép thử độc
lập đều có kết quả x > 5,8.
9. Cho x ~ ưí ' (3,1), Y ~ ơi'\4,2). Tim xác suất để một quan
sát của X có giá trị lớn hơn một quan sát của Y.
10. Cho phương sai của một biến ngẫu nhiên bằng 25. Giả sử
chọn một mẫu có du n g lượng /ỉ = 16 của biến này. hãy tìm P{s >
4), trong đó 5^ là phương sai m ẫu hiệu chính.
120
§ 4 .3 UỒC LUỢNG ĐIỂM
4.3.1. T ó m tá t lý thuyết
1. Cho một mẫu
X |,
.v,,..., ,v„ có liên hệ với một tham số không
biết 6 và bài toán đặt ra là xác định ớ dựa trên thông tin mẫu trên.
Đây chính là bài toán ước ỉượuị> tham sổ. Tất nhiên do 6 không
biết và thông tin mẫu thường là chưa đủ nên việc xác định 6 chỉ là
x ấ p xỉ ( g ầ n đ ú n g ) . C ó t h ể c o i m ộ t h à m g i á trị ê{ Xị ,
x„) là
một ước lượng của ô . Như vậy từ nay về sau ta ký hiệu ước lượng
của một tham số 6 nào đó là ò (tham sô' có đội mũ).
Uơc lượng, được xác định bằng một số, sau này sẽ được gọi
là ì(ớc hrợng điểm. Phụ thuộc vào những tiêu chuẩn (hay nguyên
lý thống kê) khác nhau mà ta sẽ có các ước lượng khác nhau của
cùng một tham số.
X,) được gọi là không chệch, nếu ta có
* uiýc lượng
£'ớ = 0 ( h a y / ? ( ớ - ớ ) = 0 - ước lượng có lệch trung bình bằng 0).
Nếu không th ế ta có ước lượng chệch.
* ư&c lượng
Ớ (X |,...,
,Y„) được gọi là
vững,
nếu
n
lớn vô hạn
Ô sẽ hội tụ về ỡ theo xác suất (xem mục 2.4).
* ước lượng
,v„) được gọi là hiệu qitả, nếu nó là ước
lượng không chệch có phương sai bé nhất.
* Uơc lượng ớ(.v,..... x„) được gọi là Ììợp ì ỷ ììiìất, nếu nó làm
cực đại hàm hợp lý (hàm hợp lý chính là tích các hàm mật độ của
V, và các hàm đó có phụ ihuộc vào tham sỏ cần ước lư ợ n g )...
2. Có nhiều tham số lất được quan tâm và chúng ta phải tìm
ước lượng của nó.
121
Ucíc lượng của kỳ vọng của biến ngẫu nhiên X cảm sinh ra
*
m ẫu thường rất được chú ý. M ột Irong nhũìig ước iượng n h ư vậy
là trung bình m ẫu (xem công thức (1.2)) có nhiều tính chất thống
kê rất đẹp đẽ, c hẳng hạn nó vừa là không chệch, vừa là vững và
đồng thời có thể cũng hiệu q u ả ... Công thức (1.2) rất dễ dùng, dễ
tính và trong nhiều trường hợp nó có thể đơn giản hơn nữa;
c hẳng hạn nếu các .V, cách đều nhau một k h o ả n g là li, các tần số
xuất hiện
Xị
tương ứng là
lìị,
với m ột x„ chọn khá tuỳ ý, ta có thể
chứng minh:
(3.1)
với d: =
X: — X
. N h ư vậy nếu chọn x,| hợp lý, thay vì tính tổng
^ r i i X i , t h ư ờ n g gồm tổng của các tích thập phân, ta đưa về tính
tổng
Itĩịdị là tổng của các tích nguyên.
*
Phương sai của biến X cũng là một th a m số rất cần phải ước
lượng, chẳng hạn có thể dùng (1.3) hoặc (1.4). G iống như trong
công thức (3.1) có thể chứng m inh một c ô n g thức tương đương
như sau:
í ^
/r^
n -l
\i=ì
-
i=ì
n
(3.2)
Trong trường hợp các số liệu không cách đều hoặc chúng q u á ít,
có thể t iạij trực tiếp theo (1.3) hoặc (1.4) sẽ nhanh hơn. Tuy
nhiên có thể biến đổi chúng đi chút ít:
122
»
« /=1
hoặc
5’- = - x ( - " ' <
,=1
' w
« ,=l
•
*
N goài ra còn các đạc trưng mẫu khác cung đáng quan tâm
như: m ô -m en mẫu, trung vị m ẫu, tần suất m ẫu ...
3.
Có thể tổng kết các tính chất của các ước lượng điểm quan
trọng trong bảng số sau đây, với .V|. .Vị,..., .v„ là tập m ẫu cảm sinh
bởi biến ngẫu nhiên X có EX = a và vx = ơ ^ (riêng đối với xác
suất: m là số lần xuất hiện sự kiện trong n phép thử).
lliam
số
ước lượng
Kỳ
vọng
1 »
a = EX
» /=i
Phirơng
sai
Eồ
Tính chất
VỒ
n
Không chệch
vững
a
n
1
l(
n -1
ơ~
= vx
11 \
n-3
/^4
2'
,
»- 1
- mô-men
y
Không chệch
vững
trung lâm cấp 4
Xác
suấl p
ỉìl
/7
p
Á^-p)
n
Không chệch
vững
4.3.2. C á c bài giải m ẫ u
123
Bài 1. Cho mẫu A'|, A'2,..., A'„ c ả m sinh bởi một biến ngẫu nhiên
X ~ ưf
và ơ ^
Hãy tìm ước lượng hợ p lý nhất của hai tham số a
Giải: H àm mật độ chuẩn, ký hiệu l à / ( x . a , c r "), đã biết ở
chương II. H àm hợp lý, ký hiệu là L ( x ị , . . . , x „ , a , a ^ ) , sẽ có dạng:
»
/
L = n / ( X :,a,a
/=1
r
T
I
^
m L = - — ỉn 2 7Ĩ -
2
Chú
/ỉ
^
^. T .
,Ổ
1
.
9
~ ỉn
ơ
2
ý là điểm cực đại của IriL
^
■nll
2 tĩ
ìỉi Ị_/
cu n g c h ín h là điểm cực đại của L,
í
nên ta có thê giải hệ —- — = 0 (z =
dỡ;
V
1,2)..
w
Hệ phương trình hợp lý sẽ là:
ổlnL
õa
= 4 r ẳ f c - « ) = 0,
ỡ- /=1
ổlnL
n
2cr
= 0.
-^Ị
Rút ơ từ phương trình đầu thay vào p h ư ơ ng trình thứ hai, ta có
thể tìm được các nghiệm một c á c h dễ d à n g (chú ý là nếu hệ có
ng h iệm du y nhất thì nó chính là đ iể m cực đại của hàm hợp lý):
a
i=\
N hư vậy phương sai mẫu là ước lượng h ợ p lý nhất (mặc dù là ước
lượng chệch) của phương sai.
124
Bài 2. Đo độ dài của một loại trục xe, ta có bảng kết quả sau
đây (cột 1 và cột 2):
Số lượng
giá trị
Nhóm
í/,77,
dfn^
h
1 8 ,4 -1 8 ,6
1
18,5
-3
-3
9
1 8 ,6 -1 8 ,8
6
18,7
-2
-1 2
24
18,8 - 19,0
22
18,9
-1
-2 2
22
19,0 - 19,2
41
19,1
0
0
0
1 9 ,2 -1 9 ,4
19
19,3
1
19
19
19,4 - 19,6
7
19,5
2
14
28
19,6 - 19,8
4
19,7
3
12
36
z
100
8
138
Hãy ước lượng độ dài trung bình và phương sai.
Giải: Ta chọn giá trị g iữ a các k h o ả n g làm đại diện cho
khoảng đó. Bây giờ có thể dùng (3.1) và (3.2) để tìm các ước
lượng không chệch cho kỳ vọng và phương sai với x„ chọn = 19,1
và lì = 0,2. Các giá trị X, xếp vào cột thứ 3, còn dị xếp vào cột thứ
4; các tích í/,/7, và dỊriị n ằ m ở cột 5 và cột 6. Tổng của cột 2,
chính là dung lượng m ẫ u n = 100, tổng cột 5 và cột 6 sẽ được
dù n g để tính X vầL s^ :
x =
h
n- 1
+ ! i y „ dị = 1 9 ,1 + - ^ . 8 = 19,116;
"
' '
100
(z
)‘
n
0 ,0 4 r j 3 3 _ 64
99
100
0.0555.
125
B ài 3. Đ ể xác định độ chính xác của một chiếc cân tạ không
có sai số hệ thống, người ta tiến hành 5 lần cân độc lập (cùng
một vật), kết quả như sau:
94,1
9 4 ,8
9 6 ,0
9 5 ,4
9 5 ,2
(kg)
X ác định ước lượng không chệch của phương sai số đo trong hai
trường hợp: a) biết khối lượng vật cân là 95; b) không biết khối
lượng vật cân.
Giải: a) Khi đã biết trị trung bình lý thuyết a = 95 thì ước
lượng không chệch của phưofng sai được tính theo công thức (bạn
đọc có thể chứng m inh)
« /=1
J /=1
b) N ếu không biết a, ta phải ước lượng theo còng thức (1.2)
Từ đó ước lượng k h ông ch ệch của phương sai là;
= Ì Ẻ ( ^ . -« 5 .5 )" = 0 ,7 .
tỉ
i /=1
^ ,=1
B à i 4 . Đ o lượng huyết tương của 8 người mạnh khoẻ ta có:
2,75
2,86
3,37
2,76
2,62
3,49
3,05
3,12
Ợít)
X ác định các đặc trưng mẫu: a) trung bình; b) trung vị; c) m ốt.
Giải: a) ở đây « = 8 và việc tìm trung bình mẫu là không có
X =
gì khó khăn:
I
= 3,001.
8 ;=1
1_ \
T -x
^
_
.
_
_
•
s:
,
s
b) Đ ể tìm trung vị mẫu ta sắp xếp lại dãy số liệu
126