Tải bản đầy đủ (.pdf) (26 trang)

báo cáo xác suất thống kê nhóm 2 thầy Huy

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.2 MB, 26 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC ỨNG DỤNG
֎֎֎

BÁO CÁO BÀI TẬP LỚN MÔN
XÁC SUẤT VÀ THỐNG KÊ
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

HỌ VÀ TÊN: TRẦN HỒNG HẠNH
MSSV: 1411106
NHÓM – LỚP: DT02

THÀNH PHỐ HỒ CHÍ MINH THÁNG 07-2016


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

MỤC LỤCs
1. ĐỀ BÀI TẬP – ĐỀ SỐ 2 ............................................................................... 3
2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL ........................ 5
2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK
2015 (N.Đ.HUY). .............................................................................................. 5
2.1.1 Ví dụ 10 trang 172 ................................................................................. 5
2.1.2 Ví dụ 12 trang 181 ................................................................................. 8
2.2 Bài tập 2 ........................................................................................ 15
2.3 Bài tập 3 ........................................................................................ 18
2.4 Bài tập 4 ........................................................................................ 20
2.5 Bài tập 5 ........................................................................................ 24


GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 2


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ
NHĨM 2

1. ĐỀ BÀI TẬP – ĐỀ SỐ 2
1.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
1.2 Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của nhà máy sản xuất
pin–ắc quy người ta đo được mật độ nhiễm chì của họ như sau:
Số thứ tự
quan sát

Mức nhân tố

1
2
3
4
5
6
7

F1

F2


F3

F4

F5

0,25
0,28
0,32
0,22
0,22

0,22
0,25
0,24
0,28
0,31
0,21
0,22

0,25
0,26
0,28
0,25
0,22
0,28
0,31

0,31
0,33

0,30
0,29
0,25

0,22
0,28
0,28
0,25
0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà máy
nói trên.
Mức ý nghóa  = 3%.
1.3 Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40 – 50 tuổi
và nhóm từ 50 – 60 tuổi trong số các công nhân lành nghề ở Thụy Điển năm 1930.
Nhóm
tuổi

Thu nhập
0–1

1–2

2–3

3–4

4–6

6


40 –
50

71

430

1072

1609

1178

158

50 –
60

54

324

894

1202

903

112


Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các công
nhân lành nghề hay không? Mức ý nghóa  = 5%.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 3


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ
NHĨM 2

1.4 Theo dõi số học sinh đến lớp muộn của năm trường PTTH vào các ngày khác
nhau trong tuần người ta thu được số liệu về số lượng học sinh trung bình đến lớp
muộn của các trường đó vào một ngày tiêu biểu trong tuần như sau:

Ngày trong
tuần

Trường PTTH
A

B

C

D

Thứ hai
Thứ tư

Thứ sáu
Thứ bảy

5
4
4
4

4
5
3
4

5
3
4
3

7
2
5
2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có sự
khác biệt gì về số lượng học sinh đến lớp muộn vào các ngày khác nhau trong
tuần? Mức ý nghóa  = 1%.
1.5 Trong một thí nghiệm khoa học người ta nghiên cứu độ dày của lớp mạ kền khi
dùng ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày của lớp
mạ nhận được ở các bể:
Số lần đo ở bể mạ


Độ dày lớp mạ kền
tính bằng m

A

B

C

4-8

32

51

68

8 - 12

123

108

80

12 - 16

10


26

26

16 - 20

41

24

28

20 - 24

19

20

28

Với mức ý nghóa  = 0,05, hãy kiểm đònh giả thiết: độ dày lớp mạ sau khoảng
thời gian nói trên không phụ thuộc loại bể mạ được dùng.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 4


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2


2. PHÂN TÍCH BÀI TOÁN – GIẢI TOÁN TRÊN EXCEL

2.1 Trình bày lại ví dụ 10 trang 172 và ví dụ 12 trang 181 Sách GT XSTK 2015
(N.Đ.HUY).
2.1.1 Ví dụ 10 trang 172: Hiệu suất phần trăm (%) của một phản ứng hóa
học được nghiên cứu theo 3 yếu tố: pH (A), nhiệt độ (B) và chất xúc tác (C) được
trình bày trong bảng sau:
Yếu tố
Yếu tố
B
A
B1
B2
B3
B4
A1
C1
9
C2
14
C3
16
C4
12
A2
C2
12
C3
15

C4
12
C1
10
A3
C3
13
C4
14
C1
11
C2
14
A4
C4
10
C1
11
C2
13
C3
13
Hãy đánh giá về ảnh hưởng của các yếu tố trên hiệu suất phản ứng?

Bài làm:
 Dạng bài: Phân tích phương sai ba yếu tố.
 Ta giả thiết:
H0: Các giá trị trung bình của ba yếu tố pH (A), nhiệt độ (B) và chất xúc tác
(C) bằng nhau.
Ta tiến hành phân tích phương sai ba yếu tố trên và dựa trên bảng ANOVA để kết

luận ảnh hưởng của các yếu tố đến hiệu suất của phản ứng.
 Cơ sở lý thuyết:
Khi phân tích phương sai ba yếu tố ta thường dung mô hình vuông La tinh có dạng
như sau:
Yếu tố
A
A1
A2
A3
A4
T.i.

B1
C1
C2
C3
C4

B2
Y111
Y212
Y313
Y414
T.1.

C2
C3
C4
C1


GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Y122
Y223
Y324
Y421
T.2.

Yếu tố
B
B3
C3
C4
C1
C2

B4
Y133
Y234
Y331
Y432
T.3.

C4
C1
C2
C3

Y144
Y241

Y342
Y443
T.4.

Ti..
T1..
T2..
T3..
T4..

Page 5


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA:
Nguồn
sai số

Bậc tự do

Yếu tố
A
(hàng)

r-1

Yếu tố B
(cột)


Tổng số bình phương
2

SSR =

𝑟 𝑇𝑖..
𝑖=1 𝑟

r-1

SSC =

𝑇𝑗 ..
𝑟
𝑗 =1 𝑟

Yếu tố
C

r-1

SSF =

𝑇𝑘 ..
𝑟
𝑘=1 𝑟

Sai số


(r-1)(r-2)

Tổng
cộng

r2 - 1



2

2




𝑇...2
𝑟2
𝑇...2
𝑟2
𝑇...2
𝑟2

SSE = SST – (SSF + SSR +
SSC)
SST =

𝑖

𝑗


2
𝑘 𝑌𝑖𝑗𝑘 −

Bình phương
trung bình

Giá trị thống


MSR = SSR / (r 1)

FR = MSR /
SSE

MSC = SSC / (r 1)

FC = MSC
/SSE

MSF = SSF / (r 1)

F = MSF / SSE

MSE =

SSE
(r − 1)(r−2)

𝑇…2

𝑟2

Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:

 Tính các giá trị Ti… T.j. T..k và T
- Các giá trị Ti..
Chọn ô B7 và nhập biểu thức =SUM(B2:E2)
Chọn ô C7 và nhập biểu thức =SUM(B3:E3)
Chọn ô D7 và nhập biểu thức =SUM(B4:E4)
Chọn ô E7 và nhập biểu thức =SUM(B5:E5)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 6


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Các giá trị T.j.
Chọn ô B8 và nhập biểu thức =SUM(B2:B5)
Dùng con trỏ kéo kí hiệu tự điền từ ô B8 đến E8
Các giá trị T..k
Chọn ô B9 và nhập biểu thức =SUM(B2;C5;D4;E3)
Chọn ô C9 và nhập biểu thức =SUM(B3;C2;D5;E4)
Chọn ô D9 và nhập biểu thức =SUM(B4;C3;D2;E5)
Chọn ô E9 và nhập biểu thức =SUM(B5;C4;D3;E2)
- Giá trị T…
Chọn ô B10 và nhập biểu thức =SUM(B2:E5)

Tính các giá trị 𝐺 và 𝐺
- Các giá trị 𝑮 và 𝑮
Chọn ô G7 và nhập biểu thức =SUMSQ(B7:E7)
Dùng con trỏ kéo kí hiệu tự điền từ ô G7 đến ô G9
- Giá trị 𝑮
Chọn ô G10 và nhập biểu thức =POWER(B10,2)
- Giá trị 𝑮
Chọn ô G11 và nhập biểu thức =SUMSQ(B2:E5)
Tính các giá trị SSR, SSC, SSF, SST và SSE
- Các giá trị SSR, SSC và SSF
Chọn ô I7 và nhập biểu thức =G7/4-39601/POWER(4,2)
Dùng con trỏ kéo kí hiệu tự điền từ ô I7 đến ô I9
- Giá trị SST
Chọn ô I11 và nhập biểu thức =G11-G10/POWER(4,2)
- Giá trị SSE
Chọn ô I10 và nhập biểu thức =I11-SUM(I7:I9)
Tính các giá trị MSR, MSC, MSF, và MSE
- Các giá trị MSR, MSC và MSF
Chọn ô K7 và nhập biểu thức =I7/(4-1)
Dùng con trỏ kéo kí hiệu tự điền từ ô K7 đến ô K9
- Giá trị MSE
Chọn ô K10 và nhập biểu thức =I10/((4-1)*(4-2))
Tính giá trị G và F
Chọn ô M7 và nhập biểu thức =K7/0.3958
Dùng con trỏ kéo kí hiệu tự điền từ ô M7 đến ô M9
 Kết quả và biện luận:
-










FR = 3,1 < F0.05(3.6) =4,76 => Chấp nhận H0 (pH)
Fc = 11,95 < F0.05(3.6) =4,76 => Bác bỏ H0 (Nhiệt độ)
F = 30,05 < F0.05(3.6) =4,76 => Bác bỏ H0 (Chất xúc tác)
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 7


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Vậy chỉ có nhiệt độ và chất xúc tác gây ảnh hưởng tới hiệu suất.
2.1.2 Ví dụ 12 trang 181: Người ta dung ba mức nhiệt độ gồm 105, 120 và
135 C kết hợp với ba khoảng thời gian là 15, 30 và 60 phút để thực hiện một
phản ứng tổng hợp. Các hiệu suất của phản ứng (%) được trình bày trong bảng
sau đây:
o

Thời gian
(phút)
X1
15
30
60

15
30
60
15
30
60

Nhiệt độ (oC)
X2

Hiệu suất (%)
Y

105
105
105
120
120
120
135
135
135

1.87
2.02
3.28
3.05
4.07
5.54
5.03

6.45
7.26

Hãy cho biết yếu tố nhiệt độ hoặc yếu tố thời gian có liên quan tính tuyến với
hiệu suất của phản ứng tổng hợp? Nếu có thì điều kiện nhiệt độ 115oC trong
vòng 50 phút thì hiệu suất phản ứng sẽ là bao nhiêu?
Bài làm:
 Dạng bài: Hồi quy tuyến tính đa tham số.
 Ta giả thiết:
H0: Phương trình hồi quy không thích hợp.
Ta tìm phương trình hồi quy tính tuyến đa tham số để chỉ ra sự phụ thuộc hoặc
không phụ thuộc giữa yếu tố thời gian (X1) và nhiệt độ (X2) với hiệu suất phản ứng
tổng hợp (Y).
 Cơ sở lý thuyết:
Phương trình tổng quát cho biến phụ thuộc Y có liên quan đến k biến số độc
lập Xi (i=1,2,...,k):
𝑌𝑋1,𝑋2,…,𝑋 𝑘 = B0 + B1X1 + B2X2 + … + BkXk

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 8


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA:
Nguồn
sai số


Bậc tự do

Tổng số bình phương

Bình phương trung
bình

Giá trị thống


Hồi quy

k

SSR

MSR = SSR / k

F = MSR /
MSE

Sai số

N-k-1

SSE

MSE = SSE / (N - k 1)

Tổng

cộng

N-1

SST = SSR + SSE

Giá trị thống kê:
 Giá trị R-bình phương:
Giá trị R2:
𝑹𝟐 =

𝑺𝑺𝑹
𝑺𝑺𝑻

𝒌𝑭

=

𝑵−𝒌−𝟏 +𝒌𝑭

(R3 ≤ 0.81 là khá tốt)

Giá trị R2 được hiệu chỉnh (Adjusted R Square)
𝑹𝟐𝒊𝒊 =

𝑵 − 𝟏 𝑹𝟐
𝒌(𝟏 − 𝑹𝟐 )
= 𝑹𝟐 −
𝑵−𝒌−𝟏
𝑵−𝒌−𝟏


𝑹𝟐𝒊𝒊 sẽ trở nên âm hay không xác định nếu R2 hay N nhỏ
 Độ lệch chuẩn:
𝑺=

𝑺𝑺𝑵

(S ≤ 0.30 là khá tốt)

(𝑵−𝒌−𝟏)

Trắc nghiệm thống kê:
 Trắc nghiệm t:
Bậc tự do của t: 𝜸 = N - k - 1
𝒕=

𝑩𝒊 −𝜷𝒊
𝑺𝟐
𝒏

;

𝑺𝒏 =

𝑺𝟐
(𝑿𝒊 −𝑿)𝟐

 Trắc nghiệm F:
Bậc tự do của giá trị F: v1 = 1, v2 = N -k – 1
 Giải toán trên Excel:

Nhập dữ liệu theo cột:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 9


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Sử dụng Regression: Data -> Data Analysis

Trong cửa sổ Data Analysis chọn Regression:

Hồi quy theo Thời gian (X1):
Các thông số:
- Input Y Range: Phạm vi biến số Y
- Input X Range: Phạm vi biến số X
- Labels: Dữ liệu bao gồm nhãn
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 10


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

- Confidence Level: Mức tin cậy (chọn 95%)
- Output options: Chọn New Worksheet Ply (Xuất kết quả ở sheet Thời gian)


Kết quả:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 11


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX1 = f(X1) = 2.7667 + 0.0445X1 với R2 = 0.2139 và S = 1.8112
t0 = 2.1290 < t0.05 = 2.365 (tra bảng VII với n = 7, α = 0.025) hay 𝑃𝑉2 =
0.0708 > α = 0.05
 Nên chấp nhận giả thiết H0.
t1 = 1.3802 < t0.05 = 2.365 hay PV = 0.2100 > α = 0.05
 Nên chấp nhận giả thiết H0.
3
F = 1.9049 < 𝐹0.05
= 5.590 (tra bảng VIII với n1 = 1 và n2 = 7) hay 𝐹𝑆4 =
0.2100 > α = 0.05

 Nên chấp nhận giả thiết H0.
Vậy phương trình hồi quy trên không có ý nghĩa thống kê. Nói 1 cách khác,
phương trình hồi quy này không thích hợp.
Kết luận: Yếu tố thời gian không có liên quan tính tuyến với hiệu suất của
phản ứng tổng hợp.
Hồi quy theo Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$B$1:$B$10

Kết quả:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 12


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX2 = f(X2) = -11.1411 + 0.1286X2 với R2 = 0.7638 và S = 0.9929
t0 = 3.4179 > t0.05 = 2.365 hay 𝑃𝑉2 = 0.0112 < α = 0.05
 Nên bác bỏ giả thiết H0.
t1 = 4.7572 > t0.05 = 2.365 hay PV = 0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
3
F = 22.6309 > 𝐹0.05
= 5.590 hay 𝐹𝑆4 = 0.0021 < α = 0.05

 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương
trình hồi quy này thích hợp.
Kết luận: Yếu tố nhiệt độ có liên quan tính tuyến với hiệu suất của phản ứng
tổng hợp.
Hồi quy theo Thời gian (X1) và Nhiệt độ (X2):
Các thông số ở cửa sổ Regression như Hồi quy theo X1, trừ Input X Range là
$A$1:$B$10
Kết quả:


GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 13


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Phương trình hồi quy:
ŶX1, X2 = f(X1,X2) = -12.7000 + 0.0445X1 + 0.1286X2 với R2 = 0.9777 và S
= 0.3297
t0 = 11.5283 > t0.05 = 2.365 hay 𝑃𝑉2 = 2.5607E-05 < α = 0.05
 Nên bác bỏ giả thiết H0.
t1 = 7.5827 > t0.05 = 2.365 hay PV = 0.0003 < α = 0.05
 Nên bác bỏ giả thiết H0.
t2 = 14.3278 > t0.05 = 2.365 hay PV = 7.2338E-6 < α = 0.05
 Nên bác bỏ giả thiết H0.
F = 131.3921 > F0.05 = 5.140 (tra bảng VII với n1 = 2 và n2 = 6) hay FS =
0.0021 < α = 0.05
 Nên bác bỏ giả thiết H0.
Vậy phương trình hồi quy trên có ý nghĩa thống kê. Nói 1 cách khác, phương
trình hồi quy này thích hợp.
Kết luận: Hiệu suất phản ứng có liên quan tính tuyến với cả hai yếu tố là thời
gian và nhiệt độ.
Dữ liệu với hàm hồi quy Y = -12.7000 + 0.0445X1 + 0.1286X2:

Vẽ biểu đồ: chọn ô C2, vào Insert -> Scatter -> Scatter with only Maker
Sự tính tuyến của phương trình hồi quy YX1, X2 = -12.7000 + 0.0445X1 + 0.1286X2
có thể được trình bày trên biểu đồ phân tán:
GVHD: PGS.TS. NGUYỄN ĐÌNH HUY


Page 14


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ

Hàm lượng dự đốn (Y’)

NHĨM 2

Hàm lượng thực nghiệm (Y)

Dự đốn hiệu suất của phản ứng bằng phương trình hồi quy tại nhiệt thời gian (X1)
50 phút, nhiệt độ (X2) 115oC:
Cơng thức ơ E3:
=B1+B2*E1+B3*E2
Kết quả: 4.3109

2.2 Kiểm tra sức khỏe của 29 công nhân ở năm phân xưởng của nhà máy sản xuất
pin–ắc quy người ta đo được mật độ nhiễm chì của họ như sau:
Số thứ tự
Mức nhân tố
quan sát
F1
F2
F3
F4
F5
1
2

3
4
5
6
7

0,25
0,28
0,32
0,22
0,22

0,22
0,25
0,24
0,28
0,31
0,21
0,22

0,25
0,26
0,28
0,25
0,22
0,28
0,31

0,31
0,33

0,30
0,29
0,25

0,22
0,28
0,28
0,25
0,30

So sánh mức độ nhiễm chì đối với công nhân ở các phân xưởng của nhà
máy nói trên.
Mức ý nghóa  = 3%.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 15


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bài làm:
 Dạng bài: Phân tích phương một yếu tố.
 Ta giả thiết:
H0: Các giá trị trung bình mức độ nhiễm chì của các công nhân của năm phân
xưởng bằng nhau.
Ta tiến hành phân tích phương sai một yếu tố trên và dựa trên bảng ANOVA để so
sánh mức độ nhiễm chì của các công nhân của nhà máy nói trên.
 Cơ sở lý thuyết:

Khi phân tích phương sai một nhân tố ta tiến hành dựng mô hình:

 Giải toán trên Excel:
Nhập dữ liệu vào bảng như sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 16


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Vào Data/Data Analysis.
Chọn Anova: Single
Factor.
Trong hộp thoại Anova Single Factor điền dữ liệu vào: Chọn vùng dữ liệu,
chỉnh lại chỉ
số Alpha: 0,03.

Sau đó bấm OK để cho ra kết quả:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 17


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ
NHĨM 2


 Phân tích kết quả: F = 1.58278429 < F0.03 = 3.21831


Chấp nhận giả thiết Ho

 Kết luận: Vậy mức độ nhiễm chì ở mỗi phân xưởng là như nhau.
2.3 Bảng sau đây cho ta phân bố thu nhập của hai nhóm tuổi: Nhóm từ 40 – 50
tuổi và nhóm từ 50 – 60 tuổi trong số các công nhân lành nghề ở Thụy Điển
năm 1930.
Nhóm
tuổi

Thu nhập
0–1

1–2

2–3

3–4

4–6

6

40 –
50

71


430

1072

1609

1178

158

50 –
60

54

324

894

1202

903

112

Có sự khác nhau về phân bố thu nhập giữa hai nhóm tuổi này trong số các
công nhân lành nghề hay không? Mức ý nghóa  = 5%.
Bài làm
 Dạng bài: So sánh 2 tỉ số.
 Ta giả thiết:

H0: Sự phân bố thu nhập giữa hai nhóm tuổi này trong số các cơng nhân lành nghề
là giống nhau.
Ta tiến hành tính tốn các tỉ số và so sánh để có thể kết luận phân bố thu nhập giữa
2 nhóm tuồi này trong số các cơng nhân lành nghề có khác nhau hay khơng.
 Giải tốn trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 18


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

ni = SUM (hàng)
mj = SUM (cột)

Tính dữ liệu kỳ vọng ij theo công thức ij = ni* mj /n ta được bảng sau:

Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:H4,C9:H10)
= 0.5116

 Phân tích kết quả:

P(X > ²) = 0.5116 >  = 0.05
Do đó giả thuyết Ho được chấp nhận.

 Kết luận: Vậy mức thu nhập giữa 2 nhóm tuổi 40 - 50 và 50 - 60 là như nhau.


GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 19


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ
NHĨM 2

2.4 Theo dõi số học sinh đến lớp muộn của năm trường PTTH vào các ngày
khác nhau trong tuần người ta thu được số liệu về số lượng học sinh trung bình
đến lớp muộn của các trường đó vào một ngày tiêu biểu trong tuần như sau:
Ngày trong
tuần

Trường PTTH
A

B

C

D

Thứ hai
Thứ tư
Thứ sáu
Thứ bảy

5

4
4
4

4
5
3
4

5
3
4
3

7
2
5
2

Bạn có nhận xét gì về số lượng học sinh đến lớp muộn của các trường. Có
sự khác biệt gì về số lượng học sinh đến lớp muộn vào các ngày khác nhau
trong tuần? Mức ý nghóa  = 1%.
Bài làm
 Dạng bài: Phân tích phương sai 2 yếu tố khơng lặp.
 Ta giả thiết:
H01 : Số lượng học sinh đi muộn theo ngày là như nhau.
H02 : Số lượng học sinh đi muộn theo trường là như nhau.
 Cơ sở lí thuyết:
Sự phân tích này nhằm đánh giá sự ảnh hưởng của hai yếu tố trên các giá trị quan
sát Yij (i=1,2…r: yếu tố A; j=1,2…c: yếu tố B)

Mơ hình:

Yếu tố A
1
2

r
Tổng
cộng
Trung
bình

Yr1

Yếu tố B
2


Y12
Y22



Yr2


T1
Y.1

T2

Y.2

1
Y11
Y21



GVHD: PGS.TS. NGUYỄN ĐÌNH HUY




c

Tổng
cộng

Trung bình

Y1c
Y2c

Y1
Y2

Y1
Y2








Yrc

Yr

Yr

Tc
Y.c

T…
Y…

Page 20


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Bảng ANOVA

Nguồn
sai số
Yếu tố A
(hàng)


Bậc tự
do

Tổng số bình
phương

(r–1)

SSB =

r Ti
i=1 c

SSF =

c Tj
j=1 r

Yếu tố B
( cột )

( c -1 )

Sai số

(r-1)(c1)

Tổng
cộng


( rc – 1) SST =

2

2

Bình phương
trung bình

T2

MSB =

− rc..

( r−1)

T2

MSF =

− rc..

c
2
j=1 Yij

SSF

( c−1)


SSE = SST - (SSF
+ SSB)
r
i=1

SSB

MSB =

Giá trị thống


FR =
FC =

MSB
MSE
MSF
MSE

SSB
(r−1)

2

- Tr..

Giả thuyết:
 “Các giá trị trung bình bằng nhau”

 “Ít nhất có hai giá trị trung bình khác nhau”
Giá trị thống kê:

Biện luận:
Nếu
Nếu

=> Chấp nhận H0 (yếu tố A)
=> Chấp nhận H0 (yếu tố B).

 Giải toán trên Excel:
Nhập dữ liệu

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 21


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Áp dụng Anova: “Two-Factor Without Replication” trong hộp thoại Data
Analysis

Vào Data->DataAnalysis. Chọn mục Anova: Two-Factor Without
Replication. Chọn OK.

Trong hộp thoại Anova: Two-Factor Without Replicationlần lượt ấn định các
chi tiết:
 Phạm vi đầu vào (Input Range): $A$2:$E$6

 Nhãn dữ liệu (Labels in First Row/Column)
 Ngưỡng tin cậy (Alpha): 0.01 (mức ý nghĩa = 1%)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 22


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

 Nhấn OK. Ta được bảng sau:

 Phân tích kết quả: FR = 2.0357 < F0.01 = 6.9919 => Chấp nhận H01
(Ngày trong tuần).
Vậy số lượng học sinh đến lớp muộn vào các ngày khác nhau trong tuần là như
nhau.
 Phân tích kết quả: FC = 0.1071 < F0.01 = 6.9919 => Chấp nhận H02
(Trường THPT).
Vậy Số lượng học sinh đến lớp muộn của các trường là như nhau.
 Kết luận: Số lượng học sinh đến muộn của các trường là như nhau.

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 23


BÁO CÁO BÀO TẬP LỚN MƠN XÁC SUẤT VÀ THỐNG KÊ
NHĨM 2


2.5 Trong một thí nghiệm khoa học người ta nghiên cứu độ dày của lớp mạ kền
khi dùng ba loại bể mạ khác nhau. Sau một thời gian mạ, người ta đo độ dày
của lớp mạ nhận được ở các bể:
Số lần đo ở bể mạ

Độ dày lớp mạ kền
tính bằng m

A

B

C

4-8

32

51

68

8 - 12

123

108

80


12 - 16

10

26

26

16 - 20

41

24

28

20 - 24

19

20

28

Với mức ý nghóa  = 0,05, hãy kiểm đònh giả thiết: độ dày lớp mạ sau
khoảng thời gian nói trên không phụ thuộc loại bể mạ được dùng.
Bài làm
 Dạng bài: Kiểm Định Tính Độc Lập
 Ta giả thiết:
H0: Độ dày lớp mạ khơng phụ thuộc vào bể mạ được dùng.

Ta tiến hành tính tốn các tỉ số và so sánh để có thể kết luận được rằng độ dày lớp
mạ khơng phụ thuộc vào bể mạ được dùng.
 Giải tốn trên Excel:
Nhập dữ liệu và tính tổng ni và mj vào bảng như sau:
ni = SUM (hàng)
mj = SUM (cột)

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 24


BÁO CÁO BÀO TẬP LỚN MÔN XÁC SUẤT VÀ THỐNG KÊ
NHÓM 2

Tính dữ liệu kỳ vọng ij theo công thức ij = ni* mj /n ta được bảng sau:

Tính P(X > ²) = CHITEST (Bảng thực tế, Bảng kỳ vọng)
= CHITEST (C3:E7,C13:E17)
= 8.67E-06

GVHD: PGS.TS. NGUYỄN ĐÌNH HUY

Page 25


×