GVHD : Nguyễn Bá Thi
XÁC SUẤT THỐNG KÊ
Bài 1:
Một hãng sản xuất ô tô tiến hành một nghiên cứu nhằm xác định xem có sự khác
nhau giữa tỉ lệ đàn ông và đàn bà trong việc chọn mua các loại ô tô của hãng hay
không. Kết quả thu được như sau:
Loại ô tô
Phụ nữ
Nam giới
A
70
40
B
80
60
C
150
100
BÀI LÀM:
Với mức α = 5%, ta cần đưa ra kết luận gì?
Loại bài: Kiểm định giả thiết về tỉ lệ.
Phương pháp: Áp dụng MS-EXCEL trong thống kê suy lý – So sánh tỉ số.
Giả thiết: Gọi H0 là giả thiết tỉ lệ đàn ông và đàn bà chọn mua các loại ô tô
của hãng là như nhau.
Áp dụng MS-EXCEL:
Nhập bảng dữ liệu thực nghiệm và tính tổng hàng tổng cột.
Tính các tổng số:
- Tổng hàng (Row totals): chọn ô B4 và nhập biểu thức = SUM(B2:B3).
- Dùng con trỏ để kéo nút tự điền từ ô C4 đến D5.
- Tổng cột (Column totals): chọn ô E2 nhập biểu thức = SUM(B2:D2).
- Dùng con trỏ để kéo nút tự điền từ ô E2 đến ô E3.
- Tổng cộng (Grand total): chọn ô E4 và nhập vào biểu thức = SUM(E2:E3).
Hoặc ta có thể tính bằng biểu thức = SUM(B4:D4).
Tính các tần số lý thuyết:
Nhóm 11
Page 1
XÁC SUẤT THỐNG KÊ
-
GVHD : Nguyễn Bá Thi
Tần số lý thuyết = (tổng hàng x tổng cột) / tổng cộng.
Chọn ô B8 và nhập vào biểu thức = B4*E2/E4.
Chọn ô B9 và nhập vào biểu thức = B4*E3/E4.
Tương tự các ô còn lại như trên hình vẽ.
Áp dụng hàm “CHITEST” để tính xác suất P:
- Chọn ô A9 và nhập vào biểu thức = CHITEST(B2:D3,B8:D9)
Kết quả: P = 0.582093 > α = 0.01, suy ra chấp nhận giả thiết H0.
Vậy tỉ lệ tỉ lệ đàn ông và đàn bà chọn mua các loại ô tô của hãng là như nhau.
Nhóm 11
Page 2
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
Bài 2:
Để xác định hiệu quả của một loại thức ăn phụ đối với sự tăng trọng của bò,
người ta lấy ngẫu nhiên 8 con bò cùng trọng lượng chia thành 2 nhóm, mỗi nhóm
4 con, một nhóm ăn bình thường, một nhóm cho ăn thêm thức ăn phụ. Sau 6 tháng
thu được kết quả sau:
Nhóm ăn thêm thức ăn phụ (A)
330
360
400
350
Nhóm thức ăn bình thường (B)
290
320
340
370
Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó, biết
rằng trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn. Với độ tin cậy 95%
hãy ước lượng trọng lượng trung bình của các con bò với mỗi loại thức ăn trên.
BÀI LÀM:
a) Với mức ý nghĩa 5% hãy cho kết luận về tác dụng của loại thức ăn phụ đó,
biết rằng trọng lượng của bò là biến ngẫu nhiên phân phối chuẩn.
Loại bài: Kiểm định giả thiết về giá trị trung bình.
Phương pháp: Kiểm định giả thuyết so sánh 2 trung bình với phương sai bằng
nhau.
Giả thiết: Ho : Có thức ăn phụ và không có thức ăn phụ tác dụng như nhau
H1 : Thức ăn phụ có tác dụng tăng trọng
Áp dụng MS-EXCEL:
Nhập dữ liệu vào bảng tính:
Nhóm 11
Page 3
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
Áp dụng “t-Test: Two-Sample Assuming Equal Variances”.
- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis (EXCEL 2010).
Chọn chương trình t-Test: Two-Sample Assuming Equal Variances lần lượt ấn
định:
+ Phạm vi đầu vào (Input Range): Variable 1 range: $A$1:$A$5
Variable 2 range: $B$1:$B$5
+ Output Range: $C$12
- Nhấp OK ta được kết quả sau:
Nhóm 11
Page 4
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
- Kết quả và biện luận: F = 1.3416 < F crit = 1.9431
* Vậy bác bỏ giả thiết Ho ,chấp nhận giả thiết H1: thức ăn phụ có tác dụng vào sự
tăng trọng của bò
Nhóm 11
Page 5
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
b) Với độ tin cậy 95% hãy ước lượng trọng lượng trung bình của các con bò
với mỗi loại thức ăn trên.
Loại bài: Ước lượng khoảng của trung bình.
Phương pháp: Áp dụng MS-EXCEL trong thống kê mô tả. Áp dụng
“descriptive statistics”.
- Nhấp lần lượt đơn lệnh Data và lệnh Data Analysis .
- Chọn lệnh Descriptive statistics:
- Nhấn Ok:
+ Phạm vi đầu vào (Input Range): $A$1:$B$5.
+ Cách sắp xếp theo hàng hay cột (Group By): Columns.
+ Nhấn dữ liệu (Labels in First Row/Column): Check.
+ Output Range: $J$8.
+ Check summary statistics.
+ Check confidence level for mean: 95%
Nhóm 11
Page 6
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
+ Nhấn Ok:
+ Chọn ô K25 nhập biểu thức =$K$6*K11
Nhóm 11
Page 7
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
+ Chọn ô M25 nhập biểu thức =$K$6*M11
+ Chọn ô P10 nhập biểu thức =K10-K25
+ Chọn ô P10 nhập biểu thức =K10+K25
+ Chọn ô S10 nhập biểu thức =M10-M25
+ Chọn ô U10 nhập biểu thức =M10+M25
+ Tính hệ số phân tán của nhóm A bằng biểu thức: =K14/K10*100
+ Tính hệ số phân tán của nhóm B bằng biểu thức: =M14/M10*100.
- Ta được bảng sau:
Nhóm 11
Page 8
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
Bài 3:
Tính tỉ số tương quan của Y đối với X, hệ số tương quan, hệ số xác định của tập
số liệu sau đây. Với mức ý nghĩa 5%, hãy kết luận về mối tương quan giữa X và Y
(có phi tuyến không? Có tuyến tính không?). Tìm đường hồi quy của Y đối với X.
X 210
90
Y 255
115
24
0
25
5
50
35
24
0
27
5
270 13
0
315 13
5
27
0
35
5
90
13
5
24
0
29
5
13
0
17
5
17
0
23
5
5
0
7
5
17
0
19
5
210
235
Loại bài: Tương quan và hồi quy.
Phương pháp: Áp dụng MS-EXEL trong phân tích tương quan và hồi quy – Phân
tích tương quan và đường hồi quy tuyến tính đơn giản.
Áp dụng MS-EXCEL:
Tính hệ số tương quan:
- Nhập số liệu vào bảng tính:
-
Áp dụng “Correlation”:
Nhóm 11
Page 9
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
+ Nhấp lần lượt đơn lệnh Data và lệnh Data analysis.
+ Chọn phương trình Corelation trong hộp thoại Data analysis rồi nhấp nút OK.
+ Trong hộp thoại Correlation, lần lượt ấn định các chi tiết:
• Phạm vi đầu vào (Input Range): $A$1:$B$10
• Cách sắp xếp theo hàng hay cột (Group By): Columns
• Nhãn dữ liệu (Labels First Row/Column): Checked
• Phạm vi đầu ra (Output Range): $E$1
+ Nhấp OK, ta thu được bảng sau:
Nhóm 11
Page 10
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
- Kết luận:
+ Hệ số tương quan: r = 0.97435576
+ Hệ số xác định: Bằng bình phương của hệ số tương quan: r2 = 0.949369149
Phân tích tương quan tuyến tính
- Giả thiết H: X và Y không có tương quan tuyến tính
T =
-
r
n −2
1 −r 2
Ta tính đc T= 15,61282957
Mà c = T0.05(13)=t 13:0.025 =2,160368656 (c là phân vị mức α/2=0.025 của
phân bố Student với n-2=13 bậc tự do).
- Biện luận: T > c
Suy ra bác bỏ giả thiết H. X và Y tương quan tuyến tính với nhau.
Phân tích mối tương quan phi tuyến:
- Giả thiết H: X và Y không có tương quan phi tuyến.
- Sắp xếp lại các giá trị của X và Y theo bảng sau :
X=210
255
235
-
X=90
115
135
X=240
255
275
295
X=50
35
75
X=270
315
355
X=130
135
175
Sử dụng bảng Anova: Single Factor
+ Nhấp lần lượt đơn lệnh Data và lệnh Data analysis.
+ Chọn chương trình “Anova: Single Factor” trong hộp thoại Data Analysis
rồi nhấn OK.
+ Trong hộp thoại Anova: Single Factor lần lượt ấn định:
• Phạm vi đầu vào (Input Range): $B$24:$G$27.
• Cách sắp xếp theo hàng hay cột (Group By): Columns.
• Nhãn dữ liệu (Labels in First Row/Column): Checked.
• Mức ý nghĩa (Alpha): 0.05.
• Output Range: $A$29.
Nhóm 11
Page 11
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
-
Nhấp OK ta được bảng sau:
-
Từ bảng Anova: Single Factor ta rút ra được SST và SSF:
+ SST = 118092.308(= Total).
+ SSF = 114492.308 (= Between Groups).
+ Từ đó ta tính được tỷ số tương quan: η2Y/X = SSF/SST = 0,969515373
Nhóm 11
Page 12
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
η − r ) ( n− k)
(
F=
( 1 − η ) ( k − 2)
2
Y/X
2
2
Y/X
F = 1.486946287
Tra bảng phân phối Fisher với bậc tự do (3,4) ở mức 5% bằng cách nhập hàm c =
FINV(0.05,3,4) ta được giá trị c = 3,633088511.
-
Biện luận: F < c
Suy ra chấp nhận giả thuyết H, X và Y không có tương quan phi tuyến.
Đường hồi quy của Y đối với X:
- Nhấp lần lượt đơn lệnh Data và lệnh Data analysis.
- Chọn chương trình Regresstion trong hộp thoại Data Analysis rồi nhấn OK.
- Trong hộp thoại Regression, lần lượt ấn định các chi tiết:
+ Phạm vi của biến cố Y (Input Y Range): $B$55:$B$70.
+ Phạm vi của biến cố X (Input X Range): $A$55:$A$70.
+ Nhãn dữ liệu (Labels): Checked.
+ Mức tin cậy (Confidence Level) = 95%.
+ Tọa độ đầu ra (Ouput Range): $D$55
+ Và một số tùy chọn khác như đường hồi quy (Line fit plots)…
Nhóm 11
Page 13
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
- Nhấp OK, ta thu được kết quả:
Suy ra đường hồi quy của Y đối với X là: Y = 1,1693X +6,1061
Mối tương quan giữa X và Y:
- Hệ số hồi quy:
0.668535974 > 0.05 : hệ số tự do có ý nghĩa.
8.41538E-10 < 0.05: hệ số của X không có ý nghĩa.
- Phương trình hồi quy: 8.4154E-10 < 0.05 : phương trình hồi quy không thích
hợp.
Kết luận: X và Y có tương quan tuyến tính
Nhóm 11
Page 14
XÁC SUẤT THỐNG KÊ
GVHD : Nguyễn Bá Thi
Bài 4:
Hãy phân tích vai trò của ngành nghề ( chính , phụ ) trong hoạt động kinh tế
của các hộ gia đình ở một vùng nông thôn trên cơ sở bản số liệu về thu nhập của
một số hộ tương ứng với các ngành nghề nói trên như sau ( mức ý nghĩa 5 %)
Nghề chính
Trồng lúa
Trồng cây ăn quả
Chăn nuôi
Dịch vụ
Nghề phụ
(1)
3.5
3.4
4.0
5.6
5.2
5.8
4.1
4.4
3.8
7.2
7.0
7.7
(2)
7.4
7.6
7.1
4.1
4.4
3.9
2.5
2.5
2.7
3.2
3.5
3.1
(3)
8.3
8.1
8.0
6.1
6.4
5.8
1.8
1.6
1.4
2.2
2.6
2.3
(4)
3.5
3.4
3.7
9.6
9.7
9.2
2.1
2.3
2.0
1.5
1.7
1.4
Loại bài: Kiểm định giả thiết về giá trị trung bình
Phương pháp: Áp dụng MS-EXCEL trong quy hoạch thực nghiệm và phân tích
phương sai – Phương pháp phân tích phương sai hai nhân tố có lặp.
Giả thiết:
HA là thu nhập không phụ thuộc vào nghề chính.
HB là thu nhập không phụ thuộc vào nghề phụ.
HAB không có sự tương tác giữa nghề chính và nghề phụ.
Áp dụng MS-EXCEL:
Áp dụng “Anova: Two factor with replication”.
-Nhập dữ liệu vào bảng tính:
Nhóm 11
Page 15