Baì kiểm tra hết môn Thống kê
Họ và tên : Hoàng Quốc Việt
Lớp : M0809
Câu 1: Lý thuyết (2 đ)
A. Trả lời đúng ( Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu:
Đúng, vì: Tổng thể thống kê là hiện tượng số lớn bao gồm các đơn vị hoặc phần tử cần quan sát và phân tích.
Các đơn vị này được gọi là đơn vị tổng thể.
Trong khi đó, Chỉ tiêu thống kê phản ánh mặt lượng gắn với chất của các hiện tượng và quá trình KTXH số
lớn trong điều kiện thời gian và địa điểm cụ thể.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Đúng, vì: Tần số tích luỹ là tổng các tần số (số lần) về dữ liệu trong khoảng dữ liệu đó, ví dụ: Tần số: 3 trong
khoảng dữ liệu từ 10 đến dưới 20; Tần số: 5 trong khoảng dữ liệu từ 20 đến dưới 30. Như vậy tần số tích luỹ
trong trường hợp này sẽ là 8 (số tuyệt đối).
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu của hai hiện
tượng khác loại.
Đúng, vì: Độ lệch chuẩn là thước đo quan trọng của độ biến thiên. Độ lệch chuẩn cho biết độ biến thiên
xung quanh giá trị trung bình.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể
chung đó.
Sai, vì: Khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ thuận với tổng thể chung đó
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức
kết quả.
Đúng, vì: Phân tích hồi quy được sử dụng để dự đoán: Một mô hình thống kê được sử dụng để dự đoán
giá trị của một biến phụ thuộc hoặc biến kết quả dựa trên những giá trị của ít nhất 1 biến độc lập hay biến
nguyên nhân.
* Mô hình hồi quy tuyến tính đơn:
Yi = 0 X i + €i
Trong đó: 0 là tham số tự do
Là độ dốc hay hệ số hồi quy
Yi: Biến phụ thuộc (kết quả)
Xi: Biến độc lập (nguyên nhân)
* Mô hình hồi quy tuyến tính của tổng thể chung:
µyx = 0 X i
* Mô hình hồi quy tuyến tính của tổng thể mẫu:
Y^i = b 0 b X i
B. Chọn phương án trả lời đúng nhất:
1. f) Cả a), b), c).
2. e) Cả a), c).
3. c) Phương pháp chọn mẫu.
4. d) Hệ số biến thiên
5. a) Giữa các cột có khoảng cách
Câu 2 (1,5 đ)
* Cỡ mẫu suy rộng số trung bình:
Giả thiết độ tin cậy (95%) => α = 5%
α/2=5/2%=2.5% => Az = 0.975. Tra bảng ta được Z = 1.960
=> n=(1.960^2*6^2)/1^2=138.297 làm tròn lên ta có Số công nhân cần được điều tra: 139
* Xác định giả thiết:
n = 139
X = 35
σ = 6,5
Zα/2=1.960
Đây là trường hợp ước lượng khoảng tin cậy của số trung bình tổng thể chung trường hợp biết độ
lệch chuẩn, tổng thể chung phân phối chuẩn, mẫu lớn. Ta có khoảng tin cậy như sau:
35 – 1,960 * 6,5/11,79 ≤ µ ≤ 35 + 1,960 * 6,5/11,79
33,919 ≤ µ ≤ 36,080
KL: Với độ tin cậy 95%, một công nhân của doanh nghiệp có thể sản xuất được số lượng sản phẩm
trên một giờ công lao động nằm trong khoảng từ 33,919 sản phẩm đến 36,080 sản phẩm.
Câu 3 (1,5 đ)
Đ ặt µ1 là chi phí sản xuất sản phẩm của phương án 1.
Gọi µ 2 là chi phí sản xuất sản phẩm của phương án 2.
Ta có:
{
Η0: µ1=µ2
Η1: µ1≠µ2
Case1
Case 2
25
20
32
27
35
25
38
29
35
23
26
26
30
28
28
24
28
26
30
t-Test: Two-Sample Assuming Equal Variances
Mean Χ1 và Χ 2
Variance S12 và S 22
Observations n1 và n 2
2
Pooled Variance S p
30
Hypothesized Mean
32
34
38
25
30
28
Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
Case1
29.75
19.84
12
20.44
Case 2
28.21
20.95
14
0
24
0.863
0.198
1.7109
0.40
2.064
Như vậy với độ tin cậy 95% ⇔ α = 0,05;
df = n1 + n2 -2 = 12+14-2 = 24
Tra bảng với tα = 0,05 (hai phía); n = 24 ta có t = ± 2,064
Với t (tính toán) = 0,863 so với t (tra bảng): –2,064 < 0,863 < +2,064.
- Ra quyết định: không bác bỏ với α = 0,05.
- KL: không có đủ cơ sở với giả thiết độ tin cậy 95%, chi phí sản xuất sản phẩm của phương án 1 so
với phương án 2 là khác nhau.
Câu 4 (2,5 đ)
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Thân Lá (mỗi lá tương ứng với 1 chữ số)
3
078
4
557789
5
12337
6
01124456
7
0233589
12
3
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Khối lượng
Trị số giữa
Tần số
Tần suất
(triệu tấn)
Từ 3,0 đến dưới 4,0
Từ 4,0 đến dưới 5,0
Từ 5,0 đến dưới 6,0
Từ 6,0 đến dưới 7,0
Từ 7,0 đến dưới 8,0
Từ 8,0 trở lên
Cộng:
(triệu tấn)
3,5
4,5
5,5
6,5
7,5
(số tháng)
3
6
5
8
7
1
30
(%)
10
20
16,67
26,67
23,33
3,33
100,00
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Trong bộ dữ liệu trên có 01 dữ liệu đột xuất, dữ liệu đó là 12,3.
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân bố
tần số. So sánh kết quả và giải thích.
Khối lượng than
6.1
4.7
6.2
7.5
6.6
6
4.9
5.3
7.3
4.8
5.3
7.3
5.7
7
3.7
7.2
3.8
Khối lượng than
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
5.993
0.318
6.05
6.1
1.740
3.027
4.866
1.470
9.3
3
12.3
179.8
30
12.3
4.5
4.7
7.8
6.4
6.5
5.2
6.4
3
Q1=
Q2=
Q3=
IQR=Q3-Q1=
4.83
6.05
6.90
2.08
5.1
4.5
7.9
6.1
Như vậy, các con số ở bảng trên cho thấy:
Lượng than khai thác trung bình trong 1 tháng = 5,993 (triệu tấn).
Trong từng tháng tổng sản lượng than khai thác được có 1/2 lượng than đạt năng suất trên 6,05 triệu
tấn còn 1/2 than được khai thác đạt năng suất dưới6,05 tri ệu t ấn.( Trung vị = 6.05)
Lượng than khai thác bằng 6,1 triệu tấn/tháng có tần suất lớn nhất và cũng gần với trung vị nhất
(Mốt = 6.1)
Độ lệch tiêu chuẩn = 1.74 cho thấy chênh lệch bình quân số than khai thác trong các tháng so với số
than khai thác trung bình là 5.993.
Giới hạn trên có giá trị từ 10,02 đến 13,14. Giới hạn dưới từ 1,71 đến 0, đây là khoảng nghi ngờ
lượng biến đột xuất.
Câu 5 (2,5 đ)
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối lien hệ giữa % tăng
chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô hình.
Phương trình hồi quy tuyến tính: Yˆ = b0 + b1 X 1
Giả định X là % chi phí quảng cáo.
Y là % doanh thu
Với chức năng tính toán Regression trong Excel, ta có:
Yˆ = b0 + b1 X 1
Yˆ = 2,068 + 0,385 X
Ý nghĩa của mô hình : b1 = 0,385
Mỗi khi chi phí quảng cáo tăng 1 đơn vị thì doanh thu tăng trung bình khoảng 0,385 (%).
Nếu không quảng cáo thì doanh thu = 2,068
(X = 0 → Y = b0 = 2,068 ).
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ
tương quan tuyến tính không?
Kiểm định mối liên hệ:
Cặp giả thiết
H0 : 1=0
(không có mối liên hệ tuyến tính)
H1 : 1<>0 (có mối liên hệ tuyến tính)
Tính toán trong Excel ta thu được kết quả:
t=
b1 − β1 0,385 − 0
=
= 8,02
Sb1
0,048
t = 8,02 tương ứng với 0,00418 < 0,025.
Suy ra: t thuộc miền bác bỏ.
Quyết định: bác bỏ Η 0 .
Kết luân: Với mẫu đã điều tra ở độ tin cậy 95% có thể kết luận rằng “% tăng chi phí quảng cáo và % tăng
doanh thu thực sự có mối liên hệ tương quan tuyến tính”
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Tính toán trong Excel, ta có:
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
Suy ra: r =0.9545.
0.9545
0.98
0.524
0.1868
4.5
Kết luận: r =0.9545. (>0.9) do đó % tăng chi phí quảng cáo và % tăng doanh thu có mối liên hệ rất chặt
chẽ.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với độ tin
cậy 90%.
β1 = b1 ± tα / 2;( n− 2 ) Sb1 ⇔ 0,231 ≤ β1 ≤ 0,541
Vậy: Khi quảng cáo tăng lên 1 điểm thì doanh thu nói chung (của tổng thể chung) sẽ tăng khoảng 0,231%
đến 0,541% với độ tin cậy 95%.
* Sai số của mô hình:
S XY = 0,1868 (%).
* Đánh giá mô hình:
R 2 = 0,9545 (9,545% sự thay đổi của doanh thu do quảng cáo).
R = +0,98 (mối liên hệ giữa điểm quảng cáo với doanh thu là mối liên quan tuyến tính đơn,
thuận và rất chặt chẽ.
* Dự đoán điểm chất lượng: X 1 = 5 (%), với 1 - α = 90%.
+ Dự đoán điểm: Thay số ta có:
Y1 = 2,068 + 0,385*5 = 3,993
+ Dự đoán cá biệt:
1
( X1 − X )2
ˆ
Y ± tα / 2; ( n − 2 ) S y 1 + + n
n
∑ ( X i − X )2
i =1
Với n -2 = 3; α = 10%
Tra bảng = 2,353.
X = (1+2+3+6+4+3)/5 = 3,2; X i = 5
n
∑(X
i =1
i
− X ) 2 = tổng bình phương các X i − X = 14,8; ( X i = 1,2,6,4,3)
S y = 0,1868 (số liệu ở bảng mục 1)
Sai số = 2,353*0,1868* 1 +
1 (5 − 3,2) 2
+
= 0,524
5
14,8
Cận dưới: 3,993 – 0,524 = 3,469
Cận trên: 3,993 + 0,524 = 4,517
3,469% ≤ Yx ≤ 4,517%
KL Trong trường hợp tăng chi phí quảng cáo 5% với độ tin cậy 90% thì ước tính tỉ lệ doanh thu sẽ
tăng trong khoảng từ 3,469% đến 4,517%.