GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
BàI TậP Cá NHÂN
*******
Câu 1: Lý thuyết
A. Trả lời Đúng (Đ), Sai (S) cho các câu sau và giải thích
tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên
cứu.
Đúng: Tiêu thức thống kê là một đặc điểm của từng đơn vị
tổng thể đợc chọn ra để nghiên cứu tuỳ theo mục đích khác
nhau.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt
đối.
Đúng: Tần số là số đơn vị đợc phân phối trong mỗi tổ, cho
phép chúng ta xác nhận một trị số nhất định trong một tổng
thể. Do đó, tần số biểu hiện bằng số tuyệt đối.
3) Độ lệch chuẩn là chỉ tiêu tơng đối cho phép so sánh độ
biến thiên về tiêu thức nghiên cứu của hai hiện tợng khác loại.
Sai : Độ lệch chuẩn là một trong các chỉ tiêu so sánh biến thiên
của hiện tợng cùng oại và số trung bình bằng nhau. Đối với các
hiện tợng khác loại hoặc hiện tợng cùng loại nhng số trung bình
không bằng nhau ngời ta ding hệ số biến thiên để so sánh.
1
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
4) Khoảng tin cậy cho tham số nào đó của một tổng thể
chung tỷ lệ nghịch với phơng sai của tổng thể chung đó.
.
Sai: Phơng sai là chỉ tiêu thờng dùng để đánh giá độ biến
thiên của tiêu thức, khắc phục đợc sự khác nhau về dấu giữa
các độ lệch. Phơng sai có trị số càng nhỏ thì tổng thể nghiên
cứu càng đồng đều, tính đai biểu càng cao, nghĩa là độ lớn
của khoảng tin cậy càng nhỏ.
5) Hệ số hồi quy (b1) phản ánh chiều hớng và mức độ ảnh hởng
của tiêu thức nguyên nhân đến tiêu thức kết quả.
Đúng : Từ mô hình hồi quy tuyến tính x= b0 +b1 x ta thấy
b1 l hệ số góc phản ánh ảnh hởng của nhân tố đang nghiên
cứu tới biến kết quả và mỗi khi biến giải thích (tăng lên) 1 đơn
vị thì kết quả biến thay đổi (tăng lên) b1 đơn vị.
B. Chọn phơng án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
f) Cả a), b), c).
2) Đại lợng nào phản ánh mức độ ảnh hởng của tiêu thức nguyên
nhân đến tiêu thức kết quả:
c) Hệ số hồi quy (b1).
3) Các yếu tố ảnh hởng đến số lợng đơn vị tổng thể mẫu:
d) Cả a), b), c).
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của
các hiện tợng khác loại:
2
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
d) Hệ số biến thiên.
5) Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Cả b) và c) đều đúng.
Câu 2:
Một doanh nghiệp muốn ớc lợng trung bình một giờ công
nhân hoàn thành đợc bao nhiêu sản phẩm để đặt định mức.
Giám đốc nhà máy muốn xây dựng khoảng ớc lợng có sai số
bằng 1 sản phẩm và độ tin cậy là 95%. Theo kinh nghiệm của
ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản
phẩm. Hãy tính số công nhân cần đợc điều tra để đặt định
mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu đợc tính ở trên) số sản
phẩm trung bình mà họ hoàn thành trong 1 giờ là 35 với độ
lẹch tiêu chuẩn là 6.5. Hãy ớc lợng năng suất trung bình một giờ
của toàn bộ công nhân với độ tin cậy 95%.
Bài giải:
1.
Tính số công nhân cần đợc điều tra để đặt
định mức:
Theo đề bi ta có:
- Độ tin cậy là 95% hay = 5% =0,05
- Theo bảng ta có: Z = 1,645
Gọi n là số công nhân cần đợc điều tra để đặt định mức:
áp dụng công thức ta có:
Z 2 .2
Ta có: n =
2
Error
1, 6452.6 2
Trong đó: Error = 1; = 6 => n =
=97, 4 98
12
3
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
Vậy: Số công nhân cần đợc điều tra để đặt định mứcl
98 ngời. :
2. ớc lợng năng suất trung bình một giờ của toàn bộ
công nhân với độ tin cậy 95%.
Gọi năng suất trung bình một giờ của toàn bộ công nhân với
độ
tin
x t / 2;( n1)
cậy
95%
là
.
Ta
có
công
thức
sau:
s
s
à x + t / 2;( n1)
n
n
Trong đó:
Năng suất bình quân: x = 35 sản phẩm/giờ.
Mẫu lớn:
n = 98
Độ lệch chuẩn đối với tổng thể mẫu: S = 6,5
Tra bảng t, bậc tự do n-1 = 97. = 0,05
Thay vào công thức ta có t = 1,985.
Với t=1,985 35 1,303 35+ 1,303
33,696 36,303
Vậy : Với độ tin cậy là 95% thì năng suất trung bình một giờ
của toàn bộ công nhân nằm trong khoảng từ 34 sản phẩm
đến 36 sản phẩm.
Cõu 3:
Ti mt doanh nghip, ngi ta xõy dng hai phng ỏn sn xut mt loi sn
phm. ỏnh giỏ xem chi phớ trung bỡnh theo hai phng ỏn y cú khỏc nhau
hay khụng, ngi ta tin hnh sn xut th v thu c kt qu sau: (ngn ng)
Phng án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phng án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30
28
4
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
Chi phớ theo c hai phng án trên phân phối theo quy lut
chun. Vi tin cy 95% hãy rút ra kết luận về phng án trên .
Bài giải:
PA1
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
29.75
19.840
91
12
20.441
96
0
24
0.8634
1
0.1982
29
1.7108
82
0.3964
59
2.0638
99
PA2
28.21428
571
20.95054
945
14
Gi 1 l chi phí trung chi phí trung bình của phơng án 1.
2 l chi trung chi phí trung bình của phơng án 2.
Khi ó, cp gi thit cn kim nh l :
H0: 1 = 2
H1:
2
Vì cha bit phng sai ca hai tng th chung 1 v 2
trong trng hp mu nh ( n1 =12; n2 = 14, u < 30). Do ó
tiêu chuẩn kiểm định đợc chọn là thống kê t.
Công thức tính giá trị chung của hai phơng sai mẫu nh
sau:
(n1 1)S12 + (n2 -1) S22
11 x 19,841 + 13
x 20,951
Sp2 =
=
5
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
(n1- 1) + (n2 -1)
11 +
13
Sp2 = 20,4419 Sp = 4,521
Với = 0.05:
t=
29,75 28,21
4,521 * 1 / 12 + 1 / 14
= 0,8661
=> /2 = 0,025
df = (12+14) - 2 = 24
24
Tra bng kim nh t có giá trị giới hạn t t
= 2,064
Vy tt t = 0,8661 < t
0,025, 20
/2; n1+n2-2
=t
0,025,
= 2,064
=> t không thuộc miền bác bỏ.
Vậy: Cha đủ cơ sở để kết luận chi phí trung bình của hai
phơng án là khác nhau.
Cõu 4:
Di đây là dữ liệu về khối lợng sn phm than trong 30
tháng gần đây của một nhà máy(n v: triu tn)
6,
4,7
6,2
7,5
1
6,0
5,
7,3
3,
12,
6
4,
5,3
7,3
4,8
9
3
5,
7,0
3,7
7,2
7
8
4,
4,7
7,8
6,4
5
3
6,
5,2
7,
6,1
5
6,
4
6,
3,0
5,1
4,5
9
6
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
1. Biu din tp hp s liu trên bằng biểu đồ thân lá (Stem
and leaf).
2. Xây dựng bảng tần số phân bố phù hợp dữ liệu trên.
3. Trong b s liu trên có dữ liệu đột xuất không? Nếu có là
dữ liệu nào?
4. Tính khối lợng than trung bình khai thác đợc trong 1 tháng
từ tài liệu điều tra và từ bảng phân bố tần số. So sánh
kết quả và giải thích.
Bài giải:
1. Biu din tp hp s liu than khai thác đựoc
trong 30 tháng bàng biểu đồ thân lá (stem and
leaf):
Thõn
3
4
5
6
7
8
9
10
11
12
Lỏ
0
5
1
0
0
3
7
5
2
1
2
8
7
3
1
3
7
3
2
3
8
7
4
5
9
4
8
5
9
6
Tn s
3
6
5
8
7
1
2. Xây dựng bảng tần số phân bố phù hợp dữ liệu trên.
T
Tn
Tn sut Tn số tích Tn s tích ly
7
GaMBAM08.09
ªn
Thống kê và khoa học
quyết định
số
3 tấn – 4 tấn
4 tấn – 5 tấn
5 tấn – 6 tấn
6 tấn – 7 tấn
7 tấn – 8 tấn
8 tấn – 9 tấn
9 tấn – 10
tấn
10 tấn – 11
tấn
11 tấn – 12
tấn
Tổng
3
6
5
8
7
0
0
0
1
30
(%)
lũy
(%)
10
20
16,67
26,67
23,33
0
3
9
11
19
26
26
10
30
46,67
73,33
96,67
96,67
0
26
96,67
0
26
96,67
3,33
100
27
100
3. Trong bộ số liệu trªn cã d÷ liÖu ®ét xuÊt kh«ng? NÕu
cã lµ d÷ liÖu nµo?
Sö dông c«ng cô b¶ng tÝnh Excel,
ta cã:
Column1
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Largest(1)
5.993333333
0.317639763
6.05
6.1
1.739784635
3.026850575
4.866233403
1.469798392
9.3
3
12.3
179.8
30
12.3
8
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
Smallest(1)
Confidence
3
Level(95.0%)
0.649646249
Q1=4.83
Q2=6.05
Q3=6.90
IQR
2.075
10.0
-1.39
1.71
4.83
Q1
Nghi
6.9
Q3
1
Nghi
13.13
ngờ
ngờ là
là l-
Lợng
lợng
ợng
Lợng
biến
biến
biến
biến
đột
đột
đột
đột
xuất
xuất
xuất
xuất
Đồ thị hộp ria mèo cho thấy trong bộ số liệu này không có lợng
biến đột xuất, chỉ có biến nghi ngờ là lợng biến đột xuất là
12,3 triệu tấn.
4. Tính khối lợng than trung bình khai thác đợc trong
1 tháng từ tài liệu điều tra và từ bảng phân bố tần
số. So sánh kết quả và giải thích.
a, Khi lng than trung bình khai thác đợc trong 1 tháng từ
tài liệu điều tra: X =
1 n
179,8
xi =
= 5,99 (triệu tấn)
n i =1
30
b. Khối lợng than trung bình khai thác đợc trong 1 tháng từ
bảng phân bố tần số:
9
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
T
Tr s
Tn s
gia
Giá tr t
(triu tn)
T 3.0 n di 4.0
3.5
3
10.5
T 4.0 n di 5.0
4.5
6
27
T 5.0 n di 6.0
5.5
5
27.5
T 6.0 n di 7.0
6.5
8
52
7.0
6.5
8
52
30
Tng
169
Trung bình 01
169/30=5,
tháng
93
So sánh kết quả ta thấy: Khối lợng than trung bình khai thác
đợc trong 1 tháng từ tài liệu điều tra (5,99 triệu tấn) nhỏ hơn
khối lợng than trung bình khai thác đợc trong 1 tháng từ bảng
phân bổ tần số (5,93 triệu tấn).
Câu 5:
Mt hãng trong lĩnh vực kinh doanh dầu gội dầu thực hiện
một thử nghiệm để đánh giá mức độ ảnh hởng của quảng cáo
đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên 5
vùng khác nhau của đất nớc so với mức của năm trớc và ghi chép
mức độ thay đổi của doanh thu ở các vùng nh sau
% tăng chi phí quảng cáo
% tăng doanh thu
1
2,5
2
3
6
4,5
4
3,5
3
3
1. Vi d liu trên, xác định một phơng trình hồi quy tuyến
tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng
10
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
cáo và % tăng doanh thu, phân tích mối liên hệ này qua
các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và %
tăng doanh thu thực sự có mối liên hệ tơng quan tuyến
tính không?
3. Đánh giá cờng độ của mối liên hệ và sự phù hợp của mô
hình trên.
4. Hãy ớc tính (dự đoán) tỷ lệ tăng doanh thu nếu tỷ lệ %
tăng chi phí quảng cáo là 5% với độ tin cậy 90%.
Bài giải:
1. Vi d liu trên, xác định một phơng trình hồi quy
tuyến tính để biểu hiện mối liên hệ giữa % tăng
chi phí quảng cáo và % tăng doanh thu, phân tích
mối liên hệ này qua các tham số của mô hình.
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.976967
R Square
0.954465
Adjusted R
Square
Standard
0.939287
Error
0.186842
Observations
5
ANOVA
df
Regression
1
Residual
3
Total
4
Intercept
Coefficien
Standard
ts
2.0676
Error
0.17645
SS
MS
F
Significance F
2.195270 2.195270 62.883871
0.004182
0.104730 0.034910
2.3
Lower
t Stat
11.7173
P-value
0.0013
95%
1.510601
Upper
Lower
Upper
95%
2.6291
95.0%
1.5060
95.0%
2.6291
11
GaMBAM08.09
ªn
Thống kê và khoa học
quyết định
Qu¶ng c¸o
0.3851
4
46
7.92993
36
0.0041
4
22
0.5396
14
0.2305
22
0.5396
0.0486
5
82
0.230572
98
72
98
Căn cứ vào c¸c d÷ liÖu cña ®Ò bµi ta cã:
Regression Statistics
Multiple R
0.976967
R Square
Adjusted R
0.954465
Square
0.939287
Standard Error 0.186842
Observations
5
ANOVA
Significanc
df
SS
2.19527
MS
F
eF
62.88387 0.00418
Regression
1
0 2.195270
0.10473
Residual
Total
3
4
0 0.034910
2.3
Coefficien Standar
ts
t Stat
d Error
0.17645 11.71734
4
1
2
P-value
Intercept
% tăng chi phí
2.0676
6 0.001336
QC (X)
0.3851 0.0486 7.929935 0.004182
Lower
Upper
Lower
95%
95%
95.0%
1.50601 2.62912
Upper
95.0%
2.62912
4
2 1.506014
2
0.2305 0.5396
0.53969
72
98 0.230572
8
1. Ph¬ng tr×nh håi quy tuyÕn tÝnh: : Ŷ = b0 + b1X
Tham sè b0 = 2,0676
Tham sè b1 = 0,3851
Ŷ = 2,0676 + 0,3851X
Mỗi khi quảng cáo tăng thêm 1% thì doanh thu sẽ tăng thêm
0,3851%.
12
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
2 .Kiểm định xem liệu giữa % tăng chi phí quảng cáo
và % tăng doanh thu thực sự có mối liên hệ tơng quan
tuyến tính không?
Gi thit rng:
H0: 0 = 0 (Không có mối liên hệ tuyến tính)
H0: 0 # 0 (Có mối liên hệ tuyến tính)
Tiêu chun kim nh: t = (b1- 1) / Sb1
= (0,3851 0)/0,0486 = 7,93
Tơng ứng với = 0 < 0,025. t thuc min bác bỏ.
Quyt nh bác bỏ H0.
Kết luận giữa % tăng chi phí quảng cáo và % tăng doanh thu có
mối liên hệ tơng quan tuyến tính .
3. Đánh giá cờng độ của mối liên hệ và sự phù hợp của mô
hình trên.
R2 = SSR/SST = 0,954
trên.
thể hiện sự phù hợp của mô hình
Hệ số tơng quan R = 0,977 nm trong khong giá trị t -1 n 1
v rt gn 1 vì vậy mối liên hệ tuyến tính rất chặt chẽ.
4. Hãy ớc tính (dự đoán) tỷ lệ tăng doanh thu nếu tỷ lệ
% tăng chi phí quảng cáo là 5% với độ tin cậy 90%.
Qung cáo(X)
1
2
6
4
3
3.2
= 3.2 ; (Xi - )2
Doanhthu (Y)
2.5
3
4.5
3.5
3
(Xi-X)^2
4.84
1.44
7.84
0.64
0.04
14.8
= 14.8 ; t tra bảng = t /2 (n-2) = 2.353.
13
GaMBAM08.09
ên
Thng kờ v khoa hc
quyt nh
D đoán giá trị
cá biệt :
Sai s d đoán =
0,524
Cn di = 3,470
Cn trên = 4,517
3.470 % Yx=5 4.517 %
Vậy nếu tỷ lệ % tăng chi phí quảng cáo là 5% vi tin cy
90% thì doanh thu sẽ tăng thêm khoảng từ 3.470 % n 4.517
%.
14