Thống kê trong kinh
doanh
BÀI TẬP CÁ NHÂN
MÔN: THỐNG KÊ VÀ KHOA HỌC QUYẾT ĐỊNH
Lớp: GaMBA .M0110
Họ tên học viên: NGUYỄN THỊ HẠNH TÂM
Trả lời các câu hỏi sau đây, giải thích rõ cách làm
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và –1.75 là:
Bài làm:
Phân phối chuẩn hóa Z có trung bình bằng 0 và phương sai bằng 1.Diện tích nằm dưới đường cong
bằng 1 và đường cong đối xứng nên đúng một nửa nằm trước và 1 nửa nằm sau.
Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa 2 điểm 0 và -1,75 là xác suất
của Z với P(-1,75< Z < 0). Theo đồ thị Phân phối chuẩn hóa, P(-1,75< Z < 0) = P(0P(0Sử dụng bảng Cummulative Standardized Normanl Distribution ta có:
F(1,75) – F(0) = 0,9599 – 0,5
= 0,4599
Hoặc :
Sử dụng Megastat ta có:
Normal distribution
P(lowe
r)
P(uppe
r)
.0401
.9599
-1.75
.5000
.5000
0.00
z
P(-1.75
2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi chỉ số IQ là
1 biến ngẫu nhiên X, tính P (68 < X < 132):
Bài làm:
1. Tính P(X < 132) : Đưa X- giá trị về Z-giá trị. Tìm xác xuất chuẩn:
1
Thống kê trong kinh
doanh
=2
Tính P(Z<2). Dùng bảng phân phối tích lũy F(2) = 0,9772
2. Tính P(X > 68) : Đưa X- giá trị về Z-giá trị. Tìm xác xuất chuẩn:
= -2
Tìm P(-2< Z) .
Trong phân phối chuẩn µ = 0 và σ =1
P(-2 <Z) = 1 – P(Z>2) = 1- 0.9772 = 0.228
P(-2< Z< 2) = F(2) –F(-2) = 0.9772 – 0.0228 = 0.9544
Sử dụng Megastat ta có:
Normal distribution
P(lowe
r)
P(uppe
r)
.9772
.0228
2.00
.0228
.9772
-2.00
z
P(-2< Z< 2) = 1- P(Z>2) = 1 – 2*0.0228 = 0.9544
Kết luận : Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi chỉ số
IQ là 1 biến ngẫu nhiên X, ta có P (68 < X < 132) = 0.9544
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Bài làm
Nếu độ tin cậy giảm đi thì khoảng tin cậy sẽ hẹp lại.
Độ tin cậy là xác xuất để tham số của Tổng thể chung rơi vào khoảng tin cậy.
Biểu hiện : Độ tin cậy = (1- α)%
α là xác xuất để tham số của tổng thể chung không rơi vào khoảng tin cậy.
Do đó nếu độ tin cậy giảm đi thì khoảng tin cậy hẹp lại.
2
Thống kê trong kinh
doanh
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết σ = 6.50 và kích
thước mẫu n=100. Hãy tính trung bình mẫu :
Bài làm
Khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46. Như vậy ta có:
−
σ
σ
≤ X + Zα / 2
n
n
−
σ
σ
X ± Zα / 2
= 2α / 2
= 69.46 − 62.84 = 6.62
n
n
σ
6.62
Zα / 2
=
= 3.31
2
n
−
σ
X + Zα / 2
= 69.46
n
−
X − Zα / 2
−
Thay số liệu vào ta có X = 69.46 − 3.31 = 66.15
Vậy trung bình mẫu là 66.15
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a. 0.150
b. 0.100
c. 0.051
d. 0.025
Câu d. Giá trị P-value = 0,025 dẫn đến bác bỏ giả thiết H0 vì P-value = 0.025 < α = 0.05
Do α là xác xuất để tham số của tổng thể chung không rơi vào khoảng tin cậy nên khi giá trị Pvalue nhỏ hơn α thì bác bỏ giả thiết H0
Hoàn thành các bài tập sau đây
Bài 1
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét. Để đánh giá tính
hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng
theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
9
6
8
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
5
4
5
7
4
6
8
5
4
3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo
phương pháp mới với độ tin cậy 95%. Hãy kết luận về hiệu quả của phương pháp bán hàng mới so
với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến
khi giao hàng là 7,5 ngày
Bài làm
Sử dụng Megastat ta có:
Descriptive statistics
3
Thống kê trong kinh
doanh
Count
Mean
sample variance
sample standard
deviation
Minimum
Maximum
Range
#1
30
6.13
3.29
1.81
3
10
7
Tiếp tục sử dụng Megastat,
Confidence interval - mean
95%
confidence level
6.13
mean
1.81
30
1.960
0.648
6.778
5.482
std. dev.
N
Z
half-width
upper confidence limit
lower confidence limit
Ta có khoảng tin cậy cho trung bình tổng thể
5.482 < µ <6.778
Kết luận: Với mẫu đã điều tra với độ tin cậy 95% thì số ngày trung bình từ khi đặt hàng đến khi
giao hàng.
5.482 ngày < µ <6.778 ngày
So với phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7.5
ngày thì phương pháp bán hàng mới tốt hơn vì nó nhỏ hơn 7.5 ngày.
Bài 2
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm. Để
đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành
sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với mức ý nghĩa 5% hãy
rút ra kết luận về hai phương án trên.
Bài làm
Sử dụng Kiểm định: Tính trung bình của một số mẫu trong tổng thể Phương án 1 và Phương án 2
để so sánh. µ1 : chi phí trung bình của phương án 1
µ2 : Chi phí trung bình của phương án 2
Cặp giả thiết chi phí trung bình của Phương án 1 bằng hoặc khác chi phí trung bình Phương án 2.
Kiểm định cặp giả thiết này:
4
Thống kê trong kinh
doanh
H0 : µ1 = µ2
H1 : µ1 ≠ µ2
Kết quả từ Megastat
Hypothesis Test: Independent Groups (t-test, pooled variance)
Phương án 1
29.75
4.45
12
Phương án 2
28.21
4.58
14
24
1.536
20.442
4.521
1.779
0
0.86
.8018
Mean
std. dev.
N
Df
difference (Phương án 1 - Phương án 2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized
difference
T
p-value (one-tailed, lower)
Hypothesis Test: Independent Groups (t-test, unequal variance)
Phương án 1
29.75
4.45
12
Phương án 2
28.21
4.58
14
23
1.536
1.775
0
0.87
.8021
Mean
std. dev.
N
Df
difference (Phương án 1 - Phương án 2)
standard error of difference
hypothesized
difference
T
p-value (one-tailed, lower)
Kết quả từ Megastat : P-value (t-test, pooled variance) = 0.8018 và P-Valued (t-test, unequal
variance) =0.8021 > α = 0,05 nên chưa bác bỏ giả thiết H0. Tức chi phí trung bình của Phương án 1
không bằng Phương án 2
Tiếp tục kiểm định với giả thiết chi phí trung bình của Phương án 1 ≥ phương án 2. Cặp giả
thiết:
H0 : µ1 ≥ µ2.
H1 : µ1 < µ2
Sử dụng Megastat:
Hypothesis Test: Independent Groups (t-test, pooled variance)
Phương án 1
Phương án 2
5
Thống kê trong kinh
doanh
29.75
28.21
4.45
4.58
12
14
24
1.536
mean
std. dev.
n
df
difference (Phương án 1 - Phương án 2)
20.442
pooled variance
4.521
pooled std. dev.
1.779
standard error of difference
0
0.86
.1982
hypothesized difference
t
p-value (one-tailed, upper)
Hypothesis Test: Independent Groups (t-test, unequal variance)
Phương án 1
29.75
4.45
12
Phương án 2
28.21
4.58
14
mean
std. dev.
n
23
1.536
1.775
0
df
difference (Phương án 1 - Phương án 2)
standard error of difference
hypothesized difference
0.87
.1979
t
p-value (one-tailed, upper)
Kết quả từ Megastat : P-value (t-test, pooled variance) = 0.1982 và P-Valued (t-test, unequal
variance) =0.1979 > α = 0,05 nên chưa bác bỏ giả thiết H 0. Tức chi phí trung bình của Phương án 1
lớn hơn bằng Phương án 2
Tuy nhiên chưa thể kết luận phương án sản xuất nào hiệu quả hơn vì số mẫu cảu từng phương pháp
được lấy không tương đương. Để chính xác hơn cần lấy lại mẫu và kiểm định theo cặp.
Bài 3: Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một loại hoá chất
xác định. Nếu mức độ tập trung lớn hơn 247 ppm, loại thuốc này có thể gây ra một số phản ứng
phụ; nếu mức độ tập trung nhỏ hơn 247 ppm, loại thuốc này có thể sẽ không có hiệu quả. Nhà sản
xuất muốn kiểm tra xem liệu mức độ tập trung bình quân trong một lô hàng lớn có đạt mức 247
ppm yêu cầu hay không. Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy
rằng trung bình mẫu là 250 ppm và độ lệch chuẩn của mẫu là 12 ppm.
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247 ppm với
mức ý nghĩa α = 0.05. Thực hiện điều đó với α=0.01.
6
Thống kê trong kinh
doanh
b. Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này? Nếu lô hàng đã
được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là 247 ppm, quyết định của bạn sẽ
như thế nào căn cứ vào việc kiểm định giả thiết thống kê?
Bài làm
Kiểm định cho trung bình tổng thể (µ)
X = 250
S = 12
Ta có cặp giả thiết thống kê
H0 : µ = 247 : Mức độ tập Trung bình quân trong toàn bộ lô hàng là 247 ppm
H1 : µ ≠ 247 : Mức độ Tập Trung bình quân trong toàn bộ lô hàng khác 247 ppm
Mức ý nghĩa : α = 0.05
Sử dụng bảng Megastat ta có
Hypothesis Test: Mean vs. Hypothesized Value
247.00
250.00
12.00
1.55
60
59
hypothesized value
mean Thuoc moi
std. dev.
std. error
N
Df
1.94
.0576
T
p-value (two-tailed)
Với P-value = 0.0576 > α = 0.05 => chưa bác bỏ giả thiết H 0 tức µ = 247 . Trong trường hợp
α=0.01 ta cũng chưa bác bỏ giả thiết H0.
b) Căn cứ vào kết quả kiểm định, kết luận lô hàng này đủ tiêu chuẩn vì nó đã đảm bảo chứa đựng
mức độ tập trung bình quân là 247ppm và có thể sản xuất.
Bài 4: Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của nhà sản xuất
bằng cách sử dụng thông tin về chất lượng sản phẩm của họ. Giả sử rằng các số liệu sau là thị phần
đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản phẩm theo thang điểm 0-100 được xác
định bởi một quy trình định giá khách quan (X).
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82.
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12.
a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản phẩm. Kết
luận ?
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giưa X và Y.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
7
Thống kê trong kinh
doanh
Bài làm
a. Ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản phẩm
Sử dụng Megastat ta có:
Mô hình tổng thể:
Y= β0 + β1X1
Mối Quan hệ hồi quy tuyến tính giữa chất lượng và thị phần biểu hiện bằng hàm số:
Y = 0.187X – 3.057
Sử dụng Megastat (kết quả của Megastat tại mục b bên dưới) ta có kết luận: Khi khi thị
phần tăng thêm 1% thì chất lượng sản phẩm sẽ tăng lên khoảng từ 0.15 đến 0.22 với độ tin
cậy 95%.
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giữa X và Y.
Ta kiểm định thị phần có phụ thuộc chất lượng sản phẩm hay không?
Kiểm định cặp giả thiết:
H1 : β1 = 0 : Thị phần không phụ thuộc chất lượng sản phẩm..
H2 : β1 ≠ 0 : Thị phần có phụ thuộc chất lượng sản phẩm.
Với mức α = 0,05
Sử dụng Megastat :
Regression Analysis
8
Thống kê trong kinh
doanh
r²
r
Std. Error
0.922
0.960
0.995
n
k
Dep. Var.
13
1
Y: Thị phần
ANOVA table
Source
Regression
Residual
Total
SS
128.3321
10.8987
139.2308
df
1
11
12
MS
128.3321
0.9908
F
129.53
Regression output
variables
Intercept
X : Chất lượng
coefficient
s
-3.0566
0.1866
t
(df=11)
-3.148
11.381
std. error
0.9710
0.0164
p-value
.0093
2.00E-07
p-value
2.00E-07
confidence interval
95%
95%
lower
upper
-5.1938
-0.9194
0.1505
0.2227
Kết quả : P-value =2.00E-07 < α = 0,05 => bác bỏ giả thiết H0. Tức β1 ≠ 0 => Thị phần phụ
thuộc chất lượng sản phẩm
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.:
R2 là hệ số xác định đo lường phần biến thiên của Y (thị phần) có thể được giải thích bởi
biến độc lập X (chất lượng sản phẩm).
R2 = 0.922 có ý nghĩa : 92.2% sự thay đổi của thị phần do chất lượng sản phẩm giải thích.
9