One-Sample Test
1.34 199 .182 1224.00 -579.32 3027.32
Thu nhap nam (trieu)
t df
Sig.
(2-tailed)
Mean
Difference
Lower Upper
95% Confidence Interval of the
Difference
Test Value = 32000
Giá trị t-student
= 1,34
Giá trị p-value
=0,182>0,05
& Tại các biểu trên, ta có thể biết giá trị trung bình, độ lệch chuẩn của mẫu. Ngoài ra t=1,34 nên
p-value=0,182>0,05 nên chúng ta chưa có cơ sở để bác bỏ H
0
hay chưa có cơ sở để chấp nhận H
1
.
Kiểm định tham số trung bình hai mẫu (hai mẫu độc lập)
Giả sử ta muốn so sánh thu nhập trung bình giữa những người có giới tính nam và nữ trên tổng
thể có khác nhau hay không, ta có giả thiết:
H
0
: Thu nhập trung bình của người nam và người nữ bằng nhau trên tổng thể
H
1
: Thu nhập trung bình của người nam và người nữ không bằng nhau trên tổng thể
& Nhấn Analyze – Compare Means – Independent sample t-test.
& Chọn biến thunhap vào ô Test Variables và biến gioitinh vào ô Grouping Variable
Nhấn vào Define Groups để
định nghĩa các nhóm với
Nam=1 và Nữ = 0
Nhấn vào Define Groups để
định nghĩa các nhóm với
Nam=1 và Nữ = 0
& Kết quả như sau
164
Group Statistics
124 37053.23 13962.42 1253.86
76 26976.32 7763.42 890.52
Gioi tinh
Nam
Nu
Thu nhap nam (trieu)
N Mean Std. Deviation Std. Error Mean
165
Independent Samples Test
17 .000 5.77 198 .000 10076.91 1747.75 6630 13524
6.55 196.4 .000 10076.91 1537.92 7044 13110
Equal variances
assumed
Equal variances
not assumed
Thu
nhap
nam
(trieu)
F Sig.
Levene's
Test for
Equality of
Variances
t df
Sig.
(2-ta
iled)
Mean
Difference
Std. Error
Difference
Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means
Trung bình người có
giới tính là Nam
Trung bình người có
giới tính là Nữ
Nếu sig. trong kiểm định phương sai<0,05 thì
phương sai giữa hai mẫu không bằng nhau,
ta sẽ dùng kết quả kiểm định t ở dòng thứ 2
Giá trị t của
kiểm định
p-value của
giá trị t
& Kiểm định Leneve’s (giả thiết H
0
: phương sai của hai mẫu (biến) bằng nhau, H
1
: phương sai
của hai mẫu (biến) không bằng nhau) sẽ cho phép kiểm định phương sai hai mẫu có bằng nhau
hay không, trong trường hợp này nếu sig. của F (trong thống kê Leneve’s) < 0,05 ta bác bỏ H
0
,
chấp nhận H
1
nghĩa là phương sai của hai mẫu không bằng nhau, do vậy giá trị t mà ta phải tham
chiếu là giá trị t ở dòng thứ 2. Ngược lại nếu sig. >0,05 thì phương sai của hai mẫu bằng nhau, ta
sẽ dùng kết quả kiểm định t ở dòng thứ nhất.
& Đối với kiểm định t, ta nhận thấy rằng t=6,55 và p-value = 0,000<0,05 năm ta có thể bác bỏ H
0
và chấp nhận H
1
, có nghĩa là thu nhập trung bình giữa người nam và nữ sẽ khác nhau.
Kiểm định tham số trung bình hai mẫu (hai mẫu phụ thuộc)
& Nhấn Analyze – Compare Means – Paired sample t-test. Chọn biến cần phân tích vào ô
Paired Variables.
Nhấn Option để thiết đặt
độ tin cậy
(g
iả sử độ tin cậ
y
là 95%
)
& Kết quả:
Paired Samples Statistics
42.9333 15 30.6419 7.9117
44.1333 15 28.1422 7.2663
TRUOCQC
SAUQC
Pair
1
Mean N Std. Deviation Std. Error Mean
Paired Samples Test
-1.200 5.7842 1.4935 -4.4032 2.0032 803 14 .435
TRUOCQC - SAUQCPair 1
Mean
Std.
Deviation
Std.
Error
Mean
Lower Upper
95% Confidence
Interval of the
Difference
Paired Differences
t df
Sig.
(2-tailed)
Giá trị t-student
= -0,803
Giá trị ước lượng
(giới hạn trên)
Giá trị ước lượng
(giới hạn dưới)
Giá trị p-value
=0,435>0,05
& Vì giá trị t=-0,803 và p-value = 0,435>0,05 nên chúng ta chưa có cơ sở để bác bỏ H
0
tức là
chưa có cơ sở để chấp nhận H
1
.
Phân tích phương sai (Analysis of variance – ANOVA)
Giả sử chúng ta muốn so sánh thu nhập trung bình của các đối tượng làm trong những lĩnh vực
dịch vụ - thương mại, xây dựng và công nghiệp có khác nhau hay không. Giả thiết và đối thiết sẽ
là:
H
0
: Thu nhập trung bình của những người làm trong lĩnh vực dịch vụ - thương mại, xây dựng
và công nghiệp bằng nhau
H
1
: Thu nhập trung bình của người làm trong lĩnh vực dịch vụ - thương mại, xây dựng và công
nghiệp không bằng nhau (có nghĩa là tồn tại ít nhất một thu nhập trung bình của một ngành
khác với ít nhất một thu nhập trung bình của hai ngành còn lại)
& Nhấn Analyze – Compare Means – One-way ANOVA.
& Chọn biến cần phân tích (định lượng) vào ô Dependent List và biến phân loại vào ô Factor
166
& Nhấn Post Hoc để chọn loại kiểm định nhằm xác định cụ thể sự khác biệt giữa các nhóm
(nhóm nào khác với nhóm nào). Chúng ta có thể chọn Bonferroni hoặc Tukey’s-b (hai thống kê
này đều cho ra cùng một kết quả).
& Nếu phương sai giữa các nhóm cần so sánh không bằng nhau, chúng ta chọn Tamhane’s T2
(ứng dụng cho kiểm định t từng cặp nếu phương sai của chúng không bằng nhau).
& Nhấn Continue, nhấn Option để thiết đặt các lựa chọn.
& Trong đó Homogeneity-of-variance để kiểm định sự bằng nhau phương sai các nhóm, Means
plot để làm cho hình minh họa.
Test of Homogeneity of Variances
Thu nhap nam (trieu)
.414 2 197 .661
Levene Statistic df1 df2 Sig.
& Vì Sig. >0,05 nên ta có thể khẳng định là phương sai của các nhóm là bằng nhau, thỏa mãn
điều kiện của phân tích ANOVA.
167
ANOVA
Thu nhap nam (trieu)
87185676.623 2 43592838.312 .259 .772
33196619123.377 197 168510756.971
33283804800.000 199
Between Groups
Within Groups
Total
Sum of Squares df Mean Square F Sig.
& Với F=0,259 và p-value = 0,772>0,05 nên chưa có cơ sở để bác bỏ H
0
hay chưa có cơ sở để
chấp nhập H
1
& Trong các trường hợp khác, nếu ta bác bỏ H
0
và chấp nhận H
1
, với thống kê Bonferonni ta có
thể biết được sự khác nhau từng cặp của các tham số trung bình.
& Means plots
Loai hinh doanh nghiep
Cong nghiepXay dungDich vu thuong mai
Mean of Thu nhap nam (trieu)
35000
34000
33000
32000
Hồi quy tuyến tính
Giả sử chúng ta mong muốn tìm mối tương quan giữa hai biến năm làm việc (biến độc lập) và thu
nhập hàng năm (biến phụ thuộc) trên tổng thể, chúng ta sẽ thực hiện như thế nào.
& Vẽ sơ đồ, kiểm tra bằng thị giác mối quan hệ
& Vào Graphs, nhấn Scatter
168
& Chọn Simple và bấm Define
& Chọn các biến vào ô Y Axis (biến phụ thuộc) và X Axis (biến độc lập), bấm OK
Nam lam viec
20181614121086
Thu nhap nam (trieu)
100000
80000
60000
40000
20000
0
& Chúng ta có thể xem đường hồi quy lí thuyết của dãy dữ liệu bằng cách click hai lần vào
chuôt.
& Sau khi một màn hình mới hiện ra, vào Chart – Option, hội hội thoại tiếp theo sẽ hiện ra –
Bấm OK – Hội hội thoại sẽ là:
169
& Bấm Fit Options chọn Linear regression
& Bấm Continue và OK
Nam lam viec
20181614121086
Thu nhap nam (trieu)
100000
80000
60000
40000
20000
0
170
Rõ ràng trên hình vẽ bên, ta có thể hình dung có mối quan hệ tuyến tính (theo đường thẳng) giữa
số năm làm việc và thu nhập/năm. Để kiểm tra một cách chính xác, ta thực hiện thao tác hồi quy.
& Vào Analyze và Regression chọn các biến vào các ô tương ứng
ANOVA
b
449.294 1 449.294 71.115 .000
a
1250.926 198 6.318
1700.220 199
Regression
Residual
Total
Model
1
Sum of Squares df Mean Square F Sig.
Predictors: (Constant), Thu nhap nam (trieu)
a.
Dependent Variable: Nam lam viec
b.
Vì F=71,115 và p-value=0,000 nên chúng ta có thể khẳng định tồn tạo mô hình hay tồn tại mối
quan hệ giữa hai biến năm làm việc và thu nhập trên tổng thể.
Model Summary
.514
a
.264 .261 2.51
Model
1
R R Square Adjusted R Square Std. Error of the Estimate
Predictors: (Constant), Thu nhap nam (trieu)
a.
Ta có R
2
= 0,264 có nghĩa là biến số năm làm việc sẽ giải thích 26,4% thu nhập/ năm của nhân
viên (còn lại là những biến số khác).
Ta có R
2
a
=0,261, ta có thể kết luận mối quah hệ giữa hai biến này rất yếu vì R
2
a
=0,261<0,3.
Chú ý: Nếu R
2
a
<0,3 Mối quan hệ yếu
Nếu 0,3 <= R
2
a
<0,5 Mối quan hệ trung bình (chấp nhận)
171
Nếu 0,5 <= R
2
a
<0,7 Mối quan hệ khá chặt chẽ
Nếu 1 <= R
2
a
Mối quan hệ rất chặt chẽ
Coefficients
a
9.970 .491 20.304 .000
1.162E-04 .000 .514 8.433 .000
(Constant)
Thu nhap nam (trieu)
Model
1
B Std. Error
Unstandardized Coefficients
Beta
Standardized
Coefficients
t Sig.
Dependent Variable: Nam lam viec
a.
Bảng coefficient cho phép chúng ta kiểm định các hệ số góc trong mô hình, ta có t
1
= 8,433 và p-
value = 0,000<0,05 nên ta khẳng định tồn tại mối quan hệ giữa hai biến với hệ số góc b
1
=0,00011
có nghĩa là khi tăng mỗi năm làm việc, thu nhập hàng năm tang 110 ngàn đồng.
Ta có thể thành lập được phương trình hồi quy như sau:
y
i
= 9.870 + 0,00011x
i
+ e
KIỆM ĐỊNH CHI BÌNH PHƯƠNG VỀ TÍNH ĐỘC LẬP HAY PHỤ THUỘC GIỮA HAI
BIẾN (CROSSTABS)
Kiểm định phân phối (kiểm định sự phù hợp)
Tình huống: Trong một nghiên cứu ước tính của bộ Y tế, người ta mong muốn kiểm tra giả thuyết
rằng tần suất sử dụng dịch vụ bệnh viện của các ngày trong tuần là như nhau và giảm 25% vào
cuối tuần. Một mẫu gồ
m 52 000 bệnh nhân có phân phối sau:
Ngày Số bệnh nhân (quan sát) Số bệnh nhân (lí thuyết)
Thứ hai 8623 8000
Thư ba 8308 8000
Thứ tư 8420 8000
Thứ năm 9032 8000
Thứ sáu 8754 8000
Thứ bảy 4361 6000
Chủ nhật 4502 6000
52000 52000
Khi đó, giả thiết và đối thiết:
H
0
: Nhu cầu khám chữa bệnh là như nhau ở tất cả các ngày trong tuần và giảm 25% vào cuối
tuần
H
1
: Nhu cầu này có một dạng phân phối khác
172
Kiểm định chi bình phương về tính chất độc lập hay phụ thuộc (kiểm định hàng cột hay
kiểm định mối quan hệ giữa hai biến biểu danh)
Người ta dùng kiểm định Chi bình phương để kiểm định sự kết hợp giữa bai biến (biểu danh hoặc
thứ tự). Có một số chú ý như sau:
- χ
2
được thiết lập để xác định có hay không một mối liên hệ giữa hai biến, nhưng nó không chỉ
ra được cường độ của mối liên hệ đó. Trong trường hợp này, cần sử dụng các đo lường kết
hợp.
- χ
2
cho phép tìm ra những mối liên hệ phi tuyến tính giữa hai biến.
- Với kiểm định Chi bình phương, ta thành lập được các bảng chéo. Hệ số V Cramer được áp
dụng cho tất cả các loại bảng chéo với k là chiều bé nhất của bảng chéo. Cường độ của nó biến
động từ 0 đến 1.
)1(
2
−
=
kn
V
χ
Giả sử ta chọn phân tích tính độc lập giữa hai biến định tính quy mô doanh nghiệp (quymo) và
loại hình kinh doanh (loaihinh). Các bước tiến hành như sau:
H
0
: Hai biến quy mô doanh nghiệp và loại hình doanh kinh độc lập với nhau trên tổng thể
H
1
: Hai biến quy mô doanh nghiệp và loại hình doanh kinh phụ thuộc với nhau trên tổng thể
& Vào Descriptives statistics – Crosstab chọn các biến vào các ô tương ứng
173
& Bấm Statistics để thiết lập các thống kê
174
& Bấm Cells để thiết lập các tỷ lệ phần trăm theo dòng, cột hay tổng cộng
Chi-Square Tests
38.665
a
2 .000
50.910 2 .000
36.280 1 .000
104
Pearson Chi-Square
Likelihood Ratio
Linear-by-Linear Association
N of Valid Cases
Value df Asymp. Sig. (2-sided)
0 cells (.0%) have expected count less than 5. The minimum expected count is 12.92.
a.
Giá trị kiểm định
Chi bình phương
Giá trị kiểm định
p-value
Loai hinh doanh nghiep * Quy mo doanh nghiep Crosstabulation
11 26 37
22.1 14.9 37.0
10.6% 25.0% 35.6%
16 16 32
19.1 12.9 32.0
15.4% 15.4% 30.8%
35 0 35
20.9 14.1 35.0
33.7% .0% 33.7%
62 42 104
62.0 42.0 104.0
59.6% 40.4% 100.0%
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Count
Expected Count
% of Total
Dich vu thuong mai
Xay dung
Cong nghiep
Loai hinh
doanh nghiep
Total
vua va nho lon
Quy mo doanh nghiep
Total
Symmetric Measures
.610 .000
.610 .000
104
Phi
Cramer's V
Nominal by
Nominal
N of Valid Cases
Value Approx. Sig.
Not assuming the null hypothesis.
a.
Using the asymptotic standard error assuming the null hypothesis.
b.
Trong kiểm này, ta thấy giá trị Chi bình phương = 38,665 và p-value=0,000<0,05 nên ta bác bỏ
H
0
và chấp nhận H
1
tức hai biến phụ thuộc lẫn nhau trên tổng thể.
Hệ số Phi = 0,61 khẳng định mối quan hệ giữa hai biến này khá chặt chẽ.
KIỂM ĐỊNH PHI THAM SỐ
Kiểm định hai mẫu phụ thuộc (Wilcoxon, kiểm định dấu, kiểm định Nemar)
Với ví dụ về đánh giá hai loại kem ở trên, ta cógiả thiết:
Với giả thiết và đối thiết là:
H
0
: Không có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
H
1
: Có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể
Các bước thực hiện như sau:
& Vào Analyze – Nonparametric Tests - 2 Related Samples
175
& Kết quả thu được:
Ranks
2
a
1.50 3.00
5
b
5.00 25.00
2
c
9
Negative Ranks
Positive Ranks
Ties
Total
B - A
N Mean Rank Sum of Ranks
B < A
a.
B > A
b.
A = B
c.
Test Statistics
b
-1.876
a
.061
Z
Asymp. Sig. (2-tailed)
B - A
Based on negative ranks.
a.
Wilcoxon Signed Ranks Test
b.
& Nhìn vào bảng trên ta có thể dễ dàng diễn giải dữ liệu, với Z = -1,876 và p-value=0,61>0,05
nên ta chưa có cơ sở để bác bỏ H
0
tức chưa có cơ sở để chấp nhận H
1
hay chưa có cơ sở để khẳng
định có sự khác biệt trong mức độ ưa chuộng giữa A, B trong tổng thể.
Chú ý: Kiểm địn dấu và Nemar có thể thực hiện tương tự
Kiểm định nhiều hơn hai mẫu phụ thuộc (Friedman, Kendall’s W, Cochran’s Q)
Trong trường hợp giống như ví dụ ở trường hợp kiểm định wilcoxon, nhung bây giờ ta có 3 sản
phẩm A, B, C, khi đó
KH Kem A Kem B Kem C
1 4 3 5
2 5 5 5
3 2 5 5
4 3 2 5
176
5 3 5 5
6 1 5 5
7 3 3 5
8 2 5 5
9 2 5 5
& Vào Analyze – Nonparametric Test – K Related Samples chọn các biến vào phân tích
& Kết quả:
Ranks
1.39
2.00
2.61
A
B
C
Mean Rank
Test Statistics
a
9
9.308
2
.010
N
Chi-Square
df
Asymp. Sig.
Friedman Test
a.
& Với Chi bình phương = 9,308 và p-value=0,01<0,05 nên ta bác bỏ H
0
tức chấp nhận H
1
hay đã
có sự khác biệt trong mức độ ưa chuộng giữa A, B, C trong tổng thể.
Kiểm định cho hai mẫu độc lập (Mann-Whitney U)
Tình huống: Có hai loại máy nổ Toshiba và Yamaha đang tiêu thụ tại Việt Nam, một nhà phân
phối muốn kiểm tra mức độ tiêu hao nguyên vật liệu của hai loại sản phẩm này.
Nhà phân phối gặp các khách hàng sử dụng hai loại sản phẩm, tiến hành điều tra mức tiêu hao
nguyên vật liệu, t
ổng số khách hàng điều tra là 18 người trong đó 10 người sử dụng sản phẩm
Toshiba và 10 người sử dụng sản phẩm Yamaha, kết quả thu được như sau:
177
KH Toshiba Yamaha
1
4000 4200
2
3800 4300
3
4600 3400
4
4300 3500
5
5000 3800
6
5300 4200
7
4900 4300
8
4700 3400
9
4000
10
5200
& Vào Analyze – Nonparametric Test – 2 Independent Samples chọn các biến vào phân tích
& Nhấn Grouping Define để định nghĩa các biến
& Kết quả như sau
Ranks
10 12.15 121.50
8 6.19 49.50
18
NHANHIEU
Toshiba
Yamaha
Total
TIEUHAO
N Mean Rank Sum of Ranks
178
Test Statistics
b
13.500
49.500
-2.364
.018
.016
a
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Exact Sig. [2*(1-tailed Sig.)]
TIEUHAO
Not corrected for ties.
a.
Grouping Variable: NHANHIEU
b.
Ta thấy giá trị Mann-Whitney U = 13,5, giá trị Z = -2,363 và p-value=0,18 nên ta bác bỏ H
0
, chấp
nhận H
1
tức là có sự khác nhau về mức tiêu hao nhiên liệu trung bình của hai loại sản phẩm là
khác nhau.
Kiểm định nhiều hơn hai mẫu độc lập (Kruskal-Wallis H)
Giả sử như chúng ta có 3 nhóm sản phẩm (thêm một sản phẩm của hãng Sonix), cách thức thực
hiện như sau:
& Vào Analyze – Nonparametric Test – K Independent Samples chọn các biến vào phân tích
& Vào Grouping Variable để định nghĩa biến, hiện tại chúng ta có 3 biến, chúng ta đặt giá trị ở
maximum là 3, nếu chúng ta so sánh 2 biến thì chúng ta định số 2 (giá trị 1, 2, hay 3 phụ thuộc
vào các định nghĩa value label của biến nhanhieu.
179
Ranks
10 18.55
8 9.63
8 11.06
26
NHANHIEU
Toshiba
Yamaha
3
Total
TIEUHAO
N Mean Rank
Test Statistics
a,b
7.318
2
.026
Chi-Square
df
Asymp. Sig.
TIEUHAO
Kruskal Wallis Test
a.
Grouping Variable: NHANHIEU
b.
Ta thấy giá trị Chi bình phương = 7,318 và p-value=0,026 nên ta bác bỏ H
0
, chấp nhận H
1
tức là
có sự khác nhau về mức tiêu hao nhiên liệu trung bình của ba loại sản phẩm là khác nhau.
TÓM TẮT
Trong nghiên cứu marketing, phân tích dữ liệu luôn bao hàm kiểm định giả thuyết. Để thực hiện
một kiểm định người ta phải trình bày hai giả thuyết là giả thuyết không ( thường ký hiệu H
0
) -
giả thuyết cần kiểm định; và giả thuyết đối ( thường ký hiệu H
1
) - giả thuyết thay thế cho giả
thuyết không để khi giả thuyết H
0
bị bác bỏ thì chấp nhận giả thuyết đối H
1
này. Các kỹ thuật
thống kê cho phép chúng ta đi đến quyết định là các giả thuyết đó có được kiểm chứng bằng số
liệu thực tế hay không.
Khi dựa vào mẫu để kiểm định giả thuyết có thể mắc hai loại sai lầm. sai lầm loại một là sai lầm
khi chúng ta bác bỏ một giả thuyết đúng. Sai lầm loại hai là sai lầm khi chúng ta thừa nhận một
giả thuyết sai.
Thực hi
ện một bài toán kiểm định bao gồm các bước: phát biểu giả thuyết không giả thuyết đối;
xác định mức ý nghĩa; lựa chọn phương pháp kiểm định; tính giá trị kiểm định; xác định miền
bác bỏ; đưa ra kết luận.
Thủ tục kiểm định giả thuyết có thể được sắp xếp theo hai loại chủ yếu: kiểm định tham số và
kiểm định phi tham số- tuỳ
thuộc vào thang đo lường của biến liên quan. Các kiểm định tham số
đòi sử dụng các thang đo lường là khoảng hoặc tỷ lệ, trong khi các kiểm định phi tham số phù
hợp với các thang đo lường là định danh và thứ tự. Kiểm định tham số được nghiên cứu bao gồm
kiểm định tham số trung bình của tổng thể, kiểm định tham số tỷ lệ, kiểm định sự khác nhau giữa
hai trung bình hai tổ
ng thể, kiểm định sự khác nhau trung bình của nhiều tổng thể và hồi quy
tương quan. Kiểm định phi tham số chúng ta sẽ nghiên cứu là kiểm định về quy luật phân phói
của tổng thể, kiểm định về tính độc lập hay phụ thuộc, kiểm định dấu, kiểm định Wilcoxon, kiểm
định Mann-Whitney
Các thủ tục kiểm định đều dễ dàng và đơn giản nhờ vào sự trợ giúp của phân mề
m SPSS.
180
181
CÂU HỎI ÔN TẬP
1. Thế nào là giả thuyết không? Giả thuyết đối? Cho ví dụ?
2.
Trong kiểm định giả thuyết thống kê có thể vấp những loại sai lầm nào?
3.
Hãy cho biết các bước cơ bản thực hiện bài toán kiểm định?
4.
Sự khác nhau cơ bản phân biệt giữa kiểm định tham số và phi tham số.
5.Thời gian hoàn thành một sản phẩm của nhà máy A qua quá trình quan sát 25 công nhân theo
bảng sau:
Thời gian (phút) 40-42 42-44 44-46 46-48 48-50
Số công nhân 2 6 10 4 3
Theo nhận định của nhà máy thời gian hoàn thành một sản phẩm là 44 phút, như vậy nhìn nhận
của nhà máy có đúng không? Giả sử rằng thời gian hoàn thành một sản phẩm của các công nhân
là biến chuẩn.
6. Theo thiết kế kỹ thuật chiều dài sản phẩm A là 20cm. Sau thời gian sản xuất, nghi ngờ chiều
dài sản phẩm không đạt yêu cầu. Tiến hành kiểm tra, người ta chọn ngẫu nhiên 64 sản phẩm để
đo và thu được k
ết quả như sau chiều dài trung bình 20,5 cm và độ lệch tiêu chuẩn điều chỉnh là
1cm. Biết rằngchiều dài loại chi tiết trên là biến chuẩn N(a,σ). Hãy kiểm định điều nghi ngờ với
mức ý nghĩa α=0,05 ?
7.Trong lượng sản phẩm do nhà máy sản xuất ra (X) là một đại lượng ngẫu nhiên phân phối
chuẩn với độ lệch chuẩn là σ=2 kg và trọng lượng trung bình là 20 kg. Nghi ngờ máy hoạt động
không bình th
ường làm thay đổi trọng lượng trung bình của sản phẩm, người ta cân thử 100 sản
phẩm và thu được kết qủa sau:
Trọng lượng sản phẩm (kg) 19 20 21 22 23
Số sản phẩm tương ứng 10 60 20 5 5
Với mức ý nghĩa α=0,05 hãy kết luận về nghi ngờ nói trên. Cho U
0,95
=1,645, U
0,975
=1,96 hãy ước
lượng trọng lượng sản phẩm do nhà máy sản xuất.
8. Tỉ lệ phế phẩm của một nhà máy theo dự toán là 0,1 và có người cho rằng tỉ lệ đó là tỉ lệ thật
sự của phế phẩm. Chọn ngẫu nhiên 100 sản phẩm của nhà máy có thấy 11 phế phẩm. Hãy kiểm
định nhận xét trên với α=0,05 ?
9. Giám đốc marketing của một công ty sẽ thực hiện chương trình khuyến mãi sản phẩm A ở khu
vực X nếu tỷ lệ những người thường xuyên theo dõi chương trình quảng cáo sản phẩm A của
công ty trên truyền hình là trên 15%. Thực hiện điều tra 2500 người có ti vi ở khu vực có 380
người theo dõi chương trình quảng cáo sản phẩm của công ty. Với mức ý nghĩa α = 0,05, hãy
giúp giám đốc marketing quyết định xem có nên thực hiện chương trình khuyến mãi đó không?
Ước lượng tỷ lệ những người thường xuyên theo dõi chươ
ng trình quảng cáo của công ty trên
truyền hình? Tỷ lệ những người có máy thu hình ở khu vực đó là 20%. Cho biết U
0,95
=1,645,
U
0,975
=1,96.
10. Định mức thời gian lắp đặt một máy vi tính cá nhân là một đại lượng ngẫu nhiên tuân theo
qui luật phân phối chuẩn có thời gian quy định là 30 phút. Do có thay đổi trong qui trình lắp đặt
loại máy vi tính này, người ta nghĩ rằng điều này có thể dẫn đến việc phải thay đổi định mức thời
gian lắp đặt máy. Tiến hành kiểm tra thử 5o máy vi tính và thu được kết quả sau:
Thời gian lắp đặt (phút) Số máy tính
25-27 3
27-29 14
29-31 19
31-33 10
33-35 4
Với mức ý nghĩa α=0,05, hãy kết luận xem có cần thay đổi định mức thời gian lắp đặt máy hay
không? Ước lượng thời gian lắp đặt trung bình của loại máy vi tính đó? Cho biết
=1,711,
=2,064.
)24(
95,0
T
)24(
975,0
T
11. Một công ty sản xuất giấy dùng cho máy vi tính theo kế hoạch cho ra những mẫu giấy có
chiều dài trung bình 11 cm và độ lệch chuẩn 0,02cm. Vào những khoảng thời gian nhất định,
người ta lẫy ngẫu nhiên những mẫu giấy sản xuất, xác định chiều dài trung bình xem có bằng
11cm không để biết máy làm việc bình thường hay có trục trặc gì. Trong một lần kiểm nghiệm,
một mẫu 1000 tờ giấy đã được chọn và chiều daì trung bình đ
o được 10,998 cm. Nếu độ tin cậy
cho việc ước lượng chiều dài trung bình là 95% thì nhà sản xuất có thể kết luận gì về giấy đã sản
xuất được?
12. Hãng sản xuất xe hơi Mercedes muốn nghiên cứu mức tiêu hao trung bình lượng xăng của
một loại xe tải do hãng này sản xuất. Kết quả đo được như sau:
Tiêu hao (lít/100km) Số xe
16-17 5
17-18 9
18-19 14
19-20 18
20-21 25
21-22 16
22-23 7
23-24 6
a. Ước lượng tham số trung bình với mức ý nghĩa 5%
b. Hãng khẳng định mức xăng tiêu hao trung bình là 19 lít /100km. Hãy kiểm tra lại lời khẳng
định này với mức ý nghĩa 5%?
13. Một doanh nghiệp có số liệu thống kê về doanh thu bán hàng của mình qua ba năm theo các
tháng như sau:
T1 T2 T3 T4 T5 T6 T7 T8 T9 T10 T11 T12
N1 250 240 260 270 280 230 290 180 210 250 270 300
N2 320 330 330 350 360 270 230 230 270 350 350 350
N3 360 380 380 400 410 350 300 300 350 430 430 450
a, Hãy dự đoán doanh thu bán hàng năm thứ 4.
b. Doanh nghiệp dự kiến năm thứ 4 sẽ sử dụng 2% doanh thu để thực hiện chương trình khuyến
mãi. Hãy tính khoản dự kiến này.
c. Dự kiến song song với việc thực hiện khuyến mãi, sản lượng mua của doanh nghiệp tăng lên
3%. Hãy lập bảng báo cáo kết quả.
182
183
14. Một doanh nghiệp sản xuất thức ăn để nuôi gà công nghiệp muốn kiểm tra trọng lượng của
các bao thức ăn do mình sản xuất. Chọn cân thử ngẫu nhiên 50 bao thức ăn và kết quả thu được
như sau:
20 25 29 32 30
35 21 26 32 33
27 33 22 36 29
27 36 28 23 36
32 25 36 33 24
27 31 30 29 22
26 32 29 36 30
29 31 29 32 31
29 37 38 36 39
28 32 40 30 28
a. Hãy phân kết quả cân được thành 5 lớp.
b. Ước lượng trọng lượng trung bình của các bao thức ăn trên với độ tin cậy 95%?
15. Công ty nước giả khát X có 3 loại sản phẩm là A, B, C với mong muốn số lượng chai tiêu thụ
lần lượt chiếm 25%, 25%, 50%. Với độ tin cậy 95% hãy kiểm nghiệm xem có trái với mong
muốn không nếu kết quả điều tra thu thập như sau:
Sản phẩm A B C
Sản lượng tiêu thụ 70 66 164
16. Trong một lần kiểm tra sơ bộ về tình hình học tập của sinh viên một trường đại học với một
mẫu chọn ngẫu nhiên gồm 400 sinh viên để phân loại giỏi, khá, trung bình, yếu. Với giả thiết
rằng tỷ lệ sinh viên theo các tiêu thức trên lần lượt là: 20%, 50%, 20%, 10%. Kết quả kiểm tra
cho thấy:
Giỏi Khá Trung bình Yếu
Số lượng SV 71 194 89 46
Với mức ý nghĩa 5%, hãy xác định xem giả thuyết trên có đúng không?
17. Hãy thử giả thiết Ho về tính chất độc lập của hai yếu tố phân loại A và B bằng cách dùng
phép kiểm định chi (χ) cho trong bảng sau với mức ý nghĩa 5%?
B
B1 B2 B3
A1 39 75 42
A2 63 51 70
A
A3 30 38 29
18. Để nghiên cứu về nhu cầu xem phim ở rạp chiếu bóng của nhân dân các vùng trong thành phố
Đà Nẵng, một nhân viên marketing của công ty chiếu bóng thành phố đã chọn ngẫu nhiên một
mẫu gồm 291 người để điều tra. Họ được phân thành ba vùng: nội thành, ven đô và huyện. Mỗi
người được hỏi để biết có đi xem phim: (1): mỗi ngày một lần
(2): ít nhất một lần/tuần (3): ít nhất một lần/tháng
(4): ít hơn m
ột lần/tháng (5): không đi xem bao giờ
Bảng phân bố trong mẫu theo vùng và mức độ xem phim như sau: