Tải bản đầy đủ (.pdf) (20 trang)

nghiên cứu marketing phần 7 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (879.31 KB, 20 trang )

+ Các thông số khác được thực hiện như ở mã hoá dùng lại biến cũ.
PHÂN TÍCH MÔ TẢ (THỐNG KÊ MÔ TẢ):
Bảng phân bố tần suất
Bảng phân phối tầng suất được thể hiện với tất cả các biến định tính (rời rạc) với các thang đo
biểu danh, thứ tự và các biến
định lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ.

Nhấn vào để lựa chọn các thông số đo
lương (mode, median, trung bình…)
Nhấn vào để vẽ đồ thị các tầng suất
của biến sô


Central tendancy: Đo lườn
g
khuynh hướng hội tụ: tham số
trung bình (mean), median,
mode, tổng (sum)

Dispersion: Đo lường độ
p
hân tán:
đ
ộ lệch chuẩn (std.
deviation), phương sai

Distribution: Kiểm định phân
p
hối chuẩn (skeness và
kurtosis
)




124



Loai hinh doanh nghiep
88 44.0 44.0 44.0
56 28.0 28.0 72.0
56 28.0 28.0 100.0
200 100.0 100.0
Dich vu thuong mai
Xay dung
Cong nghiep
Total
Valid
Frequency Percent Valid Percent Cumulative Percent

Tần suất
xuất hiện
Tỷ lệ
phần trăm

So lao dong
25 12.5 12.5 12.5
61 30.5 30.5 43.0
63 31.5 31.5 74.5
45 22.5 22.5 97.0
6 3.0 3.0 100.0
200 100.0 100.0

Tu 1 den 5
Tu 6 den 20
Tu 21 den 200
Tu 200 den 300
Tren 300
Total
Valid
Frequency Percent Valid Percent Cumulative Percent


Loai hinh doanh nghiep
28.0%
28.0%
44.0%
Cong nghiep
Xay dung
Dich vu thuong mai



125
Lập bảng so sánh
Bảng so sánh 2 nhân tố:

7 28.0% 6 24.0% 12 48.0%
26 42.6% 21 34.4% 14 23.0%
26 41.3% 19 30.2% 18 28.6%
27 60.0% 7 15.6% 11 24.4%
2 33.3% 3 50.0% 1 16.7%
88 44.0% 56 28.0% 56 28.0%

Tu 1 den 5
Tu 6 den 20
Tu 21 den 200
Tu 200 den 300
Tren 300
So lao
dong
Group Total
Count Row %
Dich vu thuong mai
Count Row %
Xay dung
Count Row %
Cong nghiep
Loai hinh doanh nghiep

Phân tích một biến định lượng
Ước lượng tham số trung bình (một nhóm)


126

One-Sample Statistics
200 33224.00 12932.72 914.48
Thu nhap nam (trieu)
N Mean Std. Deviation Std. Error Mean

One-Sample Test
36.331 199 .000 33224.00 31420.68 35027.32
Thu nhap nam (trieu)

t df Sig. (2-tailed)
Mean
Difference
Lower Upper
95% Confidence Interval of
the Difference
Test Value = 0

Giới hạn trên
của ước lượng
Giới hạn dưới
của ước lượng
Giá trị
trung bình
Độ lệch
chuẩn
Ước lượng sự khác biệt giữa hai tham số trung bình (độc lập hoặc phụ thuộc)
Phần này sẽ được trình bày ở chương sau cùng với phần kiểm định giả thiết.

TÓM TẮT
Để dữ liệu chuyển thành thông tin theo mục tiêu nghiên cứu, cần phải xử lý và phân tích dữ liệu.
Tuy nhiên, vì dữ thu thập từ hiện trường về còn ở dạng “thô” nên cần thiết phải thực hiện khâu
chuẩn bị dữ liệu. Chuẩn bị dữ liệu là làm cho dữ liệu có giá trị, hiệu chỉnh dữ liệu, cấu trúc và mã
hoá dữ liệu. Làm cho dữ liệu có giá trị là kiểm tra các dữ liệu để đảm bảo chúng có giá trị đối với
việc xử lý và phân tích. Hiệu chỉnh dữ liệu là sửa chữa các sai sót về ghi chép hoặc ngôn từ phát
hiện được qua kiểm tra. Mã hóa dữ liệu là nhận diện và phân loại mỗi câu trả lời trên một ký hiệu
(bằng số hoặc bằng chữ). Có 3 cách cơ bản để xử lý các dữ liệu xấu đó là quay trở lại người
phỏng vấn hoặc người trả lời để làm sáng tỏ vấn đề; suy luận từ các câu trả lời khác hoặc loại
toàn bộ câu trả lời.
Để dữ liệu thu thập thường được xử lý bằng máy điện toán nên chúng ta phải mã hoá dữ liệu. Mã

hóa dữ liệu là quá trình liên quan tới việc nhận diện và phân loại mỗi câu trả lời trên một ký hiệu
định (ký hiệu có thể bằng số hoặc bằng chữ). Công việc mã hóa có thể được thực hiện từ khi thiết
kế bản câu hỏi (mã hoá trước) hoặc sau khi dữ liệu được thu thập về (mã hoá sau). Mã hoá sau
thường dùng đối với các câu hỏi mở vì câu trả lời thường theo tình huống tự do nên nhiều khi
không dự đoán trước được. Khi thiết lập kiểu mã hóa cần phải chú ý các nguyên tắc: đảm bảo số
kiểu mã hóa thích hợp, ranh giới giữa các “loại mã hóa” rõ ràng, thông tin trả lời được xếp trong
cùng một loại mã hóa phải tương tự nhau về đặc trưng nghiên cứu, đóng kín các khoảng lớp
Dữ liệu sau khi đã được chuẩn bị tốt sẽ tiến hành phân tích và diễn giải để tìm hiểu và rút ra ý
nghĩa của các dữ liệu, cung cấp thông tin làm căn cứ đề xuất các giải pháp rõ ràng và khoa học
hơn. Phân tích và diễn giải dữ liệu là hai công việc gắn kết với nhau. Phân tích dữ liệu đúng là

127

128
điều kiện để đạt được sự diễn giải đúng. Tuy nhiên nếu phân tích đúng nhưng kết quả được giải
thích sai lệch thì cũng không có được thông tin đúng.
Phân tích dữ liệu ở mức độ cơ bản đầu tiên liên quan đến các kỹ thuật lập bảng đơn giản hay lập
bảng so sánh toàn diện, đo lường khuynh hướng hội tụ và phân tán, ước lượng các thông số thích
hợp. Bảng đơn giản tính số lần xuất hiện đặc tính giống nhau của cùng một biến. Sự phân bố này
có thể được đánh giá là có tuân theo qui luật phân phối chuẩn hay không bằng các hệ số
Skewness và Kurtosis là các hệ số đo lường mức độ đối xứng và độ nhọn của phân phối. Bảng
chéo khác bảng đơn giản là người ta đưa thêm nhân tố ảnh hưởng để phân tích cụ thể hơn đặc
tính của dữ liệu. Vì chúng ta thường không khảo sát toàn bộ tổng thể mà sử dụng mẫu nên trong
nhiều tình huống phải ước lượng giá trị tham số tổng thể từ giá trị mẫu để có thông tin cho ra
quyết định như ước lượng giá trị trung bình, tỷ lệ, phương sai, sự khác biệt hai giá trị trung bình
của hai tổng thể, sự khác biệt tỷ lệ giữa hai tổng thể. Hiện nay, việc phân tích dữ liệu ngày càng
trở nên nhanh chóng và đơn giản hơn bởi chúng ta có thể ứng dụng những phần mềm rất hiệu quả
trong công việc này.

CÂU HỎI

1. Những sai sót nào thường gặp cần phải hiệu chỉnh dữ liệu?
2. Các cách tiếp cận để hiệu chỉnh dữ liệu, trong mỗi cách, cho ví dụ minh họa?
3. Mã hóa dữ liệu là gì ? Các nguyên tắc mã hóa dữ liệu?
4. Sự khác nhau giữa mã hoá trước và mã hoá sau ?
5. Người ta thực hiện mã hoá các câu hỏi mở như thế nào ?
6. Sau đây là một số câu hỏi trích ra từ một bản câu hỏi. Hãy mã hoá cho các câu hỏi đặt ra :
A. Bao lâu thì Anh/chị mua vitamin một lần ?
a. Nhiều hơn một lần một tuần
b. Một tuần một lần
c. Hai tuần một lần
d. Ba tuần một lần
e. 1 thánh một lần
f.
Hai tháng một lần
g. Ba tháng một lần
h.
Ít thường xuyên hơn.
B. Thường thì anh/ chị mua vitamin ở đâu?
a. Nhà thuốc (không nằm trong bệnh viện)
b.
Từ bệnh viện/nhà thuốc nằm trong bệnh viện
c.
Phòng khám tư của bác sĩ
d. Khác (ghi rõ)
C.
Sau đây là một số yếu tố mà người ta thường quan tâm khi mua vitamin. Đối với từng
yếu tố, anh/chi cho biết mức độ quan trọng của nó đối với anh/chị trong việc chọn mua
một nhãn hiệu vitamin:




Rất
không
quan
trọng









Rất
quan
trọng
Giúp tăng cường sức đề kháng, phòng bệnh tật
Giúp vượt qua những mệt nhọc về thể chất
Ngăn ngừa, chống stress, giảm căng thẳng, lo lắng
Được bác sĩ khuyên dùng
Được bạn bè, người than khuyên dùng
Giúp phục hồii nhanh chóng sau khi bị bệnh
Kích thích tiêu hoá, giúp ăn ngon miệng
Quảng cáo hấp dẫn
Được các dược sĩ/ người bán thuốc khuyên dung
Có giá phải chăng
Có tác dụng nhanh chóng
1
1

1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3

3
4
4
4
4
4
4
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
5
7. Hãy dùng SPSS để định nghĩa các biến mà bạn vừa mã hóa.
8. Sự khác nhau chính giữa bảng phân phối tần suất và bảng chéo ?
9. Điều tra 100 sinh viên trường đại học kinh tế và quản trị kinh doanh có được số liệu về chiều
cao của họ như sau:
Chiều cao (mét) Số sinh viên
1,51-1,55 10
1,55-1,60 28

1,60-1,65 35
1,65-1,70 15
1,70-1,75 12
Hãy ước lượng khoảng tin cậy đối xứng của chiều cao trung bình của sinh viên với độ tin cậy là
95%. Cho biết U
0,95
=1,645, U
0,975
=1,96.
10. Định mức thời gian gia công một chi tiết là một đại lượng ngẫu nhiên tuân theo qui luật phân
phối chuẩn có thời gian quy định là 20 phút. Do điều kiện tổ chức sản xuất thay đổi, người ta tiến
hành kiểm tra 25 chi tiết và thu được dữ liệu sau:
Thời gian (phút) Số chi tiết
14-16 2
16-18 7
18-20 10
20-22 4
22-24 2
Với độ tin cậy 1- α = 0,95, hãy ước lượng thời gian gia công trung bình của chi tiết đó? Cho biết
)
=1,711, =2,064.
24(
05,0
T
)24(
025,0
T
11. Để định giá cho sản phẩm của mình, một hãng sản xuất đồ chơi trẻ em tiến hành phỏng vấn
ngẫu nhiên 50 người tiêu dùng và kết quả thu được như sau:
Mức giá (ngàn đồng) 32-34 34-36 36-38 38-40 40-42

Người chấp nhận 5 10 25 8 2

129

130
Với độ tin cậy 1- α = 0,95. Hãy ước lượng tỷ lệ khách mua hàng của hãng nếu hãng định giá:
a. 35 ngàn đồng
b. 37 ngàn đồng.
12. Để kiểm tra chất lượng sản phẩm, cục tiêu chuẩn đo lường chất lượng sản phẩm tiến hành
kiểm tra 200 hộp sữa ở một kho hàng của một công ty sữa thấy có 50 hộp sữa bị biến chất. Hãy
tìm khoảng tin cậy của tỉ lệ hộp sữa bị biến chất của kho hàng với độ tin cậy 1- α = 0,95. Biết
rằng kho hàng đó có 8000 hộp sữa.
13. Để tìm hiểu về độ tuổi trung bình của sinh viên hệ tại chức tại một trường đại học, người ta đã
tiến hành điều tra 1000 sinh viên và thu được số liệu như sau:

Độ tuổi
18-
20
21-
23
24-
26
27-
29
30-
32
33-
35
36-
38

39-
41
42-
44
45-
47
48-
50
51-
53
Số người 36 44 72 104 172 280 122 68 42 34 16 8
Hãy ước lượng khoảng tin cậy đối xứng của độ tuổi trung bình với độ tin cậy 95%?
14. Chiều dài trung bình của một chi tiết tại một xưởng lắp ráp của hãng Honda việt nam là đại
lượng ngẫu nhiên tuân theo qui luật phân phối chuẩn, người ta kiểm tra 360 chi tiết và đo được
chiều dài trung bình của chi tiết này là 20cm. Hãy ước lượng chiều dài trung bình của chi tiết đó
với độ tin cậy 95%?
15. Khi điều tra ngẫu nhiên 100 sản phẩm có trong một kho hàng thấy có 10 phế phẩm. Hãy tìm
khoảng tin cậy của tỷ lệ phế phẩm của kho hàng với độ tin cậy 95%?
16. Để xác định số chim yến có trên đảo A (độc lập với các đảo khác), người ta chọn 1.000 con
chim yến và đánh dấu tất cả số chim yến đó rồi thả chúng lại ở khắp nơi trên đảo. Sau một thời
gian, bắt ngẫu nhiên 900 con kiểm tra thấy có 45 con có đánh dấu. Hãy tìm khoảng tin cậy của số
lượng chim có trên đảo A với độ tin cậy 95%?

TÀI LIỆU THAM KHẢO
A. B. Blankenship and B. E. Breen, State of the Art Marketing Research (Chicago: NTC Business Books,
1993), 106–112.
V. Kumar, International Marketing Research (Upper Saddle River, N.J.: Prentice-Hall, 2000), 247–248.
Jerry Flint, “The Cadillac-to-Chevrolet strategy,” Forbes, vol. 153, no. 12 (June 4, 1994): 94.
Alan T. Shao, An Empirical Study of the Structures,Strategies, and Environments of U.S. Multinational
Advertising Agency Affiliates (Ann Arbor: UMI Dissertation Information Service, 1989), 155.





131

CHƯƠNG TÁM
8



PHÂN TÍCH VÀ DIỄN GIẢI DỮ LIỆU
TRONG NGHIÊN CỨU MARKETING

NỘI DUNG CHÍNH


Nội dung chương này bàn đến bao gồm:
- Thế nào là giả thuyết nghiên cứu
- Các loại sai lầm khi thực hiện kiểm định giả thuyết
- Các bước giải quyết một bài toán kiểm định
- Các phương pháp kiểm định tham số
- Các phương pháp kiểm định phi tham số


















MÔ HÌNH LỰA CHỌN PHƯƠNG PHÁP KIỂM ĐỊNH
Giả thiết thống kê là một giả thiết có liên quan đến một trong ba vấn đề sau:
(1) Tính độc lập hay phụ thuộc của đại lượng ngẫu nhiên cần nghiên cứu.
(2) Dạng của qui luật phân phối xác suất của đại lượng ngẫu nhiên.
(3) Giá trị của tham số của qui luật phân phối xác suất đã biết dạng.
(1) & (2) là giả thiết phi tham số và (3) là giả
thiết về tham số.
Trong phần này sẽ giới thiệu phương pháp kiểm định giả thiết về tham số như tham số trung bình
x trong qui luật phân phối chuẩn N(µ,σ
2
), tham số tỷ lệ p trong qui luật phân phối A(P), tham số
chi bình phương, tham số Fisher… Trong khuôn khổ cuốn sách này, chúng tôi chỉ giới thiệu cách
thức áp dụng những phương pháp kiểm định đó để giải quyết những vấn đề liên quan đến nghiên
cứu tiếp thị, những vấn đề khác liên quan đến việc giải thích bản chất của các công thức có thể
tham khảo thêm trong các giáo trình chuyên môn về thống kê toán.
Các khái niệm cơ bản
Giả thiết cần kiểm định
Giả sử đại lượng ngẫu nhiên X cần nghiên cứu tuân theo một qui luật phân phối xác suất đã biết
dạng, nhưng chưa biết giá trị của tham số θ nào đó của nó. Trên cơ sở những tin tức thu được, ta
có thể giả định rằng θ = θ

0
, trong đó θ
0
là số thực. Tất nhiên điều giả định θ = θ
0
này có thể đúng
hoặc có thể sai, do đó cần phải kiểm tra lại giả định đó. Từ đó ta có giả thiết cần kiểm định là
{H
0
: θ = θ
0
}.
Các giả thiết đối (đối thiết)
Vì giả thiết H
0
cũng có thể đúng và cũng có thể sai với một độ tin cậy nào đó, khi giả thiết H
0
sai
thì ta phải bác bỏ nó. Khi đó phải chấp nhận một trong ba giả thiết đối (ký hiệu: H
1
) sau đây:
- Trong trường hợp kiểm định dạng "hai đuôi" (Two-tail test):




=
01
00
: H

:
θθ
θθ
H

- Trong trường hợp kiểm định dạng "một đuôi" (One-tail test):



>
=
01
00
: H
:
θθ
θθ
H
hoặc



<
=
01
00
: H
:
θθ
θθ

H
Do vậy trong bài toán kiểm định giả thiết, sau khi đã đề ra giả thiết cần kiểm định H
0
, ta cần phát
biểu kèm một giả thiết đối H
1
để khẳng định rằng nếu như giả thiết H
0
bị bác bỏ thì ta chấp nhận
giả thiết đối kèm theo với một mức ý nghĩa α nào đấy (1- α được gọi là độ tin cậy).
Các loại sai lầm
Chú ý rằng, vì mẫu không phải là hình ảnh chính xác của tổng thể, nên mọi mẫu chọn được đều
chứa một sai số ngẫu nhiên nào đó. Do vậy, khi dựa vào mẫu để kiểm định giả thiết có thể gặp
ph
ải hai loại sai lầm sau:
- Sai lầm loại 1: Khi ta bác bỏ một giả thiết đúng.
- Sai lầm loại 2: Khi ta thừa nhận một giả thiết sai.

132
Trong khi tiến hành kiểm định, người ta thường ấn định trước một xác suất mức sai lầm loại 1.
Nếu xác suất này bằng α, thì α được gọi là mức ý nghĩa của kiểm định (thông thường α phải khá
bé, α = 0,05, α = 0,1).
Giả thiết H
0
đúng Giả thiết H
0
sai
Chấp nhận
Quyết định đúng
Sai lầm loại 2 (xác suất β)

Bác bỏ
Sai lầm loại 1 (xác suất α)
Quyết định đúng
Tiêu chuẩn kiểm định và miền bác bỏ
Sau khi đã đề ra giả thuyết H
0
cần kiểm định kèm theo giả thiết đối H
1
và qui định mức ý nghĩa
α, ta cần phải tìm một thống kê T cùng qui luật phân phối xác suất của nó. Với một mức ý nghĩa
α xác định, ta luôn tìm được mọi miền W
α
, thỏa mãn điều kiện
(
)
α
α
=∈
0
HWKP
(xác suất để
K thuộc miền miền bác bỏ W
α
với điều kiện H
0
đúng bằng α).
Do α khá bé, nên ta có thể coi biến cố (K∈W
α
) là biến cố không thể có (với điều kiện giả thiết H
0


đúng). Vì vậy, trong thực tế nếu dựa vào giá trị x của mẫu ngẫu nhiên X, ta tính được giá trị k
qs

của thống kê K mà lại thấy giá trị k
qs
∈W
α
, thì điều này sẽ mâu thuẫn với điều kiện nói trên.
Nguyên nhân sinh ra mâu thuẫn giữa lý thuyết và thực tế là do ta giả thiết rằng H
0
đúng. Để tránh
mâu thuẫn này ta phải bác bỏ giả thiết, vì thế W
α
được gọi là miền bác bỏ và k
qs
được gọi là tiêu
chuẩn kiểm định.
Chú ý:
- Khi giả thiết H
0
đúng thì tiêu chuẩn kiểm định K vẫn có thể nhận giá trị k
qs
∈W
α
với xác suất
xảy ra là α. Vì vậy trong trường hợp k
qs
∈W
α

mà ta bác bỏ giả thiết H
0
thì ta có thể mắc sai
lầm loại 1, với xác suất mắc sai lầm loại 1 chính là α.
- Nếu ta ký hiệu
(
)
β
α
=∈
1
HWkP
qs
thì β là xác suất bác bỏ một giả thiết sai. Do đó, xác suất
không bác bỏ một giả thiết sai
(
)
β
α
−=∈ 1
1
HWKP
qs
là xác suất mắc sai lầm loại 2 và β sẽ
được gọi là xác suất không mắc sai lầm loại 2, người ta gọi β là hiệu lực của kiểm định.
- Với kích thước mẫu n xác định thì với mẫu tiêu chuẩn kiểm định ta sẽ có miền bác bỏ W
α
thỏa
mãn điều kiện:
(

)
α
α
=∈
0
HWKP
qs
.
Nếu tồn tại một tiêu chuẩn kiểm định k
qs
với miền bác bỏ W
α
sao cho (1-β) là nhỏ nhất và β lớn
nhất. Khi đó k
qs
được gọi là tiêu chuẩn kiểm định mạnh nhất. Một tiêu chuẩn được coi là mạnh
nhất thì nó đảm bảo 3 yêu cầu:
- Xác suất mắc sai lầm loại 1 là α qui định trước.
- Xác suất mắc sai lầm loại 2 là nhỏ nhất.
- Khi bác bỏ giả thiết H
0
thì ta có thể thừa nhận giả thiết đối H
1
.
Như vậy chúng ta có thể xác định miền bác bỏ và miền chấp nhận trong các trường hợp kiểm
định một đuôi và hai đuôi là:
- Trong kiểm định hai đuôi:

133


134

- Trong kiểm định một đuôi:


Các bước chung để giải bài toán kiểm định
Bước 1: Phát biểu giả thiết và đối thiết




=
01
00
: H
:
θθ
θθ
H
hoặc hoặc



>
=
01
00
: H
:
θθ

θθ
H



<
=
01
00
: H
:
θθ
θθ
H
Bước 2: Xác định mức ý nghĩa và xây dựng miền bác bỏ
+ Mức ý nghĩa α
+ Miền bác bỏ (tùy thuộc vào phương pháp kiểm định, loại phân phối và mức ý nghĩa).
Bước 2: Lựa chọn phương pháp kiểm định và loại phân phối của nó.
Bước 4: Tính giá trị quan sát của tiêu chuẩn kiểm định k
qs

Bước 5: So sánh với miền bác bỏ để kết luận:
Miền bác bỏ
Miền chấp nhận
W
1-α
Miền bác bỏ
Miền chấp nhận
-W
1-α

Miền bác bỏ
Miền bác bỏ
Miền chấp nhận
W
1-α/2-W
1-α/2
- Nếu k
qs
∈ Wα ta sẽ bác bỏ giả thiết H
0
và thừa nhận giả thiết H
1
.
- Nếu k
qs
∉ Wα : Ta kết luận rằng chưa có cơ sở để thừa nhận giả thiết H
1
.
Có thể tóm tắt các bước để giải bài toán kiểm định theo sơ đồ sau:

B1: Phát biểu giả thiết và đối thiết


B2: Xác định mức ý nghĩa


B3: Lựa chọn phương pháp kiểm định và loại phân phối của nó


B4: Tính giá trị kiểm định (giá trị quan sát) k

qs


B5: Tìm miền bác bỏ và kết luận

CÁC PHƯƠNG PHÁP KIỂM ĐỊNH THAM SỐ
Kiểm định giả thiết về tham số trung bình µ của tổng thể
Điều kiện: Biến định lượng và phân phối của biến phải tuân theo quy luật phân phối chuẩn.
Trường hợp đã biết phương sai (
σ
2
) hoặc độ lệch chuẩn của tổng thể
Đối với trường hợp kiểm định giả thiết về tham số trung bình của tổng thể, chúng ta có thể thực
hiện thông qua các bước sau:
B1: Phát biểu giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết
H
0
: µ = µ
0
H
0
: µ ≤µ
0
H
0
: µ ≥ µ
0
Đối thiết

H
1
: µ ≠ µ
0
H
1
: µ > µ
0
H
1
: µ < µ
0
B2: Xác định mức ý nghĩa α
B3: Xác định phương pháp kiểm định: Phương pháp kiểm định tham số trung bình với σ đã biết.
B 4: Tính tiêu chuẩn kiểm định

(
)
σ
µ
nx
UK
qs
0

=≡
, trong đó x là trung bình mẫu.
Bước 3: Xác định miền bác bỏ
Miền bác bỏ W
α

là tập hợp những điểm thoả mãn điều kiện:
()



















==

αα
σ
µ
1
0
,U
nx

UW
hay
2
1
α

≥ UU
kiểm định đối xứng - bác bỏ H
0
, chấp nhận H
1
với µ ≠ µ
0
.

135
α


1
UU kiểm định phía phải - bác bỏ H
0
, chấp nhận H
1
với µ > µ
0
.

kiểm định phía phải - bác bỏ H
α


−≤
1
UU
0
, chấp nhận H
1
với

µ < µ
0
.
Chúng ta so sánh k
qs
với W
α
để đưa ra kết luận
Để tiện cho việc theo dõi, có thể tóm lược những bước của bài toán kiểm định tham số trung bình
ở trên như bảng sau:


















KIỂM ĐỊNH THAM SỐ TRUNG BÌNH CỦA TỔNG THỂ
(khi
σ
đã biết)
1. Giả thiết và đối thiết:


Đối xứng Phải Trái
Giả thiết
H
0
: µ = µ
0
H
0
: µ ≤ µ
0
H
0
: µ ≥ µ
0
Đối thiết
H
1

: µ ≠ µ
0
H
1
: µ > µ
0
H
1
: µ < µ
0

2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm: Tham số trung bình tổng thể
4. Tiểu chuẩn kiểm định:
(khi chưa biết σ thay bằng s’)

5. Điểm tới hạn và miền bác bỏ:

Đối xứng Phải Trái
Điểm tới hạn
- U
1-α/2
và U
1-α/2
U
1-α
- U
1-α
Miền bác bỏ
U<- U

1-α/2
và U>U
1-α/2
U>U
1-α
U<-U
1-α
Biểu hiện qua
hình vẽ




BB CN BB
-U
1-α/2
U
1-
α
/2
BB
-U
1-
α
BB
U
1-
α
σ
µ

nx
Uk
qs
)(
0

=≡


Ví dụ: Trọng lượng một loại sản phẩm do nhà máy sản xuất là đại lượng ngẫu nhiên tuân theo
qui luật phân phối chuẩn, có trọng lượng qui định là 20kg và độ lệch chuẩn là 2kg. Có ý kiến cho
rằng: Do thiết bị hoạt động không ổn định nên trọng lượng sản phẩm đã thay đổi, người ta tiến
hành kiểm tra 100 sản phẩm và đo được trọng lượng trung bình là 20,35kg. Với mức ý nghĩa
α
=
0,05. Hãy kết luận xem trọng lượng của sản phẩm đã thay đổi chưa? Cho biết U
0,975
=1,96.
Giải: Gọi X là trọng lượng sản phẩm do nhà máy sản xuất. Theo giả thiết X là đại lượng ngẫu
nhiên tuân theo qui luật phân phối chuẩn, trong đó
σ
= 2(kg), M(X) = 20(kg).
Ta có bài toán kiểm định giả thiết về giá trị tham số
µ
của qui luật phân phối chuẩn.
B1. Phát biểu giả thiết:
H
0
:
µ

=
µ
0
= 20(kg)
H
1
:
µ



µ
0
B2. Mức ý nghĩa
α
=0,05

136
B3. Phương pháp kiểm định: Đây là bài toán kiểm định tham số trung bình với độ lệch chuẩn
σ

đã biết.
B4. Xác định tiêu chuẩn kiểm định: Tiêu chuẩn kiểm định được chọn là:

(
)
()
75,1
2
5,3

2
1002035,20
0
==


=≡
σ
µ
nx
Uk
qs

B5. Xác định miền bác bỏ và kết luận:
Với mức ý nghĩa
α
= 0,05, miền bác bỏ tương ứng trong trường hợp này có dạng:
()










==≥


==

96,1,
975,0
2
1
0
UUU
nx
UW
αα
σ
µ

Minh họa bằng hình vẽ:
1,75
Miền bác bỏ
1,96
Miền bác bỏ



Kết luận: Vì k
qs

W
α
nên chưa có cơ sở để bác bỏ giả thiết H
0
, tức là ý kiến cho rằng trọng

lượng trung bình của sản phẩm bị thay đổi là chưa có cơ sở.
Trường hợp chưa biết phương sai (
σ
2
):
Đối với trường hợp chưa biết phương sai tổng thể, cần phải xem xét hai trường hợp sau:
a. Trường hợp mẫu nhỏ n<30
Trong trường hợp chưa biết phương sai, các giả thiết và đối thiết cũng giống như trường hợp đã
biết phương sai. Tuy nhiên, để tính toán giá trị kiểm định, cần phải tìm độ lệch chuẩn điều chỉnh
(s’) của mẫ
u để tiến hành phân tích. Vì mẫu khá nhỏ (n<30), có thể giả định hàm phân phối tuân
theo hàm T-student. Khi đó, tiêu chuẩn kiểm định được chọn là:
(
)
'
0
s
nx
Tk
qs
µ

=≡

Với
x là trung bình mẫu và s’ là độ chênh lệch chuẩn điều chỉnh của mẫu.
Với mức ý nghĩa α, miền bác bỏ:
()
()












==
−1
'
0
,
n
T
s
nx
TW
αα
µ

Khi đó:
()
1
2


n

TT
α
hoặc P(⏐T⏐)<α Æ bác bỏ H
0
, chấp nhận H
1
(hay µ ≠ µ
0
).
()
1−

n
TT
α
hoặc P(T)<2α Æ bác bỏ H
0
, chấp nhận H
1
(hay µ > µ
0
).
()
1−
−≤
n
TT
α
hoặc P(T)<2α Æ bác bỏ H
0

, chấp nhận H
1
(hay µ < µ
0
).

Ví dụ : Một nhà sản xuất một loại bóng đèn cho biết tuổi thọ trung bình thấp nhất của các
bóng đèn là 150 giờ. Kiểm tra một cách ngẫu nhiên 25 bóng đèn, người ta đo được tuổi thọ trung
bình của chúng là 145 giờ. Với độ tin cậy 99%, có thể kết luận gì về lời tuyên bố trên. Cho biết,

137
độ lệch chuẩn hiệu chỉnh mẫu là 6 giờ và tuổi thọ trung bình của loại bóng đèn trên là đại lượng
ngẫu nhiên phân phối chuẩn.
Giải:
Gọi
µ
là tuổi thọ trung bình của loại bóng đèn trên, theo giả thiết
µ
là đại lượng ngẫu nhiên phân
phối chuẩn. Ta có bài toán kiểm định giả thiết tham số
µ
với n

30.
B1. Phát biểu giả thiết:
H
0
:
µ




µ
0
= 150
H
1
:
µ
<
µ
0

B2. Xác định mức ý nghĩa
α
=0,05
B3. Phương pháp kiểm định: Đây là trường hợp kiểm định một đuôi bên trái với mẫu nhỏ,
σ

chưa biết.
B4. Tính tiêu chuẩn kiểm định:
Tiêu chuẩn kiểm định là :
167,4
6
25)150145()(
'
−=

=


=≡
s
nx
Tk
qs
µ
Với mức ý nghĩa
α
= 0,01, miền bác bỏ:
()
()






−=−=−<

µ−
==

αα
49,2TT,
S
nX
TW
T
)24(
01,0

1n
0

Minh họa bằng hình vẽ
Miền bác bỏ
-2,49 -4,167
Kết luận: Vì k
qs

W
α
nên chúng ta bác bỏ giả thiết H
0
và chấp nhận đối thuyết H
1
, nghĩa là lời
tuyên bố rằng tuổi thọ trung bình của loại bóng đèn trên thấp nhất là 150 giờ là sai.
b. Trường hợp mẫu nhỏ n≥30
Nếu kích thước mẫu n ≥ 30, khi đó giá trị
(
)
1n
2
T

α
sẽ tiến đến giá trị U
α/2
, khi đó tiêu chuẩn kiểm
định trong trường hợp này là:

(
)
'
0
s
nx
Uk
qs
µ

=≡


Ví dụ: Công ty thiết bị viễn thông ATC đã tiến hành một cuộc nghiên cứu để tìm hiểu mức độ
hài lòng của khách hàng sau khi thay đổi, cải tiến một số dịch vụ nhằm nâng cao khả năng đáp
ứng yêu cầu khách hàng của họ. Trước khi cải tiến các dịch vụ, mức độ hài lòng của khách hàng
trung bình là 75 (theo thang điểm từ 0 đến 100). Chọn ngẫu nhiên 350 khách hàng để tham khảo
ý kiến của họ sau khi các dị
ch vụ được cải tiến, mức độ hài lòng trung bình tính được là 82 với
độ lệch điều chỉnh mẫu là 8. Với độ tin cậy 95%, có thể kết luận rằng khách hàng đã được hài
lòng ở mức độ cao hơn không?
Giải:
B1. Phát biểu giả thiết và đối thiết:

138
Vì công ty quan tâm đến việc cải tiến các dịch vụ của công ty thiết bị viễn thông có làm thỏa mãn
khách hàng ở mức độ cao hơn so với trước hay không. Do đó ta đặt giải thiết:
H
0
:

µ

µ
0
= 75
H
1
:
µ
>
µ
0
=

75
B2. Chọn mức ý nghĩa
α
=0,05
B3. Xác định phương pháp kiểm đinh: Đây là bài toán kiểm định tham số trung bình,
σ
chưa biết,
mẫu lớn hơn 30
B4. Tính giá trị kiểm định
(
)
2363,6
8
350)7582(
,
0

=

=

=≡
s
nx
Uk
qs
µ

B4. Tính giá trị kiểm định
Với mức ý nghĩa
α
= 0,05 và đây là bài toán kiểm định một đuôi nên miền bác bỏ tương ứng
trong trường hợp này có dạng:
()










==>

==


645,1,
95,01
'
0
UUU
s
nx
UW
αα
µ

Với mức ý nghĩa 5%,vì U
1-
α
=1,645
1,645 6,2363
Miền bác bỏ
Kết luận: Vì k
qs

W
α
nên giả thiết H
0
bị bác bỏ, ta kết luận rằng với việc cải tiến các dịch vụ,
công ty thiết bị viễn thông ATC đã làm cho thỏa mãn khách hàng ở mức độ cao hơn trước
Kiểm định giả thiết tham số tỷ lệ
Trong một số trường hợp, chúng ta cần kiểm định giả thiết về tham số tỷ lệ của các phần tử loại
A (loại phần tử

mà chúng ta muốn nghiên cứu) trong tổng thể (P), gọi f
n
là tỷ lệ của phần tử loại
A có trong mẫu và P
0
là một tỷ lệ đã được xác định trước. Quy trình kiểm định như sau:
B1. Phát biểu giả thiết và đối thiết
Đối xứng Phải Trái
Giả thiết H
0
: P = P
0
H
0
: P ≤ P
0
H
0
: P ≥ P
0
Đối thiết
H
1
: P ≠ P
0
H
1
: P > P
0
H

1
: P < P
0
B2. Lựa chọn mức ý nghĩa α=0,05
B3. Phương pháp kiểm định: Kiểm định tham số tỷ lệ các phần tử loại A có trong tổng thể.
B4. Tính giá trị kiểm định:
()
()
00
0
1 PP
nPf
Uk
n
qs


=≡
B5. Miền bác bỏ và kết luận:

139
Với α cho trước, ta có miền bác bỏ W
α
là:
()
()













==

αα
1
00
0
;
1
U
PP
nPf
UW
n

Khi đó: kiểm định phía phải - bác bỏ H
α


1
UU
0
và chấp nhập H

1
(hay P > P
0
).
α

−≤
1
UU kiểm định phía trái - bác bỏ H
0
và chấp nhận H
1
(hay P < P
0
).

2
1
α

≥ UU
kiểm định đối xứng – bác bỏ H
0
và chấp nhận H
1
(hay P ≠ P
0
).
Chúng ta so sánh k
qs

với W
α
để đưa ra kết luận
Các bước của bài toán kiểm định tham số tỷ lệ các phần tử loại A trong tổng thể được thể hiện
trong bảng sau:













KIỂM ĐỊNH THAM SỐ TỶ LỆ CỦA TỔNG THỂ
1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết H
0
: P = P
0
H
0
: P ≤ P
0
H

0
: P ≥ P
0
Đối thiết
H
1
: P ≠ P
0
H
1
: P > P
0
H
1
: P < P
0
2. Xác định mức ý nghĩa
3. Phương pháp kiểm nghiệm tham số tỷ lệ tổng thể
4. Tiểu chuẩn kiểm định:


5. Điểm tới hạn và miền bác bỏ:
Đối xứng Phải Trái
Điểm tới hạn
- U
1-α/2
và U
1-α/2
U
1-α

- U
1-α
Miền bác bỏ
P<- U
1-α/2
và P>U
1-α/2
P>U
1-α
P<-U
1-α
Mô hình




BB CN BB
-U
1-α/2
U
1-α/2
BB
-U
1-α
BB
U
1-α
)1(
)(
00

0
PP
nPf
P
n


=

Ví dụ: Giả sử một sản phẩm của công ty sản xuất vỏ xe ô tô đã chiếm được 42% thị trường.
Hiện tại, trước sự cạnh tranh của đối thủ và những điều kiện thay dổi của môi trường, ban lãnh
đạo công ty muốn kiểm tra lại xem thị phần của công ty có còn là 42% hay không. Chọn ngẫu
nhiên 550 ô tô trên đường, kết quả cho thấy 219 xe sử dụng vỏ xe của công ty. Có kết luậ
n gì ở
mức ý nghĩa 5%.
Giải: Trường hợp này ta chỉ quan tâm đến thị phần của công ty có còn là 42% hay không. Khi
đó:
B1. Phát biểu giả thiết và đối thiết:
H
o
: P = P
0
= 0,42
H
1
: P ≠ P
0
= 0,42
B2. Chọn mức ý nghĩa
α

=0,01
B3. Chọn phương pháp kiểm định: Phương pháp điểm định đối xứng tham số tỉ lệ trong tổng thể.

140
B4. Tính tiêu chuẩn kiểm định
037,1
)42,01(42,0
550)42,0
550
219
(
)P1(P
n)Pf(
Pk
00
0n
qs
−=


=


=≡
Với mức ý nghĩa 5%, ta có thể xác định miền bác bỏ như sau:

()











==>


==

96,1,
)1(
975,0
2
1
00
0
UUU
PP
nPf
UW
n
αα

Thể hiện qua hình vẽ

141



Miền bác bỏ
-1,96 -1,037
Miền bác bỏ
-1,96
Vì kqs

W
α
nên chúng ta bác bỏ giả thiết H0 và chấp nhập H1 có nghĩa thị phần của công ty
đã thay đổi so với 42%.
Kiểm định sự khác nhau giữa trung bình của hai tổng thể
Điều kiện ứng dụng: Hai biến nghiên cứu (đại diện đo lường hai mẫu) phải là biến định lượng,
tuân theo quy luật phân phối chuẩn và phương sai bằng nhau.
Kiểm định tham số trung bình dựa trên hai biến (mẫu) độc lập
a.Tr
ường hợp đã biết phương sai
σ
2
của các mẫu
Điều kiện để thực hiện phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên
mẫu ngẫu nhiên độc lập) là dữ liệu mẫu phải theo luật phân phối chuẩn.
B1. Giả thiết và đối thiết:
Đối xứng Phải Trái
Giả thiết
H
0
: µ
x
- µ

y
= D
0
H
0
: µ
x
- µ
y
≤ D
0
H
0
: µ
x
- µ
y
≥ D
0
Đối thiết
H
1
: µ
x
- µ
y
≠ D
0
H
1

: µ
x
- µ
y
> D
0
H
1
: µ
x
- µ
y
< D
0
B2. Chọn mức ý nghĩa α
B3. Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình
giữa hai mẫu (độc lập) – Phân phối chuẩn.
B4. Xác định tiêu chuẩn kiểm định :
y
y
x
x
qs
nn
Dyx
Uk
2
2
0
σ

σ
+
−−
=≡

B5. Miền bác bỏ và kết luận: Miền bác bỏ với α cho trước :
Nếu H
1
đúng tức µ
x
- µ
y
> D
0
, khi đó W
α
:
α
σ
σ

>
+
−−
=
1
2
2
0
U

nn
Dyx
U
y
y
x
x

Nếu H
1
đúng tức µ
x
- µ
y
< D
0
, khi đó W
α
:
α
σ
σ

−<
+
−−
=
1
2
2

0
U
nn
Dyx
U
y
y
x
x

Nếu H
1
đúng tức µ
x
- µ
y
< D
0
, khi đó W
α
:
2
1
2
2
0
α
σ
σ



+
−−
= U
nn
Dyx
U
y
y
x
x

Tính hệ số quan sát, so sánh với miền bác bỏ và kết luận.

Ví dụ: Người ta tiến hành nghiên cứu về thời gian sử dụng trung bình của hai nhãn hiệu pin X
và Y (cùng chủng loại) của hai nhà sản xuất khác nhau. Chọn ngẫu nhiên mỗi nhãn hiệu 100 viên
pin kết quả ghi nhận được như sau: Pin X có thời gian sử dụng trung bình là 308 phút, độ lệch
chuẩn 84 phút, các chỉ số tương tứng của pin Y lần lượt là 254 phút và 67 phút. Với mức ý nghĩa
α
= 0,10 ,có thể kết luận thời gian sử dụng trung bình của pin X lớn hơn pin Y ít nhất là 45 phút
được không ? Biết thời gian sử dụng trung bình của hai nhãn hiệu pin trên là các đại lượng ngẫu
nhiên phân phối chuẩn.
Giải: Áp dụng phương pháp kiểm định sự khác biệt giữa hai trung bình tổng thể theo luật phân
phối chuẩn (chưa biết
σ
và n
x
, n
y
<30).

Gọi thời gian sử dụng trung bình của pin X và Y lần lượt là
µ
x
,
µ
y
; khi đó
µ
x
,
µ
y
là các đại lượng
ngẫu nhiên phân phối chuẩn. Theo đề bài, chúng ta cần quan tâm đến việc thời gian sử dụng
trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút hay không. Do vậy, B1. Giả thiết và đối
thiết:
H
0
:
µ
x
-
µ
y


45
H
1
:

µ
x
-
µ
y
> 45
B2. Chọn mức ý nghĩa
α
=0.1
B3. Phương pháp kiểm định : Phương pháp kiểm định sự khác biệt giữa hai tham số trung bình
khi
σ
đa biết
B4. Tiêu chuẩn kiểm định :
838,0
100
67
100
84
45254308
222
2
0
=
+
−−
=
+
−−
=

y
y
x
x
qs
nn
Dyx
k
σ
σ
B5. Miền bác bỏ với
α
=0,05 cho trước :
Ta có W
α
:
28,1
90,01
2
2
0
==>
+
−−
=

UU
nn
Dyx
U

y
y
x
x
α
σ
σ


142
Minh họa bằng vẽ:
Kết luận: vì k
qs


W
α
nên ta chưa thể bác bỏ H
0
và chấp nhận H
1
, tức là chưa có cơ sở để kết
luận thời gian sử dụng trung bình của pin X có lớn hơn pin Y ít nhất là 45 phút.
b.Trường hợp chưa biết
σ
2
:
• Trường hợp kích thước mẫu lớn (n
x
, n

y
≥30):
Trường hợp kích thước mẫu lớn (n
x
, n
y
≥30) với giả định cả hai tổng thể X và Y phân phối chuẩn,
ta có thể dùng công thức và quy tắc trên để kiểm định và với phương sai hiệu chỉnh mẫu s’
2
x
, s’
2
y

thay cho phương sai tổng thể kể cả trường hợp phân phối tổng thể không chuẩn.
• Trường hợp kích thước mẫu nhỏ (n
x
<30; n
y
< 30):
Phương pháp kiểm định sự khác biệt của hai trung bình tổng thể (dựa trên mẫu ngẫu nhiên độc
lập) theo luật phân phối Student (chưa biết σ):

143

Trong trường hợp mẫu nhỏ (hoặc n
x
, hoặc n
y
<30, hoặc cả n

x
, n
y
<30). Chúng ta vẫn dùng s’
2
x

s’
2
y
thay cho phương sai tổng thể.
nhưng khi đó tiêu chuẩn kiểm định sẽ theo phân phối Student với số bậc tự do được xác định theo
công thức:
Miền bác bỏ
1
)(
1
)(
)(
2
2'
2
2'
2
2'
2'

+

+

=
y
y
y
x
x
x
y
y
x
x
n
n
s
n
n
s
n
s
n
s
btd
1,28 0,838





B1. Giả thiết và đối thiết:
Đối xứng Phải Trái

Giả thiết
H
0
: µ
x
- µ
y
= D
0
H
0
: µ
x
- µ
y
≤ D
0
H
0
: µ
x
- µ
y
≥ D
0
Đối thiết
H
1
: µ
x

- µ
y
≠ D
0
H
1
: µ
x
- µ
y
> D
0
H
1
: µ
x
- µ
y
< D
0
B2. Chọn mức ý nghĩa α
B3. Xác định phương pháp kiểm định : Phương pháp kiểm định sự khác biệt tham số trung bình
giữa hai mẫu (độc lập).
B4. Tiêu chuẩn kiểm định :
y
y
x
x
n
s

n
s
Dyx
TK
2'
2'
0
+
−−
=≡

B5. Miền bác bỏ với α cho trước:

×