BỘ GIÁO DỤC VÀ ĐÀO TẠO THANH HÓA
TRƯỜNG ĐẠI HỌC HỒNG ĐỨC
KHOA KINH TẾ - QUẢN TRỊ KINH DOANH
――――*****――――
BÀI TẬP LỚN XÁC SUẤT THỐNG KÊ
ĐỀ TÀI: KIỂM ĐỊNH GIẢ THIẾT THỐNG KÊ VÀ ỨNG DỤNG
GIÁO VIÊN HƯỚNG DẪN: NGUYỄN MẠNH HÙNG
SINH VIÊN THỰC HIỆN: NGUYỄN THỊ PHƯƠNG THÚY
MÃ SINH VIÊN: 1864010043
LỚP: K21A – ĐẠI HỌC KẾ TOÁN
Thanh Hóa, tháng 5 năm 2019
MỤC LỤC
Trang
A.Mở đầu
3
1.Lý do chọn đề tài
3
2.Mục đích của đề tài
3
3.Đối tượng và phạm vi nghiên cứu đề tài
4
4.Phương pháp nghiên cứu
4
Danh mục các kí hiệu sử dụng trong bài viết
5
B.Nội dung
6
I. Lý thuyết về kiểm định giả thiết thống kê
6
1.Khái niệm giả thiết thống kê
6
2.Các sai lầm trong kiểm định giả thiết thống kê
7
3.Các bước của việc kiểm định giả thiết thống kê
8
4.Kiểm định tham số
8
4.1 Kiểm định giả thiết về giá trị trung bình
9
4.2 Kiểm định giả thiết về xác suất (hoặc tỷ lệ)
16
4.3 Kiểm định giả thiết về phương sai
20
5. .Kiểm định so sánh hai tham số
22
5.1 Kiểm định so sánh hai giá trị trung bình
22
5.2 Kiểm định so sánh hai xác suất (hay hai tỷ lệ)
28
II. Ứng dụng của kiểm định giả thiết thống kê
31
1. Ứng dụng trong kinh tế
31
2. Ứng dụng trong vấn đề văn hóa xã hội
39
C.Kết luận
43
D. Phụ lục: Cách tra các bảng phân phối xác suất
44
1.Bảng phân phối xác suất chuẩn tắc
44
2.Bảng phân phối xác suất student
44
1
3.Bảng phân phối xác suất Khi – bình phương.
45
TÀI LIỆU THAM KHẢO
47
2
A. MỞ ĐẦU
1.Lý do chọn đề tài:
Ra đời từ nửa cuối thế kỷ XVII ở nước Pháp, xác suất là một bộ phận của
toán học nghiên cứu các hiện tượng ngẫu nhiên. Nói một cách đại khái thì hiện
tượng ngẫu nhiên là hiện tượng ta không thể nói trước nó xảy ra hay không xảy ra
khi thực hiện một lần quan sát. Tuy nhiên nếu tiến hành quan sát khá nhiều lần một
hiện tượng ngẫu nhiên trong những hoàn cảnh như nhau, thì trong nhiều trường hợp
ta có thể rút ra được những kết luận khoa học về hiện tượng này. Dựa vào các thành
tựu của lý thuyết xác suất, thống kê toán xây dựng các phương pháp ra quyết định
trong điều kiện thông tin đầy đủ. Hơn 300 năm phát triển, đến nay lí thuyết xác suất
thống kê đã trở thành ngành toán học quan trọng , được ứng dụng rộng rãi trong
nhiều lĩnh vực tự nhiên và xã hội khác nhau, từ âm nhạc tới vật lý, từ cơ học đến thị
trường chứng khoán, từ dự báo thời tiết đến kinh tế, từ nông học tới y học,…. .
Môn học Xác suất thống kê là một môn học quan trọng ở bậc đại học. Việc
học tập Bộ môn Xác suất và thống kê giúp cho sinh viên có được những bài học và
ứng dụng thực tế về Đại số tổ hợp, lý thuyết xác suất, phép thử, biến cố, xác suất,
đại lượng ngẫu nhiên, quy luật phân phối xác suất, vector ngẫu nhiên, giá trị kì
vọng phương sai,….Đặc biệt trong bộ môn này, phần lý thuyết về “ Bài toán Kiểm
định giả thiết” là phần đóng vai trò đặc biệt quan trọng trong quá trình học bộ
môn, hơn thế, lý thuyết về Kiểm định Giả thiết giúp ích rất nhiều cho sinh viên
chúng em không những trong thời điểm hiện tại mà còn về sau này khi giải quyết
những vấn đề trong cuộc sống.
Nhận thấy được tầm quan trọng của phần lý thuyết về bài toán kiểm định
giả thiết cùng với những kiến thức đã được học, em quyết định lựa chọn đề tài :
“Kiểm định giả thiết thống kê và Ứng dụng”.
2.Mục đích của đề tài:
3
Đề tài tập trung hệ thống các phần lý thuyết quan trọng về Kiểm định Giả thiết
và đưa ra cách giải các bài tập có liên quan, vừa đáp ứng yêu cầu của sách giáo
khoa, vừa có giá trị thực tiễn và phù hợp với phương thức tự học, tự nghiên cứu của
sinh viên. Đồng thời, đề tài cũng đưa ra ứng dụng hữu ích của “ Kiểm định giả thiết
thống kê” trong cuộc sống hiện nay, giúp cho sinh viên vận dụng hiệu quả kiến
thức được học vào cuộc sống.
3.Đối tượng và phạm vi nghiên cứu đề tài:
Đề tài tập trung nghiên cứu về lý thuyết, các bài tập, các cách giải bài tập Kiểm
định giả thiết thống kê; Các hướng dẫn, gợi ý, lời giải vắn tắt hoặc lời giải mẫu của
bài tập kiểm định giả thiết trong phạm vi nội dung học phần dành cho sinh viên; Đi
sâu vào thực tiễn đời sống con người để thấy được tầm quan trọng của Kiểm định
giả thiết thống kê.
4.Phương pháp nghiên cứu:
Đề tài được thực hiện bằng các phương pháp nghiên cứu:
- Nghiên cứu chương trình, đề cương chi tiết học phần, nội dung lý thuyết
“Kiểm định giả thiết thống kê”.
- Nghiên cứu bài tập.
- Tham khảo ý kiến đóng góp của các giảng viên Trường Đại học Hồng Đức.
4
DANH MỤC CÁC KÍ HIỆU SỬ DỤNG TRONG BÀI VIẾT.
Ký hiệu
X
Nội dung
Kỳ vọng mẫu (trung bình mẫu) của đại lượng ngẫu nhiên
(S )
Phương sai mẫu hiệu chỉnh của đại lượng ngẫu nhiên
S2
S
S*
xα 2
Phương sai mẫu của đại lượng ngẫu nhiên
Độ lệch chuẩn mẫu của đại lượng ngẫu nhiên
Độ lệch chuẩn mẫu hiệu chỉnh của đại lượng ngẫu nhiên
xα
Phân vị một phía (phía trái) của phân phối xác suất chuẩn tắc
tαn −21
Phân vị đối xứng của phân phối xác suất student
tαn −1
Phân vị một phía (phía trái) của phân phối xác suất student
Phân vị một phía (phía phải) của phân phối xác suất Khi – bình
* 2
χ12−( αn −21)
χα2( n2 −1)
χ12−(αn −1)
χα2( n −1)
σ
α
2
γ
Phân vị đối xứng của phân phối xác suất chuẩn tắc
phương
Phân vị một phía (phía trái) của phân phối xác suất Khi – bình
phương
Phân vị một phía (phía phải) của phân phối xác suất Khi – bình
phương
Phân vị một phía (phía trái) của phân phối xác suất Khi – bình
phương
Phương sai tổng thể của đại lượng ngẫu nhiên
Mức ý nghĩa của bài toán kiểm định
Độ tin cậy của bài toán kiểm định
5
B. NỘI DUNG
I.Lý thuyết về kiểm định giả thiết thống kê.
1. Khái niệm giả thiết thống kê:
Giả thiết thống kê là một mệnh đề nhận định về tham số của tổng thể. Khi ta
đồng nhất tổng thể với một biến ngẫu nhiên thì giả thiết thống kê cũng có thể là
nhận định về phân phối xác suất của biến ngẫu nhiên.
Ký hiệu H0 là giả thiết của tham số tổng thể, đi kèm với giả thiết H0 là mệnh
đề đối lập được gọi là đối thiết, ký hiệu là H1 . Bài toán kiểm định giả thiết thống kê
gồm một cặp giả thiết H0 và đối thiết H1 . Dựa vào thông tin mẫu lấy được từ tổng
thể ta phải đưa ra quyết định bác bỏ hay chấp nhận giả thiết H0 , việc chấp nhận giả
thiết H0 tương đương với bác bỏ đối thiết H1 và ngược lại.
Ví dụ: Khi ta cảm thấy mệt mỏi, ta nghi rằng “mình bị bệnh” – đây là giả thiết H0,
(H1 là “mình không mắc bệnh”) và việc đi khám bệnh để xác định xem mình có
bệnh hay không, chính là xác định xem giả thiết H0 có đúng hay không. Việc này
chính là kiểm định giả thiết.
− Khi giả thiết H0 có dạng: H0 : a = a0 (a là 1 tham số nào đó của đại lượng
ngẫu nhiên ta đang nghiên cứu; a0 là giá trị đã biết)
Khi đó: H1 có thể là: H1 : a ≠ a0 . Việc kiểm định giả thiết với đối thiết dạng
này được gọi là kiểm định hai phía (vì miền bác bỏ nằm về hai phía của
miền chấp nhận).
Giả thiết đối dạng H1 : a ≠ a0 thường được áp dụng khi ta chưa biết rõ trong
thực tế a > a0 hay a < a0 .
− Nhưng nếu qua quan sát, phân tích ta biết được xu hướng là a > a0 thì ta có
thể đặt đối thiết H1 : a > a0 . Hoặc ta biết được khả năng a < a0 thì đặt đối thiết
H1 : a < a0.
6
Nếu kiểm định giả thiết với giả thiết đối dạng H1 : a > a0 thì được gọi là kiểm
định giả thiết về phía bên phải.
Nếu kiểm định giả thiết với giả thiết đối dạng H1 : a < a0 thì được gọi là kiểm
định giả thiết về phía bên trái.
2.Các loại sai lầm trong kiểm định giả thiết thống kê.
Khi làm kiểm định giả thiết, ta cố thể mắc phải các sai lầm sau đây:
− Sai lầm loại I: Bác bỏ 1 giả thiết đúng ( Bác bỏ H0 khi H0 đúng).
− Sai lầm loại II: Chấp nhận 1 giải thiết sai ( Nhận H0 khi H0 sai).
Kết luận
Thực tế
H0 đúng
H0 sai
Chấp nhận H0
Bác bỏ H0
Kết luận đúng
Sai lầm loại II
Sai lầm loại I
Kết luận đúng
Ví du:
1.Dựa vào các thông tin dự báo thời tiết, trung tâm khí tượng thủy văn dự báo 1 cơn
bão sắp đến sẽ đổ bộ vào miền Nam, thì H0: “ Bão đổ bộ vào miền Nam” (H1 bão
không đổ bộ vào miền Nam).Khi đó, sai lầm loại I là rất tai hại. Vì khi đó, do
không kịp thời chuẩn bị ứng phó nên bão sẽ gây ra thiệt hại nặng nề.
2. Cho đậu 1 thí sinh yếu kém (mà đáng ra phải rớt) hoặc cho rớt 1 thí sinh giỏi (mà
đáng lẽ ra phải đậu) đều là những sai lầm tai hại. Thực tế, cho thấy, có những cuộc
thi mà kết quả chỉ dựa vào số lượng tin nhắn bình chọn thì chứa đựng nhiều sai
lầm.
Tất nhiên khi kiểm dịnh một giả thiết, ta cố gắng hạn chế các sai lầm,
tức là cần giảm thiểu tối đa xác suất cả 2 sai lầm. Tuy nhiên, đây là điều
7
trong thực tế không thể làm được vì nếu ta muốn giảm sai lầm loại I thì sẽ
làm tăng xác suất sai lầm loại II, và ngược lại.
3.Các bước của việc kiểm định giả thiết thống kê.
Gồm 6 bước:
Bước 1: Thành lập giả thiết H0
Ví dụ: H0: θ = θ0
H0: θ ≤ θ0
H0: θ ≥ θ0
Bước 2: Thành lập giả thiết H1
Ví dụ: H1: θ < θ0
H1: θ > θ0
H1: θ ≠ θ0
Bước 3: Xác định mức ý nghĩa α
Bước 4: Chọn các tham số thống kê thích hợp cho việc kiểm định và xác định các
miền bác bỏ, miền chấp nhận và giá trị giới hạn.
Bước 5: Tính toán các giá trị của các tham số thống kê trong việc kiểm định dựa
trên số hiệu của mẫu ngẫu nhiên.
Bước 6: Ra quyết định: Nếu các giá trị tính toán rơi vào miền bác bỏ H 0 thì ra quyết
định bác bỏ H0. Ngược lại sẽ chấp nhận H0.
4.Kiểm định tham số.
8
4.1 Kiểm định giả thiết về giá trị trung bình.
Giả sử đại lượng ngẫu nhiên gốc X trong tổng thể phân phối theo quy luật
chuẩn với kỳ vọng là µ và phương sai mẫu σ 2 . Cần kiểm định giả thiết:
H0: µ = µ0
( µ0 là một giá trị đã biết khi đặt H0)
H1: µ ≠ µ0
Trường hợp 1: Phương sai σ2 đã biết:
Giả sử X ~ N(µ, σ2). (X1,X2,….Xn) là mẫu độc lập của X.
U=
Khi đó giá trị thống kê :
X − µ0
n : N (0,1)
σ
(với mức ý nghĩa α)
Ta có tiêu chuẩn kiểm định:
+) Nếu U ≤ xα
2
thì chấp nhận giả thiết H0, bác bỏ giả thiết H1
+) Nếu U > xα 2 thì chấp nhận giả thiết H1, bác bỏ giả thiết H0.
Ví dụ1: Trọng lượng sản phẩm do nhà máy sản xuất ra là một biến ngẫu nhiên
có phân phối chuẩn, với độ lệch chuẩn 2kg, trọng lượng trung bình theo quy định là
50kg. Nghi ngờ máy hoạt động không bình thường làm thay đổi trọng lượng trung
bình của sản phẩm, người ta cân thử 100 sản phẩm và thu được kết quả như sau:
Trọng lượng sản phẩm X
49
50
51
52
53
Số sản phẩm tương ứng ni
10
60
20
5
5
Với mức ý nghĩa α = 5% hãy kết luận về điều nghi ngờ nói trên.
9
Lời giải:
1 k
1
Ta có: X = ∑ X i ni =
( 49.10 + 50.60 + 51.20 + 52.5 + 53.5 ) = 50,35
100
n i =1
Gọi µ là trọng lượng trung bình của sản phẩm.
Từ giả thiết và câu hỏi,ta có bài toán kiểm định:
H0: µ = 50
H1: µ ≠ 50
Ta có:
α
2
=
0, 05
= 0, 025. Tra bảng ta được xα 2 = 1,96
2
Giá trị thống kê: U =
X − µ0
50,35 − 50
n=
100 = 1, 75
σ
2
Ta thấy: U ≤ xα 2 , chấp nhận giả thiết H0, bác bỏ giả thiết H1.
Vậy điều nghi ngờ “máy hoạt động không bình thường làm thay đổi trọng
lượng trung bình của sản phẩm” là sai.
Chú ý: Hoàn toàn tương tự cho các phép kiểm định trung bình một phía, ta có
thể tóm tắt bởi bảng sau:
Giả thiết
Tiêu chuẩn kiểm định
Kết luận
10
H0: µ = µ0
H1:µ ≠ µ0
H0: µ = µ0
H1: µ < µ0
H0: µ = µ0
H1: µ > µ0
U ≤ xα 2
Chấp nhận H0, bác bỏ H1
U > xα 2
Bác bỏ H0, chấp nhận H1
U ≥ − xα
Chấp nhận H0, bác bỏ H1
U < −xα
Bác bỏ H0, chấp nhận H1
U ≤xα
Chấp nhận H0, bác bỏ H1
U > xα
Bác bỏ H0, chấp nhận H1
Ví dụ2: Trong một nhà máy sản xuất bánh kẹo, một máy tự động sản xuất ra các
thanh socola với trọng lượng quy định là 250g. Biết rằng trọng lượng các thanh
socola được sản xuất có phân bố chuẩn N(µ,52). Trong một ngày bộ phận kiểm tra
kĩ thuật chọn một mẫu ngẫu nhiên gồm 16 thanh socola và tính trọng lượng trung
bình của chúng được 244kg.Có thể khằng định máy tự động sản xuất ra các thanh
socola có trọng lượng nhỏ hơn quy định hay không? (với mức ý nghĩa α = 0, 05 )
Lời giải:
Gọi µ là trọng lượng quy định của các thanh socola.
Từ giả thiết và câu hỏi ta có bài toán kiểm định :
H0: µ = 250
H1: µ < 250
Ta có: α = 0, 05 . Tra bảng ta được : xα = 1, 65 , suy ra − xα = −1, 65
Giá trị thống kê:
U=
X − µ0
244 − 250
n=
16 = −4,8
σ
5
11
(với σ = 5 , n = 16 , X = 244 , µ0 = 250 )
Ta thấy: U < − xα ,nên chấp nhận giả thiết H1, bác bỏ giả thiết H0.
Vậy máy tự động sản xuất socola có trọng lượng nhỏ hơn quy định phải
điều chỉnh lại máy.
Trường hợp 2: Chưa biết phương sai σ2 và n ≥ 30
Giả sử X ~ N(µ, σ2). (X1,X2,….Xn) là mẫu độc lập của X.
Khi đó giá trị thống kê:
U=
X − µ0
S*
n
( với mức ý nghĩaα)
Ta có tiêu chuẩn kiểm định:
+) Nếu U ≤ xα
2
thì chấp nhận giả thiết H0, bác bỏ giả thiết H1
+) Nếu U > xα 2 thì chấp nhận giả thiết H1, bác bỏ giả thiết H0.
Ví dụ: Lượng nước sạch (tính theo m3) một gia đình 4 người ở Hà Nội sử dụng
trong 6 tháng năm ngoái là 17m3.Theo dõi lượng nước sạch sử dụng trong 6 tháng
năm nay của 60 gia đình 4 người thu được số liệu sau:
Lượng nước sạch X(m3 ) 15 - 16 16 - 17 17 - 18 18 - 19 19 – 20
Số gia đình ni
7
15
21
12
5
Giả sử lượng nước sạch tiêu thụ của các hộ gia đình là một biến ngẫu nhiên có
phân bố chuẩn. Có ý kiến cho rằng lượng nước tiêu thụ năm nay tăng lên. Sử dụng
bảng số liệu trên, hãy kiểm định ý kiến đó với mức ý nghĩa 2,5%.
Lời giải:
Theo bài ra, ta có bảng rút gọn sau:
12
Lượng nước sạch X(m3)
Số gia đình ni
Ta có: X =
15,
16,
17,
18,
5
5
5
5
7
15
21
12
19,5
5
1 k
1
X i ni =
(15, 5.7 + 16, 5.15 + 17,5.21 + 18, 5.12 +19, 5.5) = 17, 38
∑
n i =1
60
1 k
1
S 2 = (∑ X 2i ni ) − X 2 = (15,52.7 + 16, 52.15 + 17,52.21 + 18,52.12 + 19,52.5) − 17, 382 ≈ 1,35
n i =1
60
( S* ) =
2
n
60
S2 =
×1,35 ≈ 1,37 → S * = 1,37 ≈ 1,17
n −1
59
Gọi µ là lượng nước sạch tiêu thụ của các hộ gia đình ở Hà Nội.
H0: µ = 17
H1: µ > 17
Giá trị thống kê: U =
Ta có:
α
2
=
X − µ0
S*
n=
17, 38 −17
1,17
60 ≈ 2, 52
0, 025
= 0, 0125 Tra bảng ta được xα 2 = 2, 24
2
Ta thấy: U > xα
2
nên chấp nhận H1, bác bỏ Ho.
13
Vậy lượng nước sạch tiêu thụ của các hộ gia đình ở Hà Nội tăng lên so với năm
ngoái.
Chú ý: Hoàn toàn tương tự cho các phép kiểm định trung bình một phía, ta có thể
tóm tắt bởi bảng sau:
Giả thiết
H0: µ = µ0
Tiêu chuẩn kiểm định
U ≤ xα 2
Kết luận
Chấp nhận H0, bác bỏ H1
U > xα 2
Bác bỏ H0, chấp nhận H1
U ≥ − xα
Chấp nhận H0, bác bỏ H1
U < −xα
Bác bỏ H0, chấp nhận H1
U ≤xα
Chấp nhận H0, bác bỏ H1
H1:µ ≠ µ0
H0: µ = µ0
H1: µ < µ0
H0: µ = µ0
U > xα
Bác bỏ H0, chấp nhận H1
H1: µ > µ0
Trường hợp 3: Chưa biết phương sai σ2 và n < 30.
Giả sử X ~ N(µ, σ2). (X1,X2,….Xn) là mẫu độc lập của X.
Khi đó giá trị thống kê:
U=
X − µ0
× n : t (n − 1, α ) (với mức ý nghĩaα)
*
S
Ta có tiêu chuẩn kiểm định:
+)
n −1
Nếu U ≤ tα 2 chấp nhận giả thiết H0, bác bỏ giả thiết H1.
+)
n −1
Nếu U > tα 2 chấp nhận giả thiết H1, bác bỏ giả thiết H0.
14
Chú ý: Hoàn toàn tương tự cho các phép kiểm định trung bình một phía, ta có thể
tóm tắt bởi bảng sau:
Giả thiết
H0: µ = µ0
H1:µ ≠ µ0
H0: µ = µ0
H1: µ < µ0
H0: µ = µ0
Tiêu chuẩn kiểm định
U ≤tαn −21
Kết luận
Chấp nhận H0, bác bỏ H1
U > tαn −21
Bác bỏ H0, chấp nhận H1
U ≥ −tαn −1
Chấp nhận H0, bác bỏ H1
U < −tαn −1
Bác bỏ H0, chấp nhận H1
n −1
U ≤tα
Chấp nhận H0, bác bỏ H1
U > tαn −1
Bác bỏ H0, chấp nhận H1
H1: µ > µ0
Ví dụ:Phòng kĩ thuật của một công ty theo dõi mức xăng tiêu hao cho cùng một
loại xe chạy từ A đến B và có bảng số liệu sau:
Mức xăng tiêu hao X (lít)
8,5
9
11
12,5
Số chuyến tương ứng ni
5
8
10
2
Với mức ý nghĩa 5%, có thể kết luận mức xăng tiêu hao trung bình thấp hơn 11l
không? Biết mức xăng tiêu hao X tuân theo quy luật chuẩn.
Lời giải:
Ta có: X =
S2 =
1 k
1
×∑ X i ni =
×(8, 5.5 + 9.8 + 11.10 + 12, 5.2) = 9, 98
n i =1
25
1 n
1
2087
X i 2Yi − X 2 =
×(8,52.5 + 92.8 + 112.10 + 12,52.2) − 9,982 =
∑
n i =1
25
1250
15
(S * )2 =
n
24 2087
×S 2 =
×
≈ 1, 6 ⇒ S * = 1, 6 ≈ 1, 26
n −1
25 1250
Từ giả thiết và câu hỏi ta có bài toán kiểm định:
H0 : µ = 11
H1 : µ < 11
Giá trị thống kê: U =
X − µ0
9,98 −11
× n=
× 25 ≈ −4, 04
*
S
1, 26
n = 25, α = 5% ⇒ tαn −1 = tα24 = 1, 71
n −1
Ta thấy: U < −tα nên chấp nhận giả thiết H1, bác bỏ giả thiết H0.
Vậy mức tiêu hao xăng trung bình thấp hơn 11l.
4.2 Kiểm định giả thiết về xác suất (hoặc tỷ lệ)
Giả sử tổng thể gồm hai loại phần tử, có tính chất A và không có tính chất A,
trong đó tỷ lệ phần tử có tính chất A là p chưa biết. Mặc dù tỷ lệ phần tử mang tính
chất A là p chưa biết,song có cơ sở giả thiết cho rằng giá trị của nó bằng p0 Cần
kiểm định giả thiết:
H0 : p = p0 ( p0 cho trước, p0 ∈ [ 0;1] )
H1 : p ≠ p0
16
Từ mẫu (X1, X2 ,…, Xn) ta có tỷ lệ quan sát được là:
f =
n( A)
n
Trong đó: - n là cỡ mẫu
- n( A) là số phần tử mang tính chất A trong mẫu.
K=
Khi đó giá trị thống kê:
f − p0
n
p0 ×(1 − p0 )
( với mức ý nghĩa α)
Ta có tiêu chuẩn kiểm định:
+) Nếu K ≤ xα 2 thì chấp nhận giả thiết H0, bác bỏ giả thiết H1.
+) Nếu K > xα
2
thì chấp nhận giả thiết H1, bác bỏ giả thiết H0.
Chú ý: Hoàn toàn tương tự cho các phép kiểm định xác suất một phía, ta có thể
tóm tắt bởi bảng sau:
Giả thiết
H0: p=p0
H1:p ≠ p0
H0: p = p0
H1: p < p0
H0: p = p0
H1: p > p0
Tiêu chuẩn kiểm định
K ≤ xα 2
Kết luận
Chấp nhận H0, bác bỏ H1
K > xα 2
Bác bỏ H0, chấp nhận H1
K ≥ −xα
Chấp nhận H0, bác bỏ H1
K <−xα
Bác bỏ H0, chấp nhận H1
K ≤xα
Chấp nhận H0, bác bỏ H1
K > xα
Bác bỏ H0, chấp nhận H1
17
Ví dụ: Kiểm tra năng lực Tiếng anh của 100 sinh viên thì thấy có 14 sinh viên
không đạt chuẩn. Với mức ý nghĩa 5%, hãy kiểm định các ý kiến sau:
a.Tỉ lệ sinh viên đạt chuẩn Tiểng Anh là 0,9
b.Tỉ lệ sinh viên đạt chuẩn Tiếng Anh lớn hơn 0,9
c.Tỉ lệ sinh viên đạt chuẩn Tiếng anh nhỏ hơn 0,9
Lời giải:
Gọi p là tỷ lệ sinh viên đạt chuẩn Tiếng anh.
a. Từ giả thiết và câu hỏi ta có bài toán kiểm định:
H0 : p = 0,9
(mức ý nghĩa α = 0, 05 )
H1 : p ≠ 0,9
Tần suất sinh viên đạt chuẩn Tiếng anh: f =
Giá trị thống kê: K =
n( A) 100 − 14
=
= 0,86
n
100
f − p0
0,86 − 0,9
=
× 100 = 1,333
p0 ×(1 − p0 )
0,9 ×0,1
⇒ K < xα 2 = 1,96 ⇒ Chấp nhận giả thiết H0, bác bỏ giả thiết H1
Vậy ý kiến “ Tỷ lệ sinh viên đạt chuẩn Tiếng anh là 0,9” là ý kiến đúng.
b. Từ giả thiết và câu hỏi ta có bài toán kiểm định:
18
H0 : p = 0,9
(mức ý nghĩa α = 0, 05 )
H1 : p < 0,9
K = −1,333 > − xα = −1, 65 ⇒ Chấp nhận giả thiết H0, bác bỏ giả thiết H1
Vậy ý kiến “Tỉ lệ sinh viên đạt chuẩn tiếng anh nhỏ hơn 0,9” là sai.
c. Từ giả thiết và câu hỏi ta có bài toán kiểm định:
H0 : p = 0,9
(mức ý nghĩa α = 0, 05 )
H1 : p > 0,9
K = −1,333 < xα = 1, 65 ⇒ Chấp nhận giả thiết H0, bác bỏ giả thiết H1
Vậy ý kiến “Tỉ lệ sinh viên đạt chuẩn tiếng anh lớn hơn 0,9” là sai.
4.3 Kiểm định giả thiết về phương sai.
2
Giả sử trong tổng thể có biến ngẫu nhiên gốc phân phối chuẩn, X : N ( µ , σ )
trong đó tham số σ 2 đặc trưng cho độ phân tán/ độ biến động/ độ ổn định/ độ đồng
đều của tổng thể theo dấu hiệu nghiên cứu, là chưa biết.
Ta kiểm định giả thiết về mối quan hệ giữa phương sai tổng thể σ 2 với một số
σ 02 cho trước. Sử dụng một mẫu với kích thước n, với phương sai mẫu là S 2 , độ
lệch chuẩn là S .
19
H0: σ 2 = σ 02
Ta có bài toán kiểm định:
H1: σ 2 ≠ σ 02
χ
Khi đó giá trị thống kê:
2
n −1) ×S 2
(
=
σ 02
(với mức ý nghĩa α)
Ta có tiêu chuẩn kiểm định:
2( n −1)
2
+) Nếu χ ≥ χ1−α
2
2( n −1)
2
hoặc χ ≤ χα
2
2( n −1)
2
(
)
2
2
+) Nếu χ < χ1−α 2 hoặc χ > χα
2 n −1
thì chấp nhận H0, bác bỏ H1.
thì chấp nhận H1, bác bỏ H0.
Chú ý: Hoàn toàn tương tự cho các phép kiểm định phương sai một phía, ta có
thể tóm tắt bởi bảng sau:
Giả thiết
Tiêu chuẩn kiểm định
Kết luận
χ 2 ≥ χ12−(αn −21)
Chấp nhận H0, bác bỏ H1
χ 2 ≤ χα2( n2 −1)
Chấp nhận H0, bác bỏ H1
χ 2 < χ12−(αn −21)
Bác bỏ H0, chấp nhận H1
χ2 > χα2( n2 −1)
Bác bỏ H0, chấp nhận H1
χ 2 ≥ χ12−(αn −1)
Chấp nhận H0, bác bỏ H1
H1: σ 2 < σ 02
χ 2 < χ12−(αn −1)
Bác bỏ H0, chấp nhận H1
H0: σ = σ
χ 2 ≤ χα2( n −1)
Chấp nhận H0, bác bỏ H1
H0: σ 2 = σ 02
H1: σ ≠ σ
2
0
H0: σ = σ
2
0
2
2
2
2
0
χ 2 > χα ( )
Bác bỏ H0, chấp nhận H1
H1: σ 2 > σ 02
Ví dụ: Để thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng thì phương sai của
2 n −1
20
hàm lượng chất bẩn trong các lô hàng hóa chất không được vượt quá 4%. Lấy ngẫu
nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng mẫu là
5,62%.Với mức ý nghĩa α = 10% , thì hãy xét xem hàm lượng chất bẩn trong các lô
hàng hóa chất có thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng hay không?
(Giả sử tập hợp chính tuân theo phân phối chuẩn).
Lời giải:
2
Gọi σ phương sai của hàm lượng chất bẩn trong các lô hàng hóa chất.
Từ giả thiết và câu hỏi ta có bài toán kiểm định:
H0: σ 2 = 4
H1: σ 2 > 4
Ta có: α = 0,1
n = 20
Theo bài ra ta có:
Giá trị thống kê:
⇒ χα (
2 n −1)
2( 20 −1)
2( 19 )
= χ0,1
= χ0,1
= 27, 2
S 2 = 5, 62
χ2 =
( n − 1) S 2 = ( 20 − 1) .5, 62 ≈ 26, 7
σ 02
4
2 n −1
Vì: χ 2 = 26, 7 < χα ( ) = 27, 2 Chấp nhận giả thiết H0, bác bỏ giả thiết H1.
Vậy với mức ý nghĩa α = 10% thì hàm lượng chất bẩn trong các lô hàng hóa
chất thỏa mãn tiêu chuẩn đã được ấn định trong hợp đồng.
5. Kiểm định so sánh hai tham số.
5.1 Kiểm định so sánh hai giá trị trung bình.
X x1 ,x2 ,x3,…. ,xk
n1 n1 ,n2, n3,…, nk
21
Cho đại lượng ngẫu nhiên X có mẫu:
(với cỡ mẫu n = n1 + n2 +….+nk phương sai có hiệu chỉnh của mẫu 1 là ( S1* ) )
2
Và đại lượng ngẫu nhiên Y có mẫu:
Y
y1 ,y2 ,y3,…. ,yk
m1 m1 ,m2,m3,…,mk
(với cỡ mẫu m = m1 + m2 +….+mk, phương sai mẫu hiệu chỉnh của mẫu 2 là ( S2* ) 2 )
H0: µ1 = µ2
Ta có bài toán kiểm định:
( với mức ý nghĩa α )
H1: µ1 ≠ µ2
Trường hợp 1: Biết D(X)= σ12 và D(X)= σ22.
U=
Khi đó giá trị thống kê :
Ta có tiêu chuẩn kiểm định:
X ×Y
σ 12 σ 22
+
n
m
+)
Nếu U ≤ xα
+)
Nếu U > xα 2 thì chấp nhận H1 và bác bỏ H2.
2
thì chấp nhận H0 và bác bỏ H1.
Chú ý: Hoàn toàn tương tự cho các phép kiểm định so sánh giá trị trung bình một
phía, ta có thể tóm tắt bởi bảng sau:
22
Giả thiết
H0: µ1 = µ2
H1:µ1 ≠ µ2
H0: µ1 = µ2
H1: µ1 < µ2
H0: µ1 = µ2
Tiêu chuẩn kiểm định
U ≤ xα 2
Kết luận
Chấp nhận H0, bác bỏ H1
U > xα 2
Bác bỏ H0, chấp nhận H1
U ≥ − xα
Chấp nhận H0, bác bỏ H1
U < −xα
Bác bỏ H0, chấp nhận H1
U ≤xα
Chấp nhận H0, bác bỏ H1
U > xα
Bác bỏ H0, chấp nhận H1
H1: µ1 > µ2
Trường hợp 2: Chưa biết σ12 và σ22; n ≥ 30 và m ≥ 30.
Khi đó giá trị thống kê:
U =
X −Y
( S1* ) 2 ( S 2* ) 2
+
n
m
Ta có tiêu chuẩn kiểm định:
+)
Nếu U ≤ xα
+)
Nếu U > xα 2 thì chấp nhận H1 và bác bỏ H2
2
thì chấp nhận H0 và bác bỏ H1
Chú ý: Hoàn toàn tương tự cho các phép kiểm định so sánh giá trị trung bình
một phía, ta có thể tóm tắt bởi bảng sau:
Giả thiết
H0: µ1 = µ2
H1: µ1 ≠ µ2
H0: µ1 = µ2
H1: µ1 < µ2
H0: µ1 = µ2
H1: µ1 > µ2
Tiêu chuẩn kiểm định
U ≤ xα 2
Kết luận
Chấp nhận H0, bác bỏ H1
U > xα 2
Bác bỏ H0, chấp nhận H1
U ≥ − xα
Chấp nhận H0, bác bỏ H1
U < −xα
Bác bỏ H0, chấp nhận H1
U ≤xα
Chấp nhận H0, bác bỏ H1
U > xα
Bác bỏ H0, chấp nhận H1
23
Trường hợp 3: Biết σ12 và σ22; n < 30 và m < 30 và có σ12 = σ22
Khi đó giá trị thống kê: U =
X −Y
1 1
S 2 ×( + )
n m
với S 2 =
(n − 1) ×( S1* ) 2 + (m − 1) ×( S 2* ) 2
n+m−2
Ta có tiêu chuẩn kiểm định:
n+m−2
2
+)
Nếu U ≤ tα
+)
n +m −2
Nếu U > tα 2 thì chấp nhận H1, bác bỏ H0
thì chấp nhận H0, bác bỏ H1
Chú ý: Hoàn toàn tương tự cho các phép kiểm định so sánh trung bình một phía,
ta có thể tóm tắt bởi bảng sau:
Giả thiết
H0: µ1 = µ2
H1:µ1 ≠ µ2
H0: µ1 = µ2
H1: µ1 < µ2
H0: µ1 = µ2
Tiêu chuẩn kiểm định
U ≤tαn +2m −2
Kết luận
Chấp nhận H0, bác bỏ H1
U > tαn +2m −2
Bác bỏ H0, chấp nhận H1
U ≥ −tαn +m −2
Chấp nhận H0, bác bỏ H1
n +m −2
U <−tα
Bác bỏ H0, chấp nhận H1
n +m −2
U ≤tα
Chấp nhận H0, bác bỏ H1
U > tαn +m −2
Bác bỏ H0, chấp nhận H1
H1: µ1 > µ2
Ví dụ: Hai nhóm cùng học xác suất thống kê với cùng một thầy với cùng một
phương pháp. Cuối học kì thu được kết quả như sau:
Nhóm 1:
Điểm X
6,7
7,2
7,4
7,6
Số sinh viên
2
8
3
1
24