Tải bản đầy đủ (.pdf) (57 trang)

Nguyên lý thống kê kinh tế (chương 4,5,6)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.25 MB, 57 trang )

07-Nov-16

HỌC PHẦN

NGUYÊN LÝ THỐNG KÊ KINH TẾ
Phan Ngọc Bảo Anh
Khoa Kế toán – Tài chính – Ngân hàng
Email:

Chƣơng 4

PHÂN PHỐI CHUẨN
– PHÂN PHỐI MẪU
Phan Ngọc Bảo Anh
Khoa Kế toán – Tài chính Ngân hàng
Email:

NỘI DUNG CHƢƠNG 4
 BIẾN NGẪU NHIÊN
 PHÂN PHỐI CHUẨN – PHÂN PHỐI CHUẨN CHUẨN HÓA
 PHÂN PHỐI CỦA MỘT VÀI ĐẠI LƢỢNG THỐNG KÊ
 PHÂN PHỐI MẪU

1


07-Nov-16

BIẾN NGẪU NHIÊN
Biến ngẫu nhiên là đại lƣợng lấy giá trị thực tùy thuộc
vào kết quả ngẫu nhiên của phép thử.


Các chữ in X, Y,… thƣờng dùng để ký hiệu các biến ngẫu
nhiên và Xi, Yi,... để chỉ các trị số của chúng.
Biến ngẫu nhiên

Biến ngẫu nhiên
rời rạc

Biến ngẫu nhiên
liên tục

BIẾN NGẪU NHIÊN
Biến ngẫu nhiên đƣợc chia thành hai loại:
 Biến ngẫu nhiên gọi là rời rạc nếu tập hợp trị số
mà nó có thể lấy là hữu hạn hoặc liệt kê đƣợc: số sản
phẩm không đạt tiêu chuẩn kỹ thuật trong một đợt
sản xuất, số chấm xuất hiện khi gieo con xúc xắc,…
 Biến ngẫu nhiên liên tục là loại mà trị số của nó có
thể lấy đầy một khoảng nào đó.

PHÂN PHỐI XÁC SUẤT
Bất kỳ một hình thức nào đó cho biết mối quan hệ giữa
các giá trị có thể có của biến ngẫu nhiên và xác suất
tƣơng ứng đƣợc gọi là phân phối xác suất của biến
ngẫu nhiên đó.
Để biết đƣợc phân phối xác suất của biến ngẫu nhiên X:
 Các giá trị có thể có của biến X.
 Xác suất để nó nhận mỗi giá trị có thể có.
Lƣu ý: Xác suất tổng bằng 1.

2



07-Nov-16

PHÂN PHỐI XÁC SUẤT CỦA
BIẾN NGẪU NHIÊN RỜI RẠC
BNN rời rạc X nhận các giá trị 𝑥1 , 𝑥2 ,…, 𝑥𝑛
Phân phối xác suất của BNN rời rạc có hình thức tổng quát
nhƣ sau: (Bảng phân phối xác suất)

X

𝑥1

𝑥2



𝑥𝑛

Cộng

P(X)

p1

p2




pn

1

Chú ý:

2)

n
i=1 pi

N
i=1 𝑥𝑖

3) μ = E X =

1) pi = P X = 𝑥𝑖
=1

4)

σ2

N
i=1(𝑥𝑖

=

pi


− μ)2 pi

PHÂN PHỐI XÁC SUẤT CỦA
BIẾN NGẪU NHIÊN RỜI RẠC
Ví dụ: Tung 2 đồng xu.
Đặt X: số lần xuất hiện mặt hình.
4 khả năng có thể xảy ra

S

S

H

H

S

H

H

Phân phối xác suất
X
0
1
2
Xác suất

S


P(X)
¼ = 0,25
2/4 = 0,5
¼ = 0,25

.50
.25
0

1

2

x

PHÂN PHỐI XÁC SUẤT CỦA
BIẾN NGẪU NHIÊN LIÊN TỤC
Gọi X là biến ngẫu nhiên liên tục, khi đó phân phối xác
suất của X là một hàm 𝑓(𝑥) sao cho với hai giá trị bất kỳ
b
a và b (a < b),

P ( a  X  b)   f ( x ) dx

𝑓(𝑥)

a

Hàm mật độ xác suất f(x) phải thỏa

hai điều kiện:
i ) f ( x )  0 x


ii )  f ( x ) dx  1


0

a

b

𝑥

3


07-Nov-16

MỘT VÀI QUY LUẬT PHÂN PHỐI
XÁC SUẤT THÔNG DỤNG
 Phân phối nhị thức
 Phân phối Poisson
 Phân phối siêu bội
 Phân phối chuẩn
 Phân phối Chi bình phƣơng (𝜒 2 )
 Phân phối t (phân phối t Student)
 Phân phối Fisher – Snedecor (phân phối F)
 ….


PHÂN PHỐI CHUẨN
Định nghĩa
Phân phối chuẩn là phân phối của biến ngẫu nhiên liên tục.
Một biến ngẫu nhiên liên tục X đƣợc gọi là có phân phối
chuẩn nếu hàm mật độ xác suất có dạng:

1
f ( x) 
e
 . 2

Trong đó:
𝜋 = 3,14159
e = 2,71828
μ: trung bình tổng thể
σ: độ lệch tiêu chuẩn

( x )2
2 2

−∞ < 𝑥 < +∞

Ký hiệu: X ~ N(,2)

PHÂN PHỐI CHUẨN
Tính chất
1/ Phân phối chuẩn đối xứng, có dạng hình chuông.
2/ Trung bình = Trung vị = Mode



3/

 .



1
e
2

( x )2
2 2

dx  1

Chính là diện tích giới hạn bởi
đồ thị f(x) và trục hoành.
4/ Đồ thị đối xứng với nhau
qua đƣờng thẳng x = 
5/ X có trung bình là  và
phƣơng sai là 2

 = Me = M0

4


07-Nov-16


PHÂN PHỐI CHUẨN
Tính chất
Xấp xỉ 68% giá trị nằm trong khoảng ± 1σ so với μ
Xấp xỉ 95% giá trị nằm trong khoảng ± 2σ so với μ
Xấp xỉ 99,73% giá trị nằm trong khoảng ± 3σ so với μ
𝑓(𝑥)

𝑥

PHÂN PHỐI CHUẨN
1 < 2 < 3

PHÂN PHỐI CHUẨN

1 < 2

5


07-Nov-16

PHÂN PHỐI CHUẨN

P (c  X  d )  ?

𝑓(𝑥)

c

𝑥


d

PHÂN PHỐI CHUẨN CHUẨN HÓA
Phân phối chuẩn chuẩn hóa là một phân phối chuẩn có
trung bình () bằng 0 và phƣơng sai (2) bằng 1.
Một biến chuẩn chuẩn hóa
Xét biến ngẫu nhiên X ~ N (,2). Ta có thể chuẩn hóa X
bằng cách:

Z=

X−μ
σ

Khi đó E(Z) = 0 và Var(Z) = 1. Ta nói Z có phân phối
chuẩn hóa. Ký hiệu X ~ N(0,12)

PHÂN PHỐI CHUẨN CHUẨN HÓA
Phân phối chuẩn chuẩn hóa là một phân phối chuẩn có
trung bình () bằng 0 và phƣơng sai (2) bằng 1.
Còn gọi là phân phối chuẩn tắc (phân phối đơn giản)

Hàm mật độ xác suất:

f ( z) 

1
e
2


z
2

𝑓(𝑧)

2

𝜍𝑧 = 1

𝑧
𝜇𝑧 = 0

6


07-Nov-16

PHÂN PHỐI CHUẨN CHUẨN HÓA
Xác suất của Z ~ N (0, 12)
Hàm số  ( z ) 

z


0

1
e
2


 z2
2

dz

đƣợc gọi là hàm tích phân Laplace

Tính chất của hàm Laplace:
+ (z) = P(0 < z < z0)
+ (z) là hàm số lẻ: (-z)= -(z)
+



 z2
2

0

1
e
2

Z

0,00

0,01


0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

0,0

0,0000

0,0040

0,0080

0,0120

0,0160

0,0199


0,0239

0,0279

0,0319

0,0359

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753


0,2

0,0793

0,0832

0,0871

0,0910

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,3

0,1179

0,1217

0,1255


0,1293

0,1331

0,1368

0,1406

0,1443

0,1480

0,1517

0,4

0,1554

0,1591

0,1628

0,1664

0,1700

0,1736

0,1772


0,1808

0,1844

0,1879

0,5

0,1915

0,1950

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,2190

0,2224

0,6


0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2517

0,2549

0,7

0,2580

0,2611

0,2642

0,2673


0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,8

0,2881

0,2910

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078


0,3106

0,3133

0,9

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,3340

0,3365

0,3389

1,0

0,3413


0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,1

0,3643

0,3665

0,3686

0,3708

0,3729


0,3749

0,3770

0,3790

0,3810

0,3830

1,2

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,3980

0,3997


0,4015



 0,5

z
𝑧0

Tra bảng (Z)

(1,08) = 0,3599
Hoặc trong Excel dùng hàm (NORMSDIST(Z) – 0,5)

BẢNG PHÂN PHỐI CHUẨN CHUẨN HÓA
Z

0,00

0,01

0,02

0,0

0,0000

0,0040

0,0080


0,1

0,0398

0,0438 0,0478
0,0478

0,2

0,0793

0,0832

0,0871

0,3

0,1179

0,1217

0,1255

𝜇𝑧 = 0

𝜍𝑧 = 1
0,0478

Xác suất

P (0 < Z < 0,12)
= 0,0478

0
Z = 0,12

𝑧

7


07-Nov-16

PHÂN PHỐI CHUẨN CHUẨN HÓA

Tra bảng (Z) ?

S
𝑧
-3

-2

0

-1

2

1


3

Zb

Za

PHÂN PHỐI CHUẨN

Z=
 X ~ N (,2)

X−μ
σ

X ~ N(0,12)

 P (a < X < b) = P (Za < Z < Zb) = S

Z𝑎 =

a−μ
σ

Z𝑏 =

b−μ
σ

PHÂN PHỐI CHUẨN

Chú ý: Công thức tính xác suất:

 X ~ N (μ, σ2): P (a  X  b)   (

 Nếu X ~ N (μ, σ2) thì Z =

𝑋−𝜇
𝜎

b



) (

a



)

~ N (0, 12), ta có:

a) P (Z > a) = 0,5 - (a)
b) P (Z < b) = 0,5 + (b)
d) P (a < Z < b) = (b) - (a), với a < b

e)  (Z ≥ 4) ≈ 0,5

8



07-Nov-16

PHÂN PHỐI CHUẨN
Ví dụ:
Trọng lƣợng của một loại sản phẩm là X có phân phối
chuẩn với μ = 8,6g, σ2 = 0,36. Lấy một sản phẩm bất kỳ:
a. Tính xác suất để SP ấy có trọng lƣợng từ 8g đến 9,8g
b. Tính xác suất để SP ấy có trọng lƣợng nhỏ hơn 7,8g

Excel: SGK/121

PHÂN PHỐI CHUẨN
Khái niệm Z
Z là một số sao cho P(Z > Z) = .
Đây chính là xác suất sai lầm mà ta thƣờng dùng trong
thống kê.
Một vài giá trị đặc biệt:


0,005

0,010

0,025

0,050

0,100


Z

2,575

2,330

1,960

1,645

1,280

PHÂN PHỐI CỦA MỘT VÀI
ĐẠI LƢỢNG THỐNG KÊ
1. Phân phối Chi bình phƣơng
Giả sử x1, x2, ... xn là các biến ngẫu nhiên độc lập, cùng có phân
𝑆2

phối chuẩn N (0,1). Khi đó 𝜒 2 = (𝑛 − 1) 𝜎2
𝑆2

=

𝑛
2
𝑖=1(𝑥𝑖 −𝑥 )

𝑛−1


trong đó

có phân phối Chi bình phƣơng bậc tự do (n-1).

2
Ký hiệu: 𝜒𝑛−1
~ 𝑛−1

𝑆2
𝜎2

Khi n càng lớn thì phân phối Chi bình phƣơng sẽ xấp xỉ phân
phối chuẩn.
𝟐
2
𝝌𝒏−𝟏;𝜶
là một số sao cho 𝑝(𝜒 2 > 𝜒𝑛−1;𝛼
)=𝛼
Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
hàm CHIINV(𝛼,df). Trong đó, df là bậc tự do.

9


07-Nov-16

PHÂN PHỐI CỦA MỘT VÀI
ĐẠI LƢỢNG THỐNG KÊ

1. Phân phối Chi bình phƣơng

Phân phối Chi bình phƣơng có thể đƣợc sử dụng để:
- Kiểm định tính độc lập của hai biến
- So sánh sự phù hợp giữa các tần số quan sát và tần số lý
thuyết
- Suy rộng cho phƣơng sai tổng thể

PHÂN PHỐI CỦA MỘT VÀI
ĐẠI LƢỢNG THỐNG KÊ
2. Phân phối t (phân phối t Student)
Giả sử x1, x2, ... xn là biến ngẫu nhiên, cùng có phân phối
𝑥−𝜇
𝑛

chuẩn. Khi đó 𝑡 = 𝑆

có phân phối Student bậc tự do (n-1).

𝑥−𝜇
~𝑡𝑛−1
𝑛

Ký hiệu: 𝑡 = 𝑆

Phân phối t là phân phối xác suất có hình dáng gần giống với
phân phối chuẩn với hai đuôi dài hơn. Khi n càng lớn thì phân
phối t sẽ tiến rất nhanh về phân phối chuẩn.
tn-1; là một số sao cho P(t > tn-1;) = 
Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
hàm TINV(2,df). Trong đó, df là bậc tự do.


PHÂN PHỐI CỦA MỘT VÀI
ĐẠI LƢỢNG THỐNG KÊ
3. Phân phối Fisher (F)
- Giả sử có hai mẫu độc lập có nx, ny quan sát lấy từ hai tổng thể
có phân phối chuẩn, phƣơng sai tổng thể và phƣơng sai mẫu lần
lƣợt là x2 , y2 , Sx2 , Sy2 thì khi đó 𝐹 =

2
2
𝑆𝑋
/𝜎𝑋
𝑆𝑌2 /𝜎𝑌2

có phân phối

Fisher bậc tự do của tử (nx - 1) và bậc tự do của mẫu (ny - 1)
Ký hiệu: F ~ Fv1,v2
- Fv1,v2; là một số sao cho p(F > Fv1;v2;) = 
- Muốn tìm giá trị này ta có thể tra bảng hoặc trong Excel dùng
hàm FINV(,df1,df2). Trong đó, df1,df2 là bậc tự do.

10


07-Nov-16

MỐI LIÊN HỆ GIỮA TỔNG THỂ VÀ MẪU
Tổng thể: toàn bộ các đơn vị thuộc đối tƣợng điều tra.
Mẫu: một số đơn vị nhất định đƣợc chọn ra từ tổng thể để
tiến hành điều tra thực tế.

Chỉ tiêu
Quy mô
Số trung bình
Tỷ lệ theo một
tiêu thức
Phƣơng sai

Tổng thể
N
𝑋𝑖
𝜇=
𝑁
𝑁∗
p=
𝑁
𝑋
𝑖 −𝜇
𝜍2 =
𝑁
𝜍 2 = p(1 - p)

Mẫu
n
𝑥𝑖
𝑥=
𝑛
𝑛∗
f=
𝑛
𝑥

𝑖 −𝑥
𝑆2 =
𝑛−1
𝑆 2 = f(1 - f)

2

2

PHÂN PHỐI MẪU
Định lý giới hạn trung tâm
Định lý: Khi cỡ mẫu n đủ lớn thì phân phối của
trung bình mẫu 𝑥 sẽ xấp xỉ phân phối chuẩn, bất
chấp hình dáng phân phối của tổng thể.
Định lý: Một biến ngẫu nhiên là tổng của nhiều biến
ngẫu nhiên khác sẽ có phân phối xấp xỉ phân phối
chuẩn.

PHÂN PHỐI MẪU
Một vài tính chất của phân phối mẫu

- Nếu X có phân phối 2m thì 𝑛𝑥 cũng có phân phối 2nm
- Nếu X có phân phối chuẩn N(µ, 2) thì:
1/ 𝑛𝑥 cũng có phân phối chuẩn N(nµ, n2) và
𝑥 ~ N(µ, 2/n)
2/ Với kích thƣớc mẫu khá lớn (n30), thì phân phối của
𝑥−𝜇
𝑥/ 𝑛

trung bình mẫu sẽ xấp xỉ phân phối chuẩn và 𝑧 = 𝜎

có phân phối chuẩn tắc.
2
3/ (n  1) S ~  2
n 1
2

4/ 𝑥 và S2 độc lập với nhau.

11


07-Nov-16

Chƣơng 5

ƢỚC LƢỢNG
Phan Ngọc Bảo Anh
Khoa Kế toán – Tài chính Ngân hàng
Email:

ƢỚC LƢỢNG
Chọn ngẫu nhiên

TỔNG THỂ

MẪU

Ƣớc lƣợng & kiểm định
giả thuyết


MỐI LIÊN HỆ GIỮA TỔNG THỂ VÀ MẪU
Tổng thể: toàn bộ các đơn vị thuộc đối tƣợng điều tra.
Mẫu: một số đơn vị nhất định đƣợc chọn ra từ tổng thể để
tiến hành điều tra thực tế.
Chỉ tiêu
Quy mô
Số trung bình
Tỷ lệ theo một
tiêu thức
Phƣơng sai

Tổng thể
N
𝑋𝑖
𝜇=
𝑁
𝑁∗
p=
𝑁
𝑋
𝑖 −𝜇
𝜍2 =
𝑁
𝜍 2 = p(1 - p)

2

Mẫu
n
𝑥𝑖

𝑥=
𝑛
𝑛∗
f=
𝑛
𝑥
𝑖 −𝑥
𝑆2 =
𝑛−1
𝑆 2 = f(1 - f)

2

12


07-Nov-16

ƢỚC LƢỢNG
Ƣớc lƣợng là phỏng đoán một giá trị chƣa biết của tổng
thể dựa vào quan sát trên mẫu lấy ra từ tổng thể đó.
Thông thƣờng, ta cần ƣớc lƣợng về trung bình, tỷ lệ,
phƣơng sai, hệ số tƣơng quan của tổng thể.
Có hai hình thức ƣớc lƣợng;
 Ƣớc lƣợng điểm: kết quả cần ƣớc lƣợng đƣợc cho
bởi một trị số.
 Ƣớc lƣợng khoảng: kết quả cần ƣớc lƣợng đƣợc cho

bởi một khoảng


ƢỚC LƢỢNG ĐIỂM
Trung bình, tỷ lệ và phƣơng sai mẫu (hiệu chỉnh) lần lƣợt
là những ƣớc lƣợng điểm (ƣớc lƣợng không chệch) của
trung bình, tỷ lệ, phƣơng sai của tổng thể.

MẪU

TỔNG THỂ
ƣớc lƣợng

Trung bình

𝑥

Tỷ lệ

𝜌

p

Phƣơng sai

𝑆2

𝜍2

𝜇

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Kết quả của ƣớc lƣợng điểm là một giá trị cụ thể.

 Không thể hiện tính chính xác của ƣớc lƣợng.

ƢỚC LƢỢNG KHOẢNG
Mục đích: Dựa vào dữ liệu mẫu, với độ tin cậy cho
trƣớc, xác định khoảng giá trị mà đặc trƣng của tổng thể

có thể rơi vào.

13


07-Nov-16

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Gọi  là đặc trƣng của tổng thể cần ƣớc lƣợng.
Giả sử dựa vào mẫu quan sát, ta tìm đƣợc hai biến ngẫu
nhiên A và B sao cho:
(1- ) là độ tin cậy

P(A <  < B) = 1 - 
Giả sử a, b là giá trị cụ thể của A, B.
 Khoảng (a,b) đƣợc gọi là khoảng ƣớc lƣợng với độ tin
cậy (1-).100 (%) của .

ƢỚC LƢỢNG KHOẢNG TIN CẬY
1. Ƣớc lƣợng trung bình tổng thể
2. Ƣớc lƣợng tỷ lệ tổng thể
3. Ƣớc lƣợng phƣơng sai tổng thể
4. Ƣớc lƣợng chênh lệch giữa hai trung bình tổng thể
5. Ƣớc lƣợng chênh lệch giữa hai tỷ lệ tổng thể

6. Ƣớc lƣợng kích thƣớc cỡ mẫu

1. ƢỚC LƢỢNG KHOẢNG TIN CẬY CHO
TRUNG BÌNH TỔNG THỂ (µ)



 

Đã biết 2

   x  z / 2

Chƣa biết 2

Cỡ mẫu lớn (n30)




n



   x  z / 2


S 

n


Cỡ mẫu nhỏ (n<30)



   x  tn 1, / 2


S 

n

14


07-Nov-16

KÍCH THƢỚC CỠ MẪU
Ƣớc lƣợng trung bình

x

z  / 2
n

z  / 2

x

n


Gọi 𝜀 là một nửa chiều rộng của khoảng tin cậy
Ta có:

  z / 2



n  z2 / 2

n

2
2

𝜀 còn gọi là sai số của ƣớc lƣợng

2. ƢỚC LƢỢNG KHOẢNG TIN CẬY
CHO TỶ LỆ TỔNG THỂ (p)

Giả sử có mẫu ngẫu nhiên n quan sát (n  40)
+ 𝑝 là tỷ lệ các quan sát có tính chất A nào đó của mẫu
+ Khoảng tin cậy (1-).100 (%) của tỷ lệ p các quan sát
có tính chất A của tổng thể đƣợc xác định bởi:
p ∈ 𝑝 ± 𝑧𝛼

𝑝 − 𝑧𝛼

2


2

𝑝 1−𝑝
𝑛

𝑝 1−𝑝
< 𝑝 < 𝑝 + 𝑧𝛼
𝑛

2

𝑝 1−𝑝
𝑛

KÍCH THƢỚC CỠ MẪU
𝜀: sai số của ƣớc lƣợng

Ƣớc lƣợng tỷ lệ
^

^

p  z / 2

^

^
p (1  p )
 p  p  z / 2
n


^

^

p (1  p )
n

Gọi 𝜀 là một nửa chiều rộng của khoảng tin cậy
Ta có:

  z / 2

pˆ (1  pˆ )
n

n  z2 / 2

f (1  f )

2

Cauchy: f + (1 – f) ≥ 2 𝑓(1 − 𝑓)
↔ 1 ≥ 2 𝑓(1 − 𝑓)


1
4

≥ 𝑓(1 − 𝑓)


n  z2 / 2

0,25

2

15


07-Nov-16

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Phân phối chuẩn: là phân phối có dạng hình chuông và đối
xứng qua trung bình 𝜇
Phân phối chuẩn đơn giản: đối xứng qua trung bình 𝜇 = 0
Ý nghĩa của bảng phân phối chuẩn đơn giản: Giá trị 𝜑(𝑍)
cho biết xác suất để biến Z nằm trong khoảng (0,Z)

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Ví dụ: Z = 1,08  𝜑(1,08) = 0,3599
Z

0,00

0,01

0,02




0,08

0,09

0,0

0,0000

0,0040

0,0080



0,0319

0,0359

0,1

0,0398

0,0438

0,0478



0,0714


0,0753

0,2

0,0793

0,0832

0,0871



0,1103

0,1141

0,3

0,1179

0,1217

0,1255



0,1480

0,1517
















1,0

0,3413

0,3438

0,3461



0,3599

0,3621

1,1


0,3643

0,3665

0,3686



0,3810

0,3830

1,2

0,3849

0,3869

0,3888



0,3997

0,4015

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Cách tìm 𝑍𝛼/2
𝑍𝛼/2 là một số sao cho: P(𝑍 < - 𝑍𝛼/2 ) = P(𝑍 > 𝑍𝛼/2 ) = 𝛼/2


𝛼/2

𝛼/2

- 𝑍𝛼/2

𝑍𝛼/2

16


07-Nov-16

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Ví dụ: 𝛼 = 5%, Tìm 𝑍𝛼/2 = ?
𝛼 = 5%  𝛼/2 = 2,5% = 0,025
 𝜑(𝑍0,025) = 0,5 – 0,025 = 0,475

0,025

0,025

𝑍0,025

ƢỚC LƢỢNG KHOẢNG TIN CẬY
Tra bảng phân phối chuẩn  𝑍𝛼/2 = 1,96
Z

0,00


0,01

0,02



0,06

0,0

0,0000

0,0040

0,0080



0,0359

0,1

0,0398

0,0438

0,0478




0,0753













1,9

0,4713

0,4719

0,4726



0,4750

2,0

0,4772


0,4778

0,4783



0,4803

Một số giá trị thƣờng dùng


0,005

0,010

0,025

0,050

0,100

Z

2,575

2,330

1,960


1,645

1,280

Ví dụ 1:

Để xác định trọng lƣợng trung bình của các bao bột
mì đƣợc đóng bằng máy tự động, ngƣời ta chọn
ngẫu nhiên 15 bao và tính đƣợc trọng lƣợng trung
bình 39,8kg. Tìm khoảng tin cậy 99% của trọng
lƣợng trung bình các bao bột mì.
Giả sử trọng lƣợng bao bột mì có phân phối chuẩn
và phƣơng sai là 0,144.

17


07-Nov-16

Ví dụ 1:
Gọi  là trọng lƣợng trung bình một bao bột mì.
𝑥 = 39,8

Ta có: n = 15

2 = 0,144

(1-) = 99% =>  = 1% => Z/2 = Z0,5% = 2,575
z


z

x   /2
   x   /2
n
n
39,8  2,575

0,144
15

0,144

   39,8  2,575

15

 39,55 <  < 40,05
KL: Với khoảng tin cậy 99%, trọng lƣợng trung bình của
mỗi bao bột mì đƣợc ƣớc lƣợng trong khoảng từ 39,55 kg
đến 40,05 kg.

Ví dụ 2:
Một công ty điện thoại muốn ƣớc lƣợng thời gian trung
bình của một cuộc điện thoại đƣờng dài vào ngày cuối
tuần. Mẫu ngẫu nhiên 20 cuộc gọi đƣờng dài vào ngày
cuối tuần cho thấy thời gian trung bình là 14,8 phút, độ
lệch chuẩn 5,6 phút. Hãy ƣớc lƣợng thời gian trung
bình của một cuộc gọi đƣờng dài vào ngày cuối tuần,
với độ tin cậy 95%.


Ví dụ 2:
Gọi  là thời gian trung bình của một cuộc gọi đƣờng dài
vào ngày cuối tuần.
Ta có: n = 20

𝑥 = 14,8

S = 5,6

(1-) = 95% =>  = 5% => tn-1,/2 = t19; 0,025 = 2,093
x  t n 1, / 2

s
n

   x  t n 1, / 2

s
n

5,6
5,6
14,8  2,093
   14,8  2,093
 12,1792 <  < 17,4208
20
20

KL: Với độ tin cậy 95%, thời gian trung bình của một cuộc

điện đàm đƣờng dài vào cuối tuần đƣợc ƣớc lƣợng trong
khoảng từ 12,1792 đến 17,4208 phút.

18


07-Nov-16

Ví dụ 3:
Một nghiên cứu đƣợc thực hiện nhằm ƣớc lƣợng thị
phần của sản phẩm nội địa đối với mặt hàng bánh
kẹo. Kết quả điều tra chọn mẫu ngẫu nhiên 100
khách hàng cho thấy có 34 ngƣời dùng sản phẩm
nội địa. Tìm khoảng tin cậy 95% cho tỷ lệ khách
hàng sử dụng bánh kẹo nội địa.

Ví dụ 3:
Gọi p là thị phần của sản phẩm nội địa đối với mặt hàng
bánh kẹo.
Ta có: n = 100
𝑝 = 34/100 = 0,34
(1-) = 95% =>  = 5% => Z/2 = Z0,025 = 1,96
0,34  1,96

0,34(1  0,34)
0,34(1  0,34)
 p  0,34  1,96
100
100


0,2472 < p < 0,4328
KL: Với khoảng tin cậy 95%, tỷ lệ khách hàng sử dụng bánh
kẹo nội địa nằm trong khoảng từ 24,72% đến 43,28%.

3. ƢỚC LƢỢNG KHOẢNG TIN CẬY CHO
PHƢƠNG SAI TỔNG THỂ (𝝈𝟐 )

Chọn một mẫu ngẫu nhiên n quan sát có phân phối
chuẩn, với độ tin cậy (1 - α) ta có ƣớc lƣợng phƣơng sai:

n  1.S 2
 n21; / 2

 2 

n  1.S 2
 n21;1 / 2

2
Với 𝜒𝑛−1
có phân phối 𝜒 2 với n – 1 bậc tự do

19


07-Nov-16

3. ƢỚC LƢỢNG KHOẢNG TIN CẬY CHO
PHƢƠNG SAI TỔNG THỂ (𝝈𝟐 )


Ví dụ 4:
Một nhà sản xuất quan tâm đến biến thiên của tỷ lệ
tạp chất trong một loại hƣơng liệu đƣợc cung cấp.
Chọn ngẫu nhiên 15 mẫu hƣơng liệu cho thấy độ
lệch chuẩn về tỷ lệ tạp chất là 2,36%. Với khoảng
tin cậy 95%, hãy ƣớc lƣợng độ lệch chuẩn về tỷ lệ
tạp chất trong loại hƣơng liệu đó?

Ví dụ 4:
Gọi σ là độ lệch chuẩn về tỷ lệ tạp chất.
Ta có: n = 15; S = 2,36%
(1-) = 95% => α = 5%
2
2
 n21; / 2  142 ; 2,5%  26,119  n1;1 / 2  14;97,5%  5,629

15  1.2,362   2  15  1.2,362
26,119

5,629

 2,99   2  13,85  1,73    3,72

KL: Với độ tin cậy 95%, độ lệch chuẩn về tỷ lệ tạp chất
đƣợc ƣớc lƣợng trong khoảng từ 1,73 đến 3,72%.

4. ƢỚC LƢỢNG KHOẢNG TIN CẬY CHO
KHÁC BIỆT GIỮA TRUNG BÌNH HAI TỔNG THỂ

4.1. Ƣớc lƣợng khoảng tin cậy dựa trên sự phối hợp

từng cặp (Mẫu phối hợp từng cặp)
4.2. Ƣớc lƣợng khoảng tin cậy dựa vào mẫu độc lập

20


07-Nov-16

4. ƢỚC LƢỢNG KHOẢNG TIN CẬY CHO
KHÁC BIỆT GIỮA TRUNG BÌNH HAI TỔNG THỂ
4.1. Ƣớc lƣợng khoảng tin cậy dựa trên sự phối hợp từng
cặp (Mẫu phối hợp từng cặp)
- So sánh giữa “trƣớc” và “sau”
- So sánh giữa các đơn vị về một đặc điểm nào đó
- So sánh giữa các đơn vị phối hợp từng cặp theo không gian
- So sánh giữa các đơn vị phối hợp từng cặp theo thời gian

4.1. Ƣớc lƣợng KTC dựa trên sự phối hợp từng cặp
Giả sử ta có mẫu n cặp quan sát từ hai tổng thể X, Y
+ Gọi x, y là trung bình của X, Y
+ 𝑑 là trung bình của n sự khác biệt di (di = xi-yi)
+ Sd là độ lệch chuẩn của n sự khác biệt di (di = xi-yi)
Giả sử rằng di có phân phối chuẩn  Công thức xác định
khoảng tin cậy (1-).100 (%) của (x - y) nhƣ sau:

d  tn 1, / 2
Trong đó,

d


n

sd
s
  x   y  d  tn 1, / 2 d
n
n
n

 d (x  y )
i 1

n

i



i 1

i

n

n

i

; S 
2

d

 (d
i 1

i

n

 d )2

n 1



d
i 1

2
i

 n.d

2

n 1

4.1. Ƣớc lƣợng KTC dựa trên sự phối hợp từng cặp
Ví dụ 5:
Công ty điện lực thực hiện các biện pháp khuyến khích tiết

kiệm điện. Lƣợng điện tiêu thụ ghi nhận ở 12 hộ gia đình
trƣớc và sau khi có biện pháp khuyến khích tiết kiệm điện.
Với độ tin cậy 95%, hãy ước lượng khoảng chênh lệch về
lượng điện tiêu thụ trung bình của các hộ gia đình trước và
sau khi thực hiện biện pháp khuyến khích tiết kiệm điện? Giả
sử rằng các khác biệt giữa lượng điện trước và sau khi
khuyến khích tiết kiệm có phân phối chuẩn.

21


07-Nov-16

Hộ gia đình

Lƣợng điện tiêu thụ trƣớc và sau khi
khuyến khích tiết kiệm (Kwh)
Trƣớc
Sau
73
69
50
54
83
82
78
67
56
60
74

73
74
75
87
78
69
64
72
72
77
70
75
63

1
2
3
4
5
6
7
8
9
10
11
12

Hộ

1


Lƣợng điện tiêu thụ trƣớc và sau
khi khuyến khích tiết kiệm (Kwh)
Trƣớc (xi)
Sau (yi)
73
69

di=(xi-yi)

(di - 𝒅)2

4

0,3402

-4

55,0074

2

50

54

3

83


82

1

5,8404

4
5
6
7
8

78
56
74
74
87

67
60
73
75
78

11
-4
1
-1
9


57,5064
55,0074
5,8404
19,5072
31,1732

9
10
11
12

69
72
77
75

64
72
70
63

5
0
7
12
41

2,5068
11,6738
12,8400

73,6730
330,9167

Tổng

Gọi µx, µy là lƣợng điện tiêu thụ trung bình của hộ gia đình trƣớc
và sau khi thực hiện biện pháp khuyến khích tiết kiệm điện.

d

41
 3,4167
12

sd 

 (d

i

 d )2

n 1



330,9167
 5,4848
12  1


(1-) = 95% => α = 5% => tn-1,/2 = t11; 0,025 = 2,201
Áp dụng công thức ta có:

d  t n 1, / 2
3,4167  2,201

sd
n

  x   y  d  t n 1, / 2

sd
n

5,4848
5,4848
  X   Y  3,4167  2,201
12
12

-0,0682 < X - Y < 6,9016
KL: Khoảng tin cậy 95% của sự khác biệt giữa lƣợng điện tiêu thụ
trƣớc và sau khi khuyến khích tiết kiệm đƣợc ƣớc lƣợng từ -0,0682
đến 6,9016 (Kwh).

22


07-Nov-16


4.2. Ƣớc lƣợng KTC dựa vào mẫu độc lập
Chọn hai mẫu ngẫu nhiên độc lập gồm:
nx = x1, x2, ... xnx quan sát từ tổng thể X
ny = y1, y2, ... yny quan sát từ tổng thể Y
Tổng thể X có:

Tổng thể Y có:

+ trung bình x

+ trung bình y

+ phƣơng sai 2x

+ phƣơng sai 2y

+ trung bình mẫu 𝑥

+ trung bình mẫu 𝑦

+ phƣơng sai mẫu là S2x

+ phƣơng sai mẫu là S2y

4.2. Ƣớc lƣợng KTC dựa vào mẫu độc lập


2) Chƣa biết
2a) 2x # 2y


2

x

,2

 x2

 x   y   ( x  y )  z / 2

1) Đã biết 2x ,2y:




nx

 y2 
ny 


y:

nx, ny  30



 x   y   ( x  y )  z / 2




nx, ny < 30



 x   y   ( x  y )  tn; / 2 (



2b) 2x = 2y




 x   y   ( x  y )  tn  n


x

y  2 ;

/2

S2(

2
S x2 S y 

nx
ny 



2
S x2 S y 

)
nx
ny 


1 1 
 )
nx n y 

4.2. Ƣớc lƣợng KTC dựa vào mẫu độc lập
Ví dụ 6:
Một công ty đang muốn xem xét thời gian sản xuất của hai
dây chuyên sản xuất mới và cũ.
- Ở dây chuyền mới: 40 sản phẩm đƣợc sản xuất với thời
gian trung bình 46,5 phút/ sản phẩm, độ lệch chuẩn là 8
phút.
- Ở dây chuyền cũ: 38 sản phẩm đƣợc sản xuất với thời
gian trung bình là 51,2 phút/sản phẩm, độ lệch chuẩn là
9,5 phút.
Hãy ƣớc lƣợng khoảng tin cậy 95% cho sự khác biệt về
thời gian sản xuất giữa hai dây chuyền.

23



07-Nov-16

Gọi µx, µy là thời gian sản xuất trung bình một sản phẩm của
dây chuyền cũ và dây chuyền mới.
Dây chuyền cũ:
nx = 38
𝑥 = 51,2
Sx = 9,5
Dây chuyền mới: ny = 40
𝑦 = 46,5
Sy = 8
(1-) = 95% => α = 5% => Z/2 = Z0,025 = 1,96
Trường hợp này chưa biết phương sai tổng thể nên ta thay bằng
phương sai mẫu. Hai phương sai mẫu khác nhau và nx,ny>30
nên ta áp dụng công thức:
( x  y )  z / 2

2
2
S x2 S y
S x2 S y

  x   y  ( x  y )  z / 2

nx n y
nx n y

0,8 < x-y < 8,6
KL: Với độ tin cậy 95%, ta ƣớc lƣợng dây chuyền sản xuất mới
rút ngắn thời gian trung bình sản xuất một sản phẩm trong khoảng

từ 0,8 đến 8,6 phút.

5. ƢỚC LƢỢNG KTC CHO SỰ KHÁC BIỆT
GIỮA HAI TỶ LỆ TỔNG THỂ (trƣờng hợp n40)

Chọn hai mẫu ngẫu nhiên độc lập gồm:
nx = x1, x2, ... xnx

quan sát từ tổng thể X

ny = y1, y2, ... yny

quan sát từ tổng thể Y

Tỷ lệ mẫu tƣơng ứng là 𝑝𝑋 , 𝑝𝑌 .
Ta có khoảng tin cậy (1-).100 (%) của sự khác biệt (px - py)
đƣợc xác định nhƣ sau:


^
 ^
p x  p y   ( p x  p y )  z / 2



^
^
^
^


p x (1  p x ) p y (1  p y ) 


nx
ny



5. ƢỚC LƢỢNG KTC CHO SỰ KHÁC BIỆT
GIỮA HAI TỶ LỆ TỔNG THỂ (trƣờng hợp n40)

Ví dụ 7:
Kết quả điều tra từ mẫu ngẫu nhiên 1000 ngƣời ở mỗi
thành phố X và Y năm 2010 cho thấy tỷ lệ thất nghiệp ở
thành phố X là 7,5%; ở thành phố Y là 7,2%. Hãy ƣớc
lƣợng khoảng tin cậy 99% cho sự khác biệt về tỷ lệ thất
nghiệp giữa hai thành phố trên?

24


07-Nov-16

Ví dụ 7:
Ở thành phố X:

nx = 1000

Ở thành phố Y:


nY = 1000

(1-) = 99% => α = 1% =>

𝑝𝑋= 7,5%
𝑝𝑌 = 7,2%
z/2 = z0,005 = 2,575

^
^
^
^


^
 ^
p x (1  p x ) p y (1  p y ) 
p x  p y   ( p x  p y )  z / 2


nx
ny




-0,027 < px – py < 0,033

Vậy, với độ tin cậy 99%, có thể nói rằng tỷ lệ thất nghiệp ở thành
phố X từ thấp hơn 2,7% đến cao hơn 3,3% so với thành phố Y.


Chƣơng 6

KIỂM ĐỊNH GIẢ THUYẾT
Phan Ngọc Bảo Anh
Khoa Kế toán – Tài chính Ngân hàng
Email:

KIỂM ĐỊNH GIẢ THUYẾT
1. Công ty Coca – Cola muốn đánh giá xem thị phần hiện tại
có đƣợc cải thiện so với trƣớc khi áp dụng các biện pháp
khuyến mãi hay không, biết rằng trƣớc khi áp dụng, thị phần
của công ty là 32%.
2. BGĐ Công ty Unilever muốn tìm hiểu sở thích của khách
hàng về màu sắc, công dụng của nhãn hàng Clear có giống
nhau không hay sản phẩm nào sẽ đƣợc ngƣời tiêu dùng yêu
thích hơn?
3. Công ty Vật tƣ kỹ thuật nông nghiệp Cần Thơ muốn biết
năng suất của cùng một loại cây trồng sử dụng và không sử
dụng thuốc dƣỡng Tilt-Super có khác nhau không?

25


×