Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
LỜI CẢM ƠN
Để hoàn thành bản luận văn tốt nghiệp này, trƣớc hết em xin bày tỏ lòng
biết ơn sâu sắc đến các thầy, cô giáo trong khoa Toán trƣờng Đại học sƣ phạm
Hà Nội 2 đã động viên, giúp đỡ em trong suốt thời gian hoàn thành khoá luận
này.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc của mình tới thầy giáo Th.s.
Nguyễn Trung Dũng - ngƣời đã tạo điều kiện tốt nhất và chỉ bảo tận tình giúp
em hoàn thành khóa luận này.
Em xin chân thành cảm ơn.
Hà Nội, ngày 20 tháng 04 năm 2010
Sinh viên
Nguyễn Thị Huyền Trang
Nguyễn Thị Huyền Trang - K32 CNToán
1
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
LỜI CAM ĐOAN
Đề tài của em đƣợc hình thành dƣới sự hƣớng dẫn của thầy Th.s.
Nguyễn Trung Dũng cùng sự cố gắng của bản thân. Trong suốt thời gian
nghiên cứu và thực hiện khoá luận này em đã tham khảo một số tài liệu (đã
nêu trong phần tài liệu tham khảo).
Em xin cam đoan những kết quả trong khoá luận tốt nghiệp là kết quả
nghiên cứu của em, không trùng với bất kỳ tác giả nào khác. Nếu sai em xin
chịu hoàn toàn trách nhiệm.
Hà Nội, ngày 20 tháng 04 năm 2010
Sinh viên
Nguyễn Thị Huyền Trang
Nguyễn Thị Huyền Trang - K32 CNToán
2
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
LỜI NÓI ĐẦU
Toán ứng dụng là một ngành toán học có ý nghĩa rất to lớn và chiếm
một vị trí quan trọng. Nó là cầu nối để đƣa những kết quả đƣợc nghiên cứu
trên lý thuyết của giải tích , đại số, hình học vào trong các ngành khoa học
khác và thực tế cuộc sống.
Lý thuyết xác suất là bộ môn có tính ứng dụng rất rộng rãi trong các
ngành khoa học tự nhiên, khoa học xã hội và thực tế cuộc sống. Nó là công cụ
để giải quyết các vấn đề chuyên môn của nhiều lĩnh vực nhƣ kinh tế, sinh học
, tâm lý – xã hội. Do đó bộ môn này đƣợc đƣa vào giảng dạy ở hầu hết các
trƣờng đại học và cao đẳng.
Trong đó, phân phối chuẩn đóng vai trò quan trọng trong lý thuyết xác
suất, đồng thời chiếm vị trí trung tâm trong các kết luận thống kê ứng dụng.
Trong thực tế nhiều biến ngẫu nhiên , nhiều quy luật tuân theo luật chuẩn hoặc
gần chuẩn. Ngoài ra, phân phối chuẩn cũng đƣợc ứng dụng để mô tả nhiều
hiện tƣợng địa chất nhƣ hàm lƣợng nƣớc trong đá trầm tích, hàm lƣợng của
một số nguyên tố hoá học…và đặc biệt, phân phối chuẩn còn đƣợc ứng dụng
trong các bài toán ƣớc lƣợng và bài toán kiểm định giả thiết, là cơ sở đƣa ra
đƣợc những kết luận thống kê có giá trị.
Với mong muốn làm rõ hơn ý nghĩa của thống kê trong đời sống thông
qua một số ứng dụng cơ bản nhất của phân phối chuẩn. Em đã chọn đề tài
“Phân tích thống kê phân phối chuẩn” làm đề tài khoá luận của mình.
Nội dung của khoá luận bao gồm
Chƣơng 1: Cơ sở
Chƣơng 2: Phân tích thống kê đối với phân phối chuẩn
Với khoá luận tốt nghiệp trên, em mong rằng nó sẽ là tài liệu bổ ích cho
những ai quan tâm tới vấn đề này.
Nguyễn Thị Huyền Trang - K32 CNToán
3
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
MỤC LỤC
LỜI CẢM ƠN .............................................................................................. 1
LỜI CAM ĐOAN ........................................................................................ 2
LỜI NÓI ĐẦU ............................................................................................. 3
CHƢƠNG 1: CƠ SỞ ..................................................................................... 5
1.1 Phân phối chuẩn ..................................................................................... 9
1.2 Mẫu và phân phối mẫu của chuẩn ........................................................ 14
1.3 Ƣớc lƣợng điểm ................................................................................... 14
1.3.1 Một số định nghĩa ......................................................................... 14
1.3.2 Các phƣơng pháp tìm ƣớc lƣợng điểm ......................................... 16
1.4 Ƣớc lƣợng khoảng................................................................................ 18
1.4.1 Một số định nghĩa ........................................................................ 18
1.4.2 Phƣơng pháp P-Q-M tìm ƣớc lƣợng khoảng ............................... 19
CHƢƠNG 2 PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN ...... 20
2.1 Ƣớc lƣợng tham số ............................................................................... 20
2.2 Khoảng tin cậy của các tham số ........................................................... 22
2.3 Kiểm định giả thuyết các tham số ........................................................ 28
2.3.1 Kiểm định giả thuyết về giá trị trung bình ................................... 28
2.3.2 Kiểm định giả thuyết về hai kỳ vọng toán của hai biến ngẫu
nhiên phân phối chuẩn ........................................................................... 32
2.3.3 Kiểm định giả thuyết về phƣơng sai ............................................ 36
2.3.4 Kiểm định giả thuyết về sự bằng nhau của hai phƣơng sai ......... 37
2.3.5 Kiểm định k phƣơng sai của k biến ngẫu nhiên phân phối chuẩn38
2.3.6 Kiểm định giả thuyết về quy luật phân phối xác suất .................. 38
2.4 Một số bài toán ..................................................................................... 39
2.4.1 Bài toán về ƣớc lƣợng tham số .................................................... 39
2.4.2 Bài toán về khoảng tin cậy của các tham số ................................ 42
2.4.3 Bài toán về kiểm định tham số..................................................... 46
KẾT LUẬN ................................................................................................ 54
TÀI LIỆU THAM KHẢO ........................................................................ 55
Nguyễn Thị Huyền Trang - K32 CNToán
4
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
CHƢƠNG 1 CƠ SỞ
1.1 Phân phối chuẩn
Định nghĩa 1.1 Biến ngẫu nhiên X được gọi là có phân phối chuẩn nếu hàm
mật độ xác suất của X có dạng
fX x
x
1
2
2
.e
2
2
2
, - ∞ < < +∞ , 0 < 2 < +∞, x .
Kí hiệu X ~ N( , 2 ).
Hàm phân phối xác suất của biến ngẫu nhiên X ~ N( , 2 ) có dạng
FX x P X x
x
t
1
2 2
.e
2 2
2
dt , x .
Trƣờng hợp đặc biệt Nếu µ = 0 và σ² = 1 thì X được gọi là có phân phối
chuẩn tắc, kí hiệu là X ~ N ( 0,1).
1
.e
Chú ý Nếu X ~ N ( 0,1 ) thì f X x
2
x2
2
x
, x
1
. e
và FX x
2
t 2
2
,x .
dt
Định lý 1.1 Biến ngẫu nhiên X ~ N ( , 2 ) Z
X
N( 0,1 ) .
Chứng minh
Giả sử X ~ N ( , 2 ). Ta cần chứng minh Z
Thật vậy, do X ~ N ( , 2 ) nên f X x
Xét biến đổi Z
X
1
2 2
X
x
.e
, 0 . Ta có X .Z ,
Nguyễn Thị Huyền Trang - K32 CNToán
2 2
N( 0,1 ) .
2
.
dX
liên tục nên Z có
dZ
5
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
phân phối liên tục tuyệt đối.
Nhƣ vậy
Tức là Z
1
fZ z
X
Giả sử Z
Z 2
2
2
.e
2
2
2
2
dX
1 z2
.
e .
dZ
2
N( 0,1 ) .
X
N( 0,1 ) . Ta cần chứng minh X ~ N ( , 2 ), 0 .
Ta có X .Z , 0 có phép biến đổi ngƣợc z
X dz 1
, liên tục.
dx
Do X có phân phối liên tục tuyệt đối và có
dz
1 21( x )2 1
1
f X ( x ) f Z z( x ) .
e
.
.e
dx
2
2 2
x 2
2 2
.
Tức là X ~ N ( , 2 ).
Định lý 1.2 Giả sử X ~ N ( 0,1 ). Khi đó ta có
E( X 2n1 ) 0; E( X 2n )
( 2n )!
, n 0.
2 n ( n!)
Định lý 1.3 Cho X ~ N ( , 2 ) . Khi đó ta có
1. EX ; DX 2 .
2. Hàm sinh mômen của X là M X t e
t
2t 2
2
.
Chứng minh
1. EX . Thật vậy theo định nghĩa kì vọng toán của biến ngẫu nhiên liên
tục, ta có
1
EX xf ( x )dx
2
Ta thực hiện phép biến đổi biến số z
xe
( x )2
2 2
dx .
x
Nguyễn Thị Huyền Trang - K32 CNToán
. Khi đó x z và
6
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
dx dz . Khi đổi biến cận lấy tích phân không thay đổi. Ta có
1
EX
2
1
2
Ta có
1
2
ze
z2
2
( z )e
z2
2
dz
ze
z2
2
1
dz
2
e
z2
2
dz.
dz 0 do hàm dƣới dấu tích phân là hàm lẻ mà cận lấy
tích phân lại đối xứng qua gốc tọa độ.Và tích phân
e
z2
2
dz 2 ( tích
phân Poisson ).
Do đó: EX .
DX 2 .Thật vậy theo định nghĩa phƣơng sai của biến ngẫu nhiên liên
tục, ta có
1
DX
2
(x) e
2
( x )2
2 2
dx .
Ta thực hiện phép biến đổi biến số: z
x
. Khi đó x z và
dx dz . Ta có
( z )2 z2
EX
e dz
2
2
2
2
2
Z2
2
2
dz
2
z
2
2
e
z e dz 2 ze 2 dz
Z2
Z2
2
2
2
2
e dz 0
z.e
2
2
2 Z2
2
2
2
0 e dZ 0 .
2
Nguyễn Thị Huyền Trang - K32 CNToán
z2
2
2
7
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
Nhƣ vậy DX 2 2 2 2 .
2. Ta có
M X t EetX
1
2
2 2
e
1
t
e
etxe
2
x 2
2
2
dx
1
2t 2
[ x 2t ]2 t
2 2
2
e
1
2
dx e
t
2
etxe
t 2 2
2 2
2t 2
2
e
x2
2 2
1
2 2
e
e
t 2 2
2 2
x
e e
2
2
2 2
dx
1
[ x 2t ]2
2 2
dx
2t 2
2
.
Định lý 1.4 Cho X ~ N ( , 2 ) . Khi đó ta có
a
1. P X a
,a .
b
a
b
a
2. P a X b P
Z
.
Ở đây
x
1
x
. e
2
t 2
2
dt,x .
Chứng minh
1. Do X ~ N ( , 2 ) Z
X
N( 0,1 ) . Nên ta có
P( X a ) P( Z a )
P( Z a )
a
P( Z
)
(
2. Do X ~ N ( , 2 ) Z
a
X
).
N( 0,1 ) . Ta có
P( a X b ) P( a Z b )
Nguyễn Thị Huyền Trang - K32 CNToán
8
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
P( a Z b )
a
b
P(
Z
)
(
b
) (
a
).
Tính chất 1.1 ( x ) 1 ( x ) .
Định lý 1.5 Cho X i N( i , i2 ) , i 1,n là các biến ngẫu nhiên độc lập. Khi
n
n
n
i 1
i 1
i 1
đó X X i có phân phối chuẩn với X i và X2 i2 .
1.2 Mẫu và phân phối mẫu của chuẩn
Định nghĩa 1.2 ( Mẫu ngẫu nhiên ) Cho biến ngẫu nhiên X. Tiến hành n
quan sát độc lập về X. Gọi Xi là quan sát thứ i,i 1,n . Khi đó X1,X2,…,Xn
được gọi là mẫu ngẫu nhiên cỡ n quan sát về biến ngẫu nhiên X.
Chú ý Cho (X1,X2,…,Xn ) là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên X.
Khi đó ta có
X1,X2,…,Xn là các biến ngẫu nhiên độc lập.
X1,X2,…,Xn là các biến ngẫu nhiên có cùng phân phối xác suất với
biến ngẫu nhiên X.
Giả sử xi là giá trị cụ thể ở lần quan sát thứ i. Khi đó (x1,..,xn ) được gọi là
mẫu số liệu cụ thể mà mẫu ngẫu nhiên (X1,X2,…,Xn ) nhận.
Định lý 1.6 Giả sử X i N( i , i2 ) , i 1,n . Khi đó
n
n
a X
i 1
i
i
có phân phối
n
chuẩn với X ai i và ai2 i2 .
i 1
2
X
i 1
Định nghĩa 1.3 (Phân phối 2 ) Đại lượng ngẫu nhiên liên tục X được gọi là
phân phối theo quy luật khi bình phương với k bậc tự do nếu hàm mật độ xác
suất của nó được xác định bằng biểu thức
Nguyễn Thị Huyền Trang - K32 CNToán
9
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
x
n
1
1
2
2
.e
.x
n
f X ( x ) 2 2 . ( n )
2
0
Kí hiệu 2 ~ 2 (k).
Ở đây ( x )
t
,x > 0
,x 0.
x 1 t
e dt là hàm Gamma. Nếu k là một số nguyên thì
0
( k 1) k !
Nếu 2 ~ 2 (k ). Khi đó ta có EX = k và DX = 2k.
Định lý 1.7 Nếu X ~ N (0,1) thì X 2 ~ (21 )
X
2
Nếu X ~ N ( , ) thì
~ ( k ) .
2
2
2
Định lý 1.8 Nếu Zi có phân phối chuẩn tắc thì Zi ~ N (0,1), i 1,k và là các
biến ngẫu nhiên độc lập. Khi đó
k
U Zi2 ~ 2k .
i 1
Hệ quả Giả sử Xi ~ N ( , 2 ) , i 1,k và là các biến ngẫu nhiên độc lập.
Khi đó
k
i 1
( X i i )2
2
~ (2k ) .
X
X ~ N( , ) Z
~ N( 0,1).
Định nghĩa 1.4. (Phân phối T-student) Biến ngẫu nhiên liên tục X gọi là
2
2
2
phân phối theo quy luật Student với n bậc tự do nếu hàm mật độ xác suất của
nó xác định bằng biểu thức sau
fX ( t )
n
2
( )
t2
1
n 1
n1
( n 1 ) . (
)
2
Nguyễn Thị Huyền Trang - K32 CNToán
n
2
, t ,
10
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
trong đó (x) là hàm Gamma.
Kí hiệu X ~ T(n).
n
.
n2
là các biến ngẫu nhiên độc lập. Khi
Nếu X ~ T(n). Khi đó ta có các đặc trưng EX 0 , DX
Định lý 1.9 Cho Z ~ N(0,1) và U ~ (2n )
Z
có phân phối Student với n bậc tự do.
U
n
Định nghĩa 1.5 (Phân phối FISHER – SNEDECOR ) Biến ngẫu nhiên liên
đó T
tục F được gọi là phân phối theo quy luật Fisher – Snedecor với n1 , n2 bậc tự
do nếu hàm mật độ xác suất của nó xác định bằng biểu thức sau
,x 0
0
n1 n2
f(x)
x 2
C.
n1 n2
( n2 n1 .x ) 2
, x > 0.
n1 n2 n21 n22
(
).n1 .n2
2
Trong đó C =
.
n1
n2
( ) ( )
2
2
Nếu X ~ F(n). Khi đó ta có các đặc trưng EX
n2
,
n2 2
2n22 ( n1 n22 2 )
.
DX
n1( n2 2 )2 ( n2 4 )
Định lý 1.10 Cho Z ~ F(n1) và U ~ F(n2) là các biến ngẫu nhiên độc lập. Khi
Z
n
đó F 1 có phân phối theo quy luật Fisher với n1 và n2 bậc tự do.
U
n2
Định lý 1.11 Cho X1,X2,…,Xn là quan sát về biến ngẫu nhiên X ~ N ( , 2 ) .
Khi đó X
1 n
2
X
~
N(
,
).
i
n i1
n
Nguyễn Thị Huyền Trang - K32 CNToán
11
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
Định lý 1.12 Cho X1,X2,…,Xn là mẫu ngẫu nhiên quan sát về biến ngẫu nhiên
X ~ N ( , 2 ) . Khi đó ta có các khẳng định sau
1 n
2
a. X X i ~ N( , ).
n i1
n
b.
( n 1 )sˆ 2
2
~ (2n1 ) .
c. X và ˆs 2 là độc lập.
Chứng minh
Ta chứng minh định lý bằng phƣơng pháp quy nạp theo n.
Với n= 2
Đặt X
1 n
1 n
2
ˆ
X
s
( X i X n )2 .
và
i
n i 1
n 1 i 1
Ta có
X1 X 2
2
X2
~ N( , )
2
2
ˆs22 ( X 1 X 2 )2 ( X 2 X 2 )
2
X1 X 2 X 2 X1 ( X1 X 2 )
.
2
2
2
2
2
X1
2 X2
2
X1 X 2
2
~ N( , ),
~ N( , )
~ N( , ) ta có
Từ X 2
2
4
2
4
2
2
X1 X 2
2
X X2
~ N( 0, ) 1
~ N( 0,1)
2
2
2
2
2
2
ˆs
(X X )
22 1 2 2 ~ (21 ) .
2
Ta chứng minh X 2 ,sˆ 22 độc lập. Ta cần chỉ ra Cov(X1 + X2, X1 - X2)= 0.
Thật vậy
Cov(X1 + X2, X1 - X2)= Cov (X1,X1 )+Cov(X2,X1 )-Cov(X1,X2)-Cov(X2,X2)
Nguyễn Thị Huyền Trang - K32 CNToán
12
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
= 2 0 0 2 0.
Tức là định lý đúng với n= 2.
Giả sử định lý đúng với n. Ta chứng minh định lý đúng với n+1. Tức
chứng minh
1 n1
2
a. X n1
X i ~ N( , n 1 ).
n 1 i1
b.
nsˆ 2n1
2
~ n2 .
c. X n1 và ˆs 2n1 là độc lập.
n 1
X i X n 1
nX n X n1
1 n 1
nX n X n1
X i i 1
Thật vậy, xét X n1
n1
n 1 i 1
n1
n1
nsˆ 2n1 ( n 1 )sˆ n2
n
( X n 1 X n )2 .
n1
Theo giả thiết quy nạp, ta có X n ~ N( ,
2
2
),
( n 1 )sˆ 2
2
~ (2n1 ) và X và ˆs 2
là độc lập.
X n1 ~ N( , 2 ),X n ~ N( , 2 )
Ta có
X n1 X n ~ N( 0,
Vậy
nsˆ 2n 1
2
n1 2
X Xn
) n 1
~ N( 0,1 )
n
n1 2
n
n
( X n1 X n )2 ~ (21 ) .
2
( n 1 )
là tổng các biến ngẫu nhiên độc lập (2n1 ) và (21 ) nên
nsˆ 2n 1
2
~ (2n ) .
Ta phải chứng minh X n1 và ˆs 2n1 là độc lập. Ta có
Nguyễn Thị Huyền Trang - K32 CNToán
13
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
Cov( nX n X n1 ,X n1 X n )= n Cov( X n ,X n1 ) + Cov( X n1 ,X n1 )
+ n Cov( X n ,X n ) - Cov( X n1 ,X n )= 0 + nDX n
2
2
2
n
0.
Tức là X n1 và ˆs 2n1 là độc lập.
Định lý đƣợc chứng minh.
1.3 Ƣớc lƣợng điểm
1.3.1 Một số định nghĩa
Cho biến ngẫu nhiên X có phân phối xác suất thuộc họ chuẩn F( x, , 2 )
đã biết,trong đó ( , 2 ) . là tham số chưa biết.
Định nghĩa 1.6 ( Ƣớc lƣợng điểm ) Mỗi hàm số ˆ ( X1,X2,…,Xn ) được gọi là
ước lượng điểm cho tham số.
Định nghĩa 1.7 ( Ƣớc lƣợng không chệch ) Ước lượng điểmˆ ( X1,X2,…,Xn )
được gọi là ước lượng không chệch cho tham số nếu Eˆ (X1,X2,…,Xn)= ,
.
Nếu E ˆ ( X1,X2,…,Xn) thì ˆ ( X1,X2,…,Xn ) được gọi là ước lượng chệch
của .
Vậy ước lượng không chệch cho các tham số và 2 là
1 n
ˆ 1(X1,X2,…,Xn) = X i X là ước lượng không chệch cho tham số
n i 1
1 n
1 n
ˆ
EX .Vì E1( X 1 ,...,X n ) E( X i ) EX i .
n i 1
n i 1
n
1
ˆ 2(X1,X2,…,Xn) = ( X i X )2 là ước lượng chệch cho tham số
n i 1
n 1 2
2.
2 DX . Vì Eˆ2 ( X 1 ,...,X n )
n
n
1
( X i X )2 ˆs 2 là ước lượng không chệch
ˆ 3(X1,X2,…,Xn) =
n 1 i 1
cho tham số 2 DX .Vì Eˆ3 ( X 1 ,..., X n ) 2 .
Nguyễn Thị Huyền Trang - K32 CNToán
14
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
Định nghĩa 1.8 ( Ƣớc lƣợng vững ) Ước lượng điểm ˆ (X1,X2,…,Xn) được gọi
là ước lượng vững cho tham số =( µ,σ²) nếu với 0 thì
lim P ˆ ( X 1 ,..,X n ) 0 .
n
Như vậy theo hệ quả của luật số lớn Chebyshev ta có trung bình mẫu X là
ước lượng vững của kỳ vọng , s 2 và ˆs 2 là ước lượng vững của phương sai
σ² của biến ngẫu nhiên gốc X của tổng thể.
Định nghĩa 1.9. ( Ƣớc lƣợng hiệu quả ) Ước lượng điểm ˆ (X1,X2,…,Xn)
được gọi là ước lượng hiệu quả cho tham số nếu thỏa mãn
i. E ˆ (X1,X2,…,Xn) = , .
ii. D ˆ (X1,X2,…,Xn) DT(X1,X2,…,Xn). Trong đó T(X1,X2,…,Xn) là ước
lượng không chệch cho bất kì của .
Định nghĩa 1.10 ( Lƣợng thông tin Fisher) Cho biến ngẫu nhiên liên tục X
có phân phối chuẩn với hàm mật độ xác suất f (x, , 2 ). Lượng thông tin
Fisher chứa trong một quan sát về biến ngẫu nhiên X có tham số ( , 2 ) .
Kí hiệu là I ( ) được xác định bởi
ln f ( x, )
I( ) = E
.
2
Kết quả Lƣợng thông tin Fisher chứa trong n quan sát X1,X2,…,Xn về biến
ngẫu nhiên là In( ) = n. I( ) , I( ) là lƣợng thông tin Fisher chứa trong một
lần quan sát.
Định lý 1.13 ( Định lý cận dƣới Cramer-Rao ) Cho (X1,X2,…,Xn ) là mẫu
quan sát về biến ngẫu nhiên X có hàm mật độ xác xuất thỏa mãn các điều kiện
chính quy .
Giả sử ˆ (X1,X2,…,Xn) là một ƣớc lƣợng không chệch cho tham số . Khi đó
Nguyễn Thị Huyền Trang - K32 CNToán
15
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
ta có
Dˆ (X1,X2,…,Xn)
1
.
nI( )
Chú ý Nếu phƣơng sai của ƣớc lƣợng đạt dấu bằng của cận dƣới CramerRao thì ƣớc lƣợng đó là ƣớc lƣợng hiệu quả cho tham số .
Ta có
E 2 ln f ( x, )
ln f ( x, )
.
E
2
2
Định nghĩa 1.11 (Ƣớc lƣợng hợp lí cực đại) ˆ (X1,X2,…,Xn) được gọi là
ước lượng hợp lí cực đại cho tham số =( µ,σ²) nếu L(ˆ ) = Max L( ) .
Cho X1,X2,…,Xn là mẫu quan sát về X có phân phối chuẩn thuộc họ F(x, =(
µ,σ²)) đã biết. =( µ,σ²) là hàm số chưa biết.
Hàm hợp lý kí hiệu là L( ) = L(x1,..,xn, µ,σ²) được xác định bởi
n
L( )= f ( xi , , 2 ) .
i 1
Trong thực hành, để tìm ước lượng hợp lý cực đại cho tham số =( µ,σ²).
Người ta thường tìm nghiệm của hệ phương trình
ln L( )
0
ln L( ) 0
2
(Hệ phương trình hợp lý).
1.3.2 Các phƣơng pháp tìm ƣớc lƣợng điểm
Phƣơng pháp momen
Cho X1,X2,…,Xn là các mẫu quan sát về biến ngẫu nhiên X ~ N (µ,σ²).
Bằng phƣơng pháp mômen ta tìm các giá trị ƣớc lƣợng cho µ và σ².
Do X ~ N (µ,σ²) nên ta có các mômen chính xác của X là
Nguyễn Thị Huyền Trang - K32 CNToán
16
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
EX
2
2
2
2
EX DX ( EX ) .
Tính các mômen mẫu
m1 =
1 n
Xi X .
n i 1
1 n 2
m2 = X i .
n i 1
Đồng nhất các mômen mẫu với các mômen chính xác của X ta đƣợc hệ
1 n
n Xi X
i 1
n
2 2 1 X 2
i
n i 1
ˆ X
2 1 n 2
2
2
ˆ n X i X s .
i 1
1 n
Vậy X X i là ƣớc lƣợng hợp lý cực đại cho EX .
n i 1
2
1 n
s X i X là ƣớc lƣợng hợp lý cực đại cho 2 DX .
n i 1
2
Phƣơng pháp hợp lý cực đại
Cho X1,X2,…,Xn là mẫu quan sát về X có phân phối chuẩn thuộc họ
F(x, =( µ,σ²)) đã biết. =( µ,σ²) là hàm số chƣa biết.
Bằng phƣơng pháp hợp lý cực đại ta tìm các ƣớc lƣợng cho các tham số µ và
σ² nhƣ sau:
Đặt 1, 2 2 khi đó ta có
1
f ( xi , , ) f ( xi ,1, 2 )
.e
2 2
2
( xi 1 )2
2 2
L( , 2 ) L(1, 2 ) L( x1,..., xn ,1, 2 )
n
i 1
1
.e
2 2
( xi 1 )2
2 2
Nguyễn Thị Huyền Trang - K32 CNToán
n
2
= (2 2 ) .e
1 n
2
( xi 1 )
22 i 1
17
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
n
n
1 n
ln L(1,2 ) ln(2 ) ln 2
. ( xi 1 ) 2 .
2
2
22 i1
Xét hệ phƣơng trình hợp lý
n
n
x
n
0
ln L(1 , 2 )
xi
i
1
0
i 1
1
ˆ1 i 1 X
n
n
2
n
ln L(1 , 2 ) 0 n ( xi 1 )
ˆ 1 ( x X )2 s 2
i 1
0
2
i
2
n i 1
2 22
2 2
Vậy ƣớc lƣợng hợp lí cực đại cho X và cho 2 là s2.
1.4 Ƣớc lƣợng khoảng
1.4.1 Một số định nghĩa
Định nghĩa 1.12 ( Khoảng tin cậy ) Cho X1,X2,…,Xn là mẫu quan sát về biến
ngẫu nhiên X có tham số ( , 2 ) . Một khoảng tin cậy với hai đầu mút
phụ thuộc vào các giá trị quan sát 1( X 1 ,X 2 ,,X n );2 ( X 1 ,X 2 ,,X n )
được gọi là khoảng tin cậy cho tham số ( , 2 ) với độ tin cậy 1 nếu
P 1( X 1 ,X 2 ,,X n ) ( , 2 ) 2 ( X 1 ,X 2 ,,X n ) = 1 .
Trong đó 2 1 là độ chính xác của ước lượng.
Định nghĩa 1.13 ( Số quan sát cần thiết ) Cho độ tin cậy 1 , độ chính xác
= 2 1 thì số quan sát n cần thiết để nhận được ước lượng với độ tin cậy
và độ chính xác đã cho thoả mãn b(n) < .
Chẳng hạn ta có b( n ) tn1(
Hoặc
Hoặc
b( n ) tn1(
2
2
)
)
n
.
s
.
n 1
p* ( 1 p* )
b( n ) u( )
.
2
n
Nguyễn Thị Huyền Trang - K32 CNToán
18
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
1
2
Nhìn chung b (n) phụ thuộc vào n ở dạng n do đó muốn tăng độ chính xác
lên 2 lần thì phải tăng n lên 4 lần.
1.4.2. Phƣơng pháp P-Q-M tìm ƣớc lƣợng khoảng
B1. Xuất phát từ một ƣớc lƣợng ˆ của , 2 ( ƣớc lƣợng không chệch,
ƣớc lƣợng vững, ƣớc lƣợng hiệu quả, ƣớc lƣợng hợp lý cực đại ).
B2. Tìm biến ngẫu nhiên c ˆ , có phân phối xác suất không phụ thuộc vào
bất kỳ tham số nào.
B3. Tìm hai số c và d sao cho P c c( ˆ , ) d 1 . Từ c c( ˆ , ) d
Ta tìm đƣợc khoảng tin cậy cho , 2 .
Nguyễn Thị Huyền Trang - K32 CNToán
19
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
CHƢƠNG 2
PHÂN TÍCH THỐNG KÊ VỚI PHÂN PHỐI CHUẨN
2.1 Ƣớc lƣợng tham số
Tính chất 2.1 Cho X1,X2,…,Xn là mẫu quan sát về biến ngẫu nhiên
X ~ N( ,1 ) . Khi đó ˆ X là ƣớc lƣợng hợp lý cực đại cho .
Chứng minh
Ta có
( x )
i
1
f ( xi , )
.e 2
2
2
n
L( ) L( x1 ,...,xn , )
i 1
n
1
.e
2
( xi )2
2
n
2
= ( 2 ) .e
1 n
2
( x )
2 i 1 i
n
1
ln L( ) ln( 2 ) .( xi )2 .
2
2 i 1
Xét phƣơng trình hợp lý
n
ln L( )
1 n
0 xi n 0 ˆ xi X .
n i 1
i 1
ˆ X là ƣớc lƣợng hợp lý cực đại cho .
Vậy
Tính chất 2.2. Cho X1,X2,…,Xn
là mẫu quan sát về biến ngẫu nhiên
X ~ N( , 2 ) . Khi đó trung bình mẫu X là ƣớc lƣợng hiệu quả của kỳ vọng
toán của biến ngẫu nhiên X.
Chứng minh
Do X là ƣớc lƣợng không chệch cho và do X ~ N (µ,σ²) nên ta có
f X ( X , )
1
.e
2
( x )2
2 2
.
Xét
Nguyễn Thị Huyền Trang - K32 CNToán
20
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
( x )2
ln f( X, ) = -ln 2
2 2
ln f ( X , ) ln f ( X , ) X
.
2
Vậy
X
n
ln f ( X , )
nE
nE(
)
E( X )2
2
4
n
n 2
n
= 4 D( X ) 4 2 .
2
Mà ta lại có D( X )
2
n
bằng vế phải của bất đẳng thức Cramer- Rao.
Vậy X là ƣớc lƣợng hiệu quả nhất của .
Tính chất 2.3 Cho X1,X2,…,Xn
là mẫu quan sát về biến ngẫu nhiên
X ~ N( , 2 ) . Khi đó ˆ 2 là ƣớc lƣợng hiệu quả cho σ²
Chứng minh
Ta có
f X ( X , 2 )
1
.e
2
( x )2
2 2
.
Xét
1
( X )2
2
ln f ( X , ) ln 2
2
2 2
ln f ( X , 2 )
1
2( X ) 2 2 ( X ) 2
2
.
2
2
4 4
2 4
2
Vậy
2
ln f ( X , 2 )
2 ( X ) 2
n
2
2 2
nE
nE(
)
E
(
X
)
2
4
8
2
4
2
n
2
=
E
(
X
EX
)
DX
4 8
2
Nguyễn Thị Huyền Trang - K32 CNToán
21
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
n
2
E ( X EX )2 E( X EX )2
4
n
n
n
4
= 8 D( X EX )
.2
.
4
4 8
2 4
=
8
Mà ta lại có Eˆ 2 ES 2 2 .
1
2 4
IX ( )
2 4
IX ( 2 )
n
2
n
D 2 1
Dˆ
D( X i )2
n
n
1
1
2 4
2
2
2
= ( 3DX i DX i ) .2
.
n
n
n
2
1
ˆ2
D
IX ( 2 )
Vậy
Eˆ 2 2
ˆ 2 là ƣớc lƣợng hiệu quả cho 2 .
2.2 Khoảng tin cậy của các tham số
Tính chất 2.4 Cho X1,X2,…,Xn là mẫu quan sát về biến ngẫu nhiên
X ~ N( , 2 ) trong đó là tham số chƣa biết, 2 là hằng số đã biết. Khi đó
X u( )
khoảng tin cậy cho là X u( )
với độ tin cậy
2 n
2 n
1- ( 0 1) .
Chứng minh
Ta có ˆ
Và
1 n
X i là ƣớc lƣợng vững cho µ.
n i 1
1 n
2
X
X
~
N
(
,
)
X
~
N
(0,
).
i
n i1
n
Cho nên
X
Đặt C( ˆ , ) =
n ~ N( 0,1 ) .
X
n có phân phối xác suất không phụ thuộc vào bất kỳ
tham số nào.
Nguyễn Thị Huyền Trang - K32 CNToán
22
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
Vì N(0,1) là phân phối đối xứng nên ta chọn d = -c ,c > 0 sao cho
P C ( ˆ , ) d P C ( ˆ , ) d
Đặt u(
2
.
) = d P C ( ˆ , ) u ( ) , u ( ) đƣợc gọi là phân vị mức
của
2
2
2
2
N(0,1).
P -u( ) C( ˆ , ) u(
2
2
) =1- .
Ta xét hệ bất phƣơng trình
u(
2
)
X u(
X
2
)
n
n u(
2
)
X u(
2
)
n
.
Nhƣ vậy với độ tin cậy 1- (0 1) trong trƣờng hợp 2 DX đã biết thì
khoảng tin cây cho trung bình µ của biến ngẫu nhiên X sẽ nằm trong khoảng
X u( )
.
X u( 2 )
2 n
n
Trong đó u(
) đƣợc tìm từ u( ) 1 .
2
2
2
Tính chất 2.5. Cho X1,X2,…,Xn là mẫu quan sát về biến ngẫu nhiên
X ~ N( , 2 ) trong đó = EX , 2 =DX là tham số chƣa biết. Khi đó
sˆ
sˆ
khoảng tin cậy cho = EX là X tn1 ( )
với độ tin
; X tn1 ( )
2 n
2 n
cậy 1- (0 1) .
Chứng minh
1 n
Ta có ˆ X X i là ƣớc lƣợng vững cho µ.
n i 1
Và
X ~ N ( ,
2
n
)
X
n ~ N (0, 1) .
Nguyễn Thị Huyền Trang - K32 CNToán
23
Phân tích thống kê phân phối Chuẩn
(n 1) Sˆ 2
Ta có
2
~ n21 .
X
T
Đặt
Th.s. Nguyễn Trung Dũng
n
(n 1) sˆ2
2 (n 1)
~ Tn1
X
n ~ Tn1 .
ˆs
X
Đặt C( ˆ , ) =
n có phân phối xác suất không phụ thuộc vào bất kỳ
Hay
T=
tham số nào.
Vì Tn-1 là các biến ngẫu nhiên có phân phối đối xứng nên ta chọn d = -c ,
c < 0 sao cho
P C ( ˆ , ) d P C ( ˆ , ) d
Đặt tn-1(
2
.
) = d [ tn-1( ) đƣợc gọi là phân vị mức
của Tn-1].
2
2
2
Khi đó ta có
P tn1( ) C( , ˆ ) tn1(
2
2
Xét hệ bất phƣơng trình
X
n tn1( )
ˆs
2
2
ˆs
ˆs
X tn1( )
X tn1( )
.
2 n
2 n
Nhƣ vậy khoảng tin cậy cho EX với độ tin cậy 1- ( 0 1) trong
tn1(
) 1 .
)
trƣờng hợp 2 DX chƣa biết là X tn1(
2
)
ˆs
ˆs
X tn1( )
.
2 n
n
Tính chất 2.6 Cho X1,..,Xn là mẫu quan sát về biến ngẫu nhiên X ~ N( , 2 )
trong đó , 2 là tham số chƣa biết. Với độ tin cậy 1- ( 0 1) thì
Nguyễn Thị Huyền Trang - K32 CNToán
24
Phân tích thống kê phân phối Chuẩn
Th.s. Nguyễn Trung Dũng
khoảng tin cậy cho 2 là
( n 1 )sˆ 2 ( n 1 )sˆ 2
,
2
n1( ) n21( 1
2
2
Chứng minh
sˆ 2
Ta có
U
.
)
1 n
( X i X )2 là ƣớc lƣợng không chệch cho σ²
n 1 i 1
(n 1) sˆ2
2
~ n21 .
Tìm các số c và d sao cho P(c < U < d) = 1-
P(U d ) 2
P(U c ) .
2
Chọn d = n21 ( ) , c n21 (1 ) .
2
2
2
2
Với n21 ( ) , n21 (1 ) đƣợc gọi là phân vị mức
Ta có
.
2
2
(n 1) sˆ2
2
P n1 (1 )
(
) .
n
1
2
2
2
2
(n 1) sˆ 2
2
2
(1 )
(n 1) sˆ2
(n 1) sˆ2
( )
.
2
2
2
n1 ( )
n1 (1 )
2
2
Vậy khoảng tin cậy cho σ² với độ tin cậy 1- là khoảng
Xét
2
n 1
2
n 1
2
( n 1 )sˆ 2 ( n 1 )sˆ 2
,
.
2
2
n1( ) n1( 1 )
2
2
Tính chất 2.7 Cho X1,..,Xn là mẫu quan sát về biến ngẫu nhiên X~ ( X , X2 )
và Y1,..,Ym là mẫu quan sát về biến ngẫu nhiên Y ~ N (Y , Y2 ) độc lập với
mẫu trên. Trong đó X , Y là các tham số chƣa biết, X2 , Y2 là các tham số đã
Nguyễn Thị Huyền Trang - K32 CNToán
25