BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN BÁ SƠN
ỨNG DỤNG MA TRẬN
TRONG MƠ HÌNH HỒI QUY TUYẾN TÍNH
LUẬN VĂN THẠC SĨ KHOA HỌC
Đà Nẵng - Năm 2015
BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
NGUYỄN BÁ SƠN
ỨNG DỤNG MA TRẬN
TRONG MƠ HÌNH HỒI QUY TUYẾN TÍNH
Chun ngành : Phương pháp Toán sơ cấp
Mã số
: 60.46.01.13
LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học: TS. CAO VĂN NUÔI
Đà Nẵng - Năm 2015
LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số
liệu, kết quả nêu trong luận văn là trung thực và chưa từng được cơng bố
trong bất kì một cơng trình nào.
Học viên thực hiện luận văn
Nguyễn Bá Sơn
MỤC LỤC
MỞ ĐẦU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1 LÝ DO CHỌN ĐỀ TÀI . . . . . . . . . . . . . . . . . . . . .
1
2 MỤC ĐÍCH NGHIÊN CỨU
. . . . . . . . . . . . . . . . . .
1
3 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU . . . . . . . . .
2
4 PHƯƠNG PHÁP NGHIÊN CỨU . . . . . . . . . . . . . . . .
2
5 ĐÓNG GÓP CỦA ĐỀ TÀI . . . . . . . . . . . . . . . . . . .
2
6 Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI . . .
2
7 CẤU TRÚC LUẬN VĂN . . . . . . . . . . . . . . . . . . . .
2
CHƯƠNG 1. CÁC KIẾN THỨC CƠ BẢN
1.1
1.2
4
MA TRẬN . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
1.1.1
Định nghĩa ma trận . . . . . . . . . . . . . . . . . .
4
1.1.2
Một số dạng ma trận thường gặp . . . . . . . . . . .
5
1.1.3
Các phép toán trên ma trận . . . . . . . . . . . . .
6
1.1.4
Định thức . . . . . . . . . . . . . . . . . . . . . . .
8
1.1.5
Ma trận khả đảo và ma trận nghịch đảo . . . . . . .
9
ĐỘ ĐO VÀ XÁC SUẤT
. . . . . . . . . . . . . . . . . . . 10
1.2.1
Cấu trúc σ−đại số . . . . . . . . . . . . . . . . . . . 10
1.2.2
Xác suất . . . . . . . . . . . . . . . . . . . . . . . . 11
1.2.3
Đại lượng ngẫu nhiên và phân phối xác suất của đại
lượng ngẫu nhiên . . . . . . . . . . . . . . . . . . . 12
1.2.4
Phân phối rời rạc và phân phối liên tục . . . . . . . 12
1.2.5
Hàm mật độ xác suất . . . . . . . . . . . . . . . . . 14
1.2.6
Các đặc trưng số của đại lượng ngẫu nhiên . . . . . 14
1.2.7
1.3
Các quy luật phân phối xác suất thông dụng . . . . 16
THỐNG KÊ TOÁN . . . . . . . . . . . . . . . . . . . . . . 19
1.3.1
Mẫu ngẫu nhiên và hàm phân phối mẫu . . . . . . . 19
1.3.2
Các đặc trưng số của mẫu
1.3.3
Ước lượng tham số
1.3.4
Kiểm định giả thiết . . . . . . . . . . . . . . . . . . 23
. . . . . . . . . . . . . . 20
. . . . . . . . . . . . . . . . . . 23
CHƯƠNG 2. MƠ HÌNH HỒI QUY TUYẾN TÍNH CỔ ĐIỂN
28
2.1
2.2
PHÂN TÍCH HỒI QUY . . . . . . . . . . . . . . . . . . . . 28
2.1.1
Khái niệm hàm hồi quy tổng thể . . . . . . . . . . . 28
2.1.2
Hàm hồi quy mẫu . . . . . . . . . . . . . . . . . . . 29
MÔ HÌNH HỒI QUY HAI BIẾN . . . . . . . . . . . . . . . 30
2.2.1
Ước lượng tham số hồi quy bằng phương pháp bình
phương bé nhất . . . . . . . . . . . . . . . . . . . . 30
2.2.2
Các tổng bình phương độ lệch . . . . . . . . . . . . 33
2.2.3
Hệ số xác định . . . . . . . . . . . . . . . . . . . . . 34
2.2.4
Hệ số tương quan . . . . . . . . . . . . . . . . . . . 35
2.2.5
Các giả thiết của phương pháp bình phương bé nhất
2.2.6
Độ chính xác của các ước lượng bình phương bé nhất 36
2.2.7
Các tính chất của hệ số hồi quy . . . . . . . . . . . 37
2.2.8
Khoảng tin cậy của hệ số hồi quy
2.2.9
Kiểm định giả thiết hồi quy . . . . . . . . . . . . . . 39
35
. . . . . . . . . . 37
2.2.10 Phân tích hồi quy và dự báo . . . . . . . . . . . . . 40
CHƯƠNG 3. ỨNG DỤNG MA TRẬN TRONG MƠ HÌNH
HỒI QUY TUYẾN TÍNH
3.1
42
MƠ HÌNH HỒI QUY TUYẾN TÍNH k BIẾN TRONG
DẠNG MA TRẬN . . . . . . . . . . . . . . . . . . . . . . 42
3.1.1
Mô hình hồi quy tuyến tính k biến trong dạng ma trận 42
3.1.2
Giả thiết của mơ hình hồi quy tuyến tính cổ điển
trong dạng ma trận . . . . . . . . . . . . . . . . . . 44
3.2
ƯỚC LƯỢNG CÁC HỆ SỐ CỦA MƠ HÌNH HỒI QUY
TUYẾN TÍNH k BIẾN BẰNG PHƯƠNG PHÁP BÌNH
PHƯƠNG BÉ NHẤT TRONG DẠNG MA TRẬN . . . . . 46
3.2.1
3.3
3.2.2
Ước lượng bình phương bé nhất trong dạng ma trận 46
Ma trận hiệp phương sai của βˆ . . . . . . . . . . . . 49
3.2.3
Hệ số xác định R2 trong dạng ma trận . . . . . . . . 51
3.2.4
Ma trận tương quan . . . . . . . . . . . . . . . . . . 52
KIỂM ĐỊNH GIẢ THIẾT CÁC HỆ SỐ CỦA MƠ HÌNH
HỒI QUY TUYẾN TÍNH k BIẾN TRONG DẠNG MA
TRẬN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3.1
Kiểm định giả thiết hệ số hồi quy trong dạng ma trận 53
3.3.2
Kiểm định ý nghĩa tồn cục của mơ hình hồi quy
trong dạng ma trận . . . . . . . . . . . . . . . . . . 55
3.3.3
Kiểm định giả thiết hệ số hồi quy có điều kiện ràng
buộc . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4
DỰ BÁO BẰNG MƠ HÌNH HỒI QUY TUYẾN TÍNH k
BIẾN TRONG DẠNG MA TRẬN . . . . . . . . . . . . . . 56
3.5
3.4.1
Dự báo trung bình . . . . . . . . . . . . . . . . . . . 56
3.4.2
Dự báo cá biệt (cá thể) . . . . . . . . . . . . . . . . 57
VÍ DỤ ÁP DỤNG . . . . . . . . . . . . . . . . . . . . . . . 58
KẾT LUẬN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
TÀI LIỆU THAM KHẢO . . . . . . . . . . . . . . . . . . . . . 65
Quyết định giao đề tài luận văn thạc sĩ (bản sao) . . . . . . .
1
MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Kinh tế lượng là mơn khoa học cung cấp các phương pháp phân tích
về mặt định lượng các mối quan hệ giữa các chỉ tiêu kinh tế cùng với sự
tác động qua lại giữa chúng dựa trên cơ sở các số liệu thu thập từ thực tế
nhằm củng cố thêm các giả thiết kinh tế từ đó đưa ra các quyết định đúng
đắn hơn. Từ nhiều năm nay, cùng với sự phát triển của máy vi tính, kinh
tế lượng đã được áp dụng rộng rãi trong kinh tế cũng như trong nhiều lĩnh
vực khác nhau.
Kinh tế lượng ứng dụng các phương pháp thống kê tốn học để phân
tích số liệu về kinh tế. Một trong những mơ hình tổng qt của bài tốn
kinh tế lượng là mơ hình hồi quy tuyến tính. Hiện nay cịn ít tài liệu trình
bày một cách có hệ thống về mơ hình hồi quy tuyến tính tổng qt bằng
ngơn ngữ Tốn học, cụ thể là ma trận. Chính vì vậy chúng tôi chọn đề
tài “Ứng dụng ma trận trong mơ hình hồi quy tuyến tính” làm đề tài tốt
nghiệp.
2. MỤC ĐÍCH NGHIÊN CỨU
Mục đích nghiên cứu của luận văn này là nghiên cứu cách ứng dụng
của ma trận vào mơ hình hồi quy tuyến tính biến. Việc nghiên cứu này
giúp ta hiểu thêm về cơ sở lý thuyết cũng như các ứng dụng của ma trận
trong mơ hình hồi quy tuyến tính để phân tích và xử lý các số liệu trong
kinh tế lượng.
2
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Đối tượng mà chúng tơi tập trung nghiên cứu là các mơ hình hồi quy
tuyến tính đơn và mơ hình hồi quy tuyến tính k biến, các kiểm định giả
thiết, ước lượng và dự báo của chúng bằng phương pháp sử dụng ma trận.
Nội dung nghiên cứu của luận văn này được giới hạn trong phạm vi
về các mơ hình hồi quy tuyến tính, phương pháp ước lượng bình phương
bé nhất thơng thường, kiểm định giả thiết về hệ số hồi quy, sự phù hợp
của mơ hình, dự báo giá trị trung bình và cá thể.
4. PHƯƠNG PHÁP NGHIÊN CỨU
Sử dụng phương pháp nghiên cứu lý thuyết. Chúng tôi dựa vào các
tài liệu chuyên khảo về xác suất-thống kê, lý thuyết độ đo, đại số ma trận
và một số nội dung của kinh tế lượng để khảo sát các vấn đề đặt ra.
5. ĐĨNG GĨP CỦA ĐỀ TÀI
Chúng tơi hy vọng luận văn này là một tài liệu tham khảo cho những
ai tìm hiểu môn kinh tế lượng và cho thấy được những ứng dụng của đại
số ma trận, lý thuyết xác suất-thống kê trong lĩnh vực kinh tế.
6. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI
Luận văn góp một phần nhỏ trong việc hệ thống mơ hình hồi quy
tuyến tính tổng quát bằng ma trận và các áp dụng của nó trong lĩnh vực
kinh tế và là tài liệu tham khảo về môn kinh tế lượng ở các trường đại học
và cao đẳng cũng như những người u thích tốn ứng dụng.
7. CẤU TRÚC LUẬN VĂN
Luận văn gồm 3 chương với những nội dung chính như sau:
3
Chương 1: Các kiến thức cơ bản.
Gồm các khái niệm cơ sở phục vụ cho nội dung chương sau như: ma
trận, độ đo và xác suất, thống kê toán.
Chương 2: Mơ hình hồi quy tuyến tính cổ điển.
Chương này bao gồm các khái niệm về hồi quy, mơ hình hồi quy hai
biến, ước lượng kiểm định hồi quy và dự báo.
Chương 3: Ứng dụng ma trận trong mơ hình hồi quy tuyến tính.
Trình bày mơ hình hồi quy tuyến tính nhiều biến, ước lượng hệ số hồi
quy, kiểm định hồi quy và dự báo bằng ma trận.
4
CHƯƠNG 1
CÁC KIẾN THỨC CƠ BẢN
1.1.
MA TRẬN
1.1.1.
Định nghĩa ma trận
Một bảng số chữ nhật có m hàng n cột có dạng:
a11 a12 . . . a1n
a21 a22 . . . a2n
A=
... ... ... ...
am1 am2 . . . amn
được gọi là một ma trận cỡ m × n. aij là phần tử của ma trận A nằm ở
hàng i cột j . Để nói A là ma trận cỡ m × n có phần tử nằm ở hàng i cột
j là aij ta dùng ký hiệu A = [aij ]m×n hay A = (aij )m×n .
Khi m = n, ta có ma trận với n hàng n cột gọi là ma trận vuông cấp
n:
a11
a21
A=
. . .
an1
a12 . . . a1n
a22 . . . a2n
.
. . . . . . . . .
an2 . . . ann
Các phần tử a11 , a22 , . . . , ann gọi là các phần tử trên đường chéo.
Đường thẳng xuyên qua các phần tử chéo gọi là đường chéo chính.
5
1.1.2. Một số dạng ma trận thường gặp
a. Ma trận tam giác trên và ma trận tam giác dưới
Ma trận vng A cấp n có dạng:
a11 a12
0 a22
A=
. . . . . .
0 0
. . . a1n
. . . a2n
. . . . . .
. . . ann
trong đó aij = 0 nếu i > j được gọi là ma trận tam giác trên.
Tương tự ta có ma trận tam
a11
a21
A=
. . .
an1
giác dưới với aij = 0 nếu i < j :
0 ... 0
a22 . . . 0
.
... ...
an2 . . . ann
b. Ma trận chéo
Ma trận vuông cấp n:
a11 0 . . . 0
0 a22 . . . 0
A=
. . . . . . . . . . . .
0 0 . . . ann
trong đó aij = 0 nếu i = j và ∃i0 sao cho ai0 i0 = 0 gọi là ma trận đường
chéo.
c. Ma trận không
Ma trận không là ma trận mà tất cả các phần tử đều bằng 0. Ma trận
không ký hiệu là 0M .
6
d. Ma trận đơn vị
Gọi Mn là tập hợp các ma trận vuông
a11 a12 . . .
a21 a22 . . .
A=
. . . . . . . . .
an1 an2 . . .
cấp n: Mn = {A} với
a1n
a2n
.
. . .
ann
Ta định nghĩa ma trận đơn vị cấp n là ma trận vuông cấp n:
1 0
0 1
I=
. . . . . .
0 0
...
0
... 0
. . . . . .
... 1
trong đó các phần tử trên đường chéo chính bằng 1, các phần tử khác bằng
0.
e. Ma trận chuyển vị
Xét ma trận A = [aij ]m×n . Đổi hàng thành cột, cột thành hàng ta
được một ma trận mới gọi là ma trận chuyển vị của A ký hiệu là At .
Vậy ta có At = [¯
aij ]n×m , trong đó a
¯ij = aji và nếu A có m hàng n cột
thì At có n hàng m cột.
1.1.3.
Các phép toán trên ma trận
a. Cộng ma trận
Định nghĩa 1.1.1. Cho hai ma trận cùng cỡ m × n A = [aij ]m×n và
B = [bij ]m×n . Tổng A + B là ma trận cỡ m × n xác định bởi A + B =
[aij + bij ]m×n .
Vậy muốn cộng hai ma trận cùng cỡ ta cộng các phần tử cùng vị trí.
7
Tính chất. Nếu A, B, C là các ma trận cùng cỡ thì:
1. A + B = B + A.
2. A + 0M = 0M + A (0M là ma trận không cùng cỡ với ma trận A).
3. Gọi −A = [−aij ]m×n ta có A + (−A) = (−A) + A = 0.
4. (A + B) + C = A + (B + C).
b. Nhân ma trận với một số
Định nghĩa 1.1.2. Cho A = [aij ]m×n , k ∈ R thì tích kA là ma trận cỡ
m × n xác định bởi kA = [kaij ]m×n .
Như vậy muốn nhân một ma trận với một số ta nhân tất cả các phần
tử của ma trận với số đó.
Tính chất. Nếu A và B là các ma trận cùng cỡ thì:
1. k(A + B) = kA + kB.
2. (k + h)A = kA + hA.
3. k(hA) = (kh)A.
4. 1 · A = A.
5. 0 · A = 0M .
c. Nhân ma trận với ma trận
Định nghĩa 1.1.3. Xét hai ma trận A = [aij ]m×p và B = [bij ]p×n trong
đó số cột của ma trận A bằng số hàng của ma trận B . Ta gọi tích AB là
ma trận C = [cij ]m×n có m hàng n cột và phần tử cij được tính theo cơng
thức:
p
cij = ai1 b1j + ai2 b2j + . . . + aip bpj =
aik bkj .
k=1
Tính chất. Với giả thiết phép nhân của các ma trận có nghĩa thì:
1. A(B + C) = AB + AC.
2. (B + C)A = BA + CA.
8
3. A(BC) = (AB)C.
4. k(BC) = (kB)C = B(kC).
5. AB = BA.
d. Chuyển vị tích của hai ma trận
Giả sử A = [aij ]m×p và B = [bij ]p×n . Khi đó nhân AB được và AB
có cỡ m × n. Qua phép chuyển vị ta có At , B t . Và:
(AB)t = B t At .
1.1.4. Định thức
Định thức của ma trận vuông
Xét ma trận vuông cấp n:
a a
11 12
a21 a22
. . . . . .
A=
a
i1 ai2
. . . . . .
an1 an2
. . . a1j . . . a1n
. . . a2j . . .
... ... ...
. . . aij . . .
... ... ...
. . . anj . . .
a2n
. . .
.
ain
. . .
ann
Tại phần tử aij , nếu bỏ đi hàng i cột j ta sẽ thu được ma trận vng cấp
n − 1. Ta kí hiệu là Mij và gọi là ma trận con tương ứng với phần tử aij .
Định thức của ma trận A, kí hiệu là detA, được định nghĩa:
detA = a11 det(M11 ) − a12 det(M12 ) + . . . + (−1)1+n a1n det(M1n ).
Người ta dùng hai gạch đứng đặt hai bên để kí hiệu định thức:
A=
a11 a12
.
a21 a22
Định thức của ma trận vng cấp n được gọi là định thức cấp n.
Tính chất.
9
1. det(At ) = detA.
2. Đổi chỗ hai hàng (hay hai cột) của một định thức ta được một định
thức mới bằng định thức cũ đổi dấu.
3. Một định thức có hai hàng (hay hai cột) như nhau thì bằng khơng.
4. Một định thức có một hàng (hoặc một cột) tồn là số khơng thì bằng
khơng.
5. Khi nhân các phần tử của một hàng (hay một cột) với cùng một số
k thì được một định thức mới bằng định thức cũ nhân với k .
6. Một định thức có hai hàng (hay hai cột) tỉ lệ thì bằng khơng.
7. Khi tất cả các phần tử của một hàng (hay một cột) có dạng tổng của
hai số hạng thì định thức có thể phân tích thành tổng của hai định
thức.
8. Nếu một định thức có một hàng (hay một cột) là tổ hợp tuyến tính
của các hàng khác (hay của các cột khác) thì định thức đó bằng
khơng.
9. Khi cộng bội k của một hàng vào một hàng khác (hay cộng bội k của
một cột vào một cột khác) thì được định thức mới bằng định thức
cũ.
10. Định thức của ma trận tam giác trên (hay tam giác dưới) bằng tích
các phần tử chéo.
1.1.5. Ma trận khả đảo và ma trận nghịch đảo
Định nghĩa 1.1.4. Xét A ∈ Mn . Nếu tồn tại ma trận B ∈ Mn sao cho
AB = BA = I thì ta nói A khả đảo và B được gọi là ma trận nghịch đảo
của A.
Khi A có nghịch đảo ta nói A khơng suy biến hay A khả đảo. Kí hiệu
ma trận nghịch đảo của ma trận A là A−1 , nghĩa là ta có AA−1 = A−1 A =
I.
Tính chất.
10
1. Ma trận nghịch đảo A−1 của A ∈ Mn nếu có thì duy nhất.
2. (AB)−1 = B −1 A−1 .
Sự tồn tại của ma trận nghịch đảo và biểu thức.
Xét ma trận:
a11
a21
A=
. . .
an1
a12 . . . a1n
a22 . . . a2n
.
. . . . . . . . .
an2 . . . ann
Nếu detA = 0 thì ma trận A có nghịch đảo
c11
1
1
c12
t
−1
A =
C =
detA
detA . . .
c1n
A−1 tính bởi công thức sau:
c21 . . . cn1
c22 . . . cn2
. . . . . . . . .
c2n . . . cnn
trong đó cij = (−1)i+j Dij được gọi là phụ đại số của phần tử aij , Dij =
det(Mij ) là định thức con tương ứng với phần tử aij (Mij là ma trận suy
từ A bằng cách bỏ đi hàng i cột j là ma trận con tương ứng với phần tử
aij ).
1.2.
ĐỘ ĐO VÀ XÁC SUẤT
1.2.1. Cấu trúc σ−đại số
Định nghĩa 1.2.1. Giả sử Ω là một tập hợp khác rỗng, và A là lớp các
tập con của Ω. Người ta gọi các tập con của Ω là một σ−đại số (hay
σ−trường) nếu nó thỏa mãn các tính chất sau:
1. Ω ∈ A.
2. Nếu A ∈ A thì A¯ ∈ A (A¯ = Ω\A).
∞
3. Nếu {Ai }i∈N ⊂ A thì
Ai ∈ A.
i=1
11
Tính chất.
1. ∅ ∈ A.
n
Bk ∈ A.
2. Nếu Bk ∈ A, k = 1, n thì
k=1
n
n
Ai ∈ A.
Ai ∈ A và
3. Mọi dãy hữu hạn Ak (k = 1, n) trong A thì
i=1
i=1
Với định nghĩa của σ−đại số như trên, ta định nghĩa các biến cố trong
một phép thử ngẫu nhiên.
Các {ω} ∈ A được gọi là biến cố sơ cấp; các phần tử A ∈ A được
gọi là các biến cố; Ω được gọi là biến cố chắc chắc; ∅ được gọi là biến cố
không thể. Cặp (Ω, A) gồm một σ−đại số A và một tập Ω = ∅ được gọi
là một không gian đo được. Trong định nghĩa xác suất sau đây, ta sẽ trình
bày theo quan điểm tiên đề.
1.2.2.
Xác suất
Định nghĩa 1.2.2. Giả sử (Ω, A) là một không gian đo được. Người ta
định nghĩa xác suất trên A là một hàm tập P : A → [0, 1] thỏa mãn các
tính chất sau:
1. P (Ω) = 1.
2. Nếu dãy {Ak } xung khắc từng đôi một (nghĩa là Ai ∩ Aj = ∅, i = j )
∞
thì P
Ak
k=1
3. P (A)
∞
=
P (Ak ) (tính chất này được gọi là σ−cộng tính).
k=1
0, ∀A ∈ A.
Khi đó bộ ba (Ω, A, P ) được gọi là một không gian xác suất.
Tính chất. Với mọi A, B ∈ A thì:
¯
1. P (A) = 1 − P (A).
2. P (∅) = 0.
3. 0
P (A)
1, ∀A ∈ A.
4. Nếu A ⊂ B và A, B ∈ A thì P (A)
P (B).
12
5. ∀A, B ∈ A thì P (A ∪ B) = P (A) + P (B) − P (A ∩ B).
1.2.3.
Đại lượng ngẫu nhiên và phân phối xác suất của đại
lượng ngẫu nhiên
a. Đại lượng ngẫu nhiên
Giả sử (Ω, A, P ) là không gian xác suất và (R, F) là không gian
đo được. Ta gọi ánh xạ đo được: X : Ω → R (nghĩa là ∀B ∈ F thì
X −1 (B) ∈ A) là một đại lượng ngẫu nhiên R−giá trị.
b. Phân phối xác suất của đại lượng ngẫu nhiên
Giả sử ξ là đại lượng ngẫu nhiên. Khi đó độ đo ảnh P ◦ X −1 được
gọi là phân phối xác suất của X . Ta kí hiệu: PX = P ◦ X −1 . Như vậy
PX (B) = P (X −1 (B)), ∀B ∈ F là xác suất trên không gian đo được
(R, F).
c. Hàm phân phối xác suất
Hàm số FX (x) được xác định bởi FX (x) = PX ((−∞; x)) được gọi là
hàm phân phối xác suất của X .
Tính chất. FX (x) là hàm phân phối xác suất của X có những tính chất
sau:
1. 0
FX (x)
1, ∀x ∈ R.
2. lim FX (x) = 1 và lim FX (x) = 0.
x→+∞
x→−∞
3. FX (x) là hàm không giảm trên R.
4. FX (x) liên tục bên trái tại mọi điểm.
5. ∀α, β ∈ R, α < β, ta có P (α
1.2.4.
X < β) = F (β) − F (α).
Phân phối rời rạc và phân phối liên tục
a. Phân phối rời rạc
Ta nói đại lượng ngẫu nhiên X có phân phối rời rạc (hay X là đại
lượng ngẫu nhiên rời rạc) nếu hàm phân phối FX của nó là hàm bước nhảy
(hay hàm đơn giản).
13
Giả sử {xk } là tập hợp các điểm gián đoạn của F và pk là bước nhảy
tương pk = F (xk + 0) − F (xk − 0). Khi đó ta có pk = P {ω : X(ω) = xk }.
b. Bảng phân phối xác suất
Giả sử X là đại lượng ngẫu nhiên rời rạc có miền giá trị là {x0 , x1 , . . . , xn }.
Đặt pi = P (X = xi ), i = 0, n hoặc i = 0, ∞; (X = xi = ∅). Đại lượng
ngẫu nhiên rời rạc X có bảng phân phối xác suất dạng như sau:
X
x0
x1
...
xn
p
p0
p1
...
pn
Tính chất.
1. 0
pi
1, ∀i = 0, n.
n
pi = 1.
2.
i=0
c. Liên hệ giữa hàm phân phối xác suất và bảng phân phối
xác suất của đại lượng ngẫu nhiên rời rạc
Giả sử đại lượng ngẫu nhiên X có bảng phân phối xác suất là:
X
x0
x1
...
xn
p
p0
p1
...
pn
với x0 < x1 < x2 < . . . < xn . Khi đó ta có
0
F (x) = P (X < x) =
,x
x0
pi , x0 < x.
xi
Bảng phân phối xác suất của đại lượng ngẫu nhiên rời rạc cho ta biết khả
nằng xảy ra của các giá trị mà đại lượng ngẫu nhiên đó nhận được.
d. Phân phối liên tục
Đại lượng ngẫu nhiên X được gọi là có phân phối liên tục nếu phân
phối PX của nó tuyệt đối liên tục đối với độ đo Lebesgue của đường thẳng.
14
1.2.5.
Hàm mật độ xác suất
Định nghĩa 1.2.3. Cho X là đại lượng ngẫu nhiên liên tục, đạo hàm
Radon - Nikodym:
dPX (x)
dx
được gọi là hàm mật độ phân phối của X .
PX (x) =
Tính chất. Giả sử f (x) là hàm mật độ xác suất của đại lượng ngẫu nhiên
liên tục X . Khi đó ta có:
+∞
f (x)dx = 1.
1.
−∞
β
2. ∀α, β ∈ R, α < β, P (α
X < β) =
f (x)dx.
α
3. Nếu f (x) liên tục tại x ∈ Rhay F (x) khả vi tại x ∈ R thì F (x) =
f (x).
1.2.6.
Các đặc trưng số của đại lượng ngẫu nhiên
a. Kỳ vọng
Kỳ vọng của đại lượng ngẫu nhiên rời rạc.
Cho X là đại lượng ngẫu nhiên rời rạc nhận các giá trị x1 , x2 , . . . , xn , . . .
∞
với các xác suất tương ứng p1 , p2 , . . . , pn , . . .. Nếu chuỗi
xk pk hội tụ
k=1
tuyệt đối, thì ta gọi tổng của nó là kỳ vọng tốn học của X và được kí
hiệu là E(X),
∞
E(X) =
x k pk .
k=1
Kỳ vọng của đại lượng ngẫu nhiên liên tục.
Nếu X là đại lượng ngẫu nhiên liên tục và f (x) là hàm mật độ của
nó thì kỳ vọng toán học của X là:
+∞
E(X) =
x.f (x)dx
−∞
15
+∞
|x|.f (x)dx < ∞.
nếu
−∞
Tính chất. Kỳ vọng tốn học có tính chất:
1. E(c) = c.
2. E(aX) = a.E(X).
3. E(X ± Y ) = E(X) ± E(Y ).
4. E(XY ) = E(X)E(Y )
với X, Y độc lập và a là hằng số, c là đại lượng ngẫu nhiên hằng.
Chú ý. Hai đại lượng ngẫu nhiên được gọi là độc lập nếu ∀A ∈ B(R), B ∈
B(R) thì P [X −1 (A).Y −1 (B)] = P [X −1 (A)].P [Y −1 (B)], trong đó B(R) là
σ−đại số Borel của R.
b. Phương sai
Cho X là đại lượng ngẫu nhiên có kỳ vọng tốn học là E(X). Nếu
đại lượng ngẫu nhiên [X − E(X)]2 có kỳ vọng tốn thì kỳ vọng tốn đó
được gọi là phương sai (variance) của đại lượng ngẫu nhiên X , ký hiệu là
var(X). Nghĩa là var(X) = E[X − E(X)]2 .
Đối với đại lượng ngẫu nhiên rời rạc
n
[xi − E(X)]2 pi .
var(X) =
i=1
Đối với đại lượng ngẫu nhiên liên tục
+∞
[x − E(X)]2 .f (x)dx.
var(X) =
−∞
Ta có thể tính phương sai bởi công thức:
var(X) = E(X 2 ) − [E(X)]2 .
Tính chất. Phương sai có các tính chất sau:
1. var(aX) = a2 var(X), với a là hằng số.
16
2. var(X ± c) = var(X). với c là hằng số.
3. var(X ± Y ) = var(X) + var(Y ) nếu X, Y độc lập.
Ta kí hiệu: σ 2 = var(X).
c. Độ lệch chuẩn
Độ lệch chuẩn của đại lượng ngẫu nhiên X , ký hiệu là σ và được tính
bằng căn bậc hai của phương sai: σ =
var(X). Ở đây độ lệch chuẩn có
cùng đơn vị với X .
1.2.7. Các quy luật phân phối xác suất thông dụng
a. Phân phối chuẩn
Đại lượng ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với
tham số µ, σ 2 và được kí hiệu là X ∼ N (µ, σ 2 ), nếu hàm mật độ xác
suất của X có dạng:
−1 (x − µ)2
1
.
fX (x) = √ exp
2
σ2
σ 2π
Tính chất.
1. E(X) = µ, var(X) = σ 2 .
2. Nếu Xi ∼ N (µi , σi2 ), i = 1, n và Xi , i = 1, n độc lập thì Y =
n
(với a là hằng số) cũng có phân phối chuẩn và Y ∼ N
n
ai X i
i=1
n
ai µi ,
i=1
i=1
a2i σi2 ,
i = 1, n.
Hàm Laplace.
Hàm số φ(x) =
x
e−t
√1
2π
2
/2
dt với mọi x ∈ (−∞, +∞) được gọi là
0
hàm Laplace. Ta sẽ sử dụng hàm Laplace để tra bảng giá trị cho mục đích
kiểm định giả thiết phần thống kê.
Trường hợp µ = 0 và σ = 1 thì phân phối chuẩn được gọi là phân
phối chuẩn chuẩn tắc, kí hiệu N (0, 1). Người ta cũng gọi phân phối chuẩn
là phân phối Gauss hay phân phối chuẩn đơn vị nếu nó là N (0, 1).
17
Chuẩn hóa một đại lượng ngẫu nhiên có phân phối chuẩn là biến đổi
đại lượng ngẫu nhiên đó thành đại lượng ngẫu nhiên mới có phân phối
chuẩn chuẩn tắc N (0, 1).
b. Phân phối khi bình phương
Giả sử Xi (i = 1, . . . , n) là các đại lượng ngẫu nhiên độc lập tuân theo
quy luật phân phối chuẩn chuẩn tắc N (0, 1). Khi đó, một đại lượng ngẫu
nhiên X 2 được xác định bởi:
n
2
Xi2
X =
i=1
thì X 2 được gọi là tuân theo quy luật khi bình phương với n bậc tự do, kí
hiệu là X 2 ∼ X 2 (n).
Hàm mật độ xác suất của đại lượng ngẫu nhiên X 2 được xác định bởi
công thức:
f (x) =
1
, x
Γ(n/2).2n/2
0,
với
0
x<0
+∞
tx−1 e−t dt, x > 0.
Γ(x) =
0
Tính chất.
1. E(X 2 ) = n, var(X 2 ) = 2n.
2. Phân phối X 2 lệch phải khi bậc tự do n thấp, khi bậc tự do cao
√
√
(n > 100) thì 2X 2 − 2n − 1 xấp xỉ phân phối chuẩn chuẩn tắc
N (0, 1).
3. Nếu X12 (n1 ), X22 (n2 ) là độc lập thì X12 + X22 ∼ X 2 (n1 + n2 ).
c. t−phân phối (hay phân phối Student)
Giả sử đại lượng ngẫu nhiên độc lập X có phân phối chuẩn tắc N (0, 1)
và đại lượng ngẫu nhiên Y có phân phối khi bình phương với n bậc tự do
18
X 2 (n). Khi đó, một đại lượng ngẫu nhiên t được xác định như sau:
X
Y /n
t=
được gọi là đại lượng ngẫu nhiên có phân phối Student với n bậc tự do,
hay có t−phân phối, kí hiệu t ∼ t(n).
Hàm mật độ xác suất của đại lượng ngẫu nhiên có phân phối Student
xác định bởi biểu thức:
Γ n+1
x2
2
. 1+
f (x) = √
nπ.Γ(n/2)
n
− n+1
2
, ∀x ∈ R.
Tính chất.
1. E(t) = 0, var(t) =
n
n−2 .
2. Khi bậc tự do n lớn (n > 30) thì phân phối Student xấp xỉ với phân
phối chuẩn chuẩn tắc N (0, 1).
Phân vị mức α của t−phân phối.
Giả sử t ∼ t(n). và 0 < α < 1. Phân vị mức α của t với bậc tự do
n, kí hiệu là tnα hay t(n, α), là một giá trị số sao cho P (|t|
tnα ) = α. Các
giá trị phân vị được tính sẵn thành bảng, gọi là bảng tra t.
d. Phân phối Fisher
X1 , X2 là các đại lượng ngẫu nhiên liên tục độc lập có phân phối khi
bình phương X1 ∼ X 2 (n1 ), X2 ∼ X 2 (n2 ). Khi đó, một đại lượng ngẫu
nhiên F được xác định như sau:
F =
X1 /n1
X2 /n2
được gọi là đại lượng ngẫu nhiên có phân phối Fisher với hai bậc tự do n1
và n2 , kí hiệu là F ∼ F (n1 , n2 ).
19
Hàm mật độ của phân phối F xác định bằng biểu thức
n1 +n2
n1 /2 n2 /2
n−1+n2
2
Γ
.n
.n
x
1
2
2
0
.
n1 +n2 , x
n1
n2
Γ
Γ
2
f (x) =
(n2 + n1 x)
2
2
0,
x<0
Tính chất.
1. E(F ) =
n2
n2 −2 , var(F )
=
2n22 (n1 +n22 −2)
.
2
n1 (n2 −2) (n2 −4)
2. Khi hai bậc tự do n1 , n2 lớn (n1 , n2 > 30) thì phân phối F xấp xỉ
phân phối chuẩn chuẩn tắc N (0, 1).
Chú ý.
1. Nếu t ∼ t(n) thì t2 ∼ F (1, n).
2. Nếu bậc tự do n2 lớn thì n1 F ∼ X 2 (n1 ).
Phân bố Fisher. Giả sử F ∼ F (n1 , n2 ) và 0 < α < 1. Phân bố mức α
của F với bậc tự do (n1 , n2 ), kí hiệu là Fα (n1 , n2 ), là một giá trị số sao
cho P (F
Fα (n1 , n2 )) = α. Các giá trị phân bố được tính thành bảng,
gọi là bảng tra F .
1.3.
THỐNG KÊ TOÁN
1.3.1.
Mẫu ngẫu nhiên và hàm phân phối mẫu
a. Mẫu ngẫu nhiên và mẫu thực nghiệm
Mẫu ngẫu nhiên cỡ n là dãy n biến ngẫu nhiên (X1 , X2 , . . . , Xn ),
trong đó các Xi , i = 1, n độc lập và có cùng phân phối.
Một giá trị của mẫu ngẫu nhiên (x1 , x2 , . . . , xn ) được gọi là một mẫu
thực nghiệm cỡ n.
b. Hàm phân phối mẫu
Cho mẫu ngẫu nhiên (X1 , X2 , . . . , Xn ) có phân phối F (x). Hàm phân
phối mẫu (hay hàm phân phối thực nghiệm) là tỉ số
m
n,
trong đó n là kích