GIỚI THIỆU MÔN HỌC
THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS. Nguyễn Thị Xuân Mai
v1.0016104219
1
BÀI 5
PHÂN TÍCH HỒI QUI
VÀ TƯƠNG QUAN
Giảng viên: ThS. Nguyễn Thị Xuân Mai
v1.0016104219
2
MỤC TIÊU BÀI HỌC
•
Giới thiệu về mối liên hệ giữa các hiện tượng kinh tế
xã hội.
•
Trình bày một số khái niệm liên quan trong phân tích hồi
qui tương quan.
•
Trình bày trình tự các bước ước lượng mơ hình hồi qui.
•
Trình bày phương pháp đánh giá mối liên hệ tương quan trong mơ hình, gồm có:
đánh giá mức độ phù hợp của mơ hình, đánh giá cường độ chặt chẽ và chiều hướng
của mối liên hệ.
•
Trình bày phương pháp tính sai số chuẩn của mơ hình và xác định khoảng tin cậy
ước lượng.
•
Trình bày các kiểm định thống kê nhằm khẳng định mơ hình ước lượng được là tốt,
có thể dùng để suy diễn thống kê, gồm có: kiểm định hệ số hồi qui, kiểm định ý
nghĩa của hệ số tương quan, kiểm định sự phù hợp của mơ hình.
v1.0016104219
3
CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội.
v1.0016104219
4
HƯỚNG DẪN HỌC
•
Đọc tài liệu tham khảo.
•
Thảo luận với giáo viên và các sinh viên
khác về những vấn đề chưa hiểu rõ.
•
Trả lời các câu hỏi của bài học.
•
Đọc và tìm hiểu thêm về phương pháp phân
tích hồi qui và tương quan.
v1.0016104219
5
CẤU TRÚC NỘI DUNG
v1.0016104219
5.1
Ước lượng mơ hình hồi qui tuyến tính
5.2
Đánh giá mối liên hệ tương quan
5.3
Kiểm định các hệ số của mơ hình hồi qui
6
5.1. ƯỚC LƯỢNG MƠ HÌNH HỒI QUI TUYẾN TÍNH
5.1.1. Một số khái niệm
liên quan
v1.0016104219
5.1.2. Trình tự ước lượng
mơ hình hồi qui
7
5.1.1. MỘT SỐ KHÁI NIỆM LIÊN QUAN
•
•
•
Hồi qui tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của
một biến phụ thuộc (biến kết quả) vào một hay nhiều biến độc lập (biến
nguyên nhân).
Ví dụ: Chiều cao và tuổi của một người, Số giờ tự học và điểm số…
Mối liên hệ phụ thuộc này có thể được biểu hiện ở 2 dạng.
Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện tượng
này có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ
lệ xác định.
Có dạng Y=f(X)
khơng những được biểu hiện ở tổng thể mà còn được biểu hiện cụ thể trên
từng đơn vị cá biệt.
Liên hệ tương quan: là mối liên hệ khơng hồn tồn chặt chẽ. Sự thay đổi của
hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng khơng có
ảnh hưởng hồn tồn quyết định.
khơng được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng
số lớn (là tổng thể).
Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi qui có thể là
tuyến tính hay phi tuyến.
v1.0016104219
8
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI
•
Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc.
•
Vẽ đồ thị phân tán scatterplot.
•
Xây dựng mơ hình tốn học mơ tả mối liên hệ giữa biến độc lập và các biến
phụ thuộc.
•
Ước lượng các hệ số của mơ hình.
•
Giải thích ý nghĩa của các hệ số.
•
Bước 1. Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc
Mối quan hệ hệ nhân - quả, biến phụ thuộc thay đổi do biến độc lập thay đổi.
Ví dụ: sự thay đổi của chi phí quảng cáo dẫn đến sự thay đổi lượng hàng bán.
Mối quan hệ liên kết, một số nhân tố khác gây ra sự thay đổi trong cả hai biến.
Ví dụ: doanh số bán kính mát và kem tăng do thời tiết nóng.
v1.0016104219
9
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI
•
Bước 2: Vẽ đồ thị phân tán scatterplot
X được gọi là biến độc lập (biến nguyên nhân) được biểu diễn ở trục hoành.
Y được gọi là biến phụ thuộc (biến kết quả) được biểu diễn ở trục tung.
→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tính
giữa hai biến.
v1.0016104219
10
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
•
Bước 3: Xây dựng mơ hình hồi qui tổng thể chung
Mối quan hệ giữa X và Y được mô tả bằng một hàm tuyến tính.
Sự thay đổi của Y được giả định là do sự thay đổi của X gây ra.
Mơ hình hồi qui tuyến tính tổng thể chung là:
Hệ số hồi
qui tổng thể
Hệ số tự do
Biến phụ thuộc tổng thể
Yi β
0
β 1X i ε i
Thành phần
tuyến tính
v1.0016104219
Biến độc lập Sai số
ngẫu nhiên
Thành phần sai số
ngẫu nhiên
11
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
Yi β 0 β 1 X i ε i
Y
Giá trị quan sát của
Y cho Xi
εi
Giá trị dự đoán
của Y cho Xi
Hệ số hồi qui = β1
Sai số ngẫu nhiên
cho giá trị Xi
Hệ số tự do = β0
Xi
v1.0016104219
X
12
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
•
Bước 4: Ước lượng các hệ số của mơ hình
Có n quan sát.
Xi là giá trị của biến độc lập thứ i.
Yi là giá trị của biến phụ thuộc thứ i.
X là giá trị trung bình của biến độc lập.
Y là giá trị trung bình của biến phụ thuộc.
Giá trị ước
lượng (hay dự
đoán) của y cho
quan sát i
Ước lượng của
hệ số hồi qui
Ước lượng của
hệ số tự do
yˆ
i
b
0
b
1
x
Giá trị của x cho
quan sát i
i
Sai số ngẫu nhiên cá nhân ei có trung bình bằng 0
ei ( y i - yˆ i ) y i - (b0 b1x i )
v1.0016104219
13
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
•
Phương pháp bình phương nhỏ nhất (OLS)
•
Xác định giá trị nhỏ nhất của chênh lệch giữa giá trị thực tế và giá trị từ phương trình
hồi qui lý thuyết (phần dư ei).
min SSE min
•
e
2
i
min
(y
i
yˆ i ) 2
min
[y
i
(b 0 b 1 x i )] 2
Hệ phương trình chuẩn xác định các hệ số:
y nb0 b1 x
2
xy b0 x b1 x
•
Hay b1
v1.0016104219
x. y x. y x. y x. y
2
2
2
x x
b0 y b1.x
14
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
•
Bước 5: Giải thích ý nghĩa của các hệ số
b0 là hệ số tự do (hệ số chặn) cho biết giá trị của y khi x bằng 0 (nếu trong tổng
thể x có nhận giá trị 0). Hoặc coi đó là ảnh hưởng trung bình của tất cả biến
ngun nhân khác ngoài biến nguyên nhân x tới biến kết quả y.
b1 là hệ số hồi qui (hệ số góc) cho biết ảnh hưởng trực tiếp của biến nguyên
nhân x tới biến kết quả y. Cụ thể, khi x thay đổi 1 đơn vị thì y thay đổi trung bình
b1 đơn vị. Ngồi ra, nó cịn cho biết chiều hướng của mối liên hệ giữa x và y.
Khi b1 > 0, mối liên hệ thuận (x tăng, y tăng).
b1 < 0, mối liên hệ nghịch (x tăng, y giảm).
v1.0016104219
15
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
Ví dụ: Xây dựng mơ hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số nhân khẩu
trong một hộ và thu nhập bình quân 1 nhân khẩu.
STT
1
2
3
4
5
6
7
8
9
10
11
Tổng
Trung bình
v1.0016104219
Số nhân
khẩu/hộ
(người) x
5
4
6
5
5
5
6
6
2
7
7
58
5.273
Thu nhập bình
quân/1 nhân khẩu
(Triệu đồng) y
8.5
10.3
7.0
8.2
8.9
9.8
6.6
9.5
16.9
7.0
4.8
97.5
8.864
x.y
42.5
41.2
42.0
41.0
44.5
49.0
39.6
57.0
33.8
49.0
33.6
473.2
43.018
x2
25.0
16.0
36.0
25.0
25.0
25.0
36.0
36.0
4.0
49.0
49.0
326.0
29.636
y2
72.25
106.09
49.00
67.24
79.21
96.04
43.56
90.25
285.61
49.00
23.04
961.29
87.390
16
5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
•
Xác định các tham số:
2x x 2 x
b1
2
29, 636 5, 2732 1,831
xy x. y 43, 018 5, 273 8,864
2, 03
2
x
1,831
b0 y b1 x 8,864 2, 03 5, 273 19,57
•
ˆ x 19,57 2, 03x
Mơ hình hồi quy có dạng y
•
Ý nghĩa các tham số:
b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số nhân khẩu trong 1
hộ tới sự thay đổi của thu nhập bình quân 1 nhân khẩu.
b1 = -2,03 nêu lên ảnh hưởng trực tiếp của số nhân khẩu trong 1 hộ tới sự thay
đổi của thu nhập bình quân 1 nhân khẩu. Khi số nhân khẩu tăng thêm 1 người thì
thu nhập bình quân 1 nhân khẩu sẽ giảm đi trung bình 2,03 triệu đồng.
v1.0016104219
17
5.2. ĐÁNH GIÁ MỐI LIÊN HỆ TƯƠNG QUAN
5.2.1. Đánh giá mức độ
phù hợp của mơ hình
5.2.2. Đánh giá cường độ
chặt chẽ của mối liên hệ
5.2.3. Sai số chuẩn của
mơ hình và khoảng tin
cậy ước lượng
v1.0016104219
18
5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH
Tổng biến thiên (variation) được chia thành hai phần:
SST
SSR
SSE
Biến thiên của biến phụ thuộc
(Total Sum of Squares)
Biến thiên của hồi qui
(Regression Sum of Squares)
Biến thiên của phần dư
(Error Sum of Squares)
SST (y i y)2
SSR (yˆ i y) 2
SSE (y i yˆ i )2
Đo lường sự biến thiên của
các giá trị yi quanh giá trị trung
bình y của nó
Sự biến thiên do mối quan hệ
tuyến tính giữa x và y
Sự biến thiên do các nhân
tố khác ngồi mối quan hệ
tuyến tính giữa x và y
v1.0016104219
19
5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH
•
Hệ số xác định là tỷ lệ (lần, %) thay đổi của biến phụ thuộc được giải thích bởi sự
thay đổi của biến độc lập, ký hiệu là R2.
•
Cơng thức:
•
Tính chất: 0 R2 1 hay 100%.
R2
SSR
SST
Y
yi
SST yi y
SSE yi yˆ
2
yˆ
2
SSR yˆi y
yˆ b0 b1 x
2
y
v1.0016104219
X
X
20
5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH (tiếp theo)
Y
Y
Y
X
Y
r2 = 1
X
Liên hệ tuyến tính hồn hảo giữa X
và Y: 100% sự thay đổi của Y được
giải thích bởi sự thay đổi của X.
v1.0016104219
X
Y
X
r2 = 0
Khơng có mối liên hệ tuyến tính
giữa X và Y. Giá trị của Y không
phụ thuộc vào X.
0 < r2 < 1
X
Liên hệ tuyến tính yếu giữa X và Y: Một
phần sự thay đổi của Y được giải thích bởi
sự thay đổi của X.
21
5.2.2. ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ
•
Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và cường độ của
mối liên hệ tương quan tuyến tính.
•
Cơng thức:
•
Tính chất:
R R2
xy x. y
b1 x
x . y
y
-1 R 1
R = 1: giữa x và y có mối liên hệ hàm số
R = 0: giữa x và y khơng có mối liên hệ tương quan tuyến tính
R > 0: liên hệ thuận; R < 0: liên hệ nghịch
R → 1: mối liên hệ giữa x và y càng chặt chẽ.
v1.0016104219
22
5.2.2. ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ
•
Ví dụ: Đánh giá mức độ chặt chẽ của mối liên hệ tuyến tính giữa số nhân khẩu trong
1 hộ và thu nhập bình quân 1 nhân khẩu
y
2
y
R R2
2
y y 87,390 8,8642 2,97
2
xy x. y
1,353
b1 x 2, 03
0,925
2,97
x . y
y
•
Kết luận: mối liên hệ giữa số nhân khẩu trong 1 hộ và thu nhập bình quân 1 nhân
khẩu là mối liên hệ tương quan tuyến tính nghịch và rất chặt chẽ.
•
R2 = 0,8556
•
Kết luận: 85,56% sự thay đổi của thu nhập bình quân 1 nhân khẩu được giải thích
bởi sự thay đổi của số nhân khẩu trong 1 hộ.
v1.0016104219
23
5.2.3. SAI SỐ CHUẨN CỦA MƠ HÌNH
•
Sai số chuẩn của ước lượng đo lường biến thiên của các giá trị thực tế y xunh
quanh đường hồi qui.
•
Cơng thức:
Se
SSE
n2
yi yˆi
2
n2
→ Sai số càng lớn, biến thiên càng nhiều, đường hồi qui càng xa các điểm thực tế.
Đây là cơ sở để xác định đường hồi qui phù hợp nhất.
Y
Y
small se
v1.0016104219
X
large se
X
24
5.2.3. SAI SỐ CHUẨN CỦA MƠ HÌNH
•
Sai số chuẩn của hệ số hồi qui
•
Cơng thức:
Sb1
x x
i
TT
x
1
5
2
4
3
6
4
5
5
5
6
5
7
6
8
6
9
2
10
7
11
7
Tổng
58
Trung bình x 5.273
v1.0016104219
yi yˆi
2
n
x
x
2
i
2
Se 2
2
yˆ 19,57 2, 03 x y yˆ
8.5
9.42
10.3
11.45
7.0
7.39
8.2
9.42
8.9
9.42
9.8
9.42
6.6
7.39
9.5
7.39
16.9
15.51
7.0
5.36
4.8
5.36
97.5
97.53
8.864
y
2
0.846
1.323
0.152
1.488
0.270
0.144
0.624
4.452
1.932
2.690
0.314
14.236
xx
2
0.075
1.621
0.529
0.075
0.075
0.075
0.529
0.529
10.713
2.983
2.983
20.182
25