Tải bản đầy đủ (.pdf) (31 trang)

Bài giảng Thống kê cho khoa học xã hội: Bài 5 - ThS. Nguyễn Thị Xuân Mai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (764.31 KB, 31 trang )

GIỚI THIỆU MÔN HỌC

THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS. Nguyễn Thị Xuân Mai

v1.0016104219

1


BÀI 5
PHÂN TÍCH HỒI QUI
VÀ TƯƠNG QUAN
Giảng viên: ThS. Nguyễn Thị Xuân Mai

v1.0016104219

2


MỤC TIÊU BÀI HỌC


Giới thiệu về mối liên hệ giữa các hiện tượng kinh tế
xã hội.



Trình bày một số khái niệm liên quan trong phân tích hồi
qui tương quan.




Trình bày trình tự các bước ước lượng mơ hình hồi qui.



Trình bày phương pháp đánh giá mối liên hệ tương quan trong mơ hình, gồm có:
đánh giá mức độ phù hợp của mơ hình, đánh giá cường độ chặt chẽ và chiều hướng
của mối liên hệ.



Trình bày phương pháp tính sai số chuẩn của mơ hình và xác định khoảng tin cậy
ước lượng.



Trình bày các kiểm định thống kê nhằm khẳng định mơ hình ước lượng được là tốt,
có thể dùng để suy diễn thống kê, gồm có: kiểm định hệ số hồi qui, kiểm định ý
nghĩa của hệ số tương quan, kiểm định sự phù hợp của mơ hình.

v1.0016104219

3


CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội.

v1.0016104219


4


HƯỚNG DẪN HỌC



Đọc tài liệu tham khảo.



Thảo luận với giáo viên và các sinh viên
khác về những vấn đề chưa hiểu rõ.



Trả lời các câu hỏi của bài học.



Đọc và tìm hiểu thêm về phương pháp phân
tích hồi qui và tương quan.

v1.0016104219

5


CẤU TRÚC NỘI DUNG


v1.0016104219

5.1

Ước lượng mơ hình hồi qui tuyến tính

5.2

Đánh giá mối liên hệ tương quan

5.3

Kiểm định các hệ số của mơ hình hồi qui

6


5.1. ƯỚC LƯỢNG MƠ HÌNH HỒI QUI TUYẾN TÍNH

5.1.1. Một số khái niệm
liên quan

v1.0016104219

5.1.2. Trình tự ước lượng
mơ hình hồi qui

7



5.1.1. MỘT SỐ KHÁI NIỆM LIÊN QUAN






Hồi qui tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc của
một biến phụ thuộc (biến kết quả) vào một hay nhiều biến độc lập (biến
nguyên nhân).
Ví dụ: Chiều cao và tuổi của một người, Số giờ tự học và điểm số…
Mối liên hệ phụ thuộc này có thể được biểu hiện ở 2 dạng.
 Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện tượng
này có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ
lệ xác định.
 Có dạng Y=f(X)
 khơng những được biểu hiện ở tổng thể mà còn được biểu hiện cụ thể trên
từng đơn vị cá biệt.
 Liên hệ tương quan: là mối liên hệ khơng hồn tồn chặt chẽ. Sự thay đổi của
hiện tượng này có thể làm hiện tượng liên quan thay đổi theo nhưng khơng có
ảnh hưởng hồn tồn quyết định.
 khơng được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng
số lớn (là tổng thể).
Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi qui có thể là
tuyến tính hay phi tuyến.

v1.0016104219

8



5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI


Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc.



Vẽ đồ thị phân tán scatterplot.



Xây dựng mơ hình tốn học mơ tả mối liên hệ giữa biến độc lập và các biến
phụ thuộc.



Ước lượng các hệ số của mơ hình.



Giải thích ý nghĩa của các hệ số.



Bước 1. Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc
 Mối quan hệ hệ nhân - quả, biến phụ thuộc thay đổi do biến độc lập thay đổi.
Ví dụ: sự thay đổi của chi phí quảng cáo dẫn đến sự thay đổi lượng hàng bán.
 Mối quan hệ liên kết, một số nhân tố khác gây ra sự thay đổi trong cả hai biến.

Ví dụ: doanh số bán kính mát và kem tăng do thời tiết nóng.

v1.0016104219

9


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI


Bước 2: Vẽ đồ thị phân tán scatterplot
 X được gọi là biến độc lập (biến nguyên nhân) được biểu diễn ở trục hoành.
 Y được gọi là biến phụ thuộc (biến kết quả) được biểu diễn ở trục tung.
→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tính
giữa hai biến.

v1.0016104219

10


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)


Bước 3: Xây dựng mơ hình hồi qui tổng thể chung
 Mối quan hệ giữa X và Y được mô tả bằng một hàm tuyến tính.
 Sự thay đổi của Y được giả định là do sự thay đổi của X gây ra.
 Mơ hình hồi qui tuyến tính tổng thể chung là:

Hệ số hồi

qui tổng thể

Hệ số tự do
Biến phụ thuộc tổng thể

Yi  β

0

 β 1X i  ε i

Thành phần
tuyến tính

v1.0016104219

Biến độc lập Sai số
ngẫu nhiên

Thành phần sai số
ngẫu nhiên

11


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)

Yi  β 0  β 1 X i  ε i

Y

Giá trị quan sát của
Y cho Xi

εi
Giá trị dự đoán
của Y cho Xi

Hệ số hồi qui = β1
Sai số ngẫu nhiên
cho giá trị Xi

Hệ số tự do = β0

Xi

v1.0016104219

X
12


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)


Bước 4: Ước lượng các hệ số của mơ hình
 Có n quan sát.
 Xi là giá trị của biến độc lập thứ i.
 Yi là giá trị của biến phụ thuộc thứ i.
 X là giá trị trung bình của biến độc lập.
 Y là giá trị trung bình của biến phụ thuộc.

Giá trị ước
lượng (hay dự
đoán) của y cho
quan sát i

Ước lượng của
hệ số hồi qui

Ước lượng của
hệ số tự do



i

 b

0

 b

1

x

Giá trị của x cho
quan sát i
i

Sai số ngẫu nhiên cá nhân ei có trung bình bằng 0


ei  ( y i - yˆ i )  y i - (b0  b1x i )
v1.0016104219

13


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)


Phương pháp bình phương nhỏ nhất (OLS)



Xác định giá trị nhỏ nhất của chênh lệch giữa giá trị thực tế và giá trị từ phương trình
hồi qui lý thuyết (phần dư ei).
min SSE  min



e

2
i

 min

 (y

i


 yˆ i ) 2

 min

 [y

i

 (b 0  b 1 x i )] 2

Hệ phương trình chuẩn xác định các hệ số:

 y  nb0  b1  x

2
 xy  b0  x  b1  x


Hay b1 

v1.0016104219

x. y  x. y x. y  x. y

2
2
2

x x


b0  y  b1.x
14


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)


Bước 5: Giải thích ý nghĩa của các hệ số
 b0 là hệ số tự do (hệ số chặn) cho biết giá trị của y khi x bằng 0 (nếu trong tổng
thể x có nhận giá trị 0). Hoặc coi đó là ảnh hưởng trung bình của tất cả biến
ngun nhân khác ngoài biến nguyên nhân x tới biến kết quả y.
 b1 là hệ số hồi qui (hệ số góc) cho biết ảnh hưởng trực tiếp của biến nguyên
nhân x tới biến kết quả y. Cụ thể, khi x thay đổi 1 đơn vị thì y thay đổi trung bình
b1 đơn vị. Ngồi ra, nó cịn cho biết chiều hướng của mối liên hệ giữa x và y.


Khi b1 > 0, mối liên hệ thuận (x tăng, y tăng).



b1 < 0, mối liên hệ nghịch (x tăng, y giảm).

v1.0016104219

15


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)
Ví dụ: Xây dựng mơ hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số nhân khẩu

trong một hộ và thu nhập bình quân 1 nhân khẩu.
STT
1
2
3
4
5
6
7
8
9
10
11
Tổng
Trung bình

v1.0016104219

Số nhân
khẩu/hộ
(người) x
5
4
6
5
5
5
6
6
2

7
7
58
5.273

Thu nhập bình
quân/1 nhân khẩu
(Triệu đồng) y
8.5
10.3
7.0
8.2
8.9
9.8
6.6
9.5
16.9
7.0
4.8
97.5
8.864

x.y
42.5
41.2
42.0
41.0
44.5
49.0
39.6

57.0
33.8
49.0
33.6
473.2
43.018

x2
25.0
16.0
36.0
25.0
25.0
25.0
36.0
36.0
4.0
49.0
49.0
326.0
29.636

y2
72.25
106.09
49.00
67.24
79.21
96.04
43.56

90.25
285.61
49.00
23.04
961.29
87.390

16


5.1.2. TRÌNH TỰ ƯỚC LƯỢNG MƠ HÌNH HỒI QUI (tiếp theo)


Xác định các tham số:



 2x  x 2  x
b1 

2

 29, 636  5, 2732  1,831

xy  x. y 43, 018  5, 273  8,864

 2, 03
2
x
1,831


b0  y  b1 x  8,864   2, 03  5, 273  19,57


ˆ x  19,57  2, 03x
Mơ hình hồi quy có dạng y



Ý nghĩa các tham số:
 b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số nhân khẩu trong 1
hộ tới sự thay đổi của thu nhập bình quân 1 nhân khẩu.
 b1 = -2,03 nêu lên ảnh hưởng trực tiếp của số nhân khẩu trong 1 hộ tới sự thay
đổi của thu nhập bình quân 1 nhân khẩu. Khi số nhân khẩu tăng thêm 1 người thì
thu nhập bình quân 1 nhân khẩu sẽ giảm đi trung bình 2,03 triệu đồng.

v1.0016104219

17


5.2. ĐÁNH GIÁ MỐI LIÊN HỆ TƯƠNG QUAN

5.2.1. Đánh giá mức độ
phù hợp của mơ hình

5.2.2. Đánh giá cường độ
chặt chẽ của mối liên hệ

5.2.3. Sai số chuẩn của

mơ hình và khoảng tin
cậy ước lượng

v1.0016104219

18


5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH
Tổng biến thiên (variation) được chia thành hai phần:

SST 

SSR 

SSE

Biến thiên của biến phụ thuộc
(Total Sum of Squares)

Biến thiên của hồi qui
(Regression Sum of Squares)

Biến thiên của phần dư
(Error Sum of Squares)

SST   (y i  y)2

SSR   (yˆ i  y) 2


SSE   (y i  yˆ i )2

Đo lường sự biến thiên của
các giá trị yi quanh giá trị trung
bình y của nó

Sự biến thiên do mối quan hệ
tuyến tính giữa x và y

Sự biến thiên do các nhân
tố khác ngồi mối quan hệ
tuyến tính giữa x và y

v1.0016104219

19


5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH


Hệ số xác định là tỷ lệ (lần, %) thay đổi của biến phụ thuộc được giải thích bởi sự
thay đổi của biến độc lập, ký hiệu là R2.



Cơng thức:




Tính chất: 0  R2  1 hay 100%.

R2 

SSR
SST

Y
yi



SST   yi  y



SSE    yi  yˆ 

2





2

SSR   yˆi  y

yˆ  b0  b1 x




2

y

v1.0016104219

X

X

20


5.2.1. ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MƠ HÌNH (tiếp theo)

Y

Y

Y
X
Y

r2 = 1

X

Liên hệ tuyến tính hồn hảo giữa X

và Y: 100% sự thay đổi của Y được
giải thích bởi sự thay đổi của X.

v1.0016104219

X

Y
X
r2 = 0
Khơng có mối liên hệ tuyến tính
giữa X và Y. Giá trị của Y không
phụ thuộc vào X.

0 < r2 < 1

X

Liên hệ tuyến tính yếu giữa X và Y: Một
phần sự thay đổi của Y được giải thích bởi
sự thay đổi của X.

21


5.2.2. ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ


Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và cường độ của
mối liên hệ tương quan tuyến tính.




Cơng thức:



Tính chất:

R  R2 


xy  x. y
 b1 x
 x . y
y

 -1  R  1
 R =  1: giữa x và y có mối liên hệ hàm số
 R = 0: giữa x và y khơng có mối liên hệ tương quan tuyến tính
 R > 0: liên hệ thuận; R < 0: liên hệ nghịch
 R → 1: mối liên hệ giữa x và y càng chặt chẽ.

v1.0016104219

22


5.2.2. ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ



Ví dụ: Đánh giá mức độ chặt chẽ của mối liên hệ tuyến tính giữa số nhân khẩu trong
1 hộ và thu nhập bình quân 1 nhân khẩu

y   
2
y

R  R2 

2

y  y  87,390  8,8642  2,97
2


xy  x. y
1,353
 b1 x   2, 03 
 0,925
2,97
 x . y
y



Kết luận: mối liên hệ giữa số nhân khẩu trong 1 hộ và thu nhập bình quân 1 nhân
khẩu là mối liên hệ tương quan tuyến tính nghịch và rất chặt chẽ.




R2 = 0,8556



Kết luận: 85,56% sự thay đổi của thu nhập bình quân 1 nhân khẩu được giải thích
bởi sự thay đổi của số nhân khẩu trong 1 hộ.

v1.0016104219

23


5.2.3. SAI SỐ CHUẨN CỦA MƠ HÌNH


Sai số chuẩn của ước lượng đo lường biến thiên của các giá trị thực tế y xunh
quanh đường hồi qui.



Cơng thức:

Se 

SSE

n2

  yi  yˆi 


2

n2

→ Sai số càng lớn, biến thiên càng nhiều, đường hồi qui càng xa các điểm thực tế.
Đây là cơ sở để xác định đường hồi qui phù hợp nhất.

Y

Y

small se

v1.0016104219

X

large se

X

24


5.2.3. SAI SỐ CHUẨN CỦA MƠ HÌNH


Sai số chuẩn của hệ số hồi qui




Cơng thức:

Sb1 

  x  x
i

TT
x
1
5
2
4
3
6
4
5
5
5
6
5
7
6
8
6
9
2
10

7
11
7
Tổng
58
Trung bình x  5.273
v1.0016104219

  yi  yˆi 
2
n

x

x
2

 i 
2

Se 2

2



yˆ  19,57  2, 03 x  y  yˆ 
8.5
9.42
10.3

11.45
7.0
7.39
8.2
9.42
8.9
9.42
9.8
9.42
6.6
7.39
9.5
7.39
16.9
15.51
7.0
5.36
4.8
5.36
97.5
97.53
8.864

y

2

0.846
1.323
0.152

1.488
0.270
0.144
0.624
4.452
1.932
2.690
0.314
14.236



xx



2

0.075
1.621
0.529
0.075
0.075
0.075
0.529
0.529
10.713
2.983
2.983
20.182


25


×