-
BÀI THẢO LUẬN
HỌC PHẦN: KINH TẾ LƯỢNG
Đề tài: Xây dựng mơ hình nghiên cứu về giá trị xuất khẩu của lúa ở Việt Nam
thơng qua ít nhất 3 nhân tố ảnh hưởng, từ đó kiểm tra khuyết tật
của mơ hình và khắc phục
Năm học 2020-2021
Mục lục
1
A.Mở đầu………………………………………………………
3
B. Cơ sở lí thuyết………………………………………………
3
C.Thực hành……………………………………………………
8
1.Mơ hình hồi quy mẫu…………………………………………
7
2.Thừa thiếu biến………………………………………………
9
3.Tự tương quan………………………………………………… 16
4.Phương sai sai số thay đổi……………………………………
19
5.Đa cộng tuyến………………………………………………… 22
6. Kiểm định tính phân phối chuẩn của sai số ngẫu nhiên Ui…
26
7.Đưa ra mơ hình và giải thích…………………………………
28
D.Kết luận………………………………………………………
28
A Lời mở đầu
2
Trước khi vào bài bài thảo luận, nhóm 5 xin gửi lời cảm ơn chân thành tới thầy Mai
Hải An – giảng viên của bộ môn kinh tế lượng trường Đại Học Thương Mại vì đã đồng
hành giảng dạy, chỉ dẫn nhiệt tình trong suốt q trình nhóm thực hiện đề tài.
Gạo Việt Nam được tôn vinh là ngon nhất thế giới. Ln là quốc gia đứng nhất nhì về
xuất khẩu gạo, nay giá trị của hạt gạo Việt qua bàn tay chăm chút của các nhà khoa
học càng được quốc tế công nhận.
Năm 2020 vừa qua, trong bối cảnh nhiều doanh nghiệp trong lĩnh vực công nghiệp và
dịch vụ lao đao vì dịch Covid 19, ngành nơng nghiệp lại nổi lên như một điểm sáng,
một trụ đỡ cho nền kinh tế Việt Nam với mức đóng góp hơn 41 tỷ USD kim ngạch
xuất khẩu. Theo ước tính của liên bộ, xuất khẩu gạo năm 2020 đạt khoảng 6,15 triệu
tấn, trị giá đạt khoảng 3,07 tỷ USD. Mặc dù lượng gạo xuất khẩu giảm khoảng 3,5%
so với năm 2019, chủ yếu vì mục tiêu bảo đảm an ninh lương thực quốc gia, nhưng trị
giá xuất khẩu lại tăng tới 9,3%. Giá xuất khẩu bình quân cả năm ước đạt 499 USD/tấn,
tăng 13,3% so với năm 2019.
Vậy đối với một nền nơng nghiệp lúa gạo mang tính quan trọng như vậy thì những
nhân tố ảnh hưởng đến giá trị xuất khẩu gạo sẽ luôn là một trong những vấn đề được
quan tâm hàng đầu. Trong bài thảo luận này, nhóm 5 sẽ đi sâu vào các yếu tố: Năng
suất, chỉ số giá tiêu dùng, diện tích gieo trồng, sản lượng trong nước, thu nhập bình
qn.
B. Cơ sở lí thuyết
1. Các khuyết tật của mơ hình
1.1. Thừa biến:
Giả sử mơ hình phù hợp có dạng:
Nhưng lại chọn mơ hình:
Hệ quả:
- Các ước lượng OLS vẫn là các ước lượng không chệch và vững của các tham số
trong mơ hình đúng.
- Phương sai của các ước lượng trong mơ hình thừa biến lớn hơn trong mơ hình đúng.
- Khoảng tin cậy rộng, các kiểm định khơng cịn tin cậy nữa.
1.2. Thiếu biến:
- TH1: Nếu biến có số liệu
+ Ước lượng mơ hình có thêm
+ Kiểm định Ho: Nếu bác bỏ Ho thì mơ hình ban đầu đã bỏ sót biến.
- TH2 : Khơng biết số liệu của
Kiểm định Reset of Ramsey
B1: Ước lượng mơ hình gốc ban đầu:
Thu được và
B2: Ước lượng mới
3
= + .+ ... + .+ + ... ++
Thu được
B3: KĐGT:
TCKĐ: F ( trong đó m là số biến độc lập mới thêm vào mơ hình,
k là số tham số trong mơ hình mới)
- Nếu hoặc p-value < Bác bỏ Ho
1.3. Đa cộng tuyến:
a) Khái niệm
Trong các giả định của mơ hình hồi quy tuyến tính cổ điển (CLRM), có giả thiết:
Các biến độc lập khơng có mối quan hệ tuyến tính chính xác. Nếu giả thiết này vi
phạm, sẽ có hiện tượng đa cộng tuyến, đó là hiện tượng các biến độc lập trong mơ hình
phụ thuộc lẫn nhau và thể hiện được dưới dạng hàm số.
b) Bản chất của đa cộng tuyến
Xét mơ hình hồi quy tuyến tính cổ điển nhiều biến:
- Đa cộng tuyến hồn hảo (tồn phần) xảy ra giữa các biến giải thích
Nếu tồn tại khơng đồng thời bằng 0 thỏa mãn:
thì mơ hình có đa cộng tuyến hồn hảo
- Đa cộng tuyến khơng tồn phần xảy ra giữa các biến giải thích
Nếu tồn tại không đồng thời bằng 0 thỏa mãn:
=> Mô hình xảy ra hiện tượng đa cộng tuyến khơng tồn phần
Nhận xét: Trong thực tế chủ yếu gặp phải đa cộng tuyến khơng tồn phần.
- Có 3 cách phát hiện đa cộng tuyến:
Cách 1: Hệ số xác định bội R2 cao nhưng tỉ số t thấp
Trong trường hợp R2 cao (thường R2 > 0,8) mà tỷ số t thấp ( )
Mơ hình có đa cộng tuyến.
Nhược điểm: Chỉ thể hiện rõ khi có đa cộng tuyến ở mức độ cao.
Cách 2: Hệ số tương quan cặp
=> Hệ số tương quan cao
Xảy ra đa cộng tuyến giữa
Cách 3: Thực hiện mơ hình hồi quy phụ (hồi quy của mỗi biến độc lập theo các biến
độc lập cịn lại)
Xét mơ hình:
KĐGT:
TCKĐ:
Nếu Ho đúng
Dùng p-value hoặc để KĐGT
c) Khắc phục đa cộng tuyến
- Giải pháp 1: Bỏ bớt biến độc lập (điều này xảy ra với giả định rằng không có mối
quan hệ giữa biến phụ thuộc và biến độc lập bị loại bỏ mơ hình)
4
- Giải pháp 2: Bổ sung dữ liệu hoặc tìm dữ liệu mới, tìm mẫu dữ liệu khác hoặc gia
tăng cỡ mẫu.
- Giải pháp 3: Thay đổi dạng mơ hình, mơ hình kinh tế lượng có nhiều dạng hàm khác
nhau. Thay đổi dạng mơ hình cũng có nghĩa là tái cấu trúc mơ hình.
- Giải pháp 4: Sử dụng phương trình sai phân cấp 1
1.4. Phương sai sai số thay đổi:
a) Kiểm định Park:
Park đưa ra giả thiết:
Vì chưa biết nên ước lượng hàm trên park đề nghị sử dụng thay cho
B1: Ước lượng mơ hình hồi quy gốc để thu được các phần dư
B2: Ước lượng hồi quy:
Nếu có nhiều biến giải thích thì ước lượng hồi quy này với từng biến giải thích.
B3: KĐGT:
TCKĐ:
nếu Ho đúng thì T
Hoặc dựa vào bảng kiểm định park bằng phần mềm Eviews ta có được: p-value
Với α cho trước, nếu p-value < α, bác bỏ Ho
b) Kiểm định White:
- White có lát cắt:
(1)
- White khơng lát cắt:
(2)
B1: ước lượng mơ hình gốc thi được
B2: ước lượng mơ hình White ở dạng (1) hoặc (2) thu được
B3: KĐGT:
TCKĐ:
nếu H0 đúng
Dựa vào bảng kiểm định white bằng phần mềm eview ta có được p-value
Với α cho trước, nếu p-value < α, bác bỏ Ho
c) Kiểm định Glejser:
Tương tự kiểm định Park, nhưng mô hình ở B2 thay thế bởi một trong các mơ hình:
d) Kiểm định G-Q:
B1: sắp xếp các giá trị quan sát theo chiều tăng dần biến
B2: Bỏ c quan sát ở giữa theo quy tắc
Nếu n= 30 lấy c= 4 hoặc c=6
Nếu n=60 lấy c=10
Các quan sát còn lại chia làm 2 nhóm mỗi nhóm có (n-c)/2 quan sát
B3: ước lượng mơ hình với (n-c)/2 quan sát đầu và cuối thu được và tương ứng với
bậc tự do là:
df =
5
B4: KĐGT
TCKĐ:
F=
Nếu Ho đúng
Wα = {Ftn: Ftn >}
e) Kiểm định dựa trên biến phụ thuộc
Giả thiết:
Lấy: ,
B1: ước lượng mô hình gốc thi được
B2: ước lượng mơ hình thu được
B3: KĐGT
TCKĐ: nếu H0 đúng
Hoặc nếu H0 đúng F
Tìm Wα hoặc p-value
1.5. Tự tương quan:
a) Kiểm định B-G:
Xét mơ hình: (1)
với
thỏa mãn các giả thiết của mơ hình cổ điển cần kiểm định
KĐGT :
TCKĐ:
nếu Ho đúng thì
Dựa vào bảng kiểm định B-G bằng phần mềm eview ta có được: p-value
Với α cho trước, nếu p-value < α, bác bỏ Ho
b) Kiểm định D-W:
Xét mơ hình: giả sử
Giả thuyết:
TCKĐ:
Trường hợp tự tương quan bậc nhất ( với n và k’, tra bảng thống kê d ta tìm được và):
- Nếu 0 < d < có tự tương quan dương
- Nếu : không đủ cơ sở để kết luận
- Nếu : khơng có tự tương quan
- Nếu : có tự tương quan âm
C.Thực hành
1. Mơ hình hồi quy mẫu
Khi ước lượng mơ hình giá trị xuất khẩu gạo theo năng suất, chỉ số giá tiêu dùng, diện
tích gieo trồng, sản lượng trong nước, thu nhập bình qn ta được mơ hình sau:
6
+ ++
Trong đó
Yt là giá trị xuất khẩu gạo (triệu USD)
Xt là năng suất (tạ/ha)
Zt là chỉ số giá tiêu dùng (%)
Mt là diện tích gieo trồng (nghìn ha)
St là sản lượng trong nước (nghìn tấn)
Kt là thu nhập bình quân đầu người
- Khi năng suất tăng, giá trị xuất khẩu tăng nên mang dấu (+)
- Khi chỉ số giá tiêu dùng tăng, giá trị xuất khẩu giảm nên mang dấu (+)
- Khi diện tích gieo trồng tăng , giá trị xuất khẩu tăng nên mang dấu (+)
- Khi sản lượng trong nước tăng, giá trị xuất khẩu tăng nên mang dấu (+)
- Khi thu nhập bình quân đầu người tăng, giá trị xuất khẩu tăng nên mang dấu (+)
Bảng số liệu những yếu tố ảnh hưởng đến giá trị xuất khẩu gạo nước ta
Năm
Giá trị
xuất
khẩu
(triệu
USD)
Năng
suất
Chỉ số giá tiêu
dùng
Diện tích
gieo trồng
Sản lượng
trong nc
Thu nhập bình
quân đầu người
Tạ/ha
(%)
(nghìn ha)
Nghìn tấn
(USD)
X
Z
M
S
K
Y
2005
1400
48.9
108.40
7329.2
35832.9
700
2006
1300
48.9
106.60
7324.8
35849.5
796
2007
1500
49.9
7207.4
35942.7
919
2008
2900
52.3
7400.2
38729.8
1145
2009
2670
52.4
106.52
7437.2
38950.2
1160
2010
3200
53.4
111.75
7489.4
40005.6
1273
112.60
119.89
7
2011
3700
55.4
118.13
7655.4
42398.5
1517
2012
3670
56.4
106.81
7761.2
43737.8
1749
2013
2900
55.7
106.04
7902.5
44039.1
1960
2014
3000
57.5
101.84
7816.2
44974.6
2052
2015
2800
57.6
100.60
7828.0
45091.0
2109
2016
2100
55.8
104.74
7737.1
43165.1
2200
2017
2600
55.5
102.60
7705.2
42738.9
2385
2018
3100
58.2
102.98
7570.9
44046.0
2587
2019
2800
58.2
105.23
7470.1
43448.2
3000
Sau khi chạy mơ hình hồi quy mẫu bằng eview ta thu được bảng sau
8
Từ bảng kết quả Eview ta có mơ hình:
= 4097.028+ 28.51022Xt + 27.25250Zt – 4.945696Mt - 1.270281St-Kt
2. Kiểm tra thừa biến, thiếu biến
2.1. Kiểm tra thừa biến
TH1: Với mức ý nghĩa α=0,05 có nên loại bỏ biến năng suất (X) khỏi mơ hình
khơng?
Giả sử mơ hình đúng: + +
BTKĐ:
TCKĐ: T =
Ta có bảng eview:
Ta thấy: P_value = 0,0068 < 5% => Bác bỏ , chấp nhận
Kết luận: Với mức ý nghĩa α=0,05, không nên loại bỏ biến năng suất (X) ra khỏi mơ
hình.
9
TH2: Với mức ý nghĩa α=0,05 có nên loại bỏ biến chỉ số giá tiêu dùng (Z) khỏi
mơ hình khơng?
Giả sử mơ hình đúng: + +
TCKĐ: T =
Ta có bảng eview:
Ta thấy: P_value = 0,1231 > 5% => Chấp nhận , bác bỏ
Kết luận: Với mức ý nghĩa α=0,05, nên loại bỏ biến chỉ số giá tiêu dùng (Z) ra khỏi
mơ hình.
TH3: Với mức ý nghĩa α=0,05 có nên loại bỏ biến diện tích gieo trồng (M)
khỏi mơ hình khơng?
Giả sử mơ hình đúng: + +
TCKĐ: T =
10
Ta có bảng eview:
Ta thấy: P_value = 0,0116 < 5% => Bác bỏ , chấp nhận
Kết luận: Với mức ý nghĩa α=0,05, khơng nên loại bỏ biến diện tích gieo trồng (M)
ra khỏi mơ hình.
TH4: Với mức ý nghĩa α=0,05 có nên loại bỏ biến sản lượng trong nước (S)
khỏi mơ hình khơng?
Giả sử mơ hình đúng: + +
TCKĐ: T =
Ta có bảng eview:
11
Ta thấy: P_value = 0,0115 < 5% => Bác bỏ , chấp nhận
Kết luận: Với mức ý nghĩa α=0,05, không nên loại bỏ biến sản lượng trong nước
(S) ra khỏi mơ hình.
TH5: Với mức ý nghĩa α=0,05 có nên loại bỏ biến thu nhập bình quân đầu
người (K) khỏi mơ hình khơng?
Giả sử mơ hình đúng: + +
TCKĐ: T =
Ta có bảng eview:
12
Ta thấy: P_value = 0,0023 < 5% => Bác bỏ , chấp nhận
Kết luận: Với mức ý nghĩa α=0,05, không nên loại bỏ biến thu nhập bình quân đầu
người (K) ra khỏi mơ hình.
Sau khi kiểm tra về thừa biến, ta thấy Z bị loại khỏi mơ hình.
Mơ hình cịn lại X, M, S và K
13
Mơ hình sau khi kiểm tra thừa biến là:
266535,8 + 4991,781 33,16416 6,0821671,571755
2.2. Kiểm định thiếu biến
Xét mơ hình (*):
Bài tốn kiểm định:
TCKĐ:
F=
Chạy trên eview ta có kết quả:
14
Ta thấy: P_value = 0,8658 > 5% => Chấp nhận , bác bỏ
Kết luận: Mơ hình khơng thiếu biến.
3. Tự tương quan
3.1. Kiểm định Durbin Watson
Xét mơ hình:
Yt = β1 + β2Xt + β3Mt + β4St + β5Kt + Ut
15
BTKĐ :
n
d
�(e e
t 2
t 1
t
n
�e
)2
2
t
t 1
TCKĐ:
Với n=15, k’=4, = 0,05 => du =1.977, dL = 0.685
4–du =2.023 ; 4-dL= 3.315
Sử dụng phần mềm Eviews để thực hiện kiểm định Durbin-Waston, ta có kết quả như
sau:
Trong bảng kết quả trên, ta thấy giá trị thống kê Durbin-Waston là:
d=2.356741
Vì 4-du < d < 4-dL => d (4) => Khơng có kết luận về tự tương quan
Kết luận: Khơng có kết luận về tự tương quan.
3.2. Kiểm định BG
Kiểm định B-G bậc 1:
Xét mơ hình:
Yt = β1 + β2Xt + β3Mt + β4St + β5Kt + Ut
Ước lượng mơ hình B-G có dạng:
16
β1 + β2X + β3M + β4S + β5K
Với p=1 ta có kết quả:
BTKĐ:
TCKĐ : χ2 = (n-1)R2
2
2 (1)
Nếu H0 đúng thì ~
P-value = 0.2807 > 0.05 => Chấp nhận H0, bác bỏ H1
Kết luận: Mơ hình khơng có tự tương quan bậc 1
Kiểm định B-G bậc 2
Xét mơ hình:
Yt = β1 + β2Xt + β3Mt + β4St + β5Kt + Ut
Ước lượng mơ hình B-G có dạng:
β1 + β2X + β3M + β4S + β5K
Với p=2 ta có kết quả:
17
BTKĐ:
TCKĐ :
χ2 = (n-1)R2
Nếu H0 đúng thì
P-value = 0.4539 > 0.05 => Chấp nhận H0, bác bỏ H1
Kết luận: Mô hình khơng có tự tương quan bậc 2
4.Phương sai sai số thay đổi
4.1. Kiểm định White.
Xét mơ hình sau :
Ước lượng mơ hình có dạng:
Thực hiện kiểm định White trên phần mềm Eviews ta có kết quả như sau:
Heteroskedasticity Test: White
18
F-statistic
Obs*R-squared
Scaled explained SS
0.856878
3.828904
1.723985
Prob. F(4,10)
Prob. Chi-Square(4)
Prob. Chi-Square(4)
0.5215
0.4297
0.7864
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 03/27/21 Time: 14:10
Sample: 2005 2019
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X^2
M^2
S^2
K^2
-4885015.
1297.415
0.099040
-0.002720
0.014413
4506434.
1471.356
0.082641
0.002661
0.016059
-1.084009
0.881782
1.198432
-1.021947
0.897544
0.3038
0.3986
0.2584
0.3309
0.3905
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.255260
-0.042636
67605.53
4.57E+10
-185.0648
0.856878
0.521498
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
44936.43
66208.83
25.34197
25.57799
25.33945
1.678615
Bài toán kiểm định :
Tiêu chuẩn kiểm định :
Nếu đúng thì
P- value = 0.521498 > 0,05 => Chấp nhận , bác bỏ
Kết luận: Mơ hình khơng có PSSS thay đổi.
4.2. Kiểm định Park:
Xét mơ hình sau :
Ước lượng mơ hình có dạng:
Thực hiện kiểm định Park trên phần mềm Eviews ta có kết quả như sau:
Dependent Variable: LOG(RESID^2)
Method: Least Squares
Date: 03/27/21 Time: 15:12
Sample: 2005 2019
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
1028.445
2711.886
0.379236
0.7124
19
LOG(X)
LOG(M)
LOG(S)
LOG(K)
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
-692.1557
-553.0558
625.6462
5.267952
0.407331
0.170263
2.105440
44.32878
-29.41096
1.718205
0.222053
1130.518
1143.021
1130.671
4.565384
-0.612247
-0.483855
0.553340
1.153890
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
0.5540
0.6389
0.5922
0.2754
9.227023
2.311387
4.588128
4.824144
4.585614
1.642740
Bài toán kiểm định:
Tiêu chuẩn kiểm định:
Nếu đúng thì
P- value = 0.222053 > 0,05 => Chấp nhận , bác bỏ
Kết luận: Mơ hình khơng có PSSS thay đổi.
4.3. Kiểm định Gleijser:
Xét mơ hình sau :
Ước lượng mơ hình có dạng:
Dependent Variable: ABS(RESID)
Method: Least Squares
Date: 03/27/21 Time: 15:16
Sample: 2005 2019
Included observations: 15
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
X
M
S
K
242.9257
-3.930924
-0.034044
0.005608
-0.000625
211.3024
3.794919
0.028607
0.005116
0.000894
1.149659
-1.035839
-1.190094
1.096194
-0.699211
0.2770
0.3247
0.2615
0.2987
0.5004
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
0.301967
0.022754
0.866747
7.512505
-16.09797
1.081492
0.415935
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Bài toán kiểm định:
20
1.495914
0.876779
2.813062
3.049079
2.810548
1.963563
Tiêu chuẩn kiểm định:
Nếu đúng thì
P- value = 0.415935 > 0,05 => Chấp nhận , bác bỏ
Kết luận: Mơ hình khơng có PSSS thay đổi.
5. Đa cộng tuyến:
5.1 Kiểm tra khuyết tật
a, R2 cao nhưng tỉ số t thấp:
Từ bảng kết quả Eviews:
Ta có:
R2 = 0.914195
tm = 3.849042
tx = 4,370126
ts = -3,947815
21
tk = -5.865098
Ta thấy rằng hệ số xác định bội R2 của mơ hình là rất gần 1, chứng tỏ mơ hình đưa ra
là hoàn toàn phù hợp. Các thống kê t đều có |t| >t12α/2 (2.179) => mơ hình khơng xảy ra
đa cộng tuyến.
b, Hệ số tương quan cặp giữa các biến giải thích cao:
Ta có bảng thể hiện hệ số tương quan cặp giữa các biến:
Y
1.000000
0.720938
0.593883
0.712189
0.459212
Y
X
M
S
K
X
0.720938
1.000000
0.769004
0.974363
0.914242
M
0.593883
0.769004
1.000000
0.892852
0.606566
S
0.712189
0.974363
0.892852
1.000000
0.856363
K
0.459212
0.914242
0.606566
0.856363
1.000000
Ta thấy:
|r(X,S)|= 0,974363 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến X và S
|r(X,K)|= 0,914242 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến X và K
|r(S,K)|= 0,856363 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến S và K
|r(S,M)|= 0.892852 > 0,8 cao nên có thể có quan hệ tuyến tính giữa 2 biến S và M
=> có cơ sở kết luận có đa cộng tuyến trong mơ hình.
c, Xét hồi quy phụ:
*Tiến hành hồi quy X theo M:
Dependent Variable: X
Method: Least Squares
Date: 03/26/21 Time: 17:25
Sample: 1 15
Included observations: 15
Variable
Coefficient
C
M
-34.41946
0.011725
R-squared
0.591367
Adjusted R-squared 0.559933
S.E. of regression
2.162334
Sum squared resid
60.78394
Log likelihood
-31.77864
F-statistic
18.81336
Prob(F-statistic)
0.000805
Std. Error
t-Statistic
20.48655 -1.680100
0.002703 4.337437
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Bài toán kiểm định:
22
Prob.
0.1168
0.0008
54.40667
3.259594
4.503819
4.598226
4.502814
0.652634
Tiêu chuẩn kiểm định: F = Ho đúng F(k-2,n-k+1)
P-giá trị= 0.0008 < 0,05 -> bác bỏ giả thuyết Ho -> Mơ hình xảy ra hiện tượng đa cộng
tuyến
*Tiến hành hồi quy X theo S:
Dependent Variable: X
Method: Least Squares
Date: 03/26/21 Time: 17:30
Sample: 1 15
Included observations: 15
Variable
C
S
Coefficient
Std. Error
t-Statistic
Prob.
15.91754
0.000933
2.472669
5.97E-05
6.437393
15.61520
0.0000
0.0000
R-squared
0.949384
Adjusted R-squared 0.945490
S.E. of regression
0.761028
Sum squared resid
7.529132
Log likelihood
-16.11455
F-statistic
243.8346
Prob(F-statistic)
0.000000
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
54.40667
3.259594
2.415273
2.509680
2.414268
0.708835
Bài toán kiểm định:
Tiêu chuẩn kiểm định: F = Ho đúng F(k-2,n-k+1)
P-giá trị= 0.0000 < 0,05 -> bác bỏ giả thuyết Ho -> Mơ hình xảy ra hiện tượng đa cộng
tuyến
*Tiến hành hồi quy X theo K:
Dependent Variable: X
Method: Least Squares
Date: 03/26/21 Time: 17:32
Sample: 1 15
Included observations: 15
Variable
C
K
Coefficient
Std. Error
t-Statistic
Prob.
47.12250
0.004276
0.962726
0.000526
48.94697
8.135739
0.0000
0.0000
R-squared
0.835838
Adjusted R-squared 0.823211
S.E. of regression
1.370540
Sum squared resid
24.41893
Log likelihood
-24.93889
F-statistic
66.19024
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
23
54.40667
3.259594
3.591852
3.686259
3.590847
0.846545
Prob(F-statistic)
0.000002
Bài toán kiểm định:
Tiêu chuẩn kiểm định: F = Ho đúng F(k-2,n-k+1)
P-giá trị= 0.0000 < 0,05 -> bác bỏ giả thuyết Ho -> Mơ hình xảy ra hiện tượng đa cộng
tuyến
5.2. Khắc phục đa cộng tuyến (Bỏ bớt biến độc lập)
|r(X,S)|= 0,974363 > 0,8 -> X và S có tương quan chặt chẽ. Nhiều thông tin về Y chứa
ở X cũng có thể chứa ở S. Vậy nếu bỏ 1 trong 2 biến X hoặc S thì sẽ giải quyết vấn đề
đa cộng tuyến nhưng một phần thông tin về Y sẽ mất đi.
*Hồi quy Y theo X:
Dependent Variable: Y
Method: Least Squares
Date: 03/26/21 Time: 17:39
Sample: 1 15
Included observations: 15
Variable
Coefficient
C
X
-6426.639
166.6948
R-squared
0.519751
Adjusted R-squared 0.482809
S.E. of regression
542.0172
Sum squared resid
3819175.
Log likelihood
-114.6403
F-statistic
14.06931
Prob(F-statistic)
0.002423
Std. Error
t-Statistic
2421.943 -2.653505
44.44118 3.750908
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
Prob.
0.0199
0.0024
2642.667
753.6811
15.55204
15.64645
15.55103
0.612437
*Hồi quy Y theo S:
Dependent Variable: Y
Method: Least Squares
Date: 03/26/21 Time: 17:40
Sample: 1 15
Included observations: 15
Variable
Coefficient
C
S
-3862.175
0.157642
R-squared
Adjusted R-squared
S.E. of regression
0.507214
0.469307
549.0467
Std. Error
t-Statistic
1783.917 -2.164997
0.043096 3.657950
Mean dependent var
S.D. dependent var
Akaike info criterion
24
Prob.
0.0496
0.0029
2642.667
753.6811
15.57781
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)
3918880.
-114.8336
13.38060
0.002893
Schwarz criterion
15.67222
Hannan-Quinn criter. 15.57680
Durbin-Watson stat
0.655551
Từ hai bảng kết quả, ta có:
R2 khi loại bỏ biến X = 0,519751
R2 khi loại bỏ biến S = 0,507214
=> vậy ta có thể loại bỏ biến X ra khỏi mơ hình để khắc phục hiện tượng đa cộng
tuyến. Theo đó, sẽ khơng cịn hiện tượng đa cộng tuyến giữa X và K.
|r(S,K)|= 0,856363 > 0,8 -> K và S có tương quan chặt chẽ. Nhiều thơng tin về Y chứa
ở K cũng có thể chứa ở S. Vậy nếu bỏ 1 trong 2 biến K hoặc S thì sẽ giải quyết vấn đề
đa cộng tuyến nhưng một phần thông tin về Y sẽ mất đi.
*Hồi quy Y theo K:
Dependent Variable: Y
Method: Least Squares
Date: 03/26/21 Time: 17:46
Sample: 1 15
Included observations: 15
Variable
C
K
Coefficient
Std. Error
t-Statistic
Prob.
1796.695
0.496618
488.0493
0.266447
3.681380
1.863853
0.0028
0.0851
R-squared
0.210875
Adjusted R-squared 0.150173
S.E. of regression
694.7888
Sum squared resid
6275509.
Log likelihood
-118.3649
F-statistic
3.473948
Prob(F-statistic)
0.085081
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat
2642.667
753.6811
16.04866
16.14307
16.04765
0.653662
Từ bảng kết quả, ta có:
R2 khi loại bỏ biến K = 0,210875
R2 khi loại bỏ biến S = 0,507214
=> vậy ta có thể loại bỏ biến S ra khỏi mơ hình để khắc phục hiện tượng đa cộng
tuyến. Theo đó, sẽ khơng cịn hiện tượng đa cộng tuyến giữa S và M.
Như vậy sau khi kiểm tra tự tương quan thì nhóm loại đi 2 biến đó là S và X
25