Bài tập “ Tìm hiểu sự biến đổi lượng khách quốc tế đến Việt Nam từ tháng 1/2006 đến
tháng 8/2016
A. Mô tả số liệu
Bảng: Lượng khách quốc tế đến Việt Nam từ tháng 1/2006 tháng 8/2016
X
Y( nghìn
lượt người)
X
Y(nghìn
lượt người)
X
Y(nghìn
lượt người)
2006M1
2006M2
2006M3
2006M4
2006M5
2006M6
2006M7
2006M8
2006M9
2006M10
2006M11
2006M12
2007M1
2007M2
2007M3
2007M4
2007M5
2007M6
2007M7
2007M8
2007M9
2007M10
2007M11
2007M12
2008M1
2008M2
2008M3
2008M4
2008M5
2008M6
2008M7
337.048
336
304.737
321.724
272.934
274.07
271.435
288.148
271.188
276
305.577
324.625
369.017
380
362.336
350.878
320.235
335
340.297
356
331.039
332.762
359.225
392.56
399.556
411.032
414.332
395.9
366.387
352.945
332.096
2010M1
2010M2
2010M3
2010M4
2010M5
2010M6
2010M7
2010M8
2010M9
2010M10
2010M11
2010M12
2011M1
2011M2
2011M3
2011M4
2011M5
2011M6
2011M7
2011M8
2011M9
2011M10
2011M11
2011M12
2012M1
2012M2
2012M3
2012M4
2012M5
2012M6
2012M7
416.249
446.323
473.509
432.608
350.982
375.707
410
427.935
383.463
440.071
428.295
449.57
506.424
542.671
475.733
460
480.886
446.996
460
490
286.618
518.477
611.864
593.408
630
681.849
561.877
615.523
456.749
417.429
466
2014M1
2014M2
2014M3
2014M4
2014M5
2014M6
2014M7
2014M8
2014M9
2014M10
2014M11
2014M12
2015M1
2015M2
2015M3
2015M4
2015M5
2015M6
2015M7
2015M8
2015M9
2015M10
2015M11
2015M12
2016M1
2016M2
2016M3
2016M4
2016M5
2016M6
2016M7
776.174
842.026
709.725
745.98
674.204
539.776
564.736
618.588
590.881
559.002
608.617
657.304
700.692
756
617.895
690.44
576.868
529.445
593.566
664.985
626.324
649.099
732.74
760.798
805.072
833.598
820.48
789.484
757.244
700.446
846.311
2008M8
342.461
2012M8
525.292
2016M8
899.738
2008M9
286.389
2012M9
460.238
2008M10
296.742
2012M10
495.576
2008M11
279.904
2012M11
655.701
2008M12
358.048
2012M12
614.673
2009M1
345.84
2013M1
651.812
2009M2
342.913
2013M2
570.476
2009M3
303.489
2013M3
587.366
2009M4
329.371
2013M4
613.919
2009M5
292.842
2013M5
558.751
2009M6
279.147
2013M6
567.291
2009M7
271.422
2013M7
658.325
2009M8
310.786
2013M8
676.719
2009M9
304.419
2013M9
614.827
2009M10
220.78
2013M10
628.695
2009M11
368.575
2013M11
731.034
2009M12
377.847
2013M12
722.449
Nguồn số liệu: />1. Đồ thị
SER01
1,000
900
800
700
600
500
400
300
200
06
07
08
09
10
11
12
13
14
15
16
Nhìn vào đồ thị ta thấy lượng khách du lịch đến Việt Nam có xu hướng tăng qua các
năm. Trong các năm có sự biến động qua các tháng, lượng khách đến cao hơn vào đầu
năm và cuối năm. Chuỗi có thể có tính thời vụ. Để biết chắc chắn ta đi vào xây dựng và
kiểm định mô hình.
B. Xây dựng mô hình và lựa chọn mô hình dự báo tốt nhất cho chuỗi số liệu
1. Mô hình xu thế tuyến tính
Mô hình tổng quát: Yt= β0+β1*TIMEt
Trong đó: β0, β1 : các hệ số
TIMEt : biến thời gian
Yt: lượng khách quốc tế đến Việt Nam tại thời điểm t
Bảng kết quả mô hình dự báo
Dependent Variable: SER01
Method: Least Squares
Date: 09/08/16 Time: 09:24
Sample: 2006M01 2016M03
Included observations: 123
Variable
Coefficie
nt Std. Error t-Statistic
Prob.
C
TIME
239.6600 13.72947 17.45589
3.885818 0.192163 20.22146
0.0000
0.0000
R-squared
Adjusted Rsquared
0.771658
Mean dependent var 480.5808
0.769771
157.7040
S.D. dependent var
Akaike info
S.E. of regression 75.66982 criterion
Sum squared resid 692836.5 Schwarz criterion
Hannan-Quinn
Log likelihood
-705.6659 criter.
F-statistic
408.9073 Durbin-Watson stat
11.50676
11.55249
11.52534
0.634317
Vậy ta có mô hình : Y= 239.66 + 3.885818* TIMEt
Kiểm định hệ số hồi quy ở mức ý nghĩa α = 5%
Có giá trị t tra bảng t(0.025,121) = 2.2696366
/tβ0 / = 17.45589 >2.2696366 . Vậy β0 có ý nghĩa thống kê
/tβ1/= 20.22146 > 2.2696366. Vậy β1 có ý nghĩa thống kê.
Kiểm định mô hình
Ta có = = 3.91946446
Fkđ= 408.9073 > 3.91946446 . Vậy mô hình có ý nghĩa thống kê ở mức ý nghĩa α= 5%
Ý nghĩa của các tham số
• β0 =239.66 cho biết nếu biến TIME nhận giá trị 0 thì số lượt khách du lịch quốc tế là
239.66 lượt khách
• β1 = 3.885818 cho biết khi TIME tăng 1 đơn vị thì số lượt khách du lịch quốc tế đến
Việt Nam tăng 3.885818 đơn vị
• R2 = 0.771658 cho biết biến TIME có thể dự báo được 77,1658% sự biến động của
số lượt khách du lịch nước ngoài đến Việt Nam.
Đồ thị mô hình xu thế tuyến tính
1,000
800
600
300
400
200
100
200
0
-100
-200
-300
2006
2007
2008
2009
2010
Residual
2011
Actual
2012
2013
2014
2015
Fitted
2. Mô hình xu thế bậc 2
Mô hình tổng quát có dạng: Yt= β0 + β1*TIMEt+ β2*TIMEt2
Trong đó: β0, β1, β2: các hệ số
TIMEt: biến thời gian
Yt: lượng khách quốc tế đến Việt Nam tại thời điểm t
Bảng kết quả mô hình dự báo
Dependent Variable: SER01
Method: Least Squares
Date: 09/08/16 Time: 09:25
Sample: 2006M01 2016M03
Included observations: 123
Variable
Coefficie
nt Std. Error t-Statistic
Prob.
C
TIME
TIME2
286.1927 20.11323 14.22908
1.652249 0.748812 2.206495
0.018013 0.005850 3.079070
0.0000
0.0293
0.0026
R-squared
Adjusted Rsquared
0.788378
Mean dependent var 480.5808
0.784851
157.7040
S.D. dependent var
Akaike info
S.E. of regression 73.14976 criterion
Sum squared resid 642106.5 Schwarz criterion
Hannan-Quinn
Log likelihood
-700.9894 criter.
F-statistic
223.5238 Durbin-Watson stat
Prob(F-statistic)
0.000000
11.44698
11.51557
11.47484
0.683382
Vậy ta có mô hình: Y= 286.1927 + 1.652249*TIME + 0.018013*TIME2
Kiểm định hệ số hồi quy ở mức ý nghĩa α = 5%
Có giá trị t tra bảng t(0.025,120) = 2.269875
/tβ0 / = 14.22908>2.269875. Vậy β0 có ý nghĩa thống kê
/tβ1/= 2.206495<2.269875. Vậy β1 không có ý nghĩa thống kê.
/tβ2/ = 3.079070>2.269875. Vậy β2 có ý nghĩa thống kê
Kiểm định mô hình
Ta có = = 3.071779
Fkđ= 223.5238>3.071779. Vậy mô hình có ý nghĩa thống kê ở mức ý nghĩa α= 5%
Đồ thị mô hình xu thế bậc 2
1,000
800
600
300
200
400
100
200
0
-100
-200
-300
2006
2007
2008
2009
2010
Residual
2011
Actual
2012
2013
2014
2015
Fitted
3. Mô hình xu thế dạng mũ
Yt = β0 *
Trong đó: β0, β1: các hệ số
TIMEt: biến thời gian
Yt: lượng khách quốc tế đến Việt Nam tại thời điểm t
Bảng kết quả mô hình dự báo
Dependent Variable: SER01
Method: Least Squares
Date: 09/08/16 Time: 12:44
Sample: 2006M01 2016M03
Included observations: 123
Convergence achieved after 19 iterations
SER01=C(1)*EXP(C(2)*TIME)
C(1)
C(2)
R-squared
Adjusted Rsquared
Coefficie
nt Std. Error t-Statistic
Prob.
276.8295 9.935950 27.86140
0.008217 0.000410 20.05198
0.0000
0.0000
0.785622
Mean dependent var 480.5808
0.783850
157.7040
S.D. dependent var
Akaike info
S.E. of regression 73.31961 criterion
Sum squared resid 650467.6 Schwarz criterion
Hannan-Quinn
Log likelihood
-701.7851 criter.
Durbin-Watson
stat
0.674667
11.44366
11.48939
11.46223
Kiểm định hệ số hồi quy ở mức ý nghĩa α = 5%
Có giá trị t tra bảng t(0.025,121) = 2.2696366
/tβ0 / = 27.86140>2.2696366 . Vậy β0 có ý nghĩa thống kê
/tβ1/= 20.05198> 2.2696366. Vậy β1 có ý nghĩa thống kê.
Đồ thị mô hình xu thế dạng mũ
1,000
800
600
300
200
400
100
200
0
-100
-200
-300
2006
2007
2008
2009
2010
Residual
2011
2012
Actual
2013
2014
2015
Fitted
4. So sánh để lựa chọn mô hình xu thế tốt nhất
Tiêu chí MH xu thế tuyến tính
AIC
11.50676
SE
75.66982
DW
0.634317
R²
0.771658
MH xu thế hàm bậc 2
MH xu thế dạng mũ
11.44698
73.14976
0.683382
0.788378
Từ bảng trên ta nhận thấy mô hình xu thế bậc 2 là mô hình dự báo tốt nhất cho chuỗi số
liệu
C. Kiểm định tính thời vụ (4 bước)
1. Bước 1: Dùng OLS hồi quy mô hình không ràng buộc UR
Tạo các biến giả Di trong đó i=1,2,3,…,12
Bảng kết quả mô hình hồi quy như sau:
Dependent Variable: SER01
Method: Least Squares
Date: 09/08/16 Time: 13:15
Sample: 2006M01 2016M03
Included observations: 123
Variable
Coefficie
nt Std. Error t-Statistic
Prob.
TIME
TIME2
D1
D2
D3
D4
D5
D6
D7
D8
D9
D10
D11
D12
2.001102
0.015145
339.5756
354.3483
303.9623
310.6290
246.3054
219.1988
240.3722
269.8120
211.3649
233.6222
296.1001
309.0900
0.609720
0.004764
23.13799
23.20077
23.25967
24.21421
24.28644
24.35450
24.41838
24.47811
24.53370
24.58520
24.63265
24.67609
0.0014
0.0019
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.0000
0.873707
Mean dependent var 480.5808
0.858644
157.7040
R-squared
Adjusted Rsquared
3.282001
3.178992
14.67610
15.27313
13.06821
12.82838
10.14168
9.000343
9.843907
11.02258
8.615288
9.502551
12.02064
12.52589
S.D. dependent var
Akaike info
S.E. of regression 59.29247 criterion
Sum squared resid 383200.1 Schwarz criterion
Hannan-Quinn
Log likelihood
-669.2433 criter.
Durbin-Watson
stat
0.668798
11.10965
11.42973
11.23967
Thu được SSR UR=383200.1
2. Bước 2: Dùng OLS hồi quy mô hình có ràng buộc R với già thuyết các hệ số mùa vụ
bằng nhau. Đó chính là hàm xu thế bậc 2.
Vậy thu được SSRR= 642106.5
3. Bước 3: Tính Fqs
Ta có : Fqs=
Trong đó : m: số rang buộc trong mô hình. m=11
k: số tham số trong mô hình. k=14
Vậy ta tính được Fqs= 6.695006
4. So sánh Fqs với F tra bảng
Ta có F0.05(13,109)=1.810979 < Fqs= 6.695006
Vậy mô hình có tính thời vụ
D. Thực hiện dự báo cho 5 quan sát còn lại ( Từ 2016M4 đến 2016M8)
Ta có mô hình hồi quy sau:
Yt= 2.001102*TIMEt + 0.015145*TIMEt2 + 339.5756*D1 + 354,3483*D2 +…+ 309.09D12
Dự báo điểm
Thay các giá trị của D và TIME, TIME2 vào để tính Y dự báo (YT+h)
Dự báo khoảng
Với độ tin cậy p=1-α của YT+h ta có
Cận dưới = Ŷt+h - σ^
Cận trên = Ŷt+h + σ^
Trong đó: Z: Giá trị tới hạn ở bảng chuẩn. Z = 1,96
σ^: Sai số chuẩn của hồi quy xu thế. σ^=59.29247
h: tầm xa của dự báo
Thực hiện trên Excel ta được bảng sau:
Thời gian Y thực tế
2016M4 789.484
2016M5 757.244
TIME
124
125
TIME2
15376
15625
Y dự báo
791.6352
733.0838
Cận dưới
675.4219
616.8705
Cận trên
907.8484
849.297
2016M6
2016M7
2016M8
700.446
846.311
899.738
126
127
128
15876
16129
16384
711.7797
738.7859
774.0887
595.5664
622.5726
657.8755
827.9929
854.9991
890.302
E. Vẽ đồ thị dự báo và đánh giá dự báo
Đồ thị dự báo
Đánh giá dự báo: Nhìn vào đồ thị trên ta thấy từ tháng 4/2016 đến tháng 6/2016, giá trị
dự báo tương đối gần với giá trị thực tế, từ tháng 6/2016 đến tháng 8/2016 giá trị dự báo
có sự chênh lệch so với giá trị thực tế nhưng chênh lệch nhỏ. Vậy mô hình dự báo này
khá tốt.