Tải bản đầy đủ (.docx) (35 trang)

dự báo doanh thu thuần của công ty cổ phần sữa việt nam từ quý 3 – 2018 đến quý 4 – 2020

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.03 MB, 35 trang )

PHẦN 1: MÔ TẢ SỐ LIỆU
Số liệu được sử dụng là doanh thu thuần của Vinamilk từ quý 1 – 2006 đến quý 2 2018 (đơn vị: triệu VND), được nhóm tổng hợp từ trang .
Nhấn đúp vào chuỗi rev để mở cửa sổ Series: REV
Trên cửa sổ Series: REV vào View/ Descriptive Statistics & Tests/ Stats Table,

ta có bảng mô tả thống kê như sau:
Một số mô tả thống kê quan trọng:


Số quan sát

(Observations): 50


Giá trị trung

bình

(Mean):

6533686


Giá trị lớn

nhất

(Maximum):

13702481
 Giá trị nhỏ nhất (Minimum): 1284717


 Độ lệch chuẩn (Std. Dev.): 4038195

Trên cửa sổ Series: REV vào View/ Graph,

2


ta có biểu đồ mô tả số liệu
rev
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
06

07

08

09

10

11

12


13

14

15

16

17

18

19

20


PHẦN 2: DỰ BÁO DOANH THU CỦA VINAMILK
Trong bài tiểu luận này, nhóm tiểu luận dùng phần mềm Eviews để dự báo chuỗi
rev (chuỗi số liệu doanh thu thuần của Vinamilk) từ quý 3 năm 2018 đến quý 4 năm 2020
(2018Q3 2020Q4) bằng nhiều phương pháp khác nhau.
2.1

Các phương pháp dự báo giản đơn
2.1.1 Dự báo bằng phương pháp san mũ

San mũ là việc loại bỏ các yếu tố ngẫu nhiên để nhìn thấy bản chất của chuối giúp
việc dự báo trở nên dễ dàng hơn.
Phương pháp san mũ đơn loại bỏ yếu tố ngẫu nhiên và dự báo giá trị mẫu (predict)

nhưng không thể giúp dự báo ngoài mẫu (forecast).
Phương pháp san mũ kép là việc lặp lai 2 lần của san mũ đơn. Phương pháp này có
thể dự báo ngoài mẫu.
Trên cửa sổ Series: REV, vào Proc/ Exponential Smoothing/ Simple Exponential
Smoothing:


Trên cửa sổ Exponential Smoothing, trong phần Smoothing method, chọn Double.
Chuỗi san kép là chuỗi revd.

Ta thu được kết quả dự báo sau:
Date: 09/26/18 Time: 21:16
Sample: 2006Q1 2018Q2
Included observations: 50
Method: Double Exponential
Original Series: REV
Forecast Series: REVD
Parameters: Alpha
Sum of Squared Residuals
Root Mean Squared Error

0.2140
1.66E+13
576001.6

End of Period Levels:

13367301
254639.4


Mean
Trend

 Hằng số san kép:
 Chỉ số căn bậc hai của sai số bình phương trung bình là RMSE = 576001,6.


Trên cửa sổ Command dùng lệnh line rev revd có biểu đồ sau
20,000,000

16,000,000

12,000,000

8,000,000

4,000,000

0
06

07

08

09

10

11


12

13

rev

14

15

16

17

18

19

20

REVD

2.1.2 Dự báo bằng phương pháp san mũ Holt
a. Tổng quan về phương pháp
Phương pháp san mũ Holt dùng để dự báo chuỗi có yếu tố xu thế T bằng cách loại
bỏ được yếu tố xu thế T.
Ký hiệu:
là ước lượng của phần xu thế ở thời kỳ t
là ước lượng giá trị trung bình hiện tại của Y ở thời kì t

là giá trị dự báo của Y sau h giai đoạn trong tương lai
Ta có

Với là hằng số san sao cho RMSE nhỏ nhất.
b. Áp dụng
Trên cửa sổ Series: REV, vào Proc/ Exponential Smoothing/ Simple Exponential
Smoothing.
Trên cửa sổ Exponential Smoothing trong phần Smoothing method, chọn HoltWinters-No seasonal.


Chuỗi san Holt là chuỗi revh

Ta thu được kết quả dự báo sau:
Date: 09/26/18 Time: 21:23
Sample: 2006Q1 2018Q2
Included observations: 50
Method: Holt-Winters No Seasonal
Original Series: REV
Forecast Series: REVH
Parameters:

Alpha
Beta
Sum of Squared Residuals
Root Mean Squared Error

0.2100
1.0000
1.51E+13
550318.9


End of Period Levels:

13006364
-48916.19

Mean
Trend

 Hằng số san : α = 0,2100; β = 1,0000
 Chỉ số căn bậc hai của sai số bình phương trung bình RMSE = 550318,9.
Trên cửa sổ Command dùng lệnh line rev revh có biểu đồ sau


14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
06

07

08

09


10

11

12
rev

13

14

15

16

17

18

19

20

REVH

2.1.3 Dự báo bằng phương pháp san mũ Winters
a. Tổng quan về phương pháp
Phương pháp san mũ Winters dùng để dự báo các chuỗi có chứa cả yếu tố xu thế và
yếu tố mùa vụ.
Ký hiệu:

là ước lượng của phần xu thế ở thời kỳ t
là ước lượng giá trị trung bình hiện tại của Y ở thời kì t
là giá trị dự báo của Y sau h giai đoạn trong tương lai
là yếu tố thời vụ tại thời điểm t (Chỉ số mùa vụ qua các năm là không
đổi)
k

là số thời vụ trong một năm

.

yếu tố thời vụ tại thời điểm t của thời kỳ trước

Đầu tiên chúng ta phải xác định dạng mô hình của chuỗi:
Mô hình nhân:
Mô hình cộng:
Từ đó, ta có giá trị ước lượng trung bình hiện tại là:
Mô hình nhân:
Mô hình cộng:


Ước lượng giá trị xu thế T là:
Ước lượng giá trị chỉ số mùa vụ là:
Mô hình nhân:
Mô hình cộng:
Như vậy, ta có dự báo h giai đoạn trong tương lai là
Mô hình nhân:
Mô hình cộng:
(với là chỉ số mùa vụ của năm cần dự báo)
b. Áp dụng

rev
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
06

07

08

09

10

11

12

13

14

15

16


17

18

19

20

Từ đồ thị của chuỗi rev, ta thấy chuỗi có xu hướng tăng dần dốc lên theo thời gian.
Vậy ta sử dụng mô hình nhân.
Trên cửa sổ Series: REV, vào Proc/ Exponential Smoothing/ Simple Exponential
Smoothing.
Trên cửa sổ Exponential Smoothing trong phần Smoothing method, chọn HoltWinters – Muliplicative.
Chuỗi san Winters là chuỗi revw


Ta thu được kết quả dự báo:
Date: 09/19/18 Time: 21:38
Sample: 2006Q1 2018Q2
Included observations: 50
Method: Holt-Winters Multiplicative Seasonal
Original Series: REV
Forecast Series: REVW
Parameters:

Alpha
Beta
Gamma
Sum of Squared Residuals

Root Mean Squared Error

0.3700
0.8101
0.0300
4.65E+12
305032.7

End of Period Levels:

12948329
-8995.349
1.026821
0.977690
0.940517
1.054971

Mean
Trend
Seasonals: 2017Q3
2017Q4
2018Q1
2018Q2

 Hằng số san: α = 0,3700; β = 0,8100; γ = 0,0300
 Chỉ số căn bậc hai của sai số bình phương trung bình RMSE = 305032,7.
 Chỉ số mùa vụ qua các năm không đổi và bằng:
S1
S2
S3

S4

0,940517
1,054971
1,026821
0,977690


Trên cửa sổ Command dùng lệnh line rev revw có biểu đồ sau:
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
06

07

08

09

10

11

12


13

rev

2.2

14

15

16

17

18

19

20

REVW

Dự báo bằng phương pháp phân tích

a. Quy trình: gồm 4 bước:
Bước 1: Nhận dạng dữ liệu
Xác định chuỗi thuộc mô hình nhân hay mô hình cộng.
Tính CMA4 (nếu số liệu theo quý) hoặc CMA12 (nếu số liệu theo tháng)
Bước 2: Tách yếu tố mùa vụ

Tách yếu tố mùa vụ ra khỏi chuỗi thu được chuỗi mới là
Đối với mô hình nhân:

tính các tỉ số

Đối với mô hình cộng:

tính các hiệu

Phương pháp MA có thể tách ảnh hưởng của cả 2 yếu tố chu kỳ (C) và (I) để chuỗi
chỉ còn phụ thuộc yếu tố xu thế (T) để dễ dàng ước lượng.
Bước 3: Ước lượng chuỗi bằng hàm xu thế và dự báo chuỗi hiệu chỉnh.
Tính giá trị trung bình chênh lệch:
Đối với mô hình nhân: tính = x
Đối với mô hình cộng: tính x


Tính chỉ số mùa vụ:
Đối với mô hình nhân: =
Đối với mô hình cộng:
Bước 4: Dự báo chuỗi gốc
Nhân hoặc cộng chuỗi hiệu chỉnh với chỉ số mùa vụ để dự báo chuỗi gốc
Đối với mô hình nhân:

=

Đối với mô hình cộng:
b. Áp dụng
Bước 1: Xác định dạng chuỗi
Ta đã xác định được chuỗi thuộc dạng mô hình nhân (như đã kết luận ở phần III)

b, Bước 2: Tách yếu tố mùa vụ
Trên cửa sổ Series: REV, vào Seasonal Adjustment/ Moving Average Methods

Trên cửa sổ Seasonal Adjustment trong phần Adjustment methods chọn Ratio to
moving average-Multiplicative
Chuỗi đã tách yếu tố mùa vụ là revsa, chỉ số mùa vụ là sr.


Ta có kết quả chỉ số mùa vụ như sau:
Date: 09/26/18 Time: 22:31
Sample: 2006Q1 2020Q4
Included observations: 50
Ratio to Moving Average
Original Series: REV
Adjusted Series: REVSA
Scaling Factors:
1
2
3
4

0.915859
1.053087
1.037259
0.999585

Kết quả thu được ở phần Scaling Factors là chỉ số mùa vụ sr qua từng quý.
Bước 3: Ước lượng chuỗi revsa theo hàm xu thế
Ước lượng revsa theo biến T
Trên cửa sổ Command

Gõ lệnh genr t=@trend(2006Q1) để tạo biến xu thế t
Gõ lệnh LS revsa c t để ước lượng revsa theo biến t


Dependent Variable: REVSA
Method: Least Squares
Date: 09/26/18 Time: 22:33
Sample (adjusted): 2006Q1 2018Q2
Included observations: 50 after adjustments
Variable

Coefficient

Std. Error

t-Statistic

Prob.

C
T

-144357.5
272360.0

179250.0
6304.043

-0.805342
43.20403


0.4246
0.0000

R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.974929
0.974407
643275.0
1.99E+13
-738.6428
1866.588
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6528463.
4021020.
29.62571

29.70219
29.65483
0.330894

Ta có mô hình hồi quy:
Kiểm định giả thuyết thống kê về hệ số hồi quy
Cặp giả thuyết:
Với mức ý nghĩa α cho trước, nếu P-value < α thì bác bỏ H0
Theo kết quả ước lượng, với α = ta thấy:
Hệ số chặn của t có
 Bác bỏ H0, chấp nhận H1
 Hệ số hồi quy của T có ý nghĩa thống kê
 Mô hình có ý nghĩa thống kê tại mức ý nghĩa
(vì mô hình chỉ có biến độc lập duy nhất T)
Kiểm định bỏ sót biến
Cặp giả thuyết:
Trên cửa sổ ước lượng vào Stability Diagnostics/ Ramsey RESET Test


Ta có kết quả
Ramsey RESET Test
Equation: UNTITLED
Specification: REVSA C T
Omitted Variables: Squares of fitted values

t-statistic
F-statistic
Likelihood ratio

Value

6.390303
40.83598
31.26618

df
47
(1, 47)
1

Theo kết quả kiểm định ta thấy
 Bác bỏ H0, thừa nhận H1.
 OLS bị vi phạm, mô hình bị bỏ sót biến.
Ước lượng lại revsa theo t, t2, t3
Trên cửa số Command gõ lệnh LS revsa c t t^2 t^3

Probability
0.0000
0.0000
0.0000


Dependent Variable: REVSA
Method: Least Squares
Date: 09/26/18 Time: 22:58
Sample (adjusted): 2006Q1 2018Q2
Included observations: 50 after adjustments
Variable

Coefficient


Std. Error

t-Statistic

Prob.

C
T
T^2
T^3

1583024.
-52955.46
13244.91
-148.7933

164182.0
29312.69
1398.158
18.74674

9.641880
-1.806571
9.473113
-7.937025

0.0000
0.0774
0.0000
0.0000


R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
F-statistic
Prob(F-statistic)

0.994338
0.993969
312265.5
4.49E+12
-701.4428
2692.983
0.000000

Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
Hannan-Quinn criter.
Durbin-Watson stat

6528463.
4021020.
28.21771
28.37068
28.27596
1.350956


Mô hình:
Kiểm định giả thuyết thống kê về hệ số hồi quy
Cặp giả thuyết:
Với mức ý nghĩa α cho trước, nếu P-value < α thì bác bỏ H0.
Theo kết quả ước lượng, với α = 0,05 ta thấy:
Biến
t
t2
t3

p-value
0.0774 > 0,05
0.000 < 0,05
0.00 < 0,05

Ho
Không bác bỏ
Bác bỏ
Bác bỏ

Kết luận
Không có ý nghĩa thống kê
Có ý nghĩa thống kê
Có ý nghĩa thống kê

Hệ số hồi quy của biến t không có ý nghĩa thống kê nhưng không có cơ sở để loại
biến t khỏi mô hình.
Mô hình có ý nghĩa thống kê tại mức ý nghĩa vì có hai hệ số hồi quy của biến độc
lập khác 0.

Kiểm định bỏ sót biến
Giả thuyết thống kê:
Trên cửa sổ ước lượng vào Stability Diagnostics/ Ramsey RESET Test


Ramsey RESET Test
Equation: UNTITLED
Specification: REVSA C T T^2 T^3
Omitted Variables: Squares of fitted values
Value
0.566738
0.321192
0.355612

t-statistic
F-statistic
Likelihood ratio

df
45
(1, 45)
1

Probability
0.5737
0.5737
0.5510

Theo kết quả kiểm định ta thấy
 Không có cơ sở bác bỏ H0.

 OLS không bị vi phạm, mô hình không bị bỏ sót biến.
Kiểm định phân phối chuẩn của nhiễu.
Cặp giả thuyết:
Trên cửa sổ ước lượng vào View/ Residual Diagnostics/ Histogram Normality Test
12

Series: Residuals
Sample 2006Q1 2018Q2
Observations 50

10
8
6
4

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

3.13e-09
11062.21
936041.9
-827674.2
302555.4
0.238853
4.111550


Jarque-Bera
Probability

3.049472
0.217679

2
0
-800000

-400000

0

400000

800000

Theo kết quả kiểm định ta thấy
 Không có cơ sở bác bỏ H0  Nhiễu phân phối chuẩn.
Kiểm định phương sai sai số thay đổi
Cặp giả thuyết:


Trên cửa sổ ước lượng vào View/ Residual Diagnostics/ Heteroskedasticity Test

Trên cửa sổ Heteroskedasticity Test chọn White



Ta có kết quả:
Heteroskedasticity Test: White
Null hypothesis: Homoskedasticity
F-statistic
Obs*R-squared
Scaled explained SS

0.838119
5.235114
6.893640

Prob. F(6,43)
Prob. Chi-Square(6)
Prob. Chi-Square(6)

0.5475
0.5140
0.3308

Theo kết quả kiểm định ta thấy:
 Không có cơ sở bác bỏ H0.
 Mô hình không có phương sai sai số thay đổi tại mức ý nghĩa α = 0,05.
Kiểm định tự tương quan
Cặp giả thuyết:
Trên cửa sổ ước lượng vào View/ Residual Diagnostics/ Serial Correlation LM test

Ta có kết quả sau
Breusch-Godfrey Serial Correlation LM Test:
Null hypothesis: No serial correlation at up to 2 lags
F-statistic

Obs*R-squared

4.292170
8.162449

Prob. F(2,44)
Prob. Chi-Square(2)

0.0198
0.0169


Theo kết quả kiểm định ta thấy
 Bác bỏ H0, chấp nhận H1
 Mô hình mắc khuyết tật tự tương quan tại mức ý nghĩa .
Trên cửa sổ ước lượng chọn Estimate

Trên cửa sổ Estimate Equation trong phần Methods chọn ROBUSTLS - Robust least
squared

Lúc này, ta đã dùng hồi quy Robust để kiểm soát khuyết tật phương sai sai số thay
đổi.


Dependent Variable: REVSA
Method: Robust Least Squares
Date: 09/27/18 Time: 00:21
Sample (adjusted): 2006Q1 2018Q2
Included observations: 50 after adjustments
Method: M-estimation

M settings: weight=Bisquare, tuning=4.685, scale=MAD (median centered)
Huber Type I Standard Errors & Covariance
Variable

Coefficient

Std. Error

z-Statistic

Prob.

C
T
T^2
T^3

1580711.
-54787.58
13419.90
-152.1858

158549.3
28307.03
1350.190
18.10357

9.969839
-1.935476
9.939269

-8.406395

0.0000
0.0529
0.0000
0.0000

Bước 4: Dự báo chuỗi gốc

Trên cửa sổ ước lượng, ta chọn Forecast.

Trên cửa sổ Forecast
trong phần Forecast Sample chọn mẫu từ 2006Q1 2018Q2
trong phần Output/ Graph chọn Forecast & Actuals


Ta có kết quả sau:
14,000,000
14,000,000

Forecast: REVSAF
Forecast: REVSAF
Actual: REVSA
Actual: REVSA
Forecast sample: 2006Q1 2018Q2
Forecast sample: 2006Q1 2018Q2
10,000,000
10,000,000
Included observations: 50
Included observations: 50

Root
Mean Squared Error 300176.3
8,000,000
Root Mean Squared Error 300176.3
8,000,000
Mean
Absolute
Error
235812.9
Mean
Absolute
Error
235812.9
6,000,000
Mean
Abs.
Percent
Error
6,000,000
Mean
Abs.
Percent
Error 4.877383
4.877383
Theil
Inequality
Coef.
0.019651
Theil Inequality Coef. 0.019651
4,000,000

4,000,000
Bias
Proportion
0.000630
Bias
Proportion
0.000630
Variance
Proportion
0.004967
Variance
Proportion
0.004967
2,000,000
2,000,000
Covariance
Proportion
Covariance
Proportion 0.994403
0.994403
Theil
U2U2
Coefficient
0.769027
0 0
Theil
Coefficient
0.769027
06 06 07 07 08 08 09 09 10 10 11 11 12 12 13 13 14 14 15 15 16 16 17 1718 18 Sym
metric

MAPE
4.884195
Sym
metric
MAPE
4.884195
12,000,000
12,000,000

REVSAF
REVSAF

Actuals
Actuals

2 S.E.
± 2 ±S.E.

Nhìn vào kết quả dự báo trong mẫu ta thấy:
Mean Abs. Percent Error = 4.877383 < 5
Tức là sai số dự báo < 5%,  Có thể sử dụng mô hình này để dự báo ngoài mẫu.
Mở lại cửa sổ Forecast
Trong phần Forecast sample chọn mẫu 2018Q3 2020Q4.
Ta thu được chuỗi dự báo revsaf.
Ta lấy chuỗi revsaf nhân với chỉ số mùa vụ sr sẽ được chuỗi dự báo revf.
Trên cửa sổ Command gõ lệnh genr revf=revsaf*sr
Trên cửa sổ Command gõ lệnh line revf rev thu được kết quả:


16,000,000

14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
06

07

08

09

10

11

12

13

rev

2.3

14


15

16

17

18

19

20

REVF

Dự báo bằng mô hình ARIMA

a. Tổng quan về mô hình
Mô hình ARIMA bậc p, d, q là mô hình với:
AR(p) là mô hình tự tương quan bậc p
Y(d) là chuỗi dừng khi lấy sai phân bậc d
MA(q) là mô hình trung bình trượt bậc q
có phương trình là:
b. Các bước tiến hành
Bước 1: Kiểm tra tính dừng của chuỗi cần dự báo
 Đối với chuỗi thường: kiểm tra tính dừng của chuỗi gốc và tiến hành dự báo
ARIMA với chuỗi gốc.
 Đối với chuỗi có tính mùa vụ: tách yếu tố mùa vụ khỏi chuỗi gốc, sau đó kiểm tra
tính dừng của chuỗi tách và tiến hành dự báo ARIMA với chuỗi tách.
 Đối với chuỗi có tính xu thế: kiểm tra tính dừng của chuỗi gốc (với là phần dư),
sau đó kiểm tra tính dừng của chuỗi và tiến hành dự báo ARIMA với chuỗi .

Bước 2: Xác định độ trễ p, q.


Bước 3: Kiểm tra các điều kiện giả định của mô hình:
 Mô hình khả nghịch và ổn định (nghiệm đơn vị của các mô hình hồi quy phụ < 1).
 Nhiễu trắng (nhiễu không tự tương quan).
 Chất lượng dự báo.
Bước 4: Dự báo ngoài mẫu
 Đối với chuỗi có yếu tố mùa vụ: Nhân hoặc cộng chuỗi dự báo đã hiệu chỉnh với
chỉ số mùa vụ để dự báo chuỗi gốc.
 Đối với chuỗi có yếu tố xu thế: Tạo biến là dự báo của chuỗi .
c. Áp dụng
Bước 1: Kiểm tra tính mùa vụ và tách yếu tố mùa vụ nếu có
Trên cửa sổ Series: REV vào View/ Graph

Trên cửa sổ Graph Options chọn Seasonal Graph


Ta có biểu đồ sau
rev by Season
14,000,000
12,000,000
10,000,000
8,000,000
6,000,000
4,000,000
2,000,000
0
Q1


Q2

Q3

Q4

Means by Season

Các vạch đỏ trong hình là giá trị trung bình của từng mùa. Nếu các vạch này chênh
nhau càng nhiều thì tính mùa vụ càng rõ ràng. Ở đây, ta thấy các vạch đỏ không chênh
nhau nhiều, tuy nhiên vẫn có sự sai lệch chứng tỏ chuỗi giá trị sử dụng có yếu tố mùa vụ.
Ta sẽ tiến hành dự báo cho chuỗi rev bằng cách tách yếu tố mùa vụ.
Ta đã xác định được chuỗi thuộc dạng mô hình nhân (như đã kết luận ở phần III).
Tiến hành tách yếu tố mùa vụ (theo phần IV.2b) ta thu được chuỗi revsa.
Kiểm định tính dừng của chuỗi revsa
Cặp giả thuyết:
Trên cửa sổ Series: REVSA vào View/ Unit Root Tests/ Standard Unit Root Test

Trên cửa sổ Unit Root Test, phần Test for unit root in chọn Level



×