ỦY BAN NHÂN DÂN TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC SÀI GÒN
TRẦN VĂN QUỐC
NGUYỄN TRUNG PHÚ
KHAI THÁC DỮ LIỆU QUAN HỆ TRONG TÀI
CHÍNH BẰNG MÔ HÌNH ARIMA
KHÓA LUẬN TỐT NGHIỆP
NGÀNH: TOÁN ỨNG DỤNG
CHUYÊN NGÀNH: KINH TẾ ĐỊNH LƯỢNG
HỆ: ĐẠI HỌC
TP. HỒ CHÍ MINH, THÁNG 5 NĂM 2016
ỦY BAN NHÂN DÂN TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC SÀI GÒN
TRẦN VĂN QUỐC
NGUYỄN TRUNG PHÚ
KHAI THÁC DỮ LIỆU QUAN HỆ TRONG TÀI
CHÍNH BẰNG MÔ HÌNH ARIMA
KHÓA LUẬN TỐT NGHIỆP
GIẢNG VIÊN PHỤ TRÁCH: ThS. Trương Phúc Tuấn Anh
TP. HỒ CHÍ MINH, THÁNG 5 NĂM 2016
i
LỜI CAM ĐOAN
Chúng tôi xin cam đoan đây là đề tài do chúng tôi Trần Văn Quốc và Nguyễn
Trung Phú thực hiện dưới sự hướng dẫn của Thầy Th.S Trương Phúc Tuấn Anh.
Mọi số liệu thu thập được và kết quả của bài khóa luận chưa từng được công bố
ở bất cứ công trình nghiên cứu nào khác.
Chúng tôi xin chịu trách nhiệm về nghiên cứu của mình.
TP. Hồ Chí Minh, ngày 04 tháng 5 năm 2016
Sinh viên thực hiện
Nguyễn Trung Phú
Trần Văn Quốc
ii
LỜI CẢM ƠN
Lời đầu tiên, em xin được bày tỏ lời cảm ơn sâu sắc nhất đến tất cả các thầy cô
trong khoa Toán - ứng dụng trường Đại học Sài Gòn, đặc biệt là Thầy – Th.S
Trương Phúc Tuấn Anh và Thầy Lê Thái Sơn – những người đã tận tình hướng dẫn
chúng em trong suốt quá trình thực hiện khoá luận tốt nghiệp.
Em cũng xin gửi lời cảm ơn chân thành đến quý thầy cô đã tâm huyết giảng dạy
cho chúng em trong suốt những năm học vừa qua để chúng em có được cơ hội thực
hiện bài khoá luận này, với những kiến thức bổ ích ấy sẽ là hành trang giúp em
vững bước trong tương lai.
Cuối cùng em xin được cảm ơn các anh chị khoá trước, các bạn trong lớp
DTU1121, là những người luôn động viên, giúp đỡ chúng em vượt qua những khó
khăn trong quá trình tìm tòi và học hỏi để hoàn thành bài khoá luận này.
Với kiến thức còn hạn chế cũng như kinh nghiệm còn chưa nhiều, bài khóa luận
khó có thể tránh khỏi những thiếu xót, kính mong quý thầy cô góp ý nhận xét để em
có thể hoàn thiện bài khóa luận này tốt hơn nữa.
TP. Hồ Chí Minh, ngày 04 tháng 5 năm 2016
Sinh viên thực hiện
Nguyễn Trung Phú
Trần Văn Quốc
iii
MỤC LỤC
LỜI CAM ĐOAN…………………………………………………………………...i
LỜI CẢM ƠN………………………………………………………………............ii
MỤC LỤC…………………………………………………………………………iii
DANH MỤC CÁC TỪ VIẾT TẮT………………………………………………..v
DANH MỤC CÁC BẢNG………………………………………………………..vii
DANH MỤC CÁC HÌNH………………………………………………………..viii
DANH MỤC CÁC SƠ ĐỒ………………………………………………………...x
LỜI MỞ ĐẦU……………………………………………………………………...xi
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA ......................... 1
1.1. BÀI TOÁN DỰ BÁO ............................................................................................1
1.2. DỮ LIỆU CHUỖI THỜI GIAN ...............................................................................4
1.2.1. Khái niệm chuỗi thời gian thực ................................................................4
1.2.2. Thành phần xu hướng dài hạn ...................................................................5
1.2.3. Thành phần mùa ........................................................................................6
1.2.4. Thành phần chu kỳ ....................................................................................6
1.2.5. Thành phần bất thường .............................................................................7
1.3. MÔ HÌNH ARIMA ..............................................................................................7
1.3.1. Hàm tự tương quan ACF ............................................................................7
1.3.2. Hàm tự tương quan từng phần PACF .........................................................9
1.3.3. Mô hình AR(p) .........................................................................................10
1.3.4. Mô hình MA(q) ........................................................................................11
1.3.5. Sai phân I(d) .............................................................................................12
1.3.6. Mô hình ARIMA ......................................................................................13
iv
1.3.7. Bước phát triển mô hình ARIMA ............................................................15
1.4. PHẦN MỀM ỨNG DỤNG EVIEWS .......................................................................17
1.4.1. Giới thiệu Eviews .....................................................................................17
1.4.2.1. Xác định mô hình ...............................................................................25
1.4.2.2. Ước lượng mô hình ............................................................................26
1.4.2.3. Kiểm định đánh giá sự phù hợp và dự báo ........................................28
CHƯƠNG 2: THỰC TRẠNG CỦA VẤN ĐỀ NGHIÊN CỨU .................... 31
3.1. DỮ LIỆU TÀI CHÍNH ..........................................................................................31
3.2. ĐẶC ĐIỂM CỦA CHUỖI DỮ LIỆU........................................................................32
CHƯƠNG 3: THỰC NGHIỆM........................................................................ 34
3.1. Môi trường thực nghiệm..............................................................................34
3.3. Kiểm tra tính dừng của chuỗi chứng khoán PVD .......................................34
3.4. Nhận dạng mô hình .....................................................................................36
3.5. Ước lượng và kiểm định với mô hình ARIMA ...........................................38
3.6. Thực hiện dự báo .........................................................................................42
KẾT LUẬN ......................................................................................................... 46
TÀI LIỆU THAM KHẢO ................................................................................. 47
PHỤ LỤC ............................................................................................................ 48
v
DANH MỤC CÁC TỪ VIẾT TẮT
CTCP
: Công ty Cổ phần
CK
: Chứng Khoán
T
: Thành phần xu hướng dài hạn (Long –term Trend Component)
S
: Thành phần mùa (Seasional Component)
C
: Thành phần chu kỳ (Cyclical Component)
I
: Thành phần bất thường (Irregular Component)
ACF
: Hàm tự tương quan (Autocorrelation Function)
SACF
: Hàm tự tương quan mẫu
PACF
: Hàm tự tương quan từng phần (Partial Autocorrelation Function)
SPACF
: Hàm tự tương quan từng phần
AR(p)
: Tự hồi quy bậc p
I(d)
: Tích hợp bậc d
MA(q)
: Trung bình trượt bậc q
ARMA
: Tự hồi quy – Trung bình trượt
ARIMA
: Tự hồi quy – Tích hợp – Trung bình trượt
IARMA
: Tích hợp – Tự hồi quy – Trung bình trượt
AIC
: Tiêu chuẩn Akaike
BIC
: Tiêu chuẩn Schwarz
vi
MAE
: Trung bình sai số tuyệt đối
ESS
: Tổng bình phương sai số
MSE
: Trung bình bình phương sai số
RMSE
: Căn bậc hai trung bình bình phương sai số
MAPE
: Trung bình phần trăm sai lệch
vii
DANH MỤC CÁC BẢNG
TT
Tên bảng
Trang
1
Bảng 1. Xác định bậc p, q của mô hình ARMA
26
2
Bảng 2. Thống kê mô tả
33
3
Bảng 3. Tiêu chuẩn đánh giá các mô hình ARIMA
42
4
Bảng 4. Đánh giá kết quả dự báo
45
viii
DANH MỤC CÁC HÌNH
TT
Tên hình
Trang
1
Hình 1. Xu hướng tăng của sản lượng giai đoạn 1950 - 1960
5
2
Hình 2. Thành phần mùa
6
3
Hình 3. Thành phần chu kỳ
7
4
Hình 4. Màn hình chính Eviews 8.0
18
5
Hình 5. Thao tác tạo Workfile
19
6
Hình 6. Lựa chọn loại dữ liệu trong Workfile
19
7
Hình 7. Cách để mở cửa sổ Open
20
8
Hình 8. Cửa sổ Open trong Eviews
21
9
Hình 9. Cửa sổ Excel Read ở bước 1
21
10
Hình 10. Cửa sổ Excel Read ở bước 2
22
11
Hình 11. Cửa sổ Excel Read ở bước 3
22
12
Hình 12. Dữ liệu giá đóng cửa cổ phiếu PVD
23
13
Hình 13. Đồ thị giá đóng cửa
23
14
Hình 14. Biểu đồ tương quan giá đóng cửa
25
15
Hình 15. Ước lượng mô hình trong cửa sổ Equation Estimation
27
16
Hình 16. Kết quả ước lượng mô hình
27
17
Hình 17. Cửa sổ dự báo giá đóng cửa
29
18
Hình 18. Biểu đồ dao động của chuỗi dữ liệu
32
19
Hình 19. Biểu đồ giá đóng cửa cổ phiếu PVD
34
20
Hình 20. Chọn d = 0 và 11 độ trễ
35
21
Hình 21. Biểu đồ tương quan giá đóng cửa cổ phiếu PVD
35
22
Hình 22. Kiểm định nghiệm đơn vị chuỗi chưa sai phân
36
23
Hình 23. Dữ liệu chuỗi giá đóng cửa sai phân bậc 1
36
24
Hình 24. Biểu đồ giá đóng cửa sai phân bậc 1
37
25
Hình 25. Kiểm định nghiệm đơn vị chuỗi sai phân bậc 1
37
26
Hình 26. Biểu đồ tương quan giá đóng cửa sai phân bậc 1
38
ix
27
Hình 27. Ước lượng mô hình ARIMA(1,1,1)
39
28
Hình 28. Kết quả ước lượng mô hình ARIMA(1,1,1)
39
29
Hình 29. Kiểm tra tính nhiễu trắng của phần dư
40
30
Hình 30. Ước lượng mô hình ARIMA(1,1,2)
41
31
Hình 31. Ước lượng mô hình ARIMA(1,2,1)
41
32
Hình 32. Ước lượng mô hình ARIMA(1,2,3)
42
33
Hình 33. Cách thay đổi số lượng của dữ liệu quan sát
43
34
Hình 34. Tăng số lượng dữ liệu quan sát
43
35
Hình 35. Dự báo mô hình ARIMA(1,1,1)
44
36
Hình 36. Kết quả dự báo mô hình ARIMA(1,1,1)
44
x
DANH MỤC CÁC SƠ ĐỒ
TT
Tên sơ đồ
Trang
1
Sơ đồ 1. Phương pháp Box – Jenkin
16
2
Sơ đồ 2. Phương pháp Box – Jenkin tóm tắt
16
xi
LỜI MỞ ĐẦU
1. Lý do chọn đề tài
Với tình hình kinh tế đang phát triển trên thế giới và tình trạng nền kinh tế
trong nước gặp nhiều khó khăn, thử thách do tiến tới quá trình hội nhập trên trường
quốc tế và khu vực. Các kênh đầu tư như thị trường chứng khoán và thị trường bất
động sản đều chứa đựng những rủi ro rất lớn. Như trong thời gian từ cuối năm 2008
đến nay hầu như chỉ số chứng khoán giảm liên tục, đầu tư vào thị trường bất động
sản cũng khiến các nhà đầu tư thua lỗ rất nhiều. Do đó bài toán dự báo tài chính
ngày càng được nhiều người quan tâm trong bối cảnh phát triển kinh tế xã hội. Bởi
đầu tư vào thị trường chứng khoán đòi hỏi nhiều kinh nghiệm và hiểu biết từ các
nhà đầu tư. Các kĩ thuật khai phá dữ liệu được áp dụng từ các phần mềm và chương
trình chuyên dụng nhằm dự báo sự dao động của thị trường là một gợi ý có cơ sở
dựa trên nền tảng dữ liệu trước đó sẽ giúp các nhà đầu tư có thể ra quyết định trong
giao dịch.
2. Mục đích nghiên cứu
Mô hình ARIMA là một trong những ứng dụng được xây dựng với chức năng
nhận dạng mô hình, ước lượng tham số, kiểm định dữ liệu và đưa ra kết quả dựa
trên các tham số ước lượng đã được lựa chọn một cách tối ưu.
Tìm hiểu các bước phát triển mô hình ARIMA (phương pháp Box-Jenkin), nắm
được một số thao tác cơ bản, các bước thi hành mô hình ARIMA bằng Eviews 8.0
và áp dụng vào bài toán khai phá dữ liệu chuỗi thời gian trong dự báo tài chính,
chứng khoán.
3. Nội dung nghiên cứu
Trong khóa luận này, chúng tôi tập trung nghiên cứu các bước phát triển của
mô hình ARIMA và áp dụng mô hình này để tiến hành dự báo tài chính, chứng
khoán dưới sự hỗ trợ của phần mềm Eviews 8.0.
xii
4. Phương pháp nghiên cứu
Các phương pháp nghiên cứu được sử dụng trong đề tài:
x Phương pháp nghiên cứu định lượng
x Phương pháp phân tích, tổng hợp
x Phương pháp đánh giá
5. Tổng quan về đề tài
Với nội dung trình bày gồm những khái niệm cơ bản về mô hình ARIMA cho
chuỗi dữ liệu thời gian thực và cách áp dụng vào bài toán thực tế (dự báo sự dao
động của thị trường chứng khoán). Bố cục bài khóa luận được trình bày như sau:
Chương 1. CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA
Chương 2. THỰC TRẠNG CỦA VẤN ĐỀ NGHIÊN CỨU
Chương 3. THƯC NGHIỆM
1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT VÀ MÔ HÌNH ARIMA
Trong chương này, khóa luận đề cập đến lý thuyết cơ bản về chuỗi thời gian, cơ
sở lý thuyết và các yếu tố trong mô hình ARIMA như hàm tự tương quan ACF, hàm
tự tương quan từng phần PACF, mô hình tự hồi quy AR(p), mô hình trung bình
trượt MA(q), sai phân I(d). Giới thiệu các bước phát triển của mô hình ARIMA
(phương pháp Box - Jenkin), sơ lược về phần mềm Eviews 8.0 và một số thao tác
cơ bản phục vụ cho bài toán dự báo tài chính.
1.1. Bài toán dự báo
Cùng với sự phát triển không ngừng của khoa học kỹ thuật làm cho đời
sống, kinh tế - xã hội trong nhiều thập kỉ qua của chúng ta cũng tiến bộ không
ít. Điều này đồng nghĩa với việc ứng dụng các sản phẩm trí tuệ vào đời sống
con người ngày càng quen thuộc. Một trong những hành vi hữu ích cho nền
kinh tế - xã hội nước nhà qua nhiều năm nay chính là thu thập và lưu trữ số liệu
của từng thời điểm để ứng dụng vào quá trình phân tích và nghiên cứu thị
trường. Từ đó ta có thể phỏng đoán các định mức của các thời kỳ trong thời
gian tới sẽ ngày càng hoàn thiện hơn. Vì con người cho rằng quá trình đó ẩn
chứa những giá trị nhất định nào đó. Tuy nhiên trong phân tích thống kê, người
ta chỉ sử dụng một lượng nhỏ trong kho dữ liệu đó, số còn lại chúng ta chưa biết
phải làm gì với chúng nhưng chúng ta vẫn tiếp tục ghi nhận, thu thập vì trong
một giai đoạn nào đó chúng vẫn có ích khi ta cần đến. Mặt khác, trong môi
trường cạnh tranh, người ta ngày càng cần có nhiều thông tin với tốc độ nhanh để
trợ giúp việc ra quyết định và ngày càng có nhiều câu hỏi mang tính chất định tính
cần phải trả lời dựa trên một khối lượng dữ liệu khổng lồ đã có. Với những lý do
như vậy, các phương pháp quản trị và khai thác cơ sở dữ liệu truyền thống ngày
càng không đáp ứng được thực tế. Từ đó đã phát triển một khuynh hướng kỹ thuật
mới đó là kỹ thuật phát hiện tri thức và khai phá dữ liệu (KDD – Knowledge
Discovery and Data Mining).
2
Kỹ thuật phát hiện tri thức và khai phá dữ liệu đã và đang được nghiên cứu, ứng
dụng trong nhiều lĩnh vực khác nhau ở các nước trên thế giới, tại Việt Nam kỹ thuật
này tương đối còn mới mẻ tuy nhiên cũng đang được nghiên cứu và dần đưa vào
ứng dụng.
Kỹ thuật dự báo đã hình thành từ thế kỉ thứ 19, tuy nhiên dự báo có ảnh hưởng
mạnh mẽ khi công nghệ thông tin phát triển vì bản chất mô phỏng của các phương
pháp dự báo rất cần thiết sự hỗ trợ của máy tính.
Đặc biệt vào đầu những năm 1980 , phân tích chuỗi thời gian phát triển hết sức
sôi động. Sự phát triển này liên quan chặt chẽ đến cách thức mà kinh tế lượng thực
hành đã thực hiện. các phương pháp mới này được các nhà kinh tế lượng, các nhà
kinh tế vĩ mô, các chuyên gia về tài chính, các nhà chứng khoán, . . . đặc biệt quan
tâm. Chúng đã tạo ra một cuộc cách mạng trong mô hình hóa các quan hệ cân bằng,
các mô hình động.
Dự báo là một nhu cầu không thể thiếu cho những hoạt động của con người
trong bối cảnh bùng nổ thông tin trong nền kinh tế hội nhập. Dự báo sẽ cung cấp
những cơ sở cần thiết cho các hoạch định, và có thể nói rằng nếu không có khoa học
dự báo thì những dự định tương lai của con người vạch ra sẽ không có sự thuyết
phục đáng kể.
Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt ra là việc
nắm bắt tối đa thông tin về lĩnh vực dự báo. Thông tin ở đây có thể hiểu một cách
cụ thể gồm : (1) các số liệu quá khứ của lĩnh vực dự báo, (2) diễn biến tình hình
hiện trạng cũng như động thái phát triển của lĩnh vực dự báo và (3) đánh giá một
cách đầy đủ nhất các nhân tố ảnh hưởng cả về định lượng lẫn định tính.
Căn cứ vào nội dung phương pháp và mục đích của dự báo, người ta chia dự
báo thành hai loại: Phương pháp định tính và phương pháp định lượng. Phương
pháp định tính thường phụ thuộc rất nhiều vào kinh nghiệm của một hay nhiều
chuyên gia trong lĩnh vực liên quan. Phương pháp này thường được áp dụng, kết
3
quả dự báo sẽ được các chuyên gian trong lĩnh vực liên quan nhận xét, đánh giá và
đưa ra kết luận cuối.
Phương pháp định lượng sử dụng những dữ liệu quá khứ theo thời gian, dựa
trên dữ liệu lịch sử để phát hiện chiều hướng vận động của đối tượng phù hợp với
một mô hình toán học nào đó và đồng thời sử dụng mô hình đó làm mô hình ước
lượng. Tiếp cận định lượng dựa trên giả định rằng giá trị tương lai của biến số dự
báo sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ. Phương pháp
dự báo theo chuỗi thời gian là một phương pháp định lượng.
Phương pháp chuỗi thời gian sẽ dựa trên việc phân tích chuỗi quan sát của một
biến duy nhất theo biến số độc lập là thời gian. Giả định chủ yếu là biến số dự báo
sẽ giữ nguyên chiều hướng phát triển đã xảy ra trong quá khứ và hiện tại.
Khóa luận tập trung nghiên cứu mô hình ARIMA để thực hiện phân tích dữ liệu
chứng khoán hướng tới việc dự báo chứng khoán. Mô hình trung bình trượt, đồng
liên kết, tự hồi quy ARIMA (AutoRegressive Integrate Moving Average) do G. P.
E.Box và G. M. Jenkins đề xuất năm 1976 đã mở ra một trang mới trong các công
cụ dự báo, dựa trên mô hình tự hồi quy AR và mô hình trung bình động MA.
ARIMA là mô hình dự báo định lượng theo thời gian, giá trị tương lai của biến số
dự báo sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ. Mô hình
ARIMA phân tích tính tương quan giữa các dữ liệu quan sát để đưa ra mô hình dự
báo thông qua các giai đoạn nhận dạng mô hình, ước lượng các tham số từ dữ liệu
quan sát và kiểm tra các tham số ước lượng để tìm ra mô hình thích hợp. Mô hình
kết quả của quá trình trên gồm các tham số thể hiện mức độ tương quan trên dữ liệu,
và được chọn để dự báo giá trị tương lai. Giới hạn độ tin cậy của dự báo được tính
dựa trên phương sai của sai số dự báo.
4
1.2. Dữ liệu chuỗi thời gian
Chuỗi thời gian trong thống kê, xử lý tín hiệu, kinh tế lượng và toán tài chính là
một chuỗi các điểm dữ liệu, được đo theo từng khoảng khắc thời gian liền nhau theo
một tần suất thời gian thống nhất.
Phân tích chuỗi thời gian sẽ nghiên cứu hành vi, khuôn mẫu trong quá khứ của
một biến số và sử dụng những thông tin này để dự báo những thay đổi trong tương
lai, bao gồm các phương pháp để phân tích dữ liệu chuỗi thời gian, để từ đó trích
xuất ra được các thuộc tính thống kê có ý nghĩa và các đặc điểm của dữ liệu.
Dự đoán chuỗi thời gian là việc sử dụng mô hình để dự đoán các sự kiện thời
gian dựa vào các sự kiện đã biết trong quá khứ để từ đó dự đoán các điểm dữ liệu
trước khi nó xảy ra.
1.2.1. Khái niệm chuỗi thời gian thực
Chuỗi thời gian thực (chuỗi thời gian) là tập hợp của một biến số được quan sát
theo trình tự thời gian nào đó. Biến số theo thời gian có 2 loại: số liệu thời kỳ và số
liệu thời điểm.
Chuỗi thời gian của biến Y được ký hiệu là ሼሽ, với Yt là giá trị của biến Y tại
thời điểm t, giai đoạn ta đang xét là thời điểm 1 đến thời điểm n nên t = 1,2,…, n.
Trên lý thuyết, chuỗi thời gian có thể là liên tục, các biến số kinh tế - xã hội vận
động liên tục theo thời gian, do vậy các mô hình được xây dựng tổng quát cho biến
liên tục. Tuy nhiên, trong thống kê và thực tế, không có số liệu liên tục mà chỉ có
kết quả thông tin tại cuối các thời kỳ xác định hoặc các thời điểm xác định.
Ví dụ 1. Mức huy động vốn của Vietcombank – chi nhánh Quận 5 từ quý I năm
2010 đến quý IV năm 2015.
Các thành phần của dữ liệu chuỗi thời gian [1,trang 81]
Các nhà thống kê thường chia chuỗi theo thời gian thành 4 thành phần:
5
x Thành phần xu hướng dài hạn (Long –term Trend Component) - T
x Thành phần mùa (Seasional Component) - S
x Thành phần chu kỳ (Cyclical Component) - C
x Thành phần bất thường (Irregular Component) – I
1.2.2. Thành phần xu hướng dài hạn
Là thành phần thể hiện khuynh hướng biến động của một biến nào đó trong dài
hạn, chuỗi tăng hay giảm, biến là tăng trưởng hay suy thoái trong khoảng thời gian
dài.[3, trang 436]
Ví dụ 2. Tốc độ tăng trưởng của về sản lượng của một sản phẩm qua các năm
1950-1960 ( đơn vị tính là triệu).
Tốc độ tăng dân số của Việt Nam có xu hướng giảm.
Hình 1. Xu hướng tăng của sản lượng giai đoạn 1950 - 1960
6
1.2.3. Thành phần mùa
Thể hiện sự tác động của các thời điểm, thời kỳ nhất định trong năm, dùng
để đánh giá biến động rất ngắn của một biến như hàng tháng, hàng quý.[3, trang
436]
Ví dụ 3. Nhu cầu tiêu thụ áo mưa sẽ tăng mạnh vào mùa mưa và giảm vào
mùa khô.
Lượng tiêu thụ bánh kẹo sẽ tăng lên vào dịp lễ, tết.
Lượng tiêu thụ chất đốt sẽ tăng vào mùa đông và giảm vào mùa hè.
Hình 2. Thành phần mùa
1.2.4. Thành phần chu kỳ
Thể hiện sự biến động của một biến nào đó trong ngắn hạn hoặc dài hạn. Để
đánh giá thành phần này các giá trị của chuỗi thời gian phải được quan sát nhiều
năm. [3, trang 436]
Ví dụ 4. Lượng dòng chảy đến hồ Trị An từ 1959 đến 1985
7
Hình 3. Thành phần chu kỳ
1.2.5. Thành phần bất thường
Thành phần này dùng để chỉ sự thay đổi bất thường của các giá trị trong chuỗi
thời gian. Sự thay đổi này không thể dự đoán bằng các số liệu kinh nghiệm trong
quá khứ, về mặt bản chất thành phần này không có tính chu kỳ.
1.3. Mô hình ARIMA
Trong mô hình ARIMA, hàm tự tương quan (ACF), hàm tự tương quan riêng
(PACF) là những đại lượng không thể thiếu khi đánh giá về chuỗi thời gian bên
cạnh đó còn có hai đại lượng khác là trung bình và phương sai.
1.3.1. Hàm tự tương quan ACF
Hàm tự tương quan (Autocorrelation Function) dùng để đo mức độ tự tương
quan giữa giá trị của chuỗi tại t và cách đó k thời kỳ, hay nói khác đi là giữa ܻ௧ và
trễ bậc k của nó là ܻ௧ା .
Hàm tự tương quan tại độ trễ thứ k được kí hiệu bởi ACF(k) hoặc ߩ .
ACF(k) = ߩ
=
௩ሺ ǡశೖ ሻ
ሺ ሻ
Trong đó,
ܻ௧ là chuỗi thời gian ở thời điểm t
=
ாሺሺ ିఓሻሺశೖ ିఓሻሻ
ఙమ
8
ܻ௧ା là chuỗi thời gian ở thời điểm t+k
Ɋlà giá trị trung bình của chuỗi
ߪ ଶ là phương sai
Cov(ܻ௧ ǡ ܻ௧ା ) là hiệp phương sai của ܻ௧ và ܻ௧ା .
Trong thực tế, chuỗi thời gian ܻ௧ là không biết được thông tin, do đó không thể
có các hàm tự tương quan ACF trực tiếp. Chuỗi số liệu quan sát chỉ là một mẫu của
chuỗi thời gian tổng quát, do đó áp dụng các công thức tính hàm tự tương quan
trong mẫu:
Hàm tự tương quan mẫu SACF (k ) = U k
Với J k
=
σሺ ିതሻሺశೖ ିതሻ
; J0 =
Jk
J0
σሺ ିതሻమ
Do SACF là hàm tính trong mẫu, không hoàn toàn giống ACF của tổng thể, nên
giá trị có thể có sai lệch, tuy nhiên khi số quan sát tăng lên thì hàm này sẽ mang
nhiều đặc tính của tổng thể.
Để kiểm định sự bằng 0 của nhiều giá trị hàm ACF, từ ACF(1) đến ACF(k) có
thể sử dụng kiểm định Q, cụ thể như sau:
ܪ : ߩଵ =ߩଶ = …= ߩ = 0
ܪଵ ǣ ɏ ്0 ( j=1…k )
ଶሺሻ
Thống kê Q(k) = nσୀଵ ߩෝఫ ଶ , nếu Q(k) > ߯ן
്0 ( j=1…k ). [3, trang 461, 476, 479]
thì bác bỏ ܪ tức là có tồn tại ɏ
9
1.3.2. Hàm tự tương quan từng phần PACF
Hàm tự tương quan từng phần (Partial Autocorrelation Function) dùng để đo
mức độ tự tương quan giữa ܻ௧ và ܻ௧ା khi tất cả các giá trị khác không đổi, được kí
hiệu bởi PACF(k) hay ߩ và được tính bởi công thức:
k 1
U k ¦ U k 1, j U k j
PACF (k ) U kk
j 1
k 1
1 ¦ U k 1, j U j
j 1
với Uk , j
Uk 1, j Ukk Uk 1, j
Bên cạnh hàm tự tương quan mẫu, hàm tự tương quan từng phần của mẫu cũng
được tính, kí hiệu là SPACF(k) hay ߩෞ
.
k 1
U kk
U k ¦ U k 1, j U k j
j 1
k 1
1 ¦ U k 1, j U j
j 1
Với các chương trình phần mềm, đặc biệt là Eviews thì các giá trị SACF(k),
SPACF(k), thống kê Q(k) và P-value tương ứng của kiểm định Q đều được tính
toán cụ thể, từ đó có thể đánh giá về sự khác 0 của các hàm tự tương quan, đồng
thời tính dừng của chuỗi. [3, trang 462, 476]
Tập hợp tất cả giá trị của hàm tự tương quan ACF(k) và hàm tự tương quan
từng phần PACF(k) theo các bậc k=1,2,…được thể hiện dưới dạng đồ thị được gọi
là lược đồ tương quan, dựa vào lược đồ tương quan ta có thể đánh giá được tính
dừng của chuỗi thời gian, cụ thể như sau:
Trong phần mềm Eviews, lượt đồ tương quan của chuỗi được cho theo thứ tự
lần lượt cột 1 là đồ thị của của giá trị SACF(k), kế đến là đồ thị của SPACF(k) với
đường ở giữa là bằng 0, hai đường gạch đứt là hai đường tới hạn േ1.96/ξ݊; nếu
10
SACF(k) vượt qua ngoài đường gạch đứt thì có thể nói ߩ ് 0. Các giá trị trong các
cột còn lại lần lượt là giá trị của SACF(k), SPACF(k), thống kê Q và P-value.
Nếu lượt đồ có giá trị ACF(k) và PACF(k) được coi là khác 0 (nghĩa là vượt
qua ngoài giá trị tới hạn) với k=1,2. Tức là ACF và PACF có ý nghĩa với 2 bậc này,
còn với những bậc k = 3 trở về sau thì ACF và PACF có thể cho là bằng 0, qua đó
có thể nói là chuỗi dừng. Còn đối với chuỗi thời gian không dừng thì ACF(k) đều
khác 0, đồ thị nằm ra phía ngoài bên phải đường tới hạn với tất cả các bậc và
SACF(k) giảm chậm.
1.3.3. Mô hình AR(p)
Chuỗi thời gian được gọi là nhiễu trắng (white noise) nếu chuỗi có trung bình
bằng 0, phương sai không đổi và đồng phương sai bằng 0 với mọi khoảng cách thời
gian. Kí hiệu chuỗi nhiễu trắng là ݑ௧ , thì ݑ௧ thỏa mãn:
E ut
o;Var ut