Tải bản đầy đủ (.pdf) (102 trang)

Chuỗi thời gian không dừng và ứng dụng trong phân tích và dự báo kinh tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 102 trang )

i

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

BÙI VĂN BẰNG

CHUỖI THỜI GIAN KHÔNG DỪNG VÀ ỨNG DỤNG
TRONG PHÂN TÍCH DỰ VÀ BÁO KINH TẾ

Chuyên ngành: Toán ứng dụng
Mã số: 60 46 01 12

LUẬN VĂN THẠC SĨ TOÁN HỌC

Người hướng dẫn khoa học: PGS. TS Trần Trọng Nguyên

HÀ NỘI, 2016


ii

LỜI CẢM ƠN

Luận văn được hoàn thành dưới sự hướng dẫn của PGS.TS Trần Trọng
Nguyên.
Tác giả xin bày tỏ lòng biết ơn sâu sắc nhất tới PGS.TS Trần Trọng
Nguyên người đã định hướng chọn đề tài và tận tình hướng dẫn để tác giả hoàn
thành luận văn này.
Tác giả cũng xin bày tỏ lòng biết ơn chân thành tới Phòng Sau đại học,
các thầy cô giáo dạy cao học trường Đại học Sư phạm Hà Nội 2 đã giúp đỡ tác


giả trong suốt quá trình học tập và hoàn thành luận văn tốt nghiệp.
Tác giả xin được gửi lời cảm ơn đến gia đình, bạn bè đã luôn ủng hộ,
quan tâm để tác giả có thể hoàn thành luận văn.
Hà Nội, tháng 6 năm 2016
TÁC GIẢ

Bùi Văn Bằng


iii

LỜI CAM ĐOAN

Được sự hướng dẫn của PGS.TS Trần Trọng Nguyên, luận văn Thạc sĩ
chuyên ngành Toán ứng dụng với đề tài “Chuỗi thời gian không dừng và ứng
dụng trong phân tích và dự báo kinh tế” được hoàn thành bởi sự nhận thức của
bản thân, số liệu và kết quả nghiên cứu trong luận văn này là trung thực không
trùng với bất kỳ luận văn nào khác.
Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn
này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
TÁC GIẢ

Bùi Văn Bằng


iv
MỤC LỤC
MỞ ĐẦU .............................................................................................................. 1
1. Lý do chọn đề tài ............................................................................................... 1

2. Mục đích nghiên cứu ......................................................................................... 2
3. Nhiệm vụ nghiên cứu ........................................................................................ 2
4. Đối tượng và phạm vi nghiên cứu ..................................................................... 2
5. Phương pháp và công cụ nghiên cứu ................................................................ 2
6. Kết cấu của luận văn ......................................................................................... 3
7. Đóng góp mới của luận văn .............................................................................. 3
CHƯƠNG I: KIẾN THỨC CHUẨN BỊ............................................................ 4
1.1. Quá trình ngẫu nhiên ...................................................................................... 4
1.2. Chuỗi thời gian ............................................................................................... 5
1.3. Kỳ vọng của biến ngẫu nhiên ......................................................................... 5
1.4. Sai phân của chuỗi thời gian .......................................................................... 6
1.5. Toán tử dịch chuyển lùi.................................................................................. 7
1.6. Hiệp phương sai ............................................................................................. 8
1.7. Hàm tự tương quan....................................................................................... 10
CHƯƠNG 2: CHUỖI THỜI GIAN KHÔNG DỪNG VÀ MÔ HÌNH
TRUNG BÌNH TRƯỢT TÍCH HỢP TỰ HỒI QUY ..................................... 18
2.1. Chuỗi thời gian không dừng......................................................................... 18
2.2. Một số quá trình ngẫu nhiên giản đơn ......................................................... 19
2.2.1. Nhiễu trắng ............................................................................................ 19
2.2.2. Bước ngẫu nhiên ................................................................................... 20
2.2.3. Quá trình trung bình trượt (MA) ........................................................... 22
2.2.3.1. Quá trình trung bình trượt bậc nhất – MA(1) ................................ 22
2.2.3.2. Quá trình trung bình trượt bậc q – MA(q) ..................................... 23
2.2.3.3. Quá trình trung bình trượt vô hạn– MA() ................................... 23
2.2.4. Quá trình tự hồi quy (AR) ..................................................................... 24
2.2.4.1. Quá trình tự hồi quy bậc 1 - AR(1) không có hệ số chặn .............. 24


v
2.2.4.2. Quá trình AR(1) có hệ số chặn....................................................... 26

2.2.4.3. Quá trình tự hồi quy bậc p.............................................................. 28
2.3. Nhận biết tính dừng của chuỗi thời gian. ..................................................... 30
2.3.1. Nhận biết qua đồ thị .............................................................................. 30
2.3.2. Nhận biết qua biểu đồ tự tương quan .................................................... 32
2.3.3. Kiểm định nghiệm đơn vị...................................................................... 35
2.3.3.1. Kiểm định Dickey- Fuller .............................................................. 35
2.3.3.2. Kiểm định Philips và Perron .......................................................... 41
2.4. Một số vấn đề về chuỗi thời gian không dừng ............................................. 43
2.4.1. Hậu quả khi ước lượng mô hình chuỗi thời gian không dừng .............. 43
2.4.2. Hồi quy giả mạo .................................................................................... 44
2.4.3. Chuỗi dừng xu thế và dừng sai phân..................................................... 49
2.4.4. Đồng tích hợp ........................................................................................ 49
2.4.4.1. Khái niệm đồng tích hợp ................................................................ 49
2.4.4.2. Kiểm định hồi quy đồng tích hợp .................................................. 50
2.5. Loại bỏ tính không dừng trong chuỗi thời gian. .......................................... 52
2.6. Mô hình trung bình trượt tích hợp tự hồi quy ARIMA ................................ 54
2.6.1. Cách xây dựng mô hình ARIMA cho dữ liệu chuỗi thời gian.............. 54
2.6.1.1. Mô hình tự hồi quy bậc 1 ............................................................... 54
2.6.1.2. Mô hình trung bình trượt bậc 1 ...................................................... 55
2.6.1.3. Các mô hình tự hồi quy bậc cao ..................................................... 55
2.6.1.4. Mô hình trung bình trượt bậc cao .................................................. 56
2.6.1.5. Mô hình trung bình trượt và tự hồi quy ARMA ............................ 57
2.6.1.6. Mô hình trung bình trượt, tích hợp, tự hồi quy ARIMA................ 58
2.6.1.7. Mô hình ARIMA có yếu tố mùa vụ ............................................... 59
2.6.2. Phương pháp Box-Jenkins .................................................................... 60
2.6.2.1. Định dạng mô hình - xác định các tham số d, p, q......................... 60
2.6.2.2. Ước lượng mô hình ........................................................................ 63
2.6.2.3. Kiểm định tính thích hợp của mô hình........................................... 65
2.6.2.4. Dự báo và sai số dự báo ................................................................. 65



vi
CHƯƠNG 3: ỨNG DỤNG CHUỖI THỜI GIAN KHÔNG DỪNG TRONG
PHÂN TÍCH VÀ DỰ BÁO KINH TẾ............................................................. 67
3.1. Phân tích và dự báo kinh tế dựa vào dữ liệu chuỗi thời gian ....................... 67
3.2. Ứng dụng mô hình ARIMA trong phân tích và dự báo ............................... 71
3.2.1. Xác định vấn đề, thu thập dữ liệu. ........................................................ 71
3.2.2. Phân tích sơ bộ ...................................................................................... 71
3.2.3. Lựa chọn và ước lượng mô hình ........................................................... 72
3.2.4. Đánh giá mô hình .................................................................................. 79
3.2.5. Thực hiện phân tích và dự báo .............................................................. 81
3.2.6. Trình bày kết quả phân tích và dự báo .................................................. 84
3.2.7. Theo dõi kết quả dự báo, cập nhật và đánh giá lại mô hình ................. 84
3.3. Ưu nhược điểm của phương pháp dự báo bằng mô hình ARIMA .............. 84
3.3.1. Ưu điểm ................................................................................................. 84
3.3.2. Nhược điểm ........................................................................................... 85
KẾT LUẬN ........................................................................................................ 86
TÀI LIỆU KHAM KHẢO ................................................................................ 87
PHỤ LỤC ........................................................................................................... 88


vii
DANH MỤC BẢNG, BIỂU
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân ............................................. 7
Bảng 2.1: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 1.............. 39
Bảng 2.2: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 2.............. 39
Bảng 2.3: Kiểm định ADF cho chuỗi GDP ước lượng theo mô hình 3.............. 40
Bảng 2.4: Kiểm định ADF cho sai phân bậc nhất của chuỗi GDP. .................... 41
Bảng 2.5: Kiểm định Phillips và Perron cho chuỗi GDP. ................................... 42
Bảng 2.6: Kết quả hồi quy LC theo LY .............................................................. 45

Bảng 2.7: Kiểm định nghiệm đơn vị với chuỗi LC............................................. 47
Bảng 2.8: Kiểm định nghiệm đơn vị với chuỗi LY. ........................................... 47
Bảng 2.9: Kiểm định nghiệm đơn vị với chuỗi LY khi thêm biến xu thế. ......... 48
Bảng 2.10: Kiểm định nghiệm đơn vị với phần dư sau khi hồi quy. .................. 50
Bảng 2.11: Kết quả hồi quy LC, LY theo phương trình. .................................... 51
Bảng 2.12: Kiểm định nghiệm đơn vị với chuỗi D(S_LOGGDP)...................... 53
Bảng 2.13: Đặc tính đồ thị của các mô hình AR, MA. ....................................... 57
Bảng 2.14: Bậc p, q của ARIMA ........................................................................ 61
Bảng 2.15: Ước lượng các tham số. .................................................................... 65
Bảng 3.1: Kiểm định nghiệm đơn vị về tính dừng của chuỗi S_LOGGDP........ 73
Bảng 3.2: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 1. .... 76
Bảng 3.3: Kiểm định nghiệm đơn vị về tính dừng của chuỗi sai phân bậc 2. .... 77
Bảng 3.4: Kết quả ước lượng mô hình theo ARIMA theo EQ01. ...................... 78
Bảng 3.5: Kết quả ước lượng mô hình theo ARIMA theo EQ02. ...................... 80
Bảng 3.6: Kết quả ước lượng mô hình theo ARIMA theo EQ03. ...................... 80
Bảng 3.7: So sánh các mô hình. .......................................................................... 81
Bảng 3.8: Kết quả dự báo GDP quý I năm 2013. ............................................... 84


viii
DANH MỤC HÌNH
Hình 1.1: Lược đồ SACF và SPACF của chuỗi CPI. ......................................... 14
Hình 1.2: Biểu đồ hệ số tự tương quan và tự tương quan riêng.......................... 14
Hình 1.3: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu.............. 15
Hình 1.4: Biểu đồ hàm tự tương quan của chuỗi CPI theo quý. ......................... 16
Hình 2.1: Đồ thị của chuỗi thời gian dừng, không dừng .................................... 19
Hình 2.2: Đồ thị sai phân bậc 2 của chuỗi CPI theo quý. ................................... 30
Hình 2.3: Đồ thị sai phân bậc 2 của chuỗi CPI theo tháng. ................................ 31
Hình 2.4: Đồ thị kim ngạch xuất khẩu hàng hóa của Việt Nam. ........................ 32
Hình 2.5: Biểu đồ hàm tự tương quan của một chuỗi không dừng..................... 33

Hình 2.6: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu VN ....... 33
Hình 2.7: Biểu đồ hàm tự tương quan của chuỗi GDP theo quý Việt Nam ....... 34
Hình 2.8: Biểu đồ hàm tự tương quan chuỗi KNXK sau khi lấy sai phân ......... 35
Hình 2.9: Biểu đồ GDP của Mỹ từ quý I năm 1970 đến quý IV năm 1980 ....... 38
Hình 2.10: Đồ thị biến LC, LY ........................................................................... 46
Hình 3.1: Đồ thị chuỗi GDP của Việt Nam theo quý từ năm 1990 đến 2012. ... 71
Hình 3.2: Đồ thị chuỗi LOGGDP. ...................................................................... 72
Hình 3.3: Đồ thị chuỗi S_LOGGDP ................................................................... 73
Hình 3.4: Biểu đồ hàm tự tương quan của chuỗi S_LOGGDP........................... 74
Hình 3.5: Biểu đồ hàm tự tương quan sai phân bậc 1 chuỗi S_LOGGDP. ........ 75
Hình 3.6: Biểu đồ hàm tự tương quan sai phân bậc 2 chuỗi S_LOGGDP. ........ 77
Hình 3.7: Biểu đồ hàm tự tương quan của phần dư. ........................................... 79
Hình 3.8: Giá trị thực và dải biến động của giá trị dự báo.................................. 81
Hình 3.9: Đồ thị sai số dự báo của chuỗi LOGGDP. .......................................... 82
Hình 3.10: Đồ thị sai số dự báo của chuỗi GDP. ................................................ 83
Hình 3.11: Giá trị thực tế và giá trị dự báo của chuỗi GDP................................ 83


ix
DANH MỤC CHỮ VIẾT TẮT
TT

Từ viết tắt

1

AIC

2
3


ACF
ADF

4

ARIMA

5

BIC

6
7
8
9

CPI
GDP
PACF
SACF

Tiếng Anh

Tiếng Việt

Tiêu chuẩn thông tin
Akaike
Autocorrelation function
Hàm tự tương quan

Augumented Dickey- Fuller
Dickey- Fuller mở rộng
Autoregressive interrated
Trung bình trượt tích hợp
moving average
tự hồi quy
Tiêu chuẩn thông tin
Bayesian information criterion
Bayesian
Consumer price index
Chỉ số giá tiêu dùng
Gross domestic product
Tổng sản phẩm quốc nội
Partial autocorrelation function Hàm tự tương quan riêng
Sample autocorrelation function Hàm tự tương quan mẫu
Akaike information criterion


1
MỞ ĐẦU
1. Lý do chọn đề tài
Việt Nam đã và đang thiết lập nền kinh tế thị trường định hướng XHCN.
Cơ chế quản lý kinh tế, tài chính đã và đang đổi mới sâu sắc, toàn diện với mục
tiêu tăng trưởng với tốc độ cao, bền vững, xây dựng đất nước giàu mạnh. Chính
sách kinh tế phải được hoạch định phù hợp với điều kiện cụ thể của Việt Nam.
Để có được những chính sách kinh tế năng động, hợp lý, có hiệu quả, dự báo
kinh tế là một trong những công cụ hữu ích làm cơ sở khoa học có căn cứ để đưa
ra các quyết định và xây dựng các chính sách phù hợp.
Ngày nay cùng với sự phát triển của khoa học công nghệ, có nhiều
phương pháp dự báo định lượng, trong đó có phương pháp sử dụng các quá trình

ngẫu nhiên đặc biệt là các mô hình chuỗi thời gian. Các dữ liệu về chuỗi thời
gian đã và đang được sử dụng một cách thường xuyên, hiệu quả và đáng tin cậy
như một công cụ hữu hiệu để phân tích kinh tế, xã hội cũng như trong nghiên
cứu khoa học.
Có nhiều phương pháp dự báo kinh tế dựa vào dữ liệu chuỗi thời gian
như: Mô hình hồi quy đơn phương trình; mô hình hồi quy phương trình đồng
thời; mô hình tự hồi quy véc tơ (VAR); mô hình trung bình trượt tích hợp tự hồi
quy ARIMA.
Phân tích hồi quy dựa trên các dữ liệu chuỗi thời gian thường ngầm giả
định rằng chuỗi thời gian đối tượng phải là dừng, nếu không các phương pháp
kiểm định trở nên không đáng tin cậy. Nhưng trong thực tế các mô hình kinh tế
vĩ mô thì chuỗi thời gian thường lại không dừng.
Việc phát triển ứng dụng chuỗi dừng, chuỗi không dừng trong nghiên
cứu, phân tích và dự báo kinh tế là một trong các phát triển đột phá của kinh tế
học hiện đại vào cuối thế kỷ 20. Nhiều nghiên cứu, nhiều tác giả đều khởi nguồn
khi nghiên cứu các chuỗi không dừng trong kinh tế.


2
Được sự gợi ý của thầy hướng dẫn và nhận thấy tính thiết thực của vấn đề,
em đã chọn đề tài “Chuỗi thời gian không dừng và ứng dụng trong phân tích
và dự báo kinh tế” để làm nội dung cho luận văn.
2. Mục đích nghiên cứu
 Tìm hiểu về lý thuyết chuỗi thời gian dừng, không dừng.
 Tìm hiểu phương pháp dự báo dựa vào dữ liệu chuỗi thời gian.
 Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong
kinh tế.
3. Nhiệm vụ nghiên cứu
 Nghiên cứu về tính dừng, không dừng của chuỗi thời gian.
 Nghiên cứu các phương pháp kiểm định tính dừng của chuỗi thời gian.

 Nghiên cứu cách loại bỏ tính không dừng của dữ liệu chuỗi thời gian.
 Nghiên cứu các phương pháp dự báo dựa vào dữ liệu chuỗi thời gian
trong đó tập trung vào mô hình trung bình trượt tích hợp tự hồi quy.
 Ứng dụng phân tích và dự báo một số chuỗi thời gian không dừng trong
kinh tế.
4. Đối tượng và phạm vi nghiên cứu
 Các chuỗi thời gian dừng và không dừng.
 Tập trung vào các chuỗi thời gian trong kinh tế.
5. Phương pháp và công cụ nghiên cứu
* Phương pháp nghiên cứu:
 Phương pháp tiếp cận hệ thống: Phương pháp thống kê toán.
 Phương pháp thực nghiệm: Nghiên cứu các dữ liệu thực nghiệm theo thời
gian, phân tích nhận diện vấn đề, sử dụng dữ liệu lịch sử để kiểm định các
mô hình.


3
 Phương pháp phân tích tổng hợp: Nghiên cứu dữ liệu, phân tích tổng hợp
các quan điểm, qua đó chỉ ra sự vượt trội, giới hạn của từng phương pháp.
 Phương pháp mô hình hóa: Xác định, ước lượng và kiểm định các mô
hình.
* Công cụ nghiên cứu: Luận văn sử dụng các phần mềm Eviews, Excel để
nhận dạng, ước lượng và kiểm định các tham số trong các mô hình cũng như độ
phù hợp của mô hình.
6. Kết cấu của luận văn
Ngoài phần mở đầu và kết luận, danh mục tài liệu tham khảo,..., nội dung
của luận văn được chia thành 3 chương sau:
Chương 1. Kiến thức chuẩn bị.
Chương 2. Chuỗi thời gian không dừng và mô hình trung bình trượt tích
hợp tự hồi quy.

Chương 3. Ứng dụng chuỗi thời gian không dừng trong phân tích và dự
báo kinh tế.
7. Đóng góp mới của luận văn
Đưa ra mô hình dự báo tối ưu và có ý nghĩa thực tiễn.


4
CHƯƠNG I: KIẾN THỨC CHUẨN BỊ

Trong chương này giới thiệu một số kiến thức về kỳ vọng; phương sai và
hiệp phương sai; sai phân của chuỗi thời gian; toán tử dịch chuyển lùi; hàm tự
tương quan. Đây là kiến thức cơ bản để nghiên cứu chuỗi thời gian không dừng.
1.1. Quá trình ngẫu nhiên
Giả sử ta nghiên cứu sự tiến triển của một hệ vật chất nào đó theo thời
gian. Gọi Yt là vị trí (tình trạng) của hệ tại thời điểm t, Yt chính là một biến ngẫu
nhiên mô tả vị trí (tình trạng) của hệ thống. Quá trình Yt t 0 được gọi là một
quá trình ngẫu nhiên.
Tập hợp các vị trí (tình trạng) có thể của hệ là không gian trạng thái.
Định nghĩa 1.1: Họ Yt , t  T các biến ngẫu nhiên nhận giá trị trên I được gọi là
một quá trình ngẫu nhiên với tập chỉ số T và không gian trạng thái I.
Giả sử T là một tập vô hạn nào đó. Nếu với mỗi t  T , Yt là biến ngẫu
nhiên thì ta ký hiệu Y  Yt , t  T và gọi Y là hàm ngẫu nhiên (với tham biến
t  T ).

 Nếu T là tập đếm được thì ta gọi Y  Yt , t  T là quá trình ngẫu nhiên
với tham số rời rạc.
 Nếu T là một khoảng của đường thẳng thực, tức là T thuộc một trong các
tập

sau:


 ,   ;a,   ;  , b;a, b  ; a, b;  a, b;  a, b 

thì

ta

gọi

Y  Yt , t  T là quá trình ngẫu nhiên với tham số liên tục. Tham số t

đóng vai trò thời gian.
Như vậy họ các biến ngẫu nhiên Y1, Y2,... trong đó các chỉ số là các thời
điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân phối xác suất riêng.
Y1, Y2, …, được gọi là một quá trình ngẫu nhiên.


5
1.2. Chuỗi thời gian
Khái niệm 1.1: Chuỗi thời gian là một chuỗi số liệu được thu thập trong
một thời kì hoặc một khoảng thời gian lặp lại như nhau trên cùng một đối tượng,
một không gian một địa điểm.
Với số liệu chuỗi thời gian ta thường sử dụng chỉ số t để chỉ thứ tự của
các quan sát, chẳng hạn Xt, Yt,…, trong đó t = 1, 2, …, n. Chuỗi thời gian có thể
được thu thập theo đơn vị thời gian là năm, tháng, ngày hay chi tiết hơn như giờ,
phút, ….
Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên,
nhưng chúng cũng được gọi là quá trình ngẫu nhiên, ký hiệu là:
Yt với t = 1,2,....
Đặc trưng của chuỗi thời gian là: tính xu hướng, tính mùa vụ, tính ngẫu

nhiên và tính tương quan.
1.3. Kỳ vọng của biến ngẫu nhiên
* Kỳ vọng của biến ngẫu nhiên
Kỳ vọng của biến ngẫu nhiên rời rạc Yt thường được kí hiệu là E(Yt ) .
n

E(Yt )   yi pi .

(1.3.1)

i 1

Khi Yt là biến ngẫu nhiên liên tục với hàm mật độ f y (y t ) thì:
t



E(Yt ) 

yf

t yt

(y t )dy t .

(1.3.2)



E(Yt ) có thể tính được bằng giới hạn theo xác suất của trung bình chung:


1 I
E(Yt )  p lim    i 1 y (i)
.
t
I  I 

Kỳ vọng là trung bình theo nghĩa xác suất của biến ngẫu nhiên.

(1.3.3)


6
Kỳ vọng toán phản ánh giá trị trung tâm của phân phối xác suất theo biến
ngẫu nhiên.
Một số tính chất:
 E     ;   const .

(1.3.4)

 E  X   .E  X  ;   const .

(1.3.5)

 Với X, Y là 2 biến ngẫu nhiên thì: E  X  Y   E  X   E  Y  .

(1.3.6)

 Với X, Y là 2 biến ngẫu nhiên độc lập thì: E  X.Y   E  X  .E  Y  . (1.3.7)
Ví dụ 1.1: Ta xét một số quá trình sau đây.

Nếu Yt  Yt 1  u t , với E  u t   0 thì E  Yt   E  Yt 1   E  u t   E  Yt 1  .
Nếu Yt    u t , với E  u t   0 thì E  Yt   E   u t   E    E  u t    .
Nếu Yt  t  u t , E  u t   0 thì E  Yt   E t  u t   E  t   E  u t    t .
* Kỳ vọng có điều kiện:
Kỳ vọng điều kiện của X cho bởi Y, với X, Y là các biến ngẫu nhiên bất
kỳ:
E  X Y   y   E  X Y  y    x.P  X  x Y  y  .

(1.3.8)

x

1.4. Sai phân của chuỗi thời gian
Sai phân bậc nhất của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D(Yt) hay ∆Yt
được tính như sau: ∆Yt = Yt – Yt-1.

(1.4.1)

Sai phân bậc 2 của chuỗi Yt trễ 1 thời kỳ, kí hiệu là D2(Yt) hoặc ∆2Yt :
∆2Yt = ∆Yt – ∆Yt-1.
Sai phân bậc d của chuỗi Yt, kí hiệu là Dd(Yt) hoặc ∆dYt:
∆dYt = ∆d-1Yt – ∆d-1Yt-1.

(1.4.2)


7
Khi nói sai phân bậc d của một chuỗi ta hiểu là d lần lấy sai phân trễ 1
thời kỳ cho một chuỗi dữ liệu nào đó.
Sai phân bậc 1 của chuỗi Yt trễ k thời kỳ:

∆Yt = ∆Yt – ∆Yt-k .

(1.4.3)

Ví dụ 1.2: Chuỗi sai phân được lập từ một chuỗi số liệu gốc.
Bảng 1.1: CPI của Việt Nam và các chuỗi sai phân
Sai phân bậc Sai phân bậc Sai phân bậc 2

Tháng

CPI

01/1995

103.8000

NA

NA

NA

02/1995

103.4000

-0.400000

NA


NA

03/1995

100.2000

-3.200000

-3.600000

-2.800000

04/1995

101.0000

0.800000

-2.400000

4.000000

05/1995

101.8000

0.800000

1.600000


0.000000

06/1995

100.8000

-1.000000

-0.200000

-1.800000

07/1995

100.0000

-0.800000

-1.800000

0.200000

08/1995

100.3000

0.300000

-0.500000


1.100000

09/1995

100.5000

0.200000

0.500000

-0.100000

10/1995

100.1000

-0.400000

-0.200000

-0.600000

11/1995

100.1000

0.000000

-0.400000


0.400000

12/1995

100.3000

0.200000

0.200000

0.200000

1 trễ 1 thời kỳ 1 trễ 2 thời kỳ trễ 1 thời kỳ

1.5. Toán tử dịch chuyển lùi
Một cách ký hiệu rất hữu ích khi xem xét sự dịch chuyển lùi (trễ) của
chuỗi thời gian là toán tử L tác động lên chuỗi Yt, viết là: LYt = Yt-1.
Công thức đó được hiểu là toán tử L làm dữ liệu Yt dịch chuyển lùi về
phía quá khứ một thời kỳ. Hai lần L sẽ dịch chuyển Yt lùi về quá khứ hai thời
kỳ: L(LYt) = L2Yt = Yt-2 .
Tổng quát: Lk Yt  Yt k , k là một số nguyên bất kỳ.

(1.5.1)


8
Đối với chuỗi dữ liệu theo tháng, nếu chúng ta muốn xem xét sự thay đổi
của quan sát so với giá trị của cùng kỳ năm trước, chúng ta sử dụng ký hiệu L12,
và ký hiệu là L12Yt = Yt-12 .
Ký hiệu dịch chuyển lùi rất tiện dụng khi mô tả một quá trình lấy sai

phân. Sai phân bậc nhất trễ một thời kỳ có thể được viết thành.
Yt’ = Yt – Yt-1 = Yt – LYt = (1 – L)Yt.
Chú ý rằng sai phân bậc nhất trễ một thời kỳ ký hiệu là (1 – L). Tương tự,
nếu ta lấy sai phân bậc hai (trễ một thời kỳ):
Yt” = (Yt’ – Y’t-1) = (Yt – Yt-1) – (Yt-1 – Yt-2)
= Yt – 2Yt-1 + Yt-2 = (1 – 2L + L2)Yt.
Như vậy: Yt” = (1 – L)2Yt.
Chú ý rằng sai phân bậc hai được ký hiệu là (1 – L)2. Điều quan trọng là
sai phân bậc hai khác với sai phân trễ hai thời kỳ (được ký hiệu là 1 – L2).
Tương tự, sai phân trễ 12 thời kỳ phải được ký hiệu là 1 – L12, còn sai phân bậc
12 (tức là 12 lần lấy sai phân) sẽ được ký hiệu là (1 – L)12.
Sai phân bậc d của chuỗi Yt có thể ký hiệu ngắn gọn là: (1 – L)dYt.
Nếu lấy sai phân trễ một thời kỳ của chuỗi Yt sau khi đã lấy sai phân theo
mùa vụ thì có thể ký hiệu là (1 – L)(1 – Ls)Yt.
Ký hiệu dịch chuyển lùi rất tiện dụng bởi vì ký hiệu này có thể nhân với
nhau theo cách tính toán học để thấy được ảnh hưởng kết hợp. Chẳng hạn,
(1 – L)(1 – Ls)Yt = (1 – L – Ls + Ls+1)Yt = Yt – Yt-1 – Yt-s + Yt-s+1.
1

Chú ý: 1  L  Yt  1  L  2 L2  3L3  ... Yt    L  Yt với   1 .
1.6. Hiệp phương sai
* Phương sai: Thước đo lường sự tập trung của các giá trị có thể có của một
biến ngẫu nhiên xung quanh giá trị trung bình của nó.
Phương sai của biến ngẫu nhiên Yt , là kỳ vọng của bình phương sai lệch
của biến ngẫu nhiên so với kỳ vọng toán của nó, kí hiệu var(Yt ) :


9
2
var(Yt )  E  Yt  E  Yt   .




(1.6.1)

Với Yt là biến ngẫu nhiên rời rạc với các giá trị y1 , y 2 ,..., y n với xác suất
n

2

xảy ra tương ứng là p1 , p 2 ,..., p n thì: var(Yt )   yi2 pi   E  Yt   .

(1.6.2)

i 1

Với Yt là biến ngẫu nhiên liên tục:


var(Yt ) 



2

y 2t f  y t  dy t   E  X   .

(1.6.3)




Phương sai là trung bình số học của bình phương sai lệch giữa các giá trị
quan sát của biến ngẫu nhiên so với giá trị trung bình của các giá trị đó.
Phương sai phản ánh mức độ phân tán của các giá trị của biến ngẫu nhiên
so với giá trị trung tâm của kỳ vọng toán. Phương sai càng nhỏ thì các giá trị
càng tập trung ở giá trị gần trung tâm.
Tính chất:
 var(  )  0;   const .

(1.6.4)

 var(  X)   2 var  X  ;   const .

(1.6.5)

 Với X, Y là 2 biến ngẫu nhiên độc lập thì:
var  X  Y   var  X   var  Y  .

(1.6.6)

Khi tính phương sai để thuận tiện ta hay dùng công thức:
2

 var  X   E  X 2    E  X  .

(1.6.7)

 var  aX  bY   a 2 var  X   b 2 var  Y   2abcov  X,Y  .

(1.6.8)


* Độ lệch chuẩn: Độ lệch chuẩn của biến ngẫu nhiên Yt , ký hiệu là sd(Yt ) hay

 Y được định nghĩa như sau:  Y  var(Yt ) .
t

t

* Hiệp phương sai: Đo lường mối quan hệ tuyến tính giữa hai biến số.

(1.6.9)


10
Khi xét đồng thời hai biến ngẫu nhiên X và Y, cần quan tâm đến hiệp
phương sai, ký hiệu là cov(X,Y), được định nghĩa bởi công thức sau:
cov  X, Y   E  X   X  Y  Y   với X  E  X  ;  Y  E  Y  .

Công thức (1.6.10) có thể viết thành: cov  X, Y   E  X.Y   x .Y .

(1.6.10)
(1.6.11)

Khi X và Y là hai biến ngẫu nhiên độc lập thì theo (1.3.7) ta có:
cov(X, Y)  E  X.Y    X . Y  E  X  .E  Y    X . Y  X .Y  X . Y  0 .

Tính chất:
 cov  X, X   var  X  .

(1.6.12)


 cov  aX, bY   ab cov  X, Y  .

(1.6.13)

Hàm hiệp phương sai đối với chuỗi Yt là chuỗi vô hạn các hiệp phương sai:

  cov(Yt , Y
k

t k

)  E  Yt    Yt  k     với k = 0, 1, 2,...

(1.6.14)

khi k = 0 thì  0  cov(Yt , Yt )  var  Yt  .
Hiệp phương sai dương ngụ ý hai biến có mối quan hệ tuyến tính thuận
chiều tức là giá trị của hai biến số nói chung sẽ thay đổi theo cùng chiều nhau;
hiệp phương sai âm ngụ ý hai biến số có mối quan hệ tuyến tính ngược chiều.
1.7. Hàm tự tương quan
* Hệ số tự tương quan giữa Yt và Yt-k là:  k 

k
0

(1.7.1)

* Hàm tự tương quan (ACF): Khi khảo sát các  k theo độ dài của trễ
ACF  k   corr  Yt , Yt k    k 


cov(Yt ,Y )
t k với k = 0, 1, 2,… (1.7.2)
var(Yt )

* Hàm tự tương quan riêng (PACF) là hệ số tương quan có điều kiện giữa Yt
và Yt-k , kí hiệu  kk .


11

 kk  corr  Yt ,Yt k Yt 1 ,Yt 2 ,...,Yt k 1  với k = 1, 2,…

(1.7.3)

Sử dụng công thức Yule - Walker để tính truy hồi  kk .
* Hàm tự tương quan mẫu (SACF), kí hiệu  k .
Giả sử rằng có một mẫu kích thước n, ( Y1 , Y2 ,...Yn ) , từ đây sẽ tính được
n

y

t

t 1

trung bình mẫu: Y 

.


n

Các hiệp phương sai mẫu:
n

cov(Yt ,Yt k )  k 

n

 (Y  Y)(Y
t

Với n khá lớn: k 

 (Y  Y)(Y
t

t k

t

nk

t k

.

t k

t  k 1




n

var(Yt )  0 

yy

 Y)

n

.

n

 (Y  Y)

y

t

t 1



n



SACF(k)  
k

(1.7.4)

n
2

t 1

n

2
t

.

(1.7.5)

n

n

 (Y  Y)(Y
t

t k

t  k 1


n
t

t 1

k 1

yy

 Y)

t



 (Y  Y)

 

t  k 1

n

t  k 1

 
SE 
k

t




nk

n

yy

 Y)

t k

t  k 1

2

t  k 1
n

y

t k

.

(1.7.6)

2
t


t 1


1  2 
i

2

i 1

.

n

(1.7.7)

Với mẫu có kích thước nhỏ thì:
n

 
k

yy
t

t  k 1

n 1


t k

.

(1.7.8)


12
n

var(Yt )  0 

y

2
t

t 1

n 1

.

(1.7.9)

n


SACF(k)  
k


yy
t

t k

t  k 1
n

.

y

(1.7.10)

2
t

t 1

Ta có  k    k .
Các hàm tự tương quan mẫu  k (k  2) phản ánh mức độ tuyến tính của
Yt và Yt  k , tuy nhiên mức độ kết hợp giữa hai biến còn có thể do một số biến

khác gây ra. Trong trường hợp này các biến Yt 1 , Yt  2 ,...Yt  k 1 ảnh hưởng đến
mức độ kết hợp của Yt và Yt  k . Do đó để đo mức độ kết hợp riêng rẽ giữa Yt và
Yt  k người ta còn tính hệ số tự tương quan riêng mẫu của Yt và Yt  k .

* Hàm tự tương quan riêng mẫu (SPACF), kí hiệu  kk .
Công thức đệ quy của Durbin:

k 1

SPACF(k)  kk 

 k    k 1j  k  j
j1
k 1

;

1    k 1j  j

(1.7.11)

j1



 
kj  k 1j  kk k 1j ; j  1,2,...,k  1 ;


11  1 .

Ví dụ 1.3: Cho CPI theo tháng của Việt Nam từ tháng 1 năm 1995 đến tháng 12
năm 2007, n=156 (phụ lục 1). Hãy tính ACF(k) và PACF(k), k=1, 2, 3.
156

Đặt Y=CPI, ta tính được Y  100, 467 ;


Y  Y
t

2

 114,047 ;

t 1

156

  Y  Y  Y
t

t 2



 Y  38,546 ;
t 1

156

  Y  Y  Y
t

t 3

t 2




 Y  9,334 ;


13
156

  Y  Y  Y
t

t 4

t 3



 Y  11,86 .
n

Áp dụng công thức (1.7.10): ACF(k)   k 

yy
t

t  k 1
n

y


t k

.
2
t

t 1

38,546
9,334
11,86
 0,338 ;  2 
 0,082 ;  3 
 0,104 .
Ta có:  1 
114,047
114,047
114,047

Áp dụng công thức đệ quy của Durbin (1.7.11) ta tính được:
SPACF(1)   11   1  0,338 .
 2   11  1 0,082  0,3382

SPACF(2)  22 

 0,037 .
1  0,3382
1   11  1

 21   11   22  11   11 1   22  0,351 .






   21  2   22  1
SPACF(3)   33  3
 0,099 .
1   21  1   22  2

Phần mềm Eviews tính được SACF và SPACF với các độ trễ khác nhau
và vẽ lược đồ tương quan tương ứng (Hình 1.1).
* Lược đồ tương quan: Các SACF, SPACF được trình bày bằng một biểu đồ
gọi là lược đồ tương quan (correlogram), lược đồ tương quan mẫu vẽ các  k và
 kk tương ứng với các độ trễ khác nhau.

Thanh đầu của bảng trong Hình 1.1 (Autocorrelation) là biểu đồ của hàm
tự tương quan của chuỗi tương ứng với các độ trễ k được trình bày ở cột thứ 3.
Các giá trị  k tương ứng được trình bày ở cột AC. Hệ số tự tương quan riêng
 kk được trình bày ở cột PAC (Partial Auto-Correlation) và biểu đồ của nó được

trình bày trong thanh thứ hai của bảng.


14

Hình 1.1: Lược đồ SACF và SPACF của chuỗi CPI.
Trong Hình 1.1 các đường nét đứt chính là ranh giới xác định một hệ số tự
tương quan có ý nghĩa thống kê hay không ở mức tin cậy 95%. Những giá trị
 k ,  kk nằm phía bên ngoài đường nét đứt là có ý nghĩa thống kê. Những giá trị


nằm phía bên trong đường nét đứt là không có ý nghĩa thống kê.
Dựa vào lược đồ tự tương quan ta có thể kiểm tra tính tương quan, nhận
biết đặc tính của chuỗi thời gian (tính mùa vụ, tính xu thế, tính ngẫu nhiên).

Hình 1.2: Biểu đồ hệ số tự tương quan và tự tương quan riêng.


15
Nhìn Hình 1.2 chúng ta thấy rằng mức độ tương quan giữa các giá trị CPI
cách nhau 1, 2, 3, 4 thời kỳ là khá cao. Tiếp theo, hệ số tương quan tại các độ trễ
12 và 24 khá cao trong khi hệ số tương quan khác tại các độ trễ lớn hơn 4 đều
gần 0. Điều này cho thấy chuỗi có tính mùa vụ, giữa các quan sát cách nhau 12
và bội số của 12 thời kỳ có tính tương quan cao.
Biểu đồ trong Hình 1.3 cho thấy các hệ số tự tương quan ở các độ trễ từ 1
đến 36 đều có ý nghĩa thống kê. Độ lớn của các hệ số tự tương quan giảm dần
chứng tỏ các quan sát gần nhau có ảnh hưởng đến nhau chặt chẽ hơn so với các
quan sát ở xa. Đây là một chuỗi có xu thế.

Hình 1.3: Biểu đồ hàm tự tương quan của chuỗi kim ngạch xuất khẩu.
Với chuỗi ngẫu nhiên, các quan sát ở mỗi thời kỳ không có liên hệ với
nhau ở bất kỳ độ trễ nào. Như vậy về lý thuyết, các hệ số tự tương quan của
chuỗi ở mọi độ trễ đều bằng 0. Tuy nhiên, trong thực tế, các quan sát của một
chuỗi ít nhiều đều có tương quan với nhau. Vì thế, biểu đồ tự tương quan của
chuỗi ngẫu nhiên thường có các hệ số tự tương quan khác 0 chút ít, nhưng đều
không có ý nghĩa thống kê (nằm trong phần đường nét đứt).


16


Hình 1.4: Biểu đồ hàm tự tương quan của chuỗi CPI theo quý.
Nhìn vào Hình 1.4 ta thấy các hệ số tự tương quan của chuỗi đều không
có ý nghĩa thống kê ở mức 95%. Do vậy, chuỗi này là ngẫu nhiên.
* Kiểm định hệ số tương quan
+) Tiêu chuẩn Barlett
Giả thiết cần kiểm định: H 0 : k  0 ; H1 : k  0 .
1
1 

, U  /2
Nếu  k    U  /2
 thì ta chấp nhận giả thiết H0, với mức ý nghĩa  .
n
n



Ta đã biết các SACF được trình bày bằng một biểu đồ gọi là lược đồ

tương quan (correlogram), lược đồ này vẽ các k tương ứng với các độ trễ và
 
1
1 
; 1,96
khoảng tin cậy 95% cho k . Nếu k   1,96
 , khi đó có thể nói
n
n



rằng k khác không có ý nghĩa với mức 5%. Trong thực tế, khoảng tin cậy của

k xấp xỉ bằng 2 / n (n là kích thước mẫu hay số quan sát).
Kiểm định Bartlett trên đây mới đưa ra kết luận về từng hệ số tương quan. BoxPierce đã đưa ra kiểm định về sự bằng 0 đồng thời của các hệ số tự tương quan.


×