Tải bản đầy đủ (.pdf) (17 trang)

Bài giảng Phân tích định lượng Bài 4 ThS Vũ Hữu Thành

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.48 MB, 17 trang )

10/27/2014

u

antitative

Analysis

info

Giảng viên: Ths. Vũ Hữu Thành.
Nơi làm việc: Khoa Tài chính – Ngân hàng, ĐH Mở
Điện thoại: 0938077776
Email:

1


10/27/2014

Panel Data Regression

Lý thuyết 1

Cấu trúc dữ liệu bảng

Vũ Hữu Thành

2



10/27/2014

Cấu trúc dữ liệu bảng

Các loại hình
dữ liệu

1. Dữ liệu chéo hay dữ liệu theo không gian (Cross-sectional data):
Các giá trị của một hoặc nhiều biến được thu thập tại cùng một
thời điểm
2. Dữ liệu chuỗi thời gian (Time – series): Các giá trị của một hoặc
nhiều biến được thu thập trong một giai đoạn.
3. Dữ liệu bảng (panel data, longitudinal data, rosssectional timeseries data

Cấu trúc dữ liệu bảng

Đặc điểm dữ
liệu bảng

1. Là dữ liệu kết hợp giữa dữ liệu chéo và dữ liệu theo thời
gian. Các dữ liệu chéo của từng đối tượng (như doanh
nghiệp, cá nhân …) sẽ được đo lặp lại theo từng thời
điểm khác nhau
2. Loại dữ liệu này vừa phân tích được đối tượng theo
không gian và theo thời gian.

3


10/27/2014


Cấu trúc dữ liệu bảng
1. Kiểm soát được tính không đồng nhất từ các đối
tượng quan sát
Ưu điểm dữ
liệu bảng
2. Bằng cách nghiên cứu các dữ liệu chéo một cách
lặp đi lặp lại, dữ liệu bảng thực hiện tốt hơn các
nghiên cứu về những thay đổi xảy ra liên tục

Cấu trúc dữ liệu bảng

Ba loại hình
dữ liệu bảng

1. Dữ liệu bảng ngắn (short panel): Nhiều đối tượng được
quan sát trong thời gian ngắn.
2. Dữ liệu bảng dài (long panel): Một số ít đối tượng được
quan sát trong thời gian dài.
3. Dữ liệu bảng kết hợp (short panel and long panel): Nhiều
đối tượng được quan sát trong thời gian dài.
Mỗi loại dữ liệu bảng sẽ có những khác biệt nhỏ trong ước
lượng

4


10/27/2014

Cấu trúc dữ liệu bảng

Số đối tượng
quan sát
id

Name

1 ABT
1 ABT
1 ABT
1 ABT
2 ACL
2 ACL
2 ACL
2 ACL
3 AGF
3 AGF
3 AGF
3 AGF

Lý thuyết 2

Dữ liệu
chéo

Dữ liệu thời
gian
Year

ROA1


2008
2009
2010
2011
2008
2009
2010
2011
2008
2009
2010
2011

0.069668
0.172443
0.15831
0.222258
0.223329
0.098261
0.133083
0.198009
0.03748
0.036298
0.060055
0.066414

ROE
0.065824
0.206455
0.211302

0.254348
0.50874
0.267804
0.261035
0.385392
0.018517
0.023039
0.067643
0.094459

Current_ratio
3.898441602
3.88842975
2.645730317
4.239249889
1.521035796
1.115761027
1.099327103
1.196426899
0.969358019
1.155066288
1.063423883
1.152046304

Axit
1.946903
3.036423
2.016027
2.990029
1.190687

0.836681
0.644905
0.665263
0.568287
0.725999
0.5514
0.678557

Panel Data Regression

Vũ Hữu Thành

5


10/27/2014

I. Mô hình tổng quát

1. Mô hình
tổng quát

𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑣𝑖𝑡
Trong đó:
- i: Đối tượng thứ i được quan sát (đơn vị chéo thứ i)
- t: Thời đoạn quan sát thứ t của đơn vị chéo thứ i.
- α: Hệ số chặn
- β: Ảnh hưởng biên của từng biến số độc lập.
- vit: Sai số của mô hình
Tùy vào cách phân tích vit mà mô hình trên chia thành hai mô

hình sau:
(i). Mô hình sai số một nhân tố;
(ii). Mô hình sai số hai nhân tố.

I. Mô hình tổng quát

2. Mô hình sai số một
nhân tố
One way – error
component model or
Individual-specific/time
effects model

𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑢𝑖 + 𝑒𝑖𝑡
Trong đó:
- vit = 𝑢𝑖 + 𝑒𝑖𝑡
- µ𝑖 : ảnh hưởng của từng đơn vị đặc thù i không thay
đổi theo thời gian nhưng không quan sát được.
- eit : những sai số còn lại chưa đưa vào mô hình.

Tùy vào việc 𝑢𝑖 có tương quan với các biến X hay không mà mô hình này sẽ chia
làm 2 loại: (i) Mô hình các ảnh hưởng cố định – Fixed effects hoặc (ii) Mô hình các
ảnh hưởng ngẫu nhiên (Random effects)

6


10/27/2014

I. Mô hình tổng quát

3. Mô hình sai số hai
nhân tố

Two way – error
component model or
Individual-specific and
time effects model

𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑢𝑖 + λ𝑡 + 𝑒𝑖𝑡

Trong đó:
- vit = 𝑢𝑖 + λ𝑡 + 𝑒𝑖𝑡
- 𝑢𝑖 : ảnh hưởng của từng đơn vị đặc thù i.
- λ𝑡 : ảnh hưởng của thời gian (hệ số chặn thay đổi
theo thời gian)
- eit : những sai số còn lại chưa đưa vào mô hình.

Tùy vào việc 𝑢𝑖 có tương quan với các biến X hay không mà mô hình này sẽ chia
làm 2 loại: (i) Mô hình các ảnh hưởng cố định – Fixed effects hoặc (ii) Mô hình các
ảnh hưởng ngẫu nhiên (Random effects)

Đặc điểm của mô hình Panel
• Tìm hiểu sự tác động của những biến số độc lập mà giá trị của nó thay đổi theo
thời gian (điều này là khác với dữ liệu chéo);
• Tìm hiểu sự tác động của những yếu tố thuộc về đặc điểm của đơn vị được quan
sát mà những yếu tố này không thay đổi theo thời gian.

7



10/27/2014

II. Các phương pháp ước lượng
3 phương
pháp ước
lượng chính

1. Pooled Regresstion;
2. Fixed effects Regresstion;
3. Random effects Regresstion.

Cả ba phương pháp ước lượng đều đưa biến giả Dummy là năm vào mô hình để kiểm soát sự
thay đổi của các biến số độc lập theo thời gian. Trong khi đó đối với những yếu tố thuộc về đặc
điểm của đổi đối tượng quan sát không thay thay đổi theo thời gian:
(i). Nếu không có bất cứ tác động nào tới Y  Sử dụng Pool;
(ii). Nếu có tác động tới các biến độc lập X  Sử dụng Fixed Effect;
(iii). Nếu không có tác động tới các biến độc lập X  Sử dụng Random Effect

1. Pooled Regresstion
• 𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑣𝑖𝑡
Việc hồi quy theo Pool khiến cho mô hình gặp hiện tượng
thiếu biến: Thiếu những ảnh hưởng không đổi theo thời
gian của từng Id
Ommitted Variable problem:
- Ước lượng bị chệch (biased)
- Ước lượng không vững (Unconsistent)

8



10/27/2014

2. Fixed Effect
• 𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑢𝑖 + 𝑒𝑖𝑡
Trong đó:
vit = 𝑢𝑖 + 𝑒𝑖𝑡
FE xuất hiện 𝑢𝑖 là những yếu tố cố định không đổi theo thời gian.
Những yếu tố này không quan sát được và nằm ở sai số. Nó có thể tác
động lên cả X và Y. Vì 𝑢𝑖 tác động tới X nên vit tác động tới X  Làm
cho ước lượng bị chệch và không vững. Do vậy cần phải biến đổi
phương trình để các ước lượng β là không chệch và vững.

Trong mô hình này chúng ta giả sử ui có tác động tới x. Có nghĩa là
Cov(ui,xit) ≠ 0. Điều này có nghĩa là sai số kế hợp: vit = ui + eit sẽ tương
quan với các biến độc lập xit. Để xử lý tình trạng này, chúng ta phải tìm
cách khử ui

9


10/27/2014

2. Fixed Effect
Phương
pháp
biến
đổi:

Yit – Y*t = α + β1(X1it – X*1t) + … + βn(Xnit – X*nt) + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + vit – v*t
ΔYit= α + β1ΔX1it + … + βnΔXnit + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + Δvit

Lúc này Δvit = (ui + eit) – (u*i + e*it) = eit - e*it

Do ui đã bị khử nên Δvit không tác động tới ΔXnit nữa. Lúc này sẽ ước lượng được các β đảm bảo
không chệch và vững trong khi đó vẫn thỏa mãn được sự tác động của các yếu tố cố định theo
thời gian

3. Random Effect
• 𝑌𝑖𝑡 = α + 𝛽2 𝑋2𝑖𝑡 + 𝛽3 𝑋3𝑖𝑡 + ⋯ + 𝛽𝑛 𝑋𝑛𝑖𝑡 + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + 𝑢𝑖 + 𝑒𝑖𝑡
Trong đó:
vit = 𝑢𝑖 + 𝑒𝑖𝑡
RE xuất hiện 𝑢𝑖 là những yếu tố cố định không đổi theo thời gian. Những yếu tố này không quan
sát được và nằm ở sai số. Nó được giả định là không tác động lên X. Vì 𝑢𝑖 không tác động tới X
nên vit không tác động tới X.
Tuy nhiên vấn đề ở chỗ, ui + eit được gọi là sai số kết hợp theo từng thời điểm vì vậy nó có thể
xuất hiện hiện tượng tự tương quan ở sai số. Để xử lý vấn đề này khổng thể chạy Pool thông
thường mà phải biến đổi mô hình.

10


10/27/2014

3. Random Effect

Cách thức
biến đổi:

Từ công thức: Corr(vit,vis) = σ2u /(σ2u + σ2e)
Đặt: θ = 1 – [σ2u /(Tσ2u + σ2e)]1/2
Phương trình biến đổi:

Yit – θY*t = β0(1 – θ) + β1(X1it – θX*1t) + … + βn(Xnit – θX*nt) + 𝑇𝑖𝑚𝑒𝐷𝑢𝑚𝑚𝑦 + uit
– θu*t

Hồi quy phương trình trên theo OLS được gọi là GLS

Lựa chọn FE và RE:
Hausman Test

11


10/27/2014

I. Hausman test
Hausman test là kiểm định phổ biến dùng để lựa chọn giữa hai loại mô
hình FE hay RE. Giả thuyết của Hausman như sau:
H0: FE = RE  Sử dụng RE hiệu quả hơn
H1: FE ≠ RE  Sử dụng FE hiệu quả hơn

Kiểm định cho FE và RE

12


10/27/2014

I. Các loại kiểm định dành cho FE

Xử lý vi phạm mô hình


13


10/27/2014

Trường hợp 1

FE: Phương sai sai số thay đổi

Trường hợp 2

FE: Tự tương quan ở sai số - AR(1)

14


10/27/2014

FE: Tự tương quan ở sai số - AR(1)

Hướng xử lý: Sử dụng phương pháp ước lượng FGLS – Feagible Genaral Least Square

Ví dụ: Sử dụng file: 03. Xu ly sai pham mo hinh 2

Trường hợp 3

FE: Phương sai sai số thay đổi + Tự
tương quan ở sai số - AR(1)

15



10/27/2014

FE: Phương sai sai số thay đổi + Tự tương
quan ở sai số - AR(1)

Hướng xử lý: Sử dụng phương pháp ước lượng PCSE

Ví dụ: Sử dụng file: 03. Xu ly sai pham mo hinh 2

Trường hợp 4

FE: Phương sai sai số thay đổi + Tương
quan giữa sai số của các đơn vị chéo

16


10/27/2014

FE: Phương sai sai số thay đổi + Tương
quan giữa các sai số của đơn vị chéo

Hướng xử lý: Sử dụng phương pháp ước lượng FGLS – feasible generalized least
squares
Ghi chú: Thông thường đã xuất hiện tương quan giữa sai số của các đơn vị chéo thì
sẽ bị hiện tượng phương sai sai số thay đổi

Ví dụ: Sử dụng file: 04. Xu ly sai pham mo hinh 3


Trường hợp 5

FE: Phương sai sai số thay đổi + Tương
quan giữa sai số của các đơn vị chéo + Tự
tương quan

17



×