Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.38 MB, 27 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<b>ĐỀ TÀI: CÁC VI PHẠM CỦA MƠ HÌNH HỒI QUYTHEO PHƯƠNG PHÁP OLS</b>
<b>GVHD: HÀ TRỌNG QUANGNHĨM </b>
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">2.2. Nguyên nhân của hiện tượng đa cộng tuyến...5
2.3. Hậu quả của hiện tượng đa cộng tuyến...6
2.4. Phát hiện đa cộng tuyến...7
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">TÀI LIỆU THAM KHẢO...27
<b>LỜI MỞ ĐẦU</b>
Kinh tế lượng là môn chuyên ngành quan trọng trong kinh tế. Bằngcách áp dụng các thơng kê tốn và các số liệu kinh tế, mơn học giúp ta đolường và ước lượng các biến số trong kinh tế. Nhằm mục đích kiểm nghiệm lýthuyết kinh tế, kinh tế lượng đã xây dựng nên các mô hình kinh tế và đưa racác phân tích cũng như dự đốn thơng qua mơ hình này. Phương pháp thốngkê quan trọng nhất trong môn kinh tế lượng là <i><b>phân tích hồi quy (regression</b></i>
<i>analysis). Thơng qua phương pháp này, các nhà kinh tế mơ phỏng lại các tình</i>
hình kinh tế dưới dạng số liệu để dễ dàng phân tích khi khơng có cơ hội tiếnhành các thử nghiệm có kiểm sốt.
Mơ hình hồi quy trong kinh tế lượng là công cụ giúp chúng ta hiểu rõvề mối tương quan giữa biến phụ thuộc (Y) và biến độc lập (X), từ đó áp dụngvào thực tế để đưa ra các dự báo và giải pháp để khắc phục những khuyết tậtcủa nền kinh tế. Tuy nhiên, trong nghiên cứu điều có thể xảy ra sai sót, khơngphải mơ hình nghiên cứu nào cũng điều chính xác và đáng tin cậy, các sai sóttrong q trình nghiên cứu mơ hình hồi quy có thể dẫn đến các dự báo sailệch. Vấn đề các dữ liệu quan sát chệch do thiếu biến và các vấn đề khác cũngthường xảy ra và cần được giải quyết, vì thế cần phải kiểm tra lại mơ hình hồiquy.
Nhóm chúng em đã chọn chương 6 làm đề tài nghiên cứu vì nhận thấytính cần thiết của việc kiểm định đối với mơ hình hồi quy, kiểm định giúp chomơ hình trở nên đáng tin cậy và có thể được sử dụng trong các cơng trìnhnghiên cứu của nền kinh tế. Ở đây phương pháp kiểm tra được đề xuất làphương pháp OLS-phương pháp hồi quy bình phương nhỏ nhất và thơng quachương 6 chúng ta sẽ được tìm hiểu ba vi phạm của mơ hình nhằm để xem xét
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">và đưa ra hướng khắc phục phù hợp: đa cộng tuyến, phương sai nhiễu thayđổi và tự tương quan.
<b>I. CƠ SỞ LÝ THUYẾT 1. Phương pháp OLS</b>
<b>Bình phương nhỏ nhất thơng thường, (ordinary least squares –OLS)</b>
là phương pháp được sử dụng rộng rãi nhất để ước lượng các tham số trongphương trình hồi quy. Để tối thiểu hố tổng bình phương của các khoảng cáchtheo phương thẳng đứng giữa số liệu thu thập được và đường (hay mặt) hồiquy.
<b>2. Đa cộng tuyến2.1. Khái niệm</b>
Trong mơ hình hồi quy, nếu các biến độc lập có quan hệ chặt với nhau,các biến độc lập có mối quan hệ tuyến tính, nghĩa là các biến độc lập có tươngquan chặt, mạnh với nhau thì sẽ có hiện tượng đa cộng tuyến, đó là hiệntượng các biến độc lập trong mơ hình phụ thuộc lẫn nhau và thể hiện đượcdưới dạng hàm số.
Xét mơ hình hồi qui k biến:
Nếu các biến giải thích độc lập tuyến tính thì mơ hình khơng có đacộng tuyến.
Ngược lại nếu các biến giải thích phụ thuộc tuyến tính thì mơ hình đãcho có đa cộng tuyến.
<b>2.2. Ngun nhân của hiện tượng đa cộng tuyến</b>
Do biến độc lập được chọn có quan hệ nhân quả hay mối quan hệ tươngquan cao vì cùng phụ thuộc vào một điều kiện khác. Ví dụ: biến Vốn và Laođộng tương quan khá chặt chẽ
Do kích cỡ mẫu quá bé
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">Cách thu thập mẫu cục bộ, tạo thành một mẫu khơng có tính đại diệncao cho tổng thể
Chọn biến có độ biến thiên nhỏ, nghĩa là mức độ biến động giữa cácbiến X không cao.
<b>2.3. Hậu quả của hiện tượng đa cộng tuyến</b>
- Hệ số tương quan giữa các biến độc lập có giá trị khá lớn- Phương sai và hiệp phương sai lớn bất thường
- Gia tăng độ rộng khoảng tin cậy của các hệ số hồi quy- Giá trị thống kê t trong kiểm định t có khuynh hướng nhỏ đi- Hệ số xác định có thể rất cao
- Giá trị ước lượng của các và rất nhạy đối với việc tăng hoặc bớt một quansát hay loại bỏ biến có mức ý nghĩa thấp
Chú ý:
Trong thực tế đa cộng tuyến hoàn hảo gần như khơng bao giờ xảy ra vìsự phụ thuộc hàm số giữa các biến độc lập chỉ tồn tại về mặt lý thuyết. Do đótrong các mơ hình hồi quy bội khi nói đến vấn đề đa cộng tuyến thì chúng tahiểu đó là hiện tượng đa cộng tuyến khơng hồn hảo.
Đối với mơ hình hồi quy bội người ta khơng xem xét vấn đề có haykhơng có đa cộng tuyến mà xem xét mức độ nghiêm trọng của đa cộng tuyến.
Nói chung khi có đa cộng tuyến khơng hồn hảo các ước lượng nhậnđược vẫn có tính chất khơng chệch nên vẫn có thể dùng để dự báo.
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7"><b>2.4. Phát hiện đa cộng tuyến</b>
Như chúng ta sẽ thấy trong các chương về tự tương quan và phương saithay đổi, khơng có một kiểm định duy nhất để phát hiện đa cộng tuyến. Mộtsố chẩn đoán được thảo luận trong lý thuyết có thể được tóm tắt như sau:
Hệ số lớn nhưng giá trị kiểm định t thấp
Nếu tương quan cặp giữa các biến độc lập cao (lớn hơn 0,8) thì có thểxảy ra hiện tượng đa cộng tuyến.
Sử dụng hồi qui phụ (Auxiliary regression)
Sử dụng hệ số phóng đại phương sai – VIF (Variance inflation factor) Đối với hàm hồi qui có hai biến độc lập X1 và X2, VIF được định
nghĩa như sau:
Khi có đa cộng tuyến. Khi = 1 thì VIF tiến đến vơ hạn. Nếu khơngtuyến giữa và thì VIF bằng 1.
Kinh nghiệm: nếu VIF của 1 biến vượt quá 10 thì biến này được coi làcó cộng tuyến cao.
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"> Bỏ bớt biến độc lập là nguyên nhân gây ra đa cộng tuyến Thu thập thêm các quan sát mới
Kết hợp số liệu chéo và số liệu chuỗi thời gian
Chuyển dạng dữ liệu bằng cách sử dụng sai phân bậc một, chuẩn hóa sốliệu
<b>3. Phương sai số thay đổi3.1 Khái niệm</b>
Là hiện tượng mà tại đó phần dư (residuals) hoặc các sai số (e) của mơhình sau q trình hồi quy khơng tn theo phân phối ngẫu nhiên và phươngsai không bằng nhau.
Hiện tượng phương sai sai số thay đổi thường hay xuất hiện trong dữliệu bảng (panel-data) và dữ liệu cắt ngang (cross-sectional data).
Xét mơ hình :
Trong phương pháp OLS có giả thiết: , phương sai sai số không đổi(đồng đều) Hommoscedasticity
Nếu PSSS thay đổi (không đồng đều) Heteroscedasticity
<b>Ví dụ: quan sát một tên lửa cất cánh và đo quãng đường nó đã đi mỗi</b>
giây một lần. Chẳng hạn, trong vài giây đầu tiên, các phép đo có thể chính xácđến từng centimet. Tuy nhiên, 5 phút sau khi tên lửa lùi vào khơng gian, độchính xác của các phép đo có thể chỉ ở mức 100 m do khoảng cách tăng lên,biến dạng khí quyển và một loạt các yếu tố khác. Dữ liệu thu thập sẽ thể hiệnphương sai thay đổi.
<b>3.2. Nguyên nhân</b>
Nguyên nhân gây ra hiện tượng phương sai không đồng nhất rất đadạng do từ trong bản chất các yếu tố kinh tế xã hội. Có nhiều nguyên nhânlàm phương sai của các sai số khác nhau, có thể kể đến một số nguyên nhânnhư sau:
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">- Do sử dụng những dụng cụ hiện đại hơn trong thu thập số liệu, nhờ vậymà sai số đo lường cũng như sai số tính tốn có xu hướng giảm xuống- Do hành vi của con người trong các hoạt động ngày càng hồn thiện ,
các sai sót do đó cũng giảm theo
- Do điểm nằm ngoài (điểm vượt trội outlier), là một vài trường hợp bấtthường với giá trị của dữ liệu rất khác biệt , phương sai thay đổi lớn- Xác định sai dạng mơ hình có thể làm biến quan trọng bị bỏ sót cũng
góp phần làm phương sai thay đổi
<b>3.3. Hậu quả của phương sai sai số thay đổi</b>
Khi giả thiết phương sai sai số không thay đổi của mơ hình hồi quy bịphá vỡ thì sẽ dẫn tới một số hậu quả như:
- Các tham số ước lượng vẫn cịn là tuyến tính, khơng chệch nhưngkhơng cịn hiệu quả nữa
- Kiểm định t và F khơng cịn chính xác nữa
- Việc kiểm định giả thuyết khơng cịn đáng tin cậy. Những kết quả dựbáo khơng cịn là tối ưu
<b>3.4. Phát hiện PSSS </b>
Cũng như trường hợp đa cộng tuyến, câu hỏi quan trọng trên thực tế là:Làm sao ta biết được có phương sai thay đổi trong một tình huống cụ thể?Cũng như trong đa cộng tuyến, khơng có các quy tắc bất di bất dịch để pháthiện ra phương sai thay đổi mà chỉ có vài qui tắc kinh nghiệm.
<b>a) Phương pháp đồ thị phần dư </b>
Giả định ban đầu là phương sai không thay đổi, tiến hành hồi quy đểxác định ước lượng phần dư. Sau đó vẽ biểu đồ với những dữ liệu của ước
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">lượng phần dư để xem phần dư này có thay đổi theo hệ thống khi giá trị củabiến độc lập hay giá trị của Y ước lượng tăng.
<i>Chú ý: Với mơ hình hồi quy bội, cần vẽ đồ thị phần dư theo từng biến</i>
độc lập
<b>b) Kiểm định Park</b>
Kiểm định Park là một phương pháp kiểm định hiện tượng phương saicủa sai số thay đổi trong các mơ hình hồi quy. Như đã biết, đây là một phươngpháp kiểm định cho kết quả khá chính xác, tuy nhiên hạn chế của phươngpháp này chỉ áp dụng được đối với mô hình hồi quy đơn
Giả thiết: Mơ hình hồi quy phụ
<b>c) Kiểm định Glejeser</b>
Tương tự kiểm định Park, tuy nhiên sau khi thu các phần dư từ mơ hìnhhồi qui gốc, Glejser sử dụng các dạng hàm sau:
Giả thiết:
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">+ , +
(phương sai bằng nhau)
<b>d) Kiểm định tương quan Spearman</b>
Tương quan Spearman là một công cụ thống kê phân tích mối tươngquan đơn điều dưỡng một biến độc lập và một biến phụ thuộc, dễ hiểu hơn làkhi biến độc lập (X) tăng thì biến phụ thuộc gì cũng tăng (giảm) theo haykhông. Các biến được đánh giá bằng hệ số tương quan Spearman khơng cầnbắt buộc phải có mối quan hệ tuyến tính và phân phối chuẩn nên sẽ được ápdụng ở nhiều trường hợp.
- Xét mơ hình hồi qui sau:Y<small>i = + </small>0 1X<small>i + u i</small>
- Các bước thực hiện kiểm định tương quan hạng như sau:
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">1. Ước lượng mơ hình hồi qui trên dựa trên bộ mẫu cho trước, thu đượcphần dư . <small>i</small>
2. Xếp hạng | | và X theo thứ tự tăng dần hay giảm dần, tính d = hạng | | -<small>iii</small>hạng X , sau đó tính hệ số tương quan hạng Spearman. <small>i</small>
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">Khi biết : phương pháp bình phương tối thiểu có trọng số (WLS) hoặc phương pháp bình phương nhỏ nhất tổng quát (GLS)
Chưa biết : Xây dựng mơ hình hồi quy dựa trên một số giả thiết. Việc ước lượng mơ hình hồi quy tuyến tính logarit có thể làm giảm phương sai thay đổi.
<b>Lưu ý: </b>
Điều kiện để sử dụng phương pháp logarit hóa là giá trị của các biến phải dương. Ta có thể dựa vào biểu đồ phần dư … theo (X) để khảo sát tính khơng đổi của phương sai. Trong thực hành, có thể sử dụng phần mềm EVIEWS để kiểm định và khắc phục hiện tượng phương sai thay đổi. Ví dụ như sử dụng phương pháp ARCH.
<b>4. Tự tương quan 4.1 Khái niệm</b>
Tự tương quan là sự tương quan giữa các thành phần của chuỗi cácquan sát được sắp xếp theo thứ tự thời gian trong các số liệu chuỗi thời gianhoặc sắp xếp theo thứ tự không gian, đối với các số liệu theo khơng gian (sốliệu chéo).
<b>Ví dụ: Một cổ phiếu có thể có tỷ suất sinh lợi tự tương quan dương</b>
mạnh mẽ, cho thấy rằng nếu nó “tăng” vào ngày hơm nay, thì nhiều khả năngnó cũng sẽ tăng vào ngày mai
<b>4.2. Nguyên nhân</b>
<b>4.2.1. Nguyên nhân khách quan:</b>
Quán tính của các biến kinh tế (inertia): thể hiện ở tính chu kỳ đối vớicác chuỗi thời gian như tổng sản phẩm, tỷ lệ thất nghiệp hay chỉ số giá.
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">Hiện tượng mạng nhện (cobweb phenomenon): một số hoạt động kinhtế có phản ứng chậm với sự biến động của các yếu tố tác động, lý do là phảimất một khoảng thời gian để các biến động đó có hiệu lực. Ví dụ: đầu vụtrồng vải năm nay người nông dân bị ảnh hưởng bởi giá mua vải năm ngốicủa các cơng ty xuất khẩu, vì vậy hàm cung như sau:
Qst = β + β<small>01Pt-1</small> + u<small>t.</small>
Các độ trễ (Lags): khi phân tích chuỗi thời gian, có thể xảy ra hiệntượng biến phụ thuộc ở thời kỳ t bị ảnh hưởng bởi chính biến phụ thuộc ở thờikỳ
(t-1).
C<small>t = β + β + β01It2</small>C<small>t-1 + ut</small>
<b>4.2.2.Nguyên nhân chủ quan</b>
Xử lý số liệu.Mơ hình sai lệch:
- Thiếu biến quan trọng.- Dạng hàm sai.
<b>4.3. Hậu quả</b>
Các ước lượng OLS không cịn tính chất BLUE.
Ước lượng phương sai của các tham số hồi quy bị thấp, kéo theo kiểmđịnh t và kiểm định F khơng cịn chính xác.
Giá trị ước lượng của R cao hơn so với giá trị thực.<small>2</small>
Phương sai và sai số của các giá trị dự báo cũng khơng cịn chính xác.
<b>4.4. Phát hiện</b>
<b>a) Phương pháp đồ thị:</b>
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">Giả định về sự tự tương quan liên quan đến các giá trị u của tổng thể,<small>t</small>tuy nhiên, các giá trị này không thể quan sát được.
Ta quan sát e , hình ảnh của e có thể cung cấp những gợi ý về sự tự<small>tt</small>tương quan.
Ta có thể chạy OLS cho mơ hình gốc và thu thập e từ đó. Vẽ đường e<small>tt</small>theo thời gian và quan sát.
<i>Hình 1: sơ đồ U (nhiễu của tổng thể) hoặc phần dư của theo thời gian<small>i, </small>t</i>
Trong hình 1, hình (a) – nhiễu biến động theo thời gian có dạng hàmbậc 3; hình (d) - nhiễu biến động theo thời gian có dạng hàm bậc 2; hình (b)và (c) - nhiễu biến động theo thời gian có dạng hàm tuyến tính tăng hoặcgiảm. chỉ có hình (e) - nhiễu gần như khơng biến động theo thời gian. Vậy
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">0 <sup>dL</sup> <sup>dU</sup> <sup>2</sup> <sup>4 -dU</sup> <sup>4 -dL</sup> <sup>4</sup>
Có t tự ương quan dương
Có t ựtương quan âmKhơng có
t tự ương quanKhông
quyếết đ nhị
Không quyếết đ nhị
ngoại trừ trường hợp (e), các trường hợp cịn lại đều có hiện tượng tự tươngquan.
<b>b) Kiểm định của Durbin – Watson</b>
Bảng thống kê Durbin – Watson cho ta các giá trị tới hạn d<small>u, dl</small> dựa vàoba tham số: mức ý nghĩa số quan sát n, số biến giải thích k’.
Kiểm định DW thực hiện như sau:- Thiết lập cặp giả thiết: H ; H : <small>0:1</small>
- Ước lượng hồi quy bằng phương pháp bình phương bé nhấtthông thường OLS và thu được phần dư.
- Tính giá trị thống kê d
- Tính giá trị tới hạn d và d từ bảng thống kê Durbin – Waston<small>u1</small>Xét mơ hình hồi qui có tự tương quan bậc nhất: u =<small>t</small> ut-1+t (-1 1)
Thống kê d (Durbin-Watson):
Do et<small>2</small> và et-1<small>2</small> chỉ khác nhau có một quan sát, khi n đủ lớn, ta có thểxem chúng bằng nhau.
Với là ước lượng của ρ:
Với α = 5%, kích thước mẫu = n và số biến giải thích là k’ = k-1.
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">Durbin – Watson đã xây dựng bảng các giá trị cận dưới d (Lower), cận<small>L</small>trên d (Upper) để làm căn cứ kết luận.<small>U </small>
Lưu ý: trong thực hành, nếu dựa vào kiểm định DW, giá trị này xấp xỉ2: không có tự tương quan; càng khác xa 2, khả năng có tự tương quan rấtcao.
<b>4.5. Cách khắc phục</b>
Để khắc phụ hậu quả, các biện pháp sử dụng còn tùy thuộc vào bảnchất của nhiễu. Ta phân biệt hai trường hợp:
- Khi đã biết (
- Trường hợp chưa biết hệ số tự tương quan (
Thực tế rất hiếm khi ta biết được giá trị của hệ số tương quan ( nênthông thường trong xử lý số liệu, ta phải ước lượng . Sau đây là một sốphương pháp dùng để ước lượng:
a) Sử dụng phương trình sai phân tổng quát
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">Đa cộng tuyến cũng được quan sát thấy trong nhiều bối cảnh khác. Mộttrong những bối cảnh như vậy là sinh học của con người.
Ví dụ, huyết áp của một cá nhân không tương đồng với tuổi tác, mà cònbao gồm cả cân nặng, căng thẳng và mạch.
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19"><b>Ví dụ 2:</b>
<b>Xét ví dụ minh họa: Đa cộng tuyến trong việc giải thích về lợi nhuận</b>
của cổ phiếu công nghệ Fidelity Select Technology Portfolio (FSPTX).Dưới đây là kết quả của phương trình hồi qui của lợi nhuận cổ phiếunày dựa trên chỉ số tăng trưởng và chỉ số giá trị của S&P 500.
Giá trị t-statistic bằng 5.9286 của chỉ số tăng trưởng (lớn hơn 2) chothấy sự tăng trưởng có khác biệt đáng kể so với mức độ tiêu chuẩn (có giá trịlà 0). Mặt khác, t-statistic của chỉ số giá trị là −0.9012 khơng có ý nghĩa thốngkê.
Kết quả này cho thấy lợi nhuận của FSPTX có mối liên quan với chỉ sốtăng trưởng và không liên quan chặt chẽ với chỉ số giá trị. Tuy nhiên, hệ số(coefficient) của chỉ số tăng trưởng là 1.4697 thể hiện rằng lợi nhuận củaFSPTX có nhiều biến động hơn so với lợi nhuận của chỉ số tăng trưởng.
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">Lưu ý rằng hồi qui này giải thích phương sai của lợi nhuận FSPTX. Cụthể, R của hồi qui này là 0,7996. Do đó, khoảng 80% phương sai của lợi<small>2</small>nhuận của FSPTX được giải thích bằng lợi nhuận chỉ số tăng trưởng và chỉ sốgiá trị S&P 500. Giả sử, chúng ta chạy mơ hình hồi qui tuyến tính khác cóthêm chỉ số S&P 500. Dưới đây là kết quả của mơ hình:
Lưu ý rằng R trong hồi qui này đã thay đổi không đáng kể so với<small>2</small>R<small>2</small> trong hồi qui trước đó (tăng từ 0,7996 lên 0,8084), nhưng sai số chuẩn củacác hệ số của các biến độc lập đã lớn hơn nhiều.
Việc thêm chỉ số S&P 500 vào mơ hình hồi qui khơng giải thích thêmbất kì phương sai của lợi nhuận của FSPTX so với trước đó, nhưng khơng cóhệ số nào có ý nghĩa thống kê. Đây là trường hợp kinh điển của đa hiện tượngđa cộng tuyến.
Về cách khắc phục:
</div>