Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (386.33 KB, 18 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<b>Câu 1: Phân tích thống kê mơ tả các biến có trong dữ liệu DISCRIM</b>
<b>Câu 2: Xét mơ hình: psoda = 0 + 1prpblck + 2income + u (1)a) Ước lượng mơ hình hồi quy (1) và báo cáo kết quả hồi quy</b>
<b>- Mơ hình (1): psoda = 0,956 + 0,115prpblck + 1,6.10</b><small>-6</small>income + u
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><b>b) Ý nghĩa thống kê và ý nghĩa kinh tế của các tham số trong mơ hình (1)- Ý nghĩa kinh tế: </b>
+ Hệ số ^<i>β</i><small>0</small>=0,956 cho biết: Trong điều kiện các yếu tố khác không đổi, khi không có tỉ lệ damàu và thu nhập, giá soda trung bình là khoảng 0,95632 đơn vị.
+ Hệ số ^<i>β</i><small>1</small>=0,115 cho biết: Trong điều kiện các yếu tố khác không đổi, khi tăng (giảm) tỉ lệda màu 1 đơn vị thì trung bình giá của soda sẽ tăng (giảm) khoảng 0,115 đơn vị.
+ Hệ số ^<i>β</i><small>2</small>=1,6. 10<sup>−6</sup>cho biết: Trong điều kiện các yếu tố khác không đổi, khi tăng (giảm) thunhập 1 đơn vị thì trung bình giá của soda sẽ tăng (giảm) khoảng 1,6.10<small>-6</small> đơn vị.
<b>- Ý nghĩa thống kê:</b>
Hệ số ^<i>β</i><small>0</small>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>0</sub> có ý nghĩa thống kê ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>0</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>0</sub> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>0</sub><b> có ý nghĩa thống kê. </b>
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">
Hệ số ^<i>β</i><sub>1</sub>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>1</small> có ý nghĩa thống kê ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>1</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>1</small> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>1</sub><b> có ý nghĩa thống kê. </b>
Hệ số ^<i>β</i><sub>2</sub>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>2</small> có ý nghĩa thống kê ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>2</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>2</small> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>2</sub><b> có ý nghĩa thống kê.</b>
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4"><b>c) Xây dựng khoảng tin cậy 99%, 95% và 90% của các tham số độ dốc </b>
<b>Kết luận:</b>
CI<small>90%</small> (β<small>1</small>) = [0,0722; 0,158]CI<small>90%</small> (β<small>2</small>) = [1,01.10<small>−6</small>; 2,2.10<small>−6</small>]CI<small>95%</small> (β<small>1</small>) = [0,064; 0,166]
CI<small>95%</small> (β<small>2</small>) = [8,91.10<small>−7</small>; 2,31.10<small>−6</small>]CI<small>99%</small> (β<small>1</small>) = [0,048; 0,182]
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: R<small>2</small> = 0 (Mơ hình khơng phù hợp)H<small>1</small>: R<small>2</small><i> ≠ 0 (Mơ hình phù hợp)</i>
Ta có: p-value = 0,000002 < 0,1
=> Bác bỏ giả thuyết H<small>0</small>, nghĩa là R<small>2</small> ≠ 0 một cách có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Mơ hình hồi quy là phù hợp.</b>
<b>- Kiểm định giả thuyết về phân phối chuẩn của phần dư:</b>
+ Mức ý nghĩa 1%
Ta có: p-value = 0,0000 < 0,01=> Bác bỏ H<small>0</small> ở mức ý nghĩa 1%.
+ Mức ý nghĩa 5%
Ta có: p-value = 0,0000 < 0,05=> Bác bỏ H<small>0</small> ở mức ý nghĩa 5%.
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">+ Mức ý nghĩa 10%
Ta có: p-value = 0,0000 < 0,1=> Bác bỏ H<small>0</small> ở mức ý nghĩa 10%.
<b>Kết luận: Phần dư khơng có phân phối chuẩn.- Kiểm định giả thuyết phương sai sai số không đổi:</b>
+ Mức ý nghĩa 1%
Đặt giả thuyết: H<small>0</small>: Phương sai sai số không đổi H<small>1</small>: Phương sai sai số thay đổiTa có: F<small>stat</small> = 0,148 với p-value = 0,863
p-value > 0,01
=> Không đủ cơ sở để bác bỏ H<small>0</small> ở mức ý nghĩa 1%.
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: Phương sai sai số không đổi H<small>1</small>: Phương sai sai số thay đổiTa có: F<small>stat</small> = 0,148 với p-value = 0,863
p-value > 0,1
=> Không đủ cơ sở để bác bỏ H<small>0</small> ở mức ý nghĩa 10%.
<b>Kết luận: Phương sai sai số không đổi.</b>
<b>Câu 3: Loại biến income ra khỏi mơ hình (1) và ước lượng mơ hình hồi quy đơn psodatheo prpblck? So sánh tác động của prpblck đến psoda ở mơ hình hồi quy đơn với mơhình (1)?</b>
<b>- Mơ hình hồi quy đơn psoda theo prpblck: psoda = 1,037 + 0,065prpblck + u</b>
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8"><b>- So sánh tác động:</b>
Mơ hình hồi quy đơn: Tác động của prpblck đến psoda được mô tả bởi hệ số hồi quylà 0,065. Điều này có nghĩa là mỗi khi tăng (giảm) tỉ lệ da màu 1 đơn vị thì trung bình giá củasoda sẽ tăng (giảm) khoảng 0,065 đơn vị.
+ Tuy nhiên, do có sự hiện diện của một biến khác (income) trong mơ hình, tácđộng của prpblck đến psoda có thể bị biến đổi do sự tương tác giữa các biến.
+ Đồng thời, Tác động của prpblck đến psoda được mô tả bởi hệ số hồi quy là1,6.10<small>-6</small>. Điều này có nghĩa là mối quan hệ giữa income và psoda cũng được tính đến trong mơhình (1).
<b>Kết luận: Như vậy, trong mơ hình hồi quy đơn, tác động của prpblck đến psoda được môtả một cách độc lập; trong khi mơ hình (1), tác động này có thể bị ảnh hưởng bởi sự hiệndiện của một biến khác (income) vì sự tương tác giữa các biến.</b>
<b>Câu 4: Xét mơ hình log(psoda) = 0 + 1prpblck + 2log(income) + u (2)</b>
<b> Phân tích các nội dung như Câu 2</b>
<b>a) Ước lượng mơ hình (2) và báo cáo kết quả hồi quy</b>
<b>- Mơ hình (2): log(psoda) = -0,794 + 0,122prpblck + 0,077log(income) + u</b>
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9"><b>b) Ý nghĩa thống kê và ý nghĩa kinh tế của các tham số trong mơ hình (2)- Ý nghĩa kinh tế: </b>
+ Hệ số ^<i>β</i><small>0</small>=−0,794 cho biết: Trong điều kiện các yếu tố khác không đổi, khi khơng có tỉ lệ
<i>da màu và thu nhập, giá soda trung bình là khoảng e</i><small>−0,794</small> = 0,452 đơn vị.
+ Hệ số ^<i>β</i><small>1</small>=0,122 cho biết: Trong điều kiện các yếu tố khác không đổi, khi tăng (giảm) tỉ lệda màu 1 đơn vị thì trung bình giá của soda sẽ tăng (giảm) khoảng 12,2%.
+ Hệ số ^<i>β</i><small>2</small>=0,077 cho biết: Trong điều kiện các yếu tố khác không đổi, khi tăng (giảm) thunhập 1% thì trung bình giá của soda sẽ tăng (giảm) khoảng 0,077%.
<b>- Ý nghĩa thống kê:</b>
Hệ số ^<i>β</i><sub>0</sub>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>0</small> có ý nghĩa thống kê ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>0</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>0</small> = 0 H<small>1</small>: <small>0</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>0</small> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>0</sub><b> có ý nghĩa thống kê.</b>
Hệ số ^<i>β</i><sub>1</sub>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>1</sub> có ý nghĩa thống kê ở mức ý nghĩa 1%.
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">+ Mức ý nghĩa 5%Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>1</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>1</small> = 0 H<small>1</small>: <small>1</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>1</small> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>1</sub><b> có ý nghĩa thống kê.</b>
Hệ số ^<i>β</i><sub>2</sub>:
+ Mức ý nghĩa 1%Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,01 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>2</small> có ý nghĩa thống kê ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,05 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><sub>2</sub> có ý nghĩa thống kê ở mức ý nghĩa 5%.+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: <small>2</small> = 0 H<small>1</small>: <small>2</small><i> ≠ 0</i>
p-value = 0,0000 < 0,1 => Bác bỏ H<small>0</small> => Hệ số ^<i>β</i><small>2</small> có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Hệ số ^</b><i>β</i><sub>2</sub><b> có ý nghĩa thống kê</b>
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11"><b>c) Xây dựng khoảng tin cậy 99%, 95% và 90% của các tham số độ dốc</b>
<b>Kết luận:</b>
CI<small>90%</small> (β<small>1</small>) = [0,079; 0,164]CI<small>90%</small> (β<small>2</small>) = [0,049; 0,104]CI<small>95%</small> (β<small>1</small>) = [0,071; 0,172]CI<small>95%</small> (β<small>2</small>) = [0,044; 0,109]CI<small>99%</small> (β<small>1</small>) = [0,055; 0,188]CI<small>99%</small> (β<small>2</small>) = [0,034; 0,119]
<b>d) Đánh giá sự phù hợp của mơ hình. Kiểm định giả thiết về phân phối chuẩn và phươngsai sai số không đổi của phần dư</b>
- Ý nghĩa R<small>2</small> (R<small>2</small> = 0,068 = 6,8%): Các biến độc lập (prpblck, log(income)) phản ánh được 6,8%biến động của biến phụ thuộc (psoda) trong mô hình hồi quy.
<b>- Kiểm định và đưa ra kết luận về sự phù hợp của mơ hình hồi quy:</b>
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">+ Mức ý nghĩa 10%
Đặt giả thuyết: H<small>0</small>: R<small>2</small> = 0 (Mơ hình khơng phù hợp)H<small>1</small>: R<small>2</small><i> ≠ 0 (Mơ hình phù hợp)</i>
Ta có: p-value = 0,000001 < 0,1
=> Bác bỏ giả thuyết H<small>0</small>, nghĩa là R<small>2</small> ≠ 0 một cách có ý nghĩa thống kê ở mức ý nghĩa 10%.
<b>Kết luận: Mơ hình hồi quy là phù hợp.</b>
<b>- Kiểm định giả thuyết về phân phối chuẩn của phần dư:</b>
+ Mức ý nghĩa 1%
H<small>1</small>: Phần dư có phân phối khơng chuẩn Ta có: p-value = 0,0000 < 0,01
=> Bác bỏ H<small>0</small> ở mức ý nghĩa 1%.+ Mức ý nghĩa 5%
H<small>1</small>: Phần dư có phân phối khơng chuẩn Ta có: p-value = 0,0000 < 0,05
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">=> Bác bỏ H<small>0</small> ở mức ý nghĩa 5%.
+ Mức ý nghĩa 10%
H<small>1</small>: Phần dư có phân phối khơng chuẩn Ta có: p-value = 0,0000 < 0,1
=> Bác bỏ H<small>0</small> ở mức ý nghĩa 10%.
<b>Vậy phần dư khơng có phân phối chuẩn.</b>
<b>- Kiểm định giả thuyết phương sai sai số không đổi của phần dư:</b>
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">+ Mức ý nghĩa 1%
Đặt giả thuyết: H<small>0</small>: Phương sai sai số không đổi H<small>1</small>: Phương sai sai số thay đổiTa có: F<small>stat</small> = 0,083 với p-value = 0,921
p-value > 0,1
=> Không đủ cơ sở để bác bỏ H<small>0</small> ở mức ý nghĩa 10%.
<b>Kết luận: Phương sai sai số không đổi.</b>
<b> Nếu prpblck tăng 0,2 đơn vị thì psoda thay đổi như thế nào?</b>
Nếu prpblck tăng 0,2 đơn vị thì psoda tăng khoảng (0,2.12,2%) = 2,44%.
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15"><b>Câu 5: Thêm biến prppov vào mơ hình (2) và gọi là mơ hình (3). Ước lượng mơ hình (3).Nhận xét về hệ số ước lượng của prpblck</b>
<b>- Xét mơ hình: log(psoda) = 0 + 1prpblck + 2log(income) + 1prppov + u (3)</b>
<b>- Mơ hình (3): log(psoda) = -1,463 + 0,073prpblck + 0,137log(income) + 0,38prppov + u- Nhận xét về hệ số ước lượng của prpblck:</b>
Hệ số ^<i>β</i><small>1</small>=0,073 cho biết: Trong điều kiện các yếu tố khác không đổi, khi tăng (giảm) tỉ lệ damàu 1 đơn vị thì trung bình giá của soda sẽ tăng (giảm) khoảng 7,3%.
<b>Câu 6: Phân tích sự tương quan giữa prppov và log(income)? Ý nghĩa thực tế của sự tươngquan này? Từ đó nhận xét về vấn đề đa cộng tuyến trong mơ hình (3)? Ý nghĩa thực tế cảumơ hình (3) đối với ý tưởng của nhà nghiên cứu ở đề bài?</b>
Đặt X là biến đại diện cho log(income)
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16"><b>- Hệ số tương quan giữa prpblck và log(income) là -0,838. Hệ số này cho biết mối quan hệ</b>
nghịch biến giữa hai biến.
<b>- Ý nghĩa thực tế của sự tương quan này:</b>
+ Khi tỷ lệ nghèo (prppov) tăng, thu nhập trung bình của hộ gia đình (log(income)) có xuhướng giảm.
+ Điều này có thể được giải thích bởi:
Người nghèo có xu hướng tiêu dùng ít hơn, dẫn đến nhu cầu thấp hơn cho cácsản phẩm và dịch vụ, từ đó làm giảm thu nhập trung bình.
Người nghèo có thể có ít cơ hội giáo dục và đào tạo hơn, dẫn đến năng lực laođộng thấp hơn và thu nhập thấp hơn.
<b>- Nhận xét về vấn đề đa cộng tuyến trong mô hình (3):</b>
+ Giá trị hệ số tương quan giữa hai biến prppov và log(income) là 0,838 (> 0,8) là khácao, do đó mơ hình (3) có dấu hiệu đa cộng tuyến.
+ Thực hiện hồi quy phụ:
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">=> Từ kết quả của bảng trên, ta thấy R<small>2</small> = 0,703 là cũng khá cao, do đó mơ hình (3) xảy ra hiệntượng đa cộng tuyến cao.
+ Tính thừa số tăng phương sai VIF: VIF = 1/(1 – 0,703) = 3,367
<b>Kết luận: Từ 3 dấu hiệu nhận biết trên, ta có thể xác định mơ hình (1) xảy ra hiện tượng đacộng tuyến là khá cao.</b>
<b>- Ý nghĩa thực tế của mơ hình (3) đối với ý tưởng của nhà nghiên cứu ở đề bài là:</b>
+ Mơ hình (3): log(psoda) = -1,463 + 0,073prpblck + 0,137log(income) + 0,38prppov + ucho phép nhà nghiên cứu kiểm tra mối quan hệ giữa:
Giá của soda (psoda) Tỉ lệ da màu (prpblck)
Thu nhập trung bình của hộ gia đình (log(income)) Tỉ lệ nghèo (prppov)
+ Ý nghĩa thực tế của mơ hình (3) có thể được giải thích như sau: Biến độc lập prpblck(tỷ lệ da màu) có hệ số hồi quy dương và có ý nghĩa thống kê, điều này có thể cho thấy rằng giácủa psoda có xu hướng tăng khi tỷ lệ người da màu tăng lên. Điều này có thể được diễn giải rằngnhững khu vực có đơng người da màu hơn thì có thể có nhu cầu tiêu thụ soda cao hơn hoặc cácnhà hàng thức ăn nhanh trong khu vực đó có thể định giá sản phẩm cao hơn.
<b>=> Vì vậy mơ hình (3) phù hợp với ý tưởng của nhà nghiên cứu.</b>
</div>