Tải bản đầy đủ (.pdf) (22 trang)

Bài giảng Kinh tế lượng 1 - Bài 5: Phân tích hồi quy với biến định tính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (445.48 KB, 22 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

<b>BÀI 5 </b>

<b>PHÂN TÍCH HỒI QUY VỚI BIẾN ĐỊNH TÍNH </b>



<b>Hướng dẫn học </b>


Các bài trước chúng ta đã nghiên cứu các biến độc lập là biến định lượng, tức là giá trị
của chúng được đo bằng các con số. Ví dụ như các biến: chi tiêu, thu nhập, sản lượng,
vốn, lao động,


Bài này ta sẽ quan tâm đến việc đưa biến định tính vào mơ hình trong vai trị biến độc lập.
Mục 5.1 sẽ trình bày khái niệm của biến giả, cách dùng biến giả nhằm lượng hóa biến định
tính. Mục 5.2 sẽ giới thiệu mơ hình chỉ có biến định tính là biến độc lập và mục 5.3 là
trường hợp mơ hình hồi quy có biến độc lập là biến định lượng và biến định tính.


<b>Để học tốt bài này sinh viên cần thực hiện: </b>


 Học đúng lịch trình của mơn học theo tuần, đọc kĩ các khái niệm.
 Theo dõi các ví dụ và hiểu kết quả.


 Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng,
NXB Đại học Kinh tế quốc dân.


 Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên.
 Tham khảo các thông tin từ trang Web của môn học.


<b>Nội dung: </b>


 Khái niệm biến giả;


 Mơ hình có biến độc lập chỉ là biến giả;


 Mơ hình có biến độc lập là biến giả và biến định lượng.


<b>Mục tiêu: </b>


Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
 Hiểu rõ khái niệm của biến giả;


 Biết cách dùng biến giả trong vai trò biến độc lập của mơ hình hồi quy;


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

<b>T</b>

<b>ình huống dẫn nhập </b>



Thực tế có rất nhiều trường hợp mà biến độc lập ta gặp là biến định tính, thể hiện bởi một số
trạng thái (cịn gọi là tính chất hay các phạm trù) như biến mô tả về giới tính, tơn giáo, chủng
tộc, vùng miền, hình thức doanh nghiệp,


<i><b>Tình hu</b><b>ố</b><b>ng 1: </b></i>


Trong ví dụ ở các bài học trước, chúng ta đã hồi quy chi tiêu hộ gia đình phụ thuộc vào thu nhập
và số người của hộ. Có ý kiến cho rằng hành vi chi tiêu của hộ gia đình cịn phụ thuộc vào yếu tố
khu vực hộ gia đình sinh sống vậy để xem xét vấn đề này ta cần trả lời các câu hỏi:


 Mơ hình kinh tế lượng được lựa chọn có dạng như thế nào? Mơ tả bản chất biến phụ thuộc và
các biến độc lập.


 Khi đưa biến “Khu vực” (nhận giá trị tương ứng là hộ gia đình ở thành thị hay nơng thơn)
vào mơ hình trong vai trị biến độc lập thì ta cần làm như thế nào?


 Cách đưa biến trung gian (biến giả nhằm lượng hóa biến định tính) vào mơ hình như thế nào?
Cách phân tích ra sao?


<i><b>Tình hu</b><b>ố</b><b>ng 2: </b></i>



Ta muốn xem xét trong doanh nghiệp thu nhập của nhân viên phụ thuộc vào yếu tố giới tính của
nhân viên hay khơng thì có các câu hỏi sau xảy ra:


 Ta phải xây dựng mơ hình hồi quy với biến phụ thuộc, biến độc lập là gì?
 Cấu trúc mơ hình như thế nào?


 Bản chất các số liệu của các biến trong mô hình đo bằng số như thế nào?


 Khi đã lựa chọn mơ hình tuyến tính hồi quy giữa biến phụ thuộc là biến đo mức lương khởi
điểm của nhân viên mà doanh nghiệp chi trả (biến định lượng) phụ thuộc vào biến giải thích
là biến giới tính (biến định tính) với hai phạm trù nam và nữ. Một số câu hỏi cần quan tâm là:


o Muốn “lượng hóa’’biến định tính giới tính với 2 trạng thái nam và nữ thì làm như thế nào?
o Khi dùng biến giả thực hiện mục đích trên thì cách đưa biến giả vào mơ hình và tiến hành


phân tích kết quả này ra sao?
<i><b>Tình hu</b><b>ố</b><b>ng 3: </b></i>


Ta muốn xem xét sản lượng của doanh nghiệp phụ thuộc như thế nào vào việc sử dụng phương
pháp công nghệ A (truyền thống) hay B (hiện đại)?


Như vậy thì ta cần quan tâm đến cách lượng hóa yếu tố định tính “Phương pháp cơng nghệ” (với
hai trạng thái doanh nghiệp sử dụng phương pháp công nghệ A, B” và ta cũng cần trả lời về các
câu hỏi:


 Xây dựng mô hình hồi quy với biến phụ thuộc, biến độc lập là gì?
 Cấu trúc mơ hình như thế nào?


 Bản chất các số liệu của các biến trong mơ hình như thế nào?
<i><b>Tình hu</b><b>ố</b><b>ng 4: </b></i>



</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

 Ở đây mơ hình hồi quy kinh tế lượng được xây dựng với các biến hồi quy nào?


 Những biến nào trong mơ hình có giá trị bằng số, bằng chữ (tức là biến nào là biến định
lượng, biến nào là biến định tính?)


 Cách thức đưa biến giả và tiến hành phân tích như thế nào?


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

<b>5.1. </b> <b> Khái niệm biến giá </b>


<b>5.1.1. </b> <b>Giới thiệu về biến định tính và biến giả </b>


Trong kinh tế xã hội có nhiều yếu tố được đặc trưng bởi các trạng thái tính chất hay
phạm trù mà ta gọi là các biến định tính. Chẳng hạn yếu tố giới tính gồm hai trạng thái
là nam và nữ, yếu tố quê quán đặc trưng bởi hai trạng thái thành thị và nông thôn, yếu
tố vùng miền chia ba trạng thái là miền Bắc, miền Trung và miền Nam,…


Để đưa các thuộc tính của biến định tính vào mơ hình hồi quy định lượng ta cần phải
“lượng hóa” các thuộc tính bằng cách dùng biến giả (dummy variable) nhận hai giá trị
0 và 1.


<b>5.1.2. </b> <b>Các ví dụ </b>
Ví dụ 5.1:


Trong tình huống 1 ta cần hồi quy với biến định tính “Khu vực” (với hai trạng thái
thành thị và nơng thơn) thì thơng tin về biến “Khu vực” có thể được thể hiện bởi biến
giả “KV” như sau:


<i> 1 nếu hộ gia đình sống ở thành thị</i>



<i>KV = </i>


<i> 0 nếu hộ gia đình sống ở nơng thơn </i>
Như vậy số liệu với biến giả về khu vực:


Thứ tự quan sát Khu vực KV


1 Thành thị 1


2 Nông thôn 0


3 Nông thôn 0


4 Thành thị 1


5 Nông thôn 0


  


n Thành thị 1


<i><b>Ví d</b><b>ụ</b><b> 5.2: </b></i>


Trong tình huống 2, thơng tin về biến định tính “Giới tính” nhân viên (với hai trạng
thái là nam và nữ) có thể được thể hiện bởi biến giả “D” như sau:


1<i> nếu một người là nam </i>
<i>D=</i>


0<i> nếu một người là nữ</i>


Như vậy số liệu với biến giả về giới tính:


Thứ tự quan sát Giới tính D


1 Nữ 0


2 Nam 1


3 Nam 1


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

5 Nam 1


  


n Nữ 0


<i><b>Ví d</b><b>ụ</b><b> 5.3: </b></i>


Trong tình huống 3 ở trên thì ta có thơng tin về biến “Phương pháp công nghệ” (với
hai trạng thái doanh nghiệp dùng phương pháp cơng nghệ A hay B) có thể được thể
hiện bởi biến giả “CN” như sau:


1<i> nếu doanh nghiệp dùng phương pháp công nghệ A </i>
<i>CN = </i>


0<i> nếu doanh nghiệp dùng phương pháp công nghệ B </i>
Số liệu với biến giả về phương pháp công nghệ:


Thứ tự quan sát Phương pháp công nghệ sử dụng CN



1 A 1


2 B 0


3 A 1


4 B 0


5 B 0


  


n A 1


<i><b>Ví d</b><b>ụ</b><b> 5.4: </b></i>


Trong tình huống 4 nêu trên, thơng tin về biến “Vùng miền” (với ba trạng thái miền bắc,
miền trung và miền nam) có thể được thể hiện bởi hai biến giả “D2” và “D3” như sau:


1<i> nếu quan sát thuộc miền Bắc </i>
<i>D</i>2 <i>= </i>


0<i> nếu quan sát không thuộc miền Bắc </i>


<i> </i>


Số liệu với biến giả về vùng miền:


Thứ tự quan sát Vùng miền D2 D3



1 Miền Bắc 1 0


2 Miền Bắc 1 0


3 Miền Trung 0 0


4 Miền Nam 0 1


5 Miền Trung 0 0


   


n Miền Bắc 1 0


1<i> nếu quan sát thuộc miền Nam </i>
<i>D</i>3 <i>= </i>


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

<i><b>Nh</b><b>ậ</b><b>n xét: </b></i>


 Vì ta chỉ xét biến định tính có hữu hạn các trạng thái và mỗi cá thể trong tổng thể
chỉ tương ứng với một trạng thái nhất định, cá thể không chuyển từ trạng thái này
sang trạng thái khác nên biến giả sử dụng có các đặc điểm sau:


o Biến giả chỉ nhận giá trị 0 và 1.


o Mỗi cá thể trong tổng thể chỉ tương ứng với một giá trị của biến giả.
o Biến giả chia tổng thể thành các phần riêng biệt.


 Việc lựa chọn gán giá trị 1 và 0 ứng với các trạng thái nào là chỉ nhằm thuận lợi
cho việc giải thích ý nghĩa hệ số của các biến giả. Biến giả được dùng trong mơ


hình ở vai trị biến độc lập nên ta thường đánh số là D2 trở đi vì hệ số đi kèm
thường ký hiệu là β2.


 Khi biến định tính có nhiều hơn hai trạng thái thì ta vẫn có thể sử dụng biến giả có
nhiều giá trị (như biến giả nhận giá trị 0,1,2,3, tương ứng cho các trạng thái)
nhưng gặp khó khăn trong việc nghiên cứu so sánh tương ứng giữa các trạng thái
và một số yếu tố kỹ thuật khác nên người ta thường dùng nhiều biến giả với hai giá
trị 0 và 1 ở trên theo quy tắc: <i>Số biến giả sử dụng bằng số trạng thái của biến định </i>
<i>tính – 1. </i>


(Trong ví dụ 5.1, ví dụ 5.2 và ví dụ 5.3 ở trên biến định tính gồm hai trạng thái ta
sử dụng một biến giả. Cịn trong ví dụ 5.4 thì biến định tính vùng miền có 3 trạng
thái nên ta sử dụng 2 biến giả).


 Trạng thái của biến định tính mà ứng với giá trị các biến giả nhận giá trị 0 gọi là
trạng thái gốc hay trạng thái cơ bản. Việc lựa chọn trạng thái nào là trạng thái cơ
bản thì đó cũng là tùy ý.


(Trong Ví dụ 5.1, trạng thái “Nơng thơn” là trạng thái cơ bản; Ví dụ 5.2, trạng thái
“Nam” là trạng thái cơ bản; Ví dụ 5.3, trạng thái “Phương pháp công nghệ B” là
trạng thái cơ bản và trong ví dụ 4 thì trạng thái cơ bản là trạng thái “Miền trung”).
<b>5.2. </b> <b>Mô hình có biến độc lập chỉ là biến giả </b>


<b>5.2.1. </b> <b>Giới thiệu tình huống </b>


Chẳng hạn muốn xem xét và so sánh ảnh hưởng của việc dùng phương pháp công
nghệ A hay B đến sản lượng của một doanh nghiệp như thế nào.


Ta tiến hành hồi quy mơ hình với biến phụ thuộc (SL) là biến sản lượng của doanh
nghiệp phụ thuộc vào biến định tính mơ tả về việc doanh nghiệp dùng phương pháp


công nghệ A hay B.


Thật vậy ta tạo biến giả về phương pháp công nghệ, ký hiệu “CN”:
1<i> nếu doanh nghiệp sử dụng phương pháp công nghệ A </i>
<i>CN = </i>


0<i> nếu doanh nghiệp không sử dụng phương pháp công nghệ A </i>
<i>(tức là sử dụng phương pháp công nghệ B) </i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

<i>Mô hình hồi quy tổng thế</i> <i>SL</i>

<sub>1</sub>

<sub>2</sub><i>CN</i><i>u</i>


<i>Khi sử dụng phương pháp công nghệ A </i> <i>SL</i>

<sub>1</sub>

<sub>2</sub><i>u</i>


<i>Khi sử dụng phương pháp công nghệ B </i> <i>SL</i>

<sub>1</sub><i>u</i>


<i>Hàm hồi quy tổng thể</i> <i>E</i>(<i>SL</i>/<i>CN</i>)

<sub>1</sub>

<sub>2</sub><i>CN</i>


<i>Khi sử dụng phương pháp công nghệ A </i> <i>E</i>(<i>SL</i>/<i>CN</i> 1)

<sub>1</sub>

<sub>2</sub>
<i>Khi sử dụng phương pháp công nghệ B </i> <i>E</i>(<i>SL</i>/<i>CN</i> 0)

<sub>1</sub>


<i><b>Nh</b><b>ậ</b><b>n xét: </b></i>


 Sản lượng trung bình khi dùng phương pháp cơng nghệ A là β0+ β2;
 Sản lượng trung bình khi dùng phương pháp công nghệ B là β1.


 β2 là mức chênh lệch về sản lượng trung bình của doanh nghiệp khi sử dụng
phương pháp công nghệ A hay B.


(Trạng thái cơ bản ở đây là trạng thái “sử dụng phương pháp cơng nghệ B”).
Do đó:



 Muốn xem xét có phải sản lượng doanh nghiệp là khác nhau khi dùng hai phương
pháp công nghệ A và B hay khơng thì ta thực hiện bài tốn kiểm định cặp giả thuyết:


o Nếu bác bỏ H0, chấp nhận H1 thì ta kết luận sản lượng doanh nghiệp là khác


nhau khi dùng hai phương pháp công nghệ A và B.


o Nếu không bác bỏ H0 ta kết luận sản lượng của doanh nghiệp là như nhau khi


dùng hai phương pháp công nghệ A và B.


 Muốn xem xét có phải khi doanh nghiệp dùng phương pháp cơng nghệ A thì cao
hơn khi ta dùng phương pháp công nghệ B hay khơng thì ta thực hiện bài toán
kiểm định cặp giả thuyết:


<i>H0: β</i>2<i>≤ 0 </i>
<i>H1: β</i>2<i>> 0 </i>


o Nếu bác bỏ H0, chấp nhận H1 thì ta kết luận sản lượng doanh nghiệp khi dùng


phương pháp công nghệ A sẽ cao hơn khi dùng phương pháp công nghệ B.
<i>H0: β</i>2<i> =0 </i>


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

o Nếu không bác bỏ H0 ta kết luận sản lượng của doanh nghiệp khi dùng phương


pháp công nghệ A là không cao hơn khi dùng phương pháp công nghệ B.
 Muốn xét xét mức sản lượng doanh nghiệp khi sử dụng hai phương pháp công


nghệ A và B chênh lệch nhau trong khoảng nào thì ta đi tìm khoảng tin cậy đối


xứng của hệ số β2.


( ) ( )


2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i> <i>se</i> <i>t</i>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


<i>(ởđây k=2) </i>
<b>5.2.2. </b> <b>Các ví dụ cụ thể </b>


<i><b>Ví d</b><b>ụ</b><b> 5.5: </b></i>


Giả sử có 100 quan sát về hộ gia đình, với CT là chi tiêu hộ gia đình (triệu đồng/năm),
KV là khu vực gia đình sinh sống (với 2 trạng thái thành thị và nông thơn).


Tạo biến giả:


1<i> nếu hộ gia đình sống ở thành thị</i>
KV<i> = </i>


0<i> nếu hộ gia đình sống ở nông thôn </i>


Tiến hành hồi quy chi tiêu của hộ gia đình phụ thuộc vào khu vực gia đình đó
sinh sống:



<i>Mơ hình hồi quy tổng thể</i> <i>CT</i> 

<sub>1</sub>

<sub>2</sub><i>KV</i> <i>u</i>


<i>Hộ gia đình ở thành thị</i> <i>CT</i> 

<sub>1</sub>

<sub>2</sub> <i>u</i>


<i>Hộ gia đình ở nơng thơn </i> <i>CT</i> 

<sub>1</sub><i>u</i>


<i>Hàm hồi quy tổng thể</i> <i>E</i>(<i>CT</i>/<i>KV</i>)

1

2<i>KV</i>


<i>Hộ gia đình ở thành thị</i> <i>E</i>(<i>CT</i>/<i>KV</i> 1)

<sub>1</sub>

<sub>2</sub>
Hộ gia đình ở nơng thơn <i>E</i>(<i>CT</i>/<i>KV</i> 0)

<sub>1</sub>
Dependent Variable: CT


Method: Least Squares
Date: 04/17/15 Time: 05:54
Sample: 1 100


Included observations: 100


Variable Coefficient Std. Error t–Statistic Prob.


C 194.2407 7.298745 26.61290 0.0000


KV 69.54187 10.76141 6.462151 0.0000


R–squared 0.298795 Mean dependent var 226.2300


Adjusted R–squared 0.291640 F-statistic 41.75939


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

<i>Hàm hồi quy mẫu </i> <i><sub>CT</sub></i><i><sub>i</sub></i> <sub></sub><sub></sub><sub>1</sub><sub></sub><sub></sub><sub>2</sub><i><sub>KV</sub><sub>i</sub></i>



<i>Hộ gia đình ở thành thị</i> <i>CT</i>   <sub>1</sub> <sub>2</sub>194, 2407 69,54187 263, 78257 
<i>Hộ gia đình ở nơng thơn </i> <i>CT</i> <sub>1</sub>194, 2407


 Mức chi tiêu của hộ gia đình ở thành thị là 263,78257 triệu đồng/năm.
 Mức chi tiêu của hộ gia đình ở nơng thơn là 194,2407 triệu đồng/năm.


 Mức chênh lệch về chi tiêu của hộ gia đình ở thành thị so với nông thôn là
69,54187 triệu đồng/năm.


 Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu của các hộ gia đình ở thành
thị là cao hơn mức chi tiêu của các hộ gia đình ở nơng thơn hay khơng, ta thực
hiện bài tốn kiểm định giả thuyết thống kê:


Miền bác bỏ của giả thuyết H0 là:
















 






)
(
2


2 <sub>,</sub>


)
(


<i>k</i>
<i>n</i>


<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>





Giá trị quan sát của tiêu chuẩn kiểm định là:


69,54187 <sub>6,462151</sub>
10,76141



<i>qs</i>


<i>T</i>  


n = 935, k = 2, α = 0,05, ( ) (98)


0,05 1,645


<i>n k</i>


<i>t</i><sub></sub>  <i>t</i>   Tqs><i><sub>t</sub></i>(<i>n k</i>)





 Đủ cơ sở để bác bỏ giả thuyết H0 và chấp nhận giả thuyết H1.
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng mức chi tiêu của các hộ gia đình ở thành thị
là cao hơn ở nơng thơn.


<i><b>Ví d</b><b>ụ</b><b> 5.6: </b></i>


Sử dụng <b>935 </b>quan sát trong bộ số liệu ch4bt8.wf1 (trích từ Applied Econometrics,
Asteriou – web của Palgrave) (Data_giaotrinh_ktl_13/ch4bt8):


Wage (USD/tháng) chỉ mức lương của người lao động.


Urban là biến giả nhận giá trị 1 nếu người lao động ở thành thị, bằng 0 nếu người lao
động ở nông thôn.



Tạo biến giả:


<i>1 nếu hộ gia đình sống ở thành thị</i>
<i><b>Urban</b> = </i>


0<i> nếu hộ gia đình sống ở nơng thơn </i>
<i> H</i>0<i>: β</i>2<i>≤ 0 </i>


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

Hàm hồi quy tổng thể: E(Wage/Urban) = 1 + 2Urban
Người lao động thành thị: E(Wage/Urban = 1) = 1 + 2
Người lao động nông thôn: E(Wage/Urban = 0) = 1
Dependent Variable: WAGE


Method: Least Squares
Included observations: 935


Variable Coefficient Std. Error T-Statistic Prob.


C 3330.110 24.40500 136.4519 0.0000


URBAN 178.1316 28.80869 6.183260 0.0000


R-squared 0.039365 Mean dependent var 3457.945


Adjusted R-squared 0.038336 F-statistic 38.23270


Sum squared resid 1.47E+08 Prob(F-statistic) 0.000000


Hàm hồi quy mẫu: <sub>Wage</sub> <sub></sub>  <sub></sub> <sub></sub><i><sub>Urban</sub></i><sub></sub><sub>3330</sub><sub>,</sub><sub>11</sub><sub></sub><sub>178</sub><sub>,</sub><sub>1316</sub><sub></sub><i><sub>Urban</sub></i>



2


1 



Người lao động ở


thành thị:  1 2 3330,11178,13163508,2416









Wage


Người lao động ở


nông thôn:  13330,11







Wage


 Muốn tiền cơng trung bình của người ở khu vực thành thị là 3508,2416


USD/tháng.


 Mức tiền công của người ở khu vực nông thôn là 3330,11 USD/tháng.


 Ước lượng điểm về mức chênh lệch về tiền công của người lao động giữa thành thị
và nông thôn là 178,1316 USD/tháng.


 Muốn biết với độ tin cậy 95% thì mức chênh lệch về lương của người ở thành thị
và nông thôn là bao nhiêu thì ta đi tìm khoảng tin cậy đối xứng của β2.


( ) ( )


2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i> <i>se</i> <i>t</i>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


n 935, k 2, 1 – 0.95    , ( ) (933)


/ 2 0,025 1,96


<i>n k</i>


<i>t</i><sub></sub> <i>t</i>  ;2 178,1315822







2


( ) 28,80869 
<i>se</i>


 121,6665498<i> < β</i>2 <i>< </i>234,5966146
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với độ tin cậy 95% thì mức chênh lệch về lương giữa người ở thành thị và nông thôn
dao động trong khoảng (121,6665498; 234,5966146) USD/tháng.


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

<i>H0: β</i>2<i>≤ 0 </i>
<i>H1: β</i>2<i>> 0 </i>
Miền bác bỏ của giả thuyết H0 là:

















 





)
(
2


2 <sub>,</sub>


)
(


<i>k</i>
<i>n</i>


<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


178,1315822 <sub>6,18326</sub>
28,80869



<i>qs</i>


<i>T</i>  


n = 935, k = 2, α = 0,05, ( ) (933)


0,05 1,645


<i>n k</i>


<i>t</i><sub></sub>  <sub></sub><i>t</i> <sub></sub> <sub> → Tqs></sub><i><sub>t</sub></i>(<i>n k</i>)





 Chấp nhận giả thuyết H1
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng lương của người ở thành thị là cao hơn
lương của người ở nông thôn.


<b>5.3. </b> <b>Mô hình có biến độc lập là biến giả và biến định lượng </b>
<b>5.3.1. </b> <b>Giới thiệu tình huống </b>


Trong mục 5.2 đã nghiên cứu mơ hình hồi quy chỉ có biến độc lập là biến định tính
(được lượng hóa bởi biến giả nhận giá trị 0 và 1), trong mục này ta xét trường hợp
trong các biến độc lập của mơ hình có cả biến định lượng thông thường.


Chẳng hạn muốn nghiên cứu, so sánh về mức lương của người lao động phụ thuộc vào
số năm đi học có khác nhau giữa nam và nữ hay khơng? Ta xây dựng mơ hình hồi quy


với các biến:


Wage (USD/tháng) chỉ mức lương của người lao động.
Educ là số năm đi học của người lao động.


Male là biến giả (lượng hóa cho biến giới tính) nhận giá trị 1 nếu quan sát là nam, 0
nếu quan sát là nữ.


Mơ hình hồi quy tổng thể:


Lao động nam: <i>Wage</i><sub>1</sub><sub>2</sub> <sub>3</sub><i>Educ</i><i>u</i>
Lao động nữ: <i>Wage</i>  <sub>1</sub> <sub>3</sub><i>Educ</i> <i>u</i>


1 2 3


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

<i><b>Nh</b><b>ậ</b><b>n xét: </b></i>


o Khi số năm đi học tăng 1 năm thì lương trung bình của người lao động tăng β3


đơn vị.


o Khi số năm đi học là như nhau thì lương trung bình của nam cao hơn nữ là β2


đơn vị.


o Nếu β2 > 0 thì có nghĩa khi cùng số năm đi học, lương trung bình của nam cao


hơn nữ.


o Nếu β2 = 0 thì có nghĩa khi cùng số năm đi học, lương trung bình của nam và



nữ là như nhau.


o Nếu 2 < 0 thì có nghĩa khi cùng số năm đi học, tiền công của nam thấp hơn nữ.


 Muốn biết việc điến biến giả Male vào mơ hình trên có ý nghĩa hay khơng (hay
xem xét hệ số β2 có ý nghĩa thống kê khơng) thì ta tiến hành kiểm định cặp giả
thuyết thống kê:


o Nếu bác bỏ H0, chấp nhận H1 thì ta kết luận biến Male có trong mơ hình là cần


thiết (hay hệ số β2 có ý nghĩa thống kê).


o Nếu chưa bác bỏ H0 ta kết luận thì ta kết luận biến Male có trong mơ hình là


khơng cần thiết (hay hệ số β2 khơng có ý nghĩa thống kê).


 Muốn xem khi cùng số năm đi học thì mức lương của lao động nam sẽ cao hơn
lương của lao động nữ hay khơng thì ta tiến hành kiểm định cặp giả thuyết thống kê:


o Nếu bác bỏ H0, chấp nhận H1 thì ta kết luận khi có cùng số năm đi học thì tiền


công của nam là cao hơn tiền công của nữ.
<i>H</i>0<i>: β</i>2<i> = 0 </i>


<i>H</i>1<i>: β</i>2<i>≠ 0 </i>


<i>H0: β</i>2<i>≤ 0 </i>
<i> H1: β</i>2<i>> 0 </i>



E(Wage/Educ) = 1 + 3Educ
Wage


Educ


E(Wage/Educ) = 1 + 2 + 3Educ


2


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

o Nếu nhận giả thuyết H0 ta kết luận khi có cùng số năm đi học thì tiền công của


nam là không cao hơn tiền công của nữ.


 Muốn xét xét mức chênh lệch của mức lương giữa nam và nữ (khi có cùng số năm
đi học) biến động trong khoảng nào thì ta đi ước lượng hệ số β2 bằng khoảng tin
cậy đối xứng:


( ) ( )


2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i> <i>se</i> <i>t</i>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


(ở đây k = 3)
<b>5.3.2. </b> <b>Các ví dụ cụ thể </b>



<i><b>Ví d</b><b>ụ</b><b> 5.7: </b></i>


Tiếp tục dùng bộ số liệu cho 100 hộ gia đình. Ta hồi quy chi tiêu của hộ gia đình phụ
thuộc vào 2 biến: Biến thu nhập và biến “KV” ở trên.


CT: Chi tiêu hộ gia đình(triệu đồng/năm).
TN: Thu nhập hộ gia đình (triệu đồng/năm).


KV: Biến giả khu vực gia đình sình sống (lượng hóa cho biến định tính với 2 trạng
thái thành thị và nông thôn).


1<i> nếu hộ gia đình sống ở thành thị</i>


<i>KV = </i>


0<i> nếu hộ gia đình sống ở nơng thơn </i>


<i>Mơ hình hồi quy tổng thể: </i> <i>CT</i>  1 2<i>KV</i> 3<i>TN u</i>


<i>Các hộ gia đình ở thành thị: </i>
<i>Các hộ gia đình ở nông thôn: </i>


1 2 3


<i>CT</i>   <i>TN u</i>


1 3


<i>CT</i>   <i>TN u</i>



Dependent Variable: CT
Method: Least Squares
Included observations: 100


Variable Coefficient Std. Error t–Statistic Prob.


C 59.62006 6.837323 8.719796 0.0000


KV 30.27209 4.781050 6.331681 0.0000


TN 0.593527 0.027074 21.92211 0.0000


R–squared 0.882238 Mean dependent var 226.2300


Adjusted R–squared 0.879810 F–statistic 363.3475


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

 Mức chi tiêu tối thiểu của hộ gia đình ở thành thị là:


59,62006 <i>+ </i>30,27209 = 89,89215triệu đồng/năm


 Mức chi tiêu tối thiểu của hộ gia đình ở nông thôn là 59.62006triệu đồng/năm.
 Mức chênh lệch về chi tiêu của hộ gia đình ở thành thị so với nông thôn là


30,27209 triệu đồng/năm.


 Muốn biết với độ tin cậy 95%, khi có cùng mức thu nhập thì mức chênh lệch về
chi tiêu của hộ gia đình ở thành thị và nông thôn dao động trong khoảng nào thì ta
đi tìm khoảng tin cậy đối xứng của β2.


( ) ( )



2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i> <i>se</i> <i>t</i>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


n = 100, k = 3, 1  α = 0,95, ( ) (97)


/ 2 0,025 1,96


<i>n k</i>


<i>t</i><sub></sub>  <i>t</i>  ; 2 30,27209




 ; ( ) 4,7810502





<i>se</i>
 20,901232<i> < β2 < </i>39,642948


<b>Kết luận: </b>


Với độ tin cậy 95%, khi có cùng mức thu nhập thì mức chênh lệch về chi tiêu của


hộ gia đình ở thành thị và nông thôn dao động trong khoảng (20,901232,
39,642948) USD/tháng.


 Muốn biết với mức ý nghĩa 5%, có phải mức chi tiêu của các hộ gia đình ở thành thị và
nơng thơn là khác nhau hay khơng, ta thực hiện bài tốn kiểm định giả thuyết thống kê:


<i>H0: β</i>2<i> = 0 </i>
<i>H1: β</i>2<i>≠0 </i>
Miền bác bỏ của giả thuyết H0 là:












 


)
(
2
/
2
2 <sub>,</sub>
)


(
<i>k</i>
<i>n</i>
<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i> 




Giá trị quan sát của tiêu chuẩn kiểm định là:


30,27209
6,331681
4,781050
 
<i>qs</i>
<i>T</i>


n = 100, k = 3, α = 0,05, ( ) (97)


0,025 1,96


<i>n k</i>


<i>t</i><sub></sub>  <i>t</i>  → │Tqs│> ( )
/ 2



<i>n k</i>


<i>t</i><sub></sub> 


 Chấp nhận giả thuyết H1
<i>Hàm hồi quy mẫu: </i>


<i>Hộ gia đình ở thành thị: </i>
<i>Hộ gia đình ở nơng thơn: </i>


i 1 2 3


CT     <i>KV<sub>i</sub></i> <i>TN<sub>i</sub></i>


i 1 2 3


i


CT ( )


(59,62006 + 0,593527) + 30,27209TN


<i>i</i>
<i>TN</i>
  
   
  


i 1 3



i


CT


59,62006 + 30,27209TN


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

<b>Kết luận: </b>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng mức chi tiêu của các hộ gia đình ở thành
thị và nông thôn là khác nhau.


 Muốn biết với mức ý nghĩa 5%, có phải khi cùng mức thu nhập thì mức chi
tiêu của các hộ gia đình ở thành thị là cao hơn so với hộ gia đình ở nơng thơn
hay khơng, ta thực hiện bài toán kiểm định giả thuyết thống kê:


<i>H0: β</i>2<i>≤ 0 </i>
<i>H1: β</i>2 <i>> 0 </i>
Miền bác bỏ của giả thuyết H0 là:

















 





)
(
2


2 <sub>,</sub>


)
(


<i>k</i>
<i>n</i>


<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i> 




Giá trị quan sát của tiêu chuẩn kiểm định là:



30,27209 <sub>6,331681 </sub>
4,781050


 


<i>qs</i>


<i>T</i>


n = 100, k = 3, α = 0,05, ( ) (97)


0,05 1,645


<i>n k</i>


<i>t</i><sub></sub>  <sub></sub><i>t</i> <sub></sub> <sub> → Tqs></sub><i><sub>t</sub></i>(<i>n k</i>)





 Chấp nhận giả thuyết H1
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng khi có cùng mức thu nhập thì chi tiêu
của các hộ gia đình ở thành thị là cao hơn so với ở nơng thơn.


<i><b>Ví d</b><b>ụ</b><b> 5.8: </b></i>


Tiếp tục dùng bộ số liệu trên (Sử dụng 935 quan sát trong bộ số liệu ch4bt8.wf1 (trích
từ Applied Econometrics, Asteriou–web của Palgrave) (Data_giaotrinh


_ktl_13/ch4bt8).


Dependent Variable: WAGE
Method: Least Squares
Date: 04/18/15 Time: 15:13
Sample: 1 935


Included observations: 935


Variable Coefficient Std. Error t–Statistic Prob.


C 2803.999 53.16238 52.74405 0.0000


MALE 580.8848 17.69155 32.83402 0.0000


EDUC 30.10292 3.986869 7.550516 0.0000


R–squared 0.585947 Mean dependent var 3457.945


Adjusted R–squared 0.585059 F–statistic 659.4609


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

Hàm hồi quy mẫu: <i><sub>Wage</sub></i> <sub></sub><sub></sub><sub>1</sub><sub></sub><sub></sub><sub>2</sub><i><sub>Male</sub></i><sub></sub><sub></sub><sub>3</sub><i><sub>Educ</sub></i>


Lao động là nam:


<i>Educ</i>
<i>Educ</i>
<i>Wage</i>







   

10292
,
30
)
69155
,
17
8848
,
580
(
)
(<sub>1</sub> <sub>2</sub> <sub>3</sub>


Lao động là nữ: <i><sub>Wage</sub></i> <sub></sub><sub></sub><sub>1</sub><sub></sub><sub></sub><sub>3</sub><i><sub>Educ</sub></i> <sub></sub><sub>580</sub><sub>,</sub><sub>8848</sub><sub></sub><sub>30</sub><sub>,</sub><sub>10292</sub><sub></sub><i><sub>Educ</sub></i>


 Ước lượng điểm về mức chênh lệch về lương của nam và nữ (khi có cùng số năm
đi học) là 580,8848 USD/tháng.


 Muốn biết với độ tin cậy 95%, khi có cùng số năm đi học thì mức chênh lệch về
lương của nam và nữ là bao nhiêu thì ta đi tìm khoảng tin cậy đối xứng của β2:


( ) ( )



2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i><sub></sub> <i>se</i> <i>t</i><sub></sub>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


n = 935, k = 3, 1 – α = 0,95, ( ) (932)


/ 2 0,025 1,96


<i>n k</i>


<i>t</i><sub></sub> <sub></sub><i>t</i> <sub></sub> <sub>; </sub>


2 580,8848


  ;


2


( ) 17,69155 
<i>se</i>


 546,209362 < β2 < 615,560238
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với độ tin cậy 95%, khi có cùng số năm đi học thì mức chênh lệch về lương giữa
nam và nữ dao động trong khoảng (546,209362, 615,560238) USD/tháng.



 Muốn biết với mức ý nghĩa 5%, có phải lương của nam và nữ là như nhau (hay hệ
số của biến giả khơng có ý nghĩa thống kê), ta thực hiện bài toán kiểm định giả
thuyết thống kê:


<i>H</i>0<i>: β</i>2<i> = 0 </i>
<i>H</i>1<i>: β</i>2<i>≠ 0 </i>
Miền bác bỏ của giả thuyết H0 là:












 


)
(
2
/
2
2 <sub>,</sub>
)
(


<i>k</i>
<i>n</i>
<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


580,8848
32,83402528
17,69155
 
<i>qs</i>
<i>T</i>


n = 935, k = 3, α = 0,05, ( ) (932)


/ 2 0,025 1,96


<i>n k</i>


<i>t</i><sub></sub>  <sub></sub><i>t</i> <sub></sub> <sub></sub><sub>│Tqs│></sub> ( )
/ 2


<i>n k</i>



<i>t</i>


 Đủ cơ sở chấp nhận giả thuyết H1
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

 Muốn biết với mức ý nghĩa 5%, có phải khi cùng số năm đi học thì lương của nữ là
thấp hơn của nam (hay lương trung bình của nam là cao hơn nữ) hay không, ta
cũng thực hiện bài toán kiểm định giả thuyết thống kê:


<i>H0: β</i>2<i>≤ 0 </i>
<i>H1: β</i>2<i>> 0 </i>
Miền bác bỏ của giả thuyết H0 là:
















 






)
(
2


2 <sub>,</sub>


)
(


<i>k</i>
<i>n</i>


<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


580,8848


32,83402528
17,69155



 


<i>qs</i>


<i>T</i>


n = 935, k = 3, α = 0,05, ( ) (932)


/ 2 0,05 1,645


<i>n k</i>


<i>t</i><sub></sub>  <sub></sub><i>t</i> <sub></sub> <sub></sub><sub> Tqs></sub><i><sub>t</sub></i>(<i>n k</i>)





 Đủ cơ sở chấp nhận giả thuyết H1
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng khi có cùng số năm đi học thì tiền cơng
trung bình của nam cao hơn nữ (hay lương trung bình của nữ thấp hơn nam).
<i><b>Ví d</b><b>ụ</b><b> 5.9: </b></i>


Dùng bộ số liệu trên (Sử dụng <b>33 </b>quan sát trong bộ số liệu ch3bt4.wf1 (trích từ
Data_giaotrinh _ktl_13/ch3bt4) với các biến:


CT, TN lần lượt là chi têu và thu nhập của người lao động theo tháng (triệu đồng).
GT là biến giả nhằm lượng hóa biến giới tính người lao động (GT = 1 ứng với lao
động nam, GT = 0 ứng với lao động nữ).



Dependent Variable: CT
Method: Least Squares
Date: 04/18/15 Time: 18:16
Sample (adjusted): 1 33


Included observations: 33 after adjustments


Variable Coefficient Std. Error t–Statistic Prob.


C 68.73748 7.840218 8.767292 0.0000


<i>Mơ hình hồi quy tổng thể: </i> <i>CT</i>  1 2<i>GT</i> 3<i>TN u</i>


<i>Lao động nam: </i>
<i>Lao động nữ: </i>


1 2 3


<i>CT</i>   <i>TN u</i>


1 3


</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

GT 11.63350 5.230464 2.224181 0.0338


TN 0.852228 0.003835 222.2053 0.0000


R–squared 0.999404 Mean dependent var 1642.161


Adjusted R–squared 0.999365 F–statistic 25169.39



Sum squared resid 5919.280 Prob(F–statistic) 0.000000
 Ước lượng điểm về mức chênh lệch về chi tiêu của nam và nữ (khi có cùng thu


nhập) là 11,63350 triệu đồng/tháng.


 Muốn biết với độ tin cậy 95% thì mức chênh lệch về chi tiêu của nam và nữ (khi
có cùng thu nhập) dao động trong khoảng nào thì ta đi tìm khoảng tin cậy đối xứng
của β2.


( ) ( )


2 ( 2) / 2 2 2 ( 2) / 2


<i>n k</i> <i>n k</i>


<i>se</i> <i>t</i><sub></sub> <i>se</i> <i>t</i><sub></sub>


 <sub></sub>

  <sub></sub>

<sub></sub>

 <sub></sub>

 


n 33, k 3, 1 – 0,95    n = 33, k = 3, 1 – α = 0,95, ( ) (30)


/ 2 0,025 2,042


<i>n k</i>


<i>t</i><sub></sub> <sub></sub><i>t</i> <sub></sub> <sub>; </sub>


2 11, 63350


  ; se( ) 5, 2304642







 0,952892512 < β2 < 22,333957488
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với độ tin cậy 95% thì mức chênh lệch về chi tiêu trung bình giữa nam và nữ (khi
cùng thu nhập) dao động trong khoảng (0,952892512, 22,333957488) triệu
đồng/tháng.


 Muốn biết với mức ý nghĩa 5%, có phải chi tiêu của nam và nữ là như nhau (hay
biến giả GT có mặt trong hồi quy là khơng cần thiết), ta thực hiện bài tốn kiểm
định giả thuyết thống kê:


Miền bác bỏ của giả thuyết H0 là:












 



)
(
2
/
2
2 <sub>,</sub>
)
(
<i>k</i>
<i>n</i>
<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


11,63350 <sub>2,224181</sub>
5,230464


<i>qs</i>


<i>T</i>  


n = 33, k = 3, α = 0,05, ( ) (30)



/ 2 0,025 2,042


<i>n k</i>


<i>t</i><sub></sub> <sub></sub><i>t</i> <sub></sub> <sub></sub><sub>│Tqs│></sub> ( )
/ 2


<i>n k</i>


<i>t</i><sub></sub>  bác bỏ H0, chấp
nhận H1.


<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: Với mức ý nghĩa 5% thì đủ cơ sở nói rằng chi tiêu giữa nam và nữ khi </b></i>
có cùng mức thu nhập là khác nhau.


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

 Muốn biết với mức ý nghĩa 5%, có phải chi tiêu của nam là cao hơn nữ (khi có
cùng thu nhập) hay khơng, ta thực hiện bài tốn kiểm định giả thuyết thống kê:


<i>H</i>0<i>: β</i>2<i>≤ 0 </i>
<i>H</i>1<i>: β</i>2<i>> 0 </i>
Miền bác bỏ của giả thuyết H0 là:













 


)
(
2
2 <sub>,</sub>
)
(
<i>k</i>
<i>n</i>
<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


11,63350 <sub>2,224181</sub>
5,230464


 



<i>qs</i>


<i>T</i>


n = 33, k = 3, α = 0,05, ( ) (30)


0,05 1,697


<i>n k</i>


<i>t</i><sub></sub> <i>t</i>   Tqs > <i><sub>t</sub></i>(<i>n k</i>)


   bác bỏ H0, chấp nhận H1
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng khi có cùng mức thu nhập thì chi tiêu
của nam là cao hơn so với nữ.


 Muốn biết với mức ý nghĩa 5%, có phải khi thu nhập tăng lên 1 triệu đồng thì mức
chi tiêu sẽ tăng nhiều hơn 500 nghìn đồng hay khơng (đối với cả nam và nữ)? Ta
thực hiện bài toán kiểm định giả thuyết thống kê:


<i>H</i>0<i>: β</i>3<i>≤</i>0,85


<i>H</i>1<i>: β</i>3<i>> </i>0,85
Miền bác bỏ của giả thuyết H0 là:














 


)
(
3
3 <sub>,</sub>
)
(
5
,


0 <i><sub>T</sub></i> <i><sub>t</sub></i> <i>n</i> <i>k</i>


<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




5809


,
0
003835
,
0
85
,
0
852228
,


0  <sub></sub>




<i>qs</i>


<i>T</i>


n = 33, k = 3, α = 0,05, ( ) (30)


0,05 1,697


<i>n k</i>


<i>t</i><sub></sub> <i>t</i>   Tqs < <i><sub>t</sub></i>(<i>n k</i>)


  chưa bác bỏ H0
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: Với mức ý nghĩa 5% thì đủ cơ sở nói rằng khi thu nhập của người lao động </b></i>
tăng lên 1 triệu đồng thì mức chi tiêu của họ sẽ tăng nhiều hơn 0,85 triệu đồng.



 Có ý kiến cho rằng mức chi tiêu biên là thấp hơn 1 triệu đồng.


Với mức ý nghĩa 5% hãy nhận xét về ý kiến này.Ta thực hiện bài toán kiểm định
giả thuyết thống kê:


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

Miền bác bỏ của giả thuyết H0 là:


















 





)
(


3


3 <sub>,</sub>


)
(


1 <i><sub>n</sub></i> <i><sub>k</sub></i>


<i>t</i>
<i>T</i>
<i>se</i>
<i>T</i>


<i>W</i><sub></sub> <sub></sub>




Giá trị quan sát của tiêu chuẩn kiểm định là:


532464
,


38
003835


,
0


1


85228
,


0  <sub></sub><sub></sub>




<i>qs</i>


<i>T</i>


<i>n = </i>33<i>, k = </i>3<i>, α = </i>0,05<i>, </i> ( ) (30)


0,05 1,697


<i>n k</i>


<i>t</i><sub></sub> <i>t</i>


     <i>  Tqs< t</i>(<i>n k</i> )


 Bác bỏ H0 và chấp nhận H1.
<i><b>K</b><b>ế</b><b>t lu</b><b>ậ</b><b>n: </b></i>


Với mức ý nghĩa 5% thì đủ cơ sở nói rằng mức chi tiêu biên của người lao động là
thấp hơn 1 triệu đồng/tháng.


</div>
<span class='text_page_counter'>(21)</span><div class='page_container' data-page=21>

<b>T</b>

<b>óm lược cuối bài </b>



 Trong thực tế, có rất nhiều biến kinh tế xã hội là các biến định tính, nhận giá trị bởi các trạng


thái (hay các phạm trù, tính chất). Bài học này nhằm trang bị cách để chúng ta dùng biến giả
đại diện cho các biến định tính trong mỗi mơ hình hồi quy.


 Trường hợp biến định tính có 2 trạng thái, có thể sử dụng một biến giá giả 0  1 để biểu diễn
biến định tính này. Khi biến định tính có m trạng thái, cần sử dụng m  1 biến giả 0  1.
 Hệ số của biến giả dùng để so sánh chênh lệch về hệ số chặn trong các nhóm trạng thái của


biến định tính.


 Việc ước lượng và kiểm định về các hệ số ta thực hiện như các hệ số hồi quy thông thường.
 Bài học này chỉ xem xét trường hợp biến giả đại diện cho biến định tính trong vai trị biến độc


</div>
<span class='text_page_counter'>(22)</span><div class='page_container' data-page=22>

<b>C</b>

<b>âu hỏi ôn tập </b>



<b>1.</b> Thế nào là biến định tính, biến giả? Tại sao lại gọi là biến giả? So sánh sự khác nhau giữa
biến định tính và biến giả?


<b>2.</b> Thế nào gọi là trạng thái “gốc” (còn gọi là trạng thái cơ bản) của một biến định tính? Biến
giả trong mơ hình có được tính là biến (thật) có trong mơ hình hồi quy khơng? Tại sao?
<b>3.</b> Khi hồi quy với biến độc lập là biến định tính thì làm như thế nào? Trường hợp biến định


tính có m trạng thái thì cách đặt các biến giả 0  1 ra sao?


<b>4.</b> Trong bài học thì biến định tính đóng vai trị biến độc lập hay biến phụ thuộc?


<b>5.</b> Biến có thứ bậc (gọi là biến thứ bậc, có các giá trị có thể sắp xếp theo thứ tự) là biến định
tính hay định lượng?


<b>6.</b> Khi hồi quy với biến “Hạnh kiểm” về xếp loại của học sinh:
1. Tốt 2. Khá 3. Trung bình 4. Kém



Thì ta có thể xem xét biến “Hạnh kiểm” như biến định lượng nhận các giá trị 1,2,3,4 được
khơng? Có dùng được các biến giả 0  1 để đại diện cho biến này không?


<b>7.</b> Hệ số của biến giả trong một mơ hình hồi quy có ý nghĩa gì?


<b>8.</b> Ước lượng điểm hệ số của biến giả trong mơ hình có thể < 0 khơng? Nếu xảy ra thì phản ánh
điều gì?


<b>9.</b> Chênh lệch về hệ số chặn trong các mơ hình giữa các nhóm trạng thái của biến định tính có
thể = 0? Nếu xảy ra thì cho biết điều gì?


</div>

<!--links-->

×