BỘGIÁO DỤC VÀ ĐÀO TẠOTRƢỜNG ĐẠI HỌC KINH TẾTHÀNH
PHỐHỒCHÍ MINH
LUẬN ÁN TIẾN SĨ KINH TẾ
ỨNG DỤNG PHƢƠNG PHÁP HỒI QUY PHÂN VỊPHÂN TÍCH
CHÊNH LỆCH TIỀN LƢƠNG ỞVIỆT NAM
Chuyên ngành : Kinh tếphát triển(Điều khiển học kinh tế)
Mã số: 62.31.01.05LUẬN ÁN TIẾN SĨ KINH TẾ
NGƢỜI HƢỚNG DẪN KHOA HỌC
1.PGS. TS LÊ VĂN PHI
2.TS BÙI PHÚC TRUNG
NĂM 2016
iLỜI CAM ĐOAN
Tôi xin cam đoan luận án Tiến sĩ với đềtài “Ứng dụng phương pháp hồi quy
phân vịphân tích chênh lệch tiền lương ởViệt Nam” là công trình nghiên cứu khoa
học độc lập của riêng tôi. Các sốliệu và kết quảnghiên cứu trong luận án là
trung thực, có nguồn gốc rõ ràng, và chƣa từng đƣợc ai công bốtrong bất kỳcông
trình nghiên cứu nào khác.
Nghiên cứu sinh
Trần ThịTuấn Anh
Ii
iiiMỤC LỤCLỜI CAM
ĐOAN.............................................................................................................iMỤC
LỤC......................................................................................................................iiiD
ANH MỤC CÁC BẢNG
BIỂU..................................................................................viiDANH MỤC CÁC
HÌNH VẼ......................................................................................viiiDANH MỤC
CÁC TỪVIẾT
TẮT................................................................................xvPHẦNMỞĐẦU................
.............................................................................................11.Lý do chọn
đềtài........................................................................................................12.Mục tiêu
nghiên cứu...................................................................................................23.Đối
tƣợng –phạm vi nghiên cứu................................................................................34.Ý
nghĩa khoa học và ý nghĩa thực
tiễn........................................................................3CHƢƠNG 1CƠ SỞLÝ
THUYẾT VỀHÀM TIỀN LƢƠNG VÀ VẤN ĐỀPHÂN TÍCH CHÊNH LỆCH
TIỀN LƢƠNG BẰNG HỒI QUY PHÂN VỊ...................................51.1.Hàm tiền
lƣơng mincer (1974) và các nghiên cứu mởrộng................................51.2.Phƣơng
pháp hồi quy phân vị.............................................................................8a.Giới thiệu
phƣơng pháp hồi quy phân vị...............................................9b.Tính chất của
phƣơng pháp hồi quy phân vị........................................15c.Kiểm định giảthuyết
thống kê với hồi quy phân vị.............................23d.Ƣu điểm và nhƣợc điểm của
hồi quy phân vị......................................241.2.1.Tính chệch của ƣớc lƣợng do chọn
mẫu khi xây dựng hàm tiền lƣơng và phƣơng pháp hiệu chỉnh tính chệch do chọn
mẫu..........................................................26a.Tính chệch do chọn mẫu (Sample
selection bias)................................27b.Hiệu chỉnh tính chệch do chọn mẫu -Thủtục
Heckman hai bƣớc.......291.2.2.Vấn đềnội sinh và phƣơng pháp hồi quy phân vịhai
bƣớc (double -stage quantile
regression)..........................................................................................321.3.Phƣơng
pháp phân rã chênh lệch bằng hồi quy phân vị....................................341.4.Sựphù
hợp của hồi quy phân vịvới các nghiên cứu vềchênh lệch tiền lƣơng..37CHƢƠNG
2TỔNG QUAN CÁC NGHIÊN CỨU VỀCHÊNH LỆCH TIỀN
LƢƠNG.....................392.1.Tổng quan các nghiên cứuvềchênh lệch tiền lƣơngtrên
thếgiới........................39
iv2.1.1.Những nghiên cứu vềchênh lệch tiền lƣơng trƣớc khi hồi quy phân vịđƣợc
áp dụng vào phân tích tiền
lƣơng..........................................................................392.1.2.Những nghiên cứu
vềchênh lệch tiền lƣơng áp dụng hồi quy phân vịđƣợc áp dụng vào hồi quy hàm
tiền lƣơng.....................................................................442.2.Tổng quan các nghiên
cứu ởViệt Nam...............................................................582.2.1.Các nghiên cứu định
lƣợng vềchênh lệch tiền lƣơng không áp dụng hồi quy phân
vị.............................................................................................................582.2.2.Các
nghiên cứu áp dụng hồi quy phân vịtrong phân tích chênh lệch tiền
lƣơng.....................................................................................................................612
.3.Những hạn chếtrong các nghiên cứu định lƣợng vềđềtài chênh lệch tiềnlƣơng
ởviệt
nam........................................................................................................64CHƢƠNG
3PHƢƠNG PHÁP NGHIÊN
CỨU.............................................................673.1.Sốliệu sửdụng trong
đềtài.................................................................................673.1.1.Nguồn sốliệu
sửdụng......................................................................................673.1.2.Thống kê mô
tảmẫu sốliệu.............................................................................693.1.3.Mô tảhàm mật
độkernel của biến log –tiền lƣơng trên mẫu sốliệu................733.2.Phƣơng pháp
nghiên cứu của đềtài.....................................................................783.2.1.Dạng hàm
tiền lƣơng........................................................................................793.2.2.Phƣơng
pháp ƣớc lƣợng hàm tiền lƣơng và phân rã chênh lệch tiền
lƣơng.......813.2.2.1.Ƣớc lƣợng hàm tiền lƣơng bằng phƣơng pháphồi quy phân
vị...........813.2.2.2.Hiệu chỉnh tính chệch do chọn
mẫu....................................................823.2.2.3.Phƣơng pháp phân rã sựchênh lệch
tiền lƣơng...................................83CHƢƠNG 4KẾT QUẢNGHIÊN
CỨU.......................................................................864.1.Áp dụng phƣơng pháp hồi
quy phân vịđểƣớc lƣợng hàm tiền lƣơng ởviệt nam...864.1.1.Hồi quy và so sánh
hàm hồi quy phân vịhàm tiền lƣơng của nhóm lao động nam và nhóm lao động
nữ........................................................................................874.1.1.1.Hồi quy và so
sánh hệsốhồi quy theo bằng cấp ởnhóm lao động nam và nhóm lao động nữtrong
năm 2002.................................................874.1.1.2.Hồi quy và so sánh hệsốhồi quy
theo bằng cấp ởnhóm lao động nam và nhóm lao động nữtrong năm
2012.................................................924.1.1.3.So sánh hệsốhồi quy theo bằng cấp
ởnhóm lao động nam giữa năm 2002 và năm
2012...............................................................................974.1.1.4.So sánh hệsốhồi
quy theo bằng cấp ởnhóm lao động nữgiữa năm 2002 và năm
2012.............................................................................100
v4.1.2.Hồi quy phân vịtiền lƣơng theo khu vực thành thị-nông
thôn......................1024.1.2.1.Hồi quy và so sánh hệsốhồi quy theo bằng cấp ởnhóm
lao động thành thịvà nhóm lao động nông thôn trong năm
2002..............................1024.1.2.2.Hồi quy và so sánh hệsốhồi quy theo bằng cấp
ởnhóm lao động thành thịvà nhóm lao động nông thôn trong năm
2012..............................1064.1.2.3.So sánh hệsốhồi quy theo bằng cấp ởnhóm lao
động thành thịgiữa năm 2002 và năm
2012.....................................................................1094.1.2.4.So sánh hệsốhồi quy
theo bằng cấp ởnhóm lao động nông thôn giữa năm 2002 và năm
2012.....................................................................1124.2.Kết quảphân rã chênh lệch
tiền lƣơng..............................................................1144.2.1.Phân rã chênh lệch tiền
lƣơng theo giới tính...................................................1154.2.1.1.Phân rã chênh lệch
tiền lƣơng theo giới tính năm 2002.....................1154.2.1.2.Phân rã chênh lệch tiền
lƣơng theo giới tính năm 2012.....................1184.2.1.3.So sánh kết quảchênh lệch
tiền lƣơng theo giới tính ởkhu vực thành thịvà nông
thôn.....................................................................................1204.2.1.4.So sánh kết
quảphân rã chênh lệch tiền lƣơng theo giới tính giữa năm 2002 và
2012....................................................................................1224.2.2.Phân rã chênh
lệch tiền lƣơng giữa thành thịvà nông thôn.............................1234.2.2.1.Phân rã
chênh lệch tiền lƣơng giữa thành thịvà nông thôn năm 20021244.2.2.2.Phân rã
chênh lệch tiền lƣơng giữa thành thịvà nông thôn năm 20121274.2.2.3.So sánh
chênh lệch tiền lƣơng giữa thành thịvà nông thôn theo từng nhóm giới
tính..................................................................................1304.2.2.4.So sánh chênh
lệch tiền lƣơng giữa thành thịvà nông thôn năm 2002 và
2012..................................................................................................1314.2.3.Phân rã
chênh lệch tiền lƣơng giữa năm 2002 và 2012...................................1334.3.Kết
luận vềkết quảnghiên
cứu.........................................................................1374.3.1.Vềsựthay đổi hàm hồi
quy tiền lƣơng...........................................................1374.3.1.1.Sựthay đổi hàm hồi
quy tiền lƣơng theo giới tính.............................1374.3.1.2.Sựthay đổi hàm hồi quy
tiền lƣơng theo khu vực.............................1384.3.1.3.Sựthay đổi hàm hồi quy tiền
lƣơng theo thời gian............................1394.3.1.4.So sánh kết quảhồi quy hàm tiền
lƣơng ởViệt Nam với các nghiên cứu trƣớc
đó..........................................................................................................1414.3.2.Vềkế
t quảphân rã chênh lệch tiền lƣơng.......................................................142
vi4.3.2.1.Kết quảphân rã chênh lệch tiền lƣơng theo giới
tính.........................1424.3.2.2.Kếtquảphân rã chênh lệch tiền lƣơng theo khu
vực.........................1444.3.2.3.Kết quảphân rã chênh lệch tiền lƣơng theo thời
gian........................1454.3.3.So sánh kết quảphân rã chênh lệch tiền lƣơng của luận
án với các nghiên cứu
trƣớc..............................................................................................................146CH
ƢƠNG 5:KẾT LUẬN VÀ ĐỀXUẤT GIẢI
PHÁP....................................1515.1.Kết
luận....................................................................................................1515.2.Đềxuất
gợi ý một sốchính sách vềlao động tiền lƣơng...........................1555.2.1.Nhóm giải
pháp tăng tiền lƣơng của ngƣời lao động.......................................1565.2.2.Nhóm
giải pháp giảm bất bình đẳng tiền lƣơng giữa các nhóm lao
động........1575.2.2.1.Đối với vấn đềchênh lệch tiền lƣơng theo giới
tính..........................1585.2.2.2.Đối vớivấn đềchênh lệch tiền lƣơng theo thành thịnông thôn.......1605.3.Các kết quảchính của luận
án........................................................................1615.3.1.Vềmặt lý
thuyết.............................................................................................1615.3.2.Vềmặt
thực tiễn.............................................................................................1625.4.Những
hạn chếcủa luận án.............................................................................163PHỤLỤC
A: THỐNG KÊ MÔ TẢ....................................................................181PHỤLỤC
B : KẾT QUẢHỒI QUY PHÂN
VỊ...........................................................188PHỤLỤC C:KẾT QUẢPHÂN RÃ
CHÊNH LỆCH TIỀN LƢƠNG................206PHỤLỤC D:DANH MỤC HÌNH
VẼCHƢƠNG 3...........................................210PHỤLỤC E:DANH MỤC HÌNH
VẼCHƢƠNG 4...........................................219
PHẦN MỞ
ĐẦUGIỚI THIỆU VẤN ĐỀNGHIÊN CỨU
1.Lý do chọn đềtàiTiền lƣơng là một trong những yếu tốtạo động lực quan
trọng nhất trong lao động. Có rất nhiều các yếu tốtác động đến tiền lƣơng của
ngƣời lao độngnhƣ thịtrƣờng lao động,môi trƣờng làm việc, tính chất công việc
và đặc điểm của ngƣời lao động.Mỗi sựkhác nhau ởcác yếu tốnày có thểsẽdẫn đến
kết quảtrảlƣơngkhác nhau. Điều này tạosựchênh lệch vềtiền lƣơng. Bên cạnh đó,
chênh lệch tiền lƣơng còn là hệquảcủa việc phân công laođộng. Tiền lƣơng
sẽkhác nhaukhi mà mỗi ngƣời lao động đƣợc phân công đảm trách những công
đoạn, công việc khác nhau trongcùng một quy trình sản xuất. Nhƣ vậy, sựtồn tại
của chênh lệch tiền lƣơng là tất yếu.Tuy nhiên, các nhà kinh tếhọc nhƣ Becker
(1971), Cain(1986) phân biệt hai cách giải thích cho vấn đềchênh lệch tiền
lƣơng: đó là chênh lệch tiền lƣơng do phân biệt đối xửvà chênh lệch tiền lƣơng do
chênh lệch vềvốn con ngƣời và/hoặcnăng suất lao động.Sựchênh lệchtiền lƣơng
do chênh lệch vềvốn con ngƣời và/hoặcdo chênh lệch vềnăng suất lao động có
thểxem là những chênh lệch “tích cực” tạo ra động lực đểphát triển. Sựchênh lệch
tiền lƣơng do trình độhọc vấn sẽkhiến ngƣời ta cốgắng học hỏi đểđạt trình
độcao.Hay sựchênh lệch vềtiền công do chênh lệch vềnăng suất lao động, vềhiệu
quảcông việc, vềkhảnăng ngoại ngữ, vềviệc tích luỹkinh nghiệm, vềkhảnăng
sáng tạov.v... sẽtạo ra động lực đểngƣời lao động phấn đấu hoàn thiện chính mình,
từđó kích thích sựphát triển chung của xã hội. Những chênh lệch tiền lƣơng “tiêu
cực” thểhiện ởcác bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải điều
chỉnh. Ví dụnhƣ sựchênh lệch tiền lƣơng do kỳthịlao động nữgiới, ƣu ái lao động
nam giới,chênh lệch tiền lƣơng dẫn đến chênh lệch giàu nghèo, chênh lệch
mức sống giữa thành thị-nông thôn, v.v...Do vậy, có thểphân chia các nguyên
nhân của chênh lệch tiền lƣơng thành hai nhóm.Nhóm thứnhấtcó thểkểđến đó là
2do sựthay đổi của thịtrƣờng lao động,sựkhác nhau hoặcsựthay đổi của môi
trƣờng lao động tại nơi làm việc, do sựkhác nhau vềtính chất của công việc hoặc
do sựkhác nhau vềđặc điểm của bản thân ngƣời lao động.Nhómthứhailà do
sựkỳthịhoặc là do sựphân biệt đối xửtrong xã hội và/hoặc của ngƣời sửdụng lao
động đối với ngƣời lao động. Nhóm nguyên nhân này dẫn đến sựbất bình
đẳngtrong xã hội.Do vậy, nhằm (1) xác định mức độchênh lệchtiền lƣơng tại
Việt Nam, (2) xácđịnh các yếu tốthực sựtác động đến tiền lƣơngvà (3)phân
rãkhoảng chênh lệchtiền lƣơng đểlàm rõ phần chênh lệch giải thích theo
nhóm nguyên nhân thứnhấtvà phần thểhiện bất bình đẳng theo nhóm nguyên
nhânthứhainói trên, đềtài “Ứng dụng phương pháp hồi quy phân vịphân tích chênh
lệch tiền lương ởViệt Nam”đƣợc chọn làm đềtài cho luận án tiến sĩcủa tác giảtại
trƣờng Đại học Kinh tếTPHCM.2.Mục tiêu nghiên cứu Đểthực hiện các mục đích
trên, đềtài hƣớng đếnviệc hoàn thànhcác mục tiêu sauđây:1)Giới thiệumột cách
có hệthốngvềcơ sởlý thuyết và khảnăng ứng dụng phƣơng pháp hồi quy phân
vị, cũng nhƣ phƣơng pháp phân rãchênh lệch tiền lƣơng dựa trên hồi quy phân vị.
2)Thực hiệnhồi quy phân vịhàm tiền lƣơng thực tếởViệt Namvới biến
phụthuộc làlogarit tiền lƣơngthực tếtheo giờcủa ngƣời lao động. Hệsốcủa hàm tiền
lƣơng thực tếnày đƣợc ƣớc lƣợng bằng phƣơng pháp hồi quy phân vịcó hiệu
chỉnh tính chệch do chọn mẫu và khắc phục nội sinh.3)Xác định khoảngchênh lệch
tiền lƣơngtheo giới tính(nam –nữ,nam -nữởthành thị, nam –nữởnông thôn) và phân
rã các khoảngchênh lệch tiền lƣơng này đểlàm rõ phần chênh lệch đƣợc giải
thích bởi các biến độc lập và phần chênh lệch chƣa đƣợc giải thích gây ra bởi
chênh lệch vềhệsốhồi quy.Đồng thời so sánh kết quảphân tích chênh lệch tiền
lƣơng theo giới tính năm 2002 và 2012 đểlàm rõ sựthay đổi theo thời gian.
34)Xác định khoảngchênh lệch tiền lƣơngtheo khu vực(thành thị-nông thôn,
thành thị-nông thôn ởnam giới, thành thị-nông thônởnữgiới). Phân rã các
khoảngchênh lệch tiền lƣơng này đểlàm rõ phần chênh lệch đƣợc giải thích bởi
các biến độc lập và phần chênh lệch chƣa đƣợc giải thích gây ra bởi chênh lệch
vềhệsốhồi quy.Đồng thời so sánh kết quảphân tích chênh lệch tiền lƣơng
theo khu vực năm 2002 và 2012 đểlàm rõ sựthay đổi theo thời gian.5)Xác định
mứctăng lƣơng theo thời gian từnăm 2002 đến năm 2012. Phân rã sựtăng lƣơng
này thành hai phần:phần tăng lƣơng là do thay đổi vềđặc điểm lao động và phần
tăng lƣơng là do thay đổi hệsốhồi quy. 3.Đối tƣợng –phạm vi nghiên cứuĐềtài này
đƣợc thực hiện đựa trên bộsốliệukhảo sát mức sốnghộgia đình (VHLSS)năm
2002 và 2012do Tổng cục Thống kê công bố. Đối tƣợng nghiên cứu của đềtài cũng
chính là đối tƣợng đƣợc khảo sát vềtiền lƣơng và các yếu tốcó liên quan trong
cáccuộc khảo sát này. Phạm vinghiên cứu của đềtài lànghiên cứu tiền lƣơng thực
tếtheo giờcủa các đối tƣợng trong độtuổitrên lãnh thổViệt Nam. 4.Ý nghĩa khoa
học và ý nghĩa thực tiễn Với mục tiêu nghiên cứu và phƣơng pháp nghiên cứu
đƣợc lựa chọn, đềtài của luận án mang lại các ý nghĩa khoa học và thực tiễn sau
đây:(a)Đềtài áp dụng phƣơng pháphồiquy phân vị, một kỹthuật hồi quyđƣợc giới
thiệu bởi Koenker & Bassett (1978)và đã đƣợc dùng rất rộng rãi trên thếgiới
nhƣng chƣa phổbiến ởViệt Nam. Rất ít các đềtài nghiên cứu ởViệt Nam áp dụng
kỹthuật hồi quy phân vị, đặc biệt là áp dụng trong nghiên cứu hàm tiền lƣơng
vàphân rã chênh lệch tiền lƣơng. (b)Đềtài trình bàymột cách ngắn gọn, đầy đủvà
có hệthống vềlý thuyếtcủa phƣơng pháphồi quy phân vị. Đây làđiều mà cho đến
nay chƣa có tác giảởViệt Namnàothực hiện.(c)Hàm tiền lƣơng của các nhóm
lao động đƣợc ƣớc lƣợng bằng phƣơng pháp hồi quy phân vịcó hiệu chỉnh
tính chệch do chọn mẫu và có xửlý
4hiện tƣợng nội sinh trong mô hình, đem lại ƣớc lƣợng vững và đáng tin cậy.
(d)Đềtài xây dựng và ƣớc lƣợng hàm tiền lƣơng ởViệt Nam bằng phƣơng
pháp hồi quy phân vịcho từng nhóm lao động cụthể:lao động nam và lao động nữ,
lao động thành thịvà lao động nông thôn, lao động nam ởthành thịvà lao động
nữởthành thị, lao động nam ởnông thôn và lao động nữởnông thôn.(e)Đềtài xác
định mứcchênh lệch tiền lƣơng theo giới tính ởViệt Nam(trên toàn bộmẫu sốliệu
cũng nhƣ ởtừng khu vực thành thị-nông thôn). Đồng thời đềtàinghiên cứu sựthay
đổi các mức chênh lệch này theo thời gian bằng cách so sánh kết quảtính toán
giữa năm 2002 với2012. (f)Đềtài phân rã khoảng chênh lệch tiền lƣơng theo
giới tính đểxác định phần chênh lệch tiền lƣơngthểhiện qua phầnchênh lệch vềđặc
điểm lao động và phần chênh lệch thểhiện quasựkhác nhau vềhệsốhồi quy (được
xem như là dấu hiệu của phân biệt đối xửtiền lương giữa nam và nữ)(g)Đềtài xác
định mứcchênh lệch tiền lƣơng giữa hai khu vực thành thịvà nông thônởViệt Nam
và nghiên cứu sựthay đổi của mức chênh lệch này theo thời gian bằng cách so sánh
kết quảtính toán giữa hai hai thời điểm nghiên cứulà năm 2002 và 2012. (h)Đềtài
phân rã khoảng chênh lệch tiền lƣơng giữa hai khu vực thành thịvà nông thônnhằm
xác định phần chênh lệch thểhiện quakhác nhauvềđặc điểm lao động và phần
chênh lệch thểhiện thông qua khác nhau vềhệsốhồi quy (được xem như là dấu
hiệucủa sựkhác nhau trong chính sách đãi ngộcủa khu vực thành thị-nông thôn)
5
CHƢƠNG 1
CƠ SỞLÝ THUYẾTVỀHÀM TIỀN LƢƠNG VÀ VẤN ĐỀPHÂN TÍCH CHÊNH
LỆCH TIỀN LƢƠNGBẰNG HỒI QUY PHÂN VỊNhằm thực hiện các mục tiêu
nghiên cứu đã nêu, đềtài áp dụng phƣơng pháp hồi quy phân vịcó hiệu chỉnh tính
chệchdo vấn đềchọn mẫu và có xửlý nội sinh đểƣớc lƣợng hàm tiền lƣơng dạng
Mincer(1974) mởrộng. Biến phụthuộc đƣợclựa chọn là logarit tiền lƣơng thực
tếdựa trên sốliệu của VHLSS 2002 và VHLSS 2012. Sau đó, phƣơng pháp
Machado -Mata(2005) đƣợc áp dụng đểtiến hành phân rã chênh lệch tiền
lƣơng và xác định các thành phần của khoảng chênh lệch này. Do vậy,
chƣơng 1 sẽbao gồm các nội dung sau đây:-Trình bày hàm tiền lƣơng do Mincer
(1974) đềxuất và một sốcác mởrộng.-Trình bày phƣơng pháp hồi quy phân vịdo
Koenker & Bassett (1978) đềxuất và các đặc điểm của hồi quy phân vị.-Tính chệch
của ƣớc lƣợng do vấn đềchọn mẫu và hiệu chỉnh ƣớc lƣợng chệch do chọn mẫu
đối với hồi quy phân vị-Phƣơng pháp phân rã chênh lệch doMachado -Mata(2005)
đềxuất 1.1.HÀM TIỀN LƢƠNG MINCER(1974) VÀ CÁC NGHIÊN CỨU
MỞRỘNGMincer(1974) đã giới thiệu phƣơng trình tiền lƣơng thểhiện mối quan
hệgiữa logarit tiền lƣơng (hoặc tiền công/thu nhập) với các yếu tốnhƣ sốnăm đi
học,kinh nghiệm làm việc và bình phƣơng của biến kinh nghiệm dựa trên lập luận
rằng
sốtiền công đƣợc trảcho một ngƣời trong hiện tại phụthuộc vào mức đầu tƣ
vào vốn con ngƣời (human capital) của bản thân họtrƣớc đó.Ký hiệu mức tiền
lƣơng nhận đƣợc tại thời điểm t là tE. Mincer giảsửrằng đầu tƣ của một cá nhân
vào vốn con ngƣời của bản thân ởkỳt là tk, hiệu quảtƣơng ứng cùng kỳmang lại
cho mỗi đơn vịđầu tƣ là tr. Khi đó, mức tiền lƣơng nhận đƣợc ởthời điểm t đƣợc
thểhiện nhƣ sau:1
1
1(1
)t
t
t
tE E
r
k
0,1, 2...tLần lƣợt thay thếtEbằng các kỳtrƣớc đó theo công thức
truy hồi,ta đƣợc 100(1
) .tt
j jjE
rk
ELấy logarit nepe hai vế,ta đƣợc100ln
ln
ln(1
).tt
j jjE
E
r k
Giảsửrằng -Sốnăm đi học (s) là sốnăm đƣợc dành toàn thời gian cho việc học
của ngƣời lao động (trong thời gian đi học 0
1
1...
1sk
k
k (năm)).-Hiệu quảmang lại của sốnăm đi học đối với tiền
lƣơng tiềm năng là không đổi theo thời gian (0
1
1...sr r
r ).-Hiệu quảmang lại của việc đầu tƣ cho đi học sau khi tốt nghiệp
đối với tiền lƣơng tiềm năng là không đổi theo thời gian (1...strr ).Khi
đó phƣơng trình tiền lƣơng đƣợc viết lại nhƣ sau10ln
ln
ln(1
)
ln(1
).ttjjsE
E s
k Ta
có ln(1 ) xvà xlà hai vô cùng bé tƣơng đƣơng khi (
trịcủa ,khá nhỏ,ta đƣợc10ln
lnttjjsE
E
s
0)xDo đó, khigiá
k
7Đểxây dựng mối quan hệgiữa tiền lƣơng tiềm năng và thâm niên công
tác,Mincer giảsửrằng đầu tƣ vào học vấn sau tốt nghiệp giảm dần theo thời
gian với dạng hàm sốnhƣ sau:1szzkTtrong đó 0;
(0,1)z t
s và T là sốnăm làm việc cuối cùng đƣợc xét.Thay tất cảvào hàm
tiền lƣơng đã tính toán ởtrên,ta đƣợc20ln
ln
.
22tE
E
s
z
zTT
Khi đó, tiền lƣơng thuần thu đƣợc do
chi phí đầu tƣ vào học vấn sau khi tốt nghiệp là:20ln
1
ln
.22tzE
E
s
z
zT
T T
T
Hoặc có thểviết lại theo một cách khác:2ln
1
.tzE
s z
zT
Với0ln
..2.2ETTT
Cuối cùng,giảsửtiền lƣơng thực tếghi nhận
đƣợc bằng với tiền lƣơng tiềm năng thuần tại bất kỳthời điểm t, nghĩa làln
ln
1
.ttzwET Khi đó,phƣơng trình tiền lƣơng của Mincer
sẽcó dạng2lntw
s
z
z với.z t s
8Đây là phƣơng trình tiền lƣơng Mincer dạng tĩnh, đƣợc sửdụng rất nhiều trong
các công trình nghiên cứu vềtiền lƣơng và phân tích sựchênh lệch tiền lƣơng.Một
trong những công trình nghiên cứu xuất sắc, kếthừa phƣơng trình tiền lƣơng
của Mincer(1974) đƣợc phát triển bởi Card (1994).Công trình này tập trung nghiên
cứu tác động trung bình của sốnăm đi học đến tiền lƣơng, thông qua kỹthuật
hồi quy theo phƣơng pháp bình phƣơng nhỏnhất và phƣơng pháp hồi quy với
biến công cụ. Dạng hàm tiền lƣơng đƣợc mởrộng thành dạng 2ln
.tw
s
z
z
X u (1.1)Trong
đó, s:sốnăm đi họcz: Sốnăm kinh nghiệm tính đến thời điểm tvới z t sX: Các
biến độc lập khác có tác động đến tiền lƣơng nhƣ giới tính, công việc, ngành
nghề....Sau công trình nghiên cứu của Card(1994),rất nhiều các nghiên cứu
khác đã mởrộng phƣơng trình tiền lƣơng của Mincer. Các công trình này
không phải chỉnghiên cứu tiền lƣơng trung bình và phân tích chênh lệch tiền
lƣơng trung bình, nhƣ nghiên cứu của Oaxaca-Blinder(1973), mà còn mởrộng ra
nghiên cứu các tham sốthống kê khác của hàm phân phối có điều kiện của
tiền lƣơng.Trong sốđó,Buchinsky(1994) thực hiện hồi quy phân vịtrên hàm
tiền lƣơng của Mincer. Tiếp theo đó là hàng loạt các nghiên cứu khác vềtiền
lƣơng và chênh lệch tiền lƣơng dựa trên phƣơng trình tiền lƣơng của Mincer đã
đƣợc công bố.Những nghiên cứu khác nhau sửdụng những biến độc lập khác nhau
trong hàm tiền lƣơng Mincer(1974) mởrộng. 1.2.PHƢƠNG PHÁP HỒI QUY
PHÂN VỊPhƣơng pháp hồi quy phân vịđƣợc Koenker & Bassett giới thiệu
lần đầu tiên năm 1978. Thay vì ƣớc lƣợng các tham sốcủa hàm hồi quy trung bình
bằng phƣơng pháp OLS, Koenker & Bassett(1978) đềxuất việc ƣớc lƣợng
tham sốhồi quy trên từng phân vịcủa biến phụthuộc đểsao cho tổng chênh
lệch tuyệt đốicủa hàm hồi quy tại phân vịτ của biến phụthuộc là nhỏnhất.Nói một
cách khác, thay vì xác định
9tácđộng biên của biến độc lập đến giá trịtrung bình của biến phụthuộc, hồi
quy phân vịsẽgiúp xác định tác động biên của biến độc lập đến biến phụthuộc trên
từng phân vịcủa biến phụthuộc đó. Trong Mục1.1.2, đềtài giới thiệu đầy đủcác
định nghĩa, tính chất của hồi quy phân vị. Đồng thờiđềtài so sánh phƣơng pháphồi
quy phân vịvới phƣơng pháp OLS của hồi quy cổđiển đểcho thấy ƣu điểm của hồi
quy phân vịvà sựphù hợp của hồi quy phân vịtrong những nghiên cứu
vềchênh lệch tiền lƣơng,cũng nhƣ trong các nghiên cứu vềbất bình đẳng trong xã
hội. a.Giới thiệu phương pháphồi quy phân vịĐịnh nghĩavềphân vị:Cho Ylà một
đ.l.n.n với hàm phân phối YF. Với (0,1)thì giá trịphân vịτcủa Ylà giá
trịQsao cho Pr(
)
Pr(
).Y Q
Y Q
(1.2)Hoặc có thểviết lạiinf : ( )
.YQ
y F y(1.3)Nếu
Y là mộtđ.l.n.nliêntục, thì:Pr(
) Pr(
)
( )YY y
Y y F y
.Vì vậy: ( ) .YFQ(1.4)Nếu F liên tục và tăng chặt
thì1( ).YQFĐiều này có nghĩa là 100 %sốquan sát của Ycó giá trịkhông
vƣợt quá giá trịphân vịQvà100(1 )%sốquan sát của Ycó giá trịkhông thấp
hơnQ. Giá trịphân vị, cũng nhƣ giá trịkỳvọngcủa một đ.l.n.n, luôn là lời giải của
một bài toán cực trịliên quan đến đ.l.n.n đó.Cụthể, giá trịkỳvọng E(Y)của đ.l.n.n
Ylà lời giải cho bài toán tìm Rsao cho 2(
)
( )YRy
dF
yđạt cực tiểu.(1.5)Trong khi giá trịtrung bình của Ylời giảibài toán tìm
cực tiểu (1.5) thì giá trịphân vịQcủa Ylà lời giải của bài toán tìm cực tiểu hàm
mục tiêu sau( )
|
|
( ) (1 ) |
|
( ).YYyyL
y
dF y
y
dF y
(1.6)
10Hayarg min
y
dF y
(
)
y
( ) ( 1) |
|
( ).YYRyyQ
dF y
(1.7)Dạng rời rạc của (1.7) là ||1arg min
(
)
( 1)
(
) .iiiiRi Z
i ZQ
Y
Yn
(1.8)Nếu ta ký hiệu { 0}.
0,( ) .(
)( 1)
u<0,uu
khi uu u
Iu khi với I(u<0) là
hàm chỉsố(index function){ 0}0
0 ,1
0.ukhi uIkhi
u(1.9)Ta có thểviếtngắn gọn công thức(1.8) thành11arg min
(
).niRiQYn(1.10)Định nghĩavềxác suất có điều kiện và phân
vịcó điều kiệnHàm phân phốixác suất đồng thời của hai biến ngẫu nhiên Xvà
Y, ký hiệu là ( , )F x y,đƣợc định nghĩa nhƣ sau:( , ) Pr(
,
).F x
y
X x Y y Trong trƣờng hợp liên tục, ( , )
( , )yxF
x y
f s t dt ds ,với ( , )f x ylà hàm mật độđồng thời thỏa
mãn 0
( , )f x yvà ( , )
1f x y dy dx
Trong trƣờng hợp rời rạc, ( , )
( , )yxstF x y
f s
t ,với ( , )f x ylà hàm mật độđồng thời thỏa mãn 0
( , )f
x yvà ( , ) 1xyf x yNếu X và Y có hàm mật độđồng thời là ( , )f x
y. Khi đó hàm mật độxác suất biên(marginal density function) của Yđƣợc xác định
bởi
11( )
( , )Yf y
f x y dxnếu Ylà liên tục,hoặc( )
(
, )Yxf y
f x ynếu Ylà rời rạc.Tƣơng tự, hàm mật độxác suất
biên(marginal densityfunction) của Xlà( )
( , )Xf x
f x y
dynếu Xlà liên tục,hoặc( )
( , )Xyf x
f x ynếu Xlà
rời rạc.Hàm mật độxác suất có điều kiệncủa Ytại X=x đƣợc định nghĩa là |( , )
( | )
.()YXXf x yf y xfxnếu ( ) 0XfxHàm mật độxác suất
cóđiều kiệncủa Xtại Y=y là|( , )( | )()YXYf x yf x yfynếu ( )
0YfyHàm phân phối xác suất có điều kiện của YtạiXxlà:|( | )
( | )
YXyF y x
f y x dynếu Yliên tục,và|( | )
( | )YXyF
y x
f y xnếu Yrời rạc.Kỳvọng có điều kiện của Y tạiX= xlà |( |
)
.
( | )YXE Y X x
y f y x dynếu Yliên tục,|( |
)
.
( | )YXyE Y X x
y f
y xnếu Y rời rạc.Luật kỳvọng truy
hồi (Law of iterated Expectation)
XE(Y) E E(Y | X
x), trong đó EX(.) là phép lấy kỳvọng theo các giá trịcủa x.Phân vịcó điều kiện
tại phân vịcủa Y tại X = xđƣợc xác địnhnhƣ sau|( |
) inf
:
( | )
).YXQ Y X x
y F
y x
(1.11)
12Nếu|( | )YXF
y xlà liên tục thì |( |
)|
.YXF
Q Y X
x X x Nếu |( | )YXF
y xlà liên tục và tăng chặt thì 1|( | )
( | ).YXQ Y X F
X(1.12)Khi gần 0, ( |
)Q Y X
xthểhiện phần đuôi trái của hàm phân phối có điều kiện |( | )YXF
y
x.Khi gần 1, ( | )Q Y Xthểhiện phần đuôi phải của hàm phân phối có
điều kiện |( | )YXF
y x.Trong kinh tếlƣợng, việc mởrộng bài toán (1.3)
với trƣờng hợp Y có dạng hàm số( , )Y h X
uđểtìm ra hàm
kỳvọng có điều kiện ( | )
( , )E Y X h Xđƣợc gọi là phương
pháphồi qui y theo x.Tƣơng tự, Koenker & Bassett (1978) cũng đềxuất dạng
mởrộng của bài toán (1.10) đểtìm ra hàm phân vịcó điều kiện( | )Q Y X.
Phƣơng pháp này gọi là phƣơng pháp hồi quy phân vị.Đểmởrộng bài toán (1.10),
giảsửta có mẫu sốliệu với các quan sát ,iiYX, 1,invới iXlà vectơ1k.
Biến phụthuộc Ycó dạng( , )i
i
iY h X
utrong đó iulà sai sốcủa quan sát thứi khi xéttại phân vịτthỏa ( |
) 0iiQ u X.Khi đó, ta cần tìm hàm phân vịcó điều kiện ( | ) ( ,
)i
i
iQ Y X h Xđểhàm số1(
( , )niiiY h
Xđạt giá trịnhỏnhất.Tuy nhiên,việc tìm hàm phân vị( | )iiQ Y
Xcũng chính là tìm hệsốhồi quy . Bài toán trởthành tìm đểcực tiểu biểu
thức 1(
( , )niiiY h X. Khi xét bài toán này trên một
mẫu sốliệu cụthểsẽthu đƣợc ƣớc lƣợng của ,ký hiệu ˆ,Nghĩa là11ˆarg min
(
( , )).kniiRiY h Xn
Nếu( , )ihXlà hàm tuyến tính, tức là ( , )
,iih X
Xthì11ˆarg min
(
).kniiRiYXn
(1.13)
13Đặt11( , )
(
).niiiV
Y Xn
Khi đó, phƣơng trình (1.13) trởthànhˆarg min
( , ).kRV
và ˆ( | )
( , )i
i
iQ
Y X
h Xtrởthành hàm hồi quy phân vịởphân vị.Tƣơng tự, hàm hồi
quy phân vịtuyến tính ởphân vịcódạng( | )
.i
i
iQ Y X
XVà hàm hồi quy phân vịtuyến tính mẫu ởphân vịsẽlàˆ( | )i
i
iQ Y X
Xhay ˆi
i
iY X
uvới( | ) 0.iiQ u X(1.14)Giá trịˆtrong (1.14) tìm
đƣợc bằng cách chọn tham sốhồi quy phân vịsao cho hàm mục tiêu11( , )
(
)niiiV
Y Xn
đạt giá trịnhỏnhất. Khi đó, ƣớc lƣợng đạt đƣợc khi xét trên một
mẫu sốliệu, cụthểlà ˆarg min ( , ),kRV
(1.15)với11( , )
(
).niiiV
Y Xn
(1.16)Hàm mục tiêu ( , )Vcó thểcó
nhiều cách biểu diễn khác nhau.011( , )
.iiniiYXiV
I
Y Xn
(1.17)Hàm mục tiêu (1.17) có thểbiểu diễn lại một
cách tƣơng đƣơng{ |
}
{|
}1( ,
)
.
( 1).
.i
i
i
ii
i
i
ii Y X
i Y XV
Y X
Y Xn
(1.18)Cách viết này cho thấy việc ƣớc lƣợng tham
sốtrong hàm hồi quy ứng với phân vịlà dựa trên toàn bộmẫu sốliệu. Mỗi quan sát
đƣợc gán trọng sốtƣơng ứng. Cụthể, những quan sát nằm phía trên đƣờng hồi
quy phân vịđƣợc gán trọng sốvà những quan sátnằm phía dƣới đƣợc gán
trọng số1. Công thức ( , )Vở(1.18) còncó thểviết dƣới dạng khác nhƣ
sau11
1 1( , )
sgn
.
.
22ni
i
i
iiV
Y X
Y
Xn
(1.19
trong đó sgn(.)là hàm dấu,với { 0}sgn( ) 1 2zzIvới (.)Ilà hàm chỉsốđã
định nghĩa ở(1.9).Nếu12,hồi quy phân vịsẽcho kết quảhàm hồi quy trung
vịcó điều kiện 0,5
0,5( | )i
i
iQ Y X
X.Đây cũng chính là lời giải của bài toán hồi quy theo phƣơng pháp
LAD (Least Absolute Deviation–Độlệchtuyệt đối nhỏnhất) rất phổbiến trong
kinh tếlƣợng cổđiển0 ,51ˆarg min
.knLAD
i
iRiYX(1.20)Trong hồi quy phân vị, ứng với
mỗi phân vị(0,1), ta có thểƣớc lƣợng đƣợc một hàm hồi quy. Hình 1.1 là
một hình vẽminh họa cho trƣờng hợp hồi quy đƣợc thực hiện trên các phân
vị0,1 –0,25 –0,5 –0,75 và 0,9. Nguồn:tác giảtính toán từsốliệu mô phỏng trên
StataHình 1. 1:Đồthịbiểu diễn các kết quảhồi quyphân vịcủaY theo
Xq10q25q50OLSq75q90121416182068101214xyq10q25q50q75q90OLS
15Hồi quy bằng phƣơng pháp OLS chỉthu đƣợc một đƣờng hồi quy duy nhất
thểhiệngiá trịtrung bình có điều kiện của biến phụthuộc Y theo các giá trịcủa biến
độc lập X. Trong khi đó, hồi quy phân vịcho thấy đƣợc nhiều hàm hồi quy ứngvới
từng phân vịcủa biến phụthuộc.b.Tính chất của phƣơng pháp hồi quy phân vịTheo
Koenker(2005) và Hao& Naiman (2007),hồi quy phân vịcó những tính chất quan
trọngthểhiện ƣu điểm của phƣơng pháp hồi quy này so với phƣơng bình phƣơng
nhỏnhất. b.1.Tínhđẳng biến (Equivariance)Giá trịphân vịcó tính đẳng biến khi biến
đổi qua hàm sốđơn điệu:với (.)hlà một hàm sốbất kỳkhông giảmvà Y là
một đ.l.n.n liên tục, thì ta có(
)
( ( )
( ))P Y a
P hY h
a
.Vìvậy( )
( )Q h Y
h Q Y.Từđó, Koenker
(2005) chứng các tính chất đẳng biến quan trọng của hồi quy phân vị1.-Hồi quy
phân vịcó tính đẳng biến khi thay đổi quy mô(scale equivariance)Cho *.iiYYvà
*là tham sốcủa hàm hồi quy phân vị*iYtheo iX. Khi đó,+nếu0thì *.
(1.22)+nếu0thì *1. (1.23)+Trƣờng hợp đặc biệt, khi 0,
5thì*0,5
0,5ˆˆ. -Hàm hồi quy phân vịcòn có tính chất đẳng
biến khi thay đổi vịtrí. Nghĩa là, nếu*i
i
iy
y Xvà
*là tham sốcủa hồi quy phân vịcủa *iytheoiXthì*ˆˆ. (1.24)-Một
tính chất khác của hồi quy phân vịlà đẳng biến khi thay đổi dạng biến số.Cụthể,
nếu*.X
X Avới Alà ma trận không suy biến, thì*1ˆˆ.A1Xem trang
38 của Koenker (2005)
16Tính đẳng biến của hồi quy phân vịđặc biệt hữu ích trong các tính toán biến đổi
đểƣớc lƣợng tham sốkhi dùng phƣơng pháp quy hoạch tuyến tính. b.2.Tínhổn
định (robustness)Vớihồi quy cổđiển, các ƣớc lƣợng của phƣơng pháp bình
phƣơng nhỏnhất thay đổi ngay khi iYthay đổi. Mỗi sựthay đổi trong iYsẽdẫn
đến sựthay đổi của các ƣớc lƣợng hồi quy OLS. Điều này làm cho ảnh
hƣởng của các quan sát bất thƣờng (extreme value) đến ƣớc lƣợng của OLS là
rất lớn.Trong khi đó, đối với hồi quy phân vị, khi iYthay đổi nhƣng chƣa làm biến
đổidấu của ˆiiYXthì các tham sốƣớc lƣợng của hồi quy phân vịkhông
thay đổi. Nói khác đi, ngƣời ta có thểthay đổi giá trịcủa một quan sát ởmột phía
bất kỳcủa đƣờng hồi quy phân vịmà không làm ảnh hƣởng đến kết quảhồi quy,
nếu sựthay đổi đó không làm thay đổi phía của quan sát so với đƣờng hồi quy
phân vị. Do đó, cho dù nếu có thay thếmột quan sát ban đầu bằng một quan sát bất
thƣờng thì giá trịcủa tham sốƣớc lƣợng trên hồi quy vẫn không thay đổi nếu quan
sát bất thƣờng này nằm cùng phía với quan sát ban đầu so với hàm hồi quy. Vì
vậy,ƣớc lƣợng bằng phƣơng pháp hồi quy phân vịđƣợc xem là có tính ổn định
hơn so với ƣớc lƣợng OLS(Hao & Naiman(2007), trang 41) . b.3.Hàm hồi quy
phân vịkbiến luôn đi qua ít nhất k quan sát của mẫu nghiên cứuXét hàm mục tiêu
đƣợc viết dƣới dạng công thức (1.17):011( , )iiniiYXiV
I
Y Xn
(1.25)Hàm mục tiêu này liên tục và khảvi tạiiiYX. Tại những điểm
iiYX, đạo hàm có hƣớng2của ( , )Vtheo hƣớng vecto đơn
vịwlà2Xem trang 32 của Koenker (2005)
170010( , )
(
|1i
i
iitni
i
iY X
X wtitdV
w
V
X wtdtdY X
X wt
In
dt
11(
0)11(
) 01(1 )
(
) 01(
)
(
) 0ini
i
iini
i
iinX w
i
i
iiX w
khi Y XnX w
khi Y XnI
X
w khi Y Xn
*1(
,
)ni
i
i
iiY X
Xw X
w
(1.26)Với 0*00( , )0uvI
khi
uuvI
khi uMột điểm **( , )sẽđƣợc
gọi là cực tiểu của ( , )Vnếu tất cảcác đạo hàm theo hƣớng của ( , )
Vtại **( , )đều không âm, nghĩa là **( , , ) 0Vwvới
mọi pwRcó 1w. Ký hiệu ˆ( , )là điểm cực tiểu của hàm( , )
V.Khi đó, phần dƣ của hàm hồi quy phân vịtƣơng ứng là:ˆi
i
ie
Y X.Xét trƣờng hợp n = kvànbRsao cho 1,iiY X b i
kthì bsẽlàm cho ( , )Vđạt cực tiểu, vì các đạo hàm có hƣớng tại
blà011(
)
0ikiXwiI
Xw
wk
Phƣơng án này xảy ra ởk quan sát đầu tiên vàphƣơng án này cũngđƣợc coi là
nghiệm cơ bản của (1.19). Ký hiệu là tập con gồm có kphần tửcủa 1, 2,...,nvà
là tập hợp tất cảcáctập. Đồng thời, gọi ()Xlà ma trận cấp kkvới các dòng
tƣơng ứng là ,iXi(Nghĩa là từn dòng của ma trận X chọn rakdòng với các
dòng có chỉsốthuộc tập) và ()ylà vectơcột cấp 1kvới các phần tửtƣơng ứng
18là ,iYi.Khi đó hệnghiệm cơ bản là 1( )
( ) . ( )b
X
y
với . Mỗi phƣơng án thỏa mãn miền ràng buộc đều chứa ktrong
sốn quan sát của mẫu nghiên cứu, phƣơng án bđƣợc nêu ra trƣớc đó cũng là
một trong sốcác phƣơng án ()bvới trƣờng hợp 1,...,kứng với kquan sát
đầu tiên. Hình 1. 2:Đƣờng hồi quy phân vị2 biến đi qua ít nhất 2 quan sát của
mẫuNguồn: tác giảtính toán từsốliệu mô phỏngNhƣ vậy, phƣơng án tối ƣu của
bài toán quy hoạch tuyến tính trong hồi quy phân vịlà một trong sốcác
phƣơng án ()bnên chắc chắc cũng sẽđi qua ít nhất kquan sát của mẫu. Hay nói
cách khác, có ít nhất kquan sát có phần dƣ bằng 0 trong hàm hồi quy phân vịcủa
mẫu.Hình 1. 2là một ví dụminh họa bằng hình ảnh của tính chất trên đối với
một hàm hồi quy phân vịhai biến. Nhìn trên đồthị, mỗi dấu chấm là biểu diễn của
một quan sát trong mẫu, ta nhận thấy mỗi hàm hồi quy phân vịtrên hình đi qua ít
nhất hai quan sát của mẫusốliệu có đƣợc.b.4.Sốquan sát có phần dư âm của hàm
hồi quy phân vịứng với phân vịτ có thểđạttỷlệcao nhất là
τq25q751012141689101112xyq75q25
19Xét phần dƣ ˆi
i
ie Y Xcủa hàm hồi quy phân
vịcó chứa hệsốtựdo. Ký hiệu Plà sốquan sát có phần dƣ dƣơng;Nlàsốquan sát có
phần dƣâm và Zlà sốquan sát có phần dƣ bằng 0. Khi đóN n
N Z
(1.27)(1 )P n
P Z (1.28)Từtính chất này có thểsuy ra
rằng với mỗi hàm hồi quy ứng với phân vịthì sẽcó không quá .100%sốquan sát
của mẫu nằm phía dƣới đƣờng hồi quy phân vị(có phần dƣ iuâm) và không
quá(1 ).100%sốquan sát nằm phía trên (có phần dƣ iukhông âm) hàm hồi
quy phân vịđang xét.3b.5.Tính tăng dần của các hàm hồi quy phân vị4tại giá
trịtrung bình của XKý hiệu11niiXXnlà giá trịtrung bình của X. Gọi hàm hồi
quy phân vịởphân vịlàˆ( | )Q Y X X. Giảsửxét tại haiphân
vị12,sao cho 12thì ta luôn có21ˆˆ(
)
0XX(1.29)Công thức(1.29) hàm ý rằng, khi cùng xét tại X,giá
trịƣớc lƣợng ˆ( | )iiQ Y Xứng với phân vịcao hơn sẽluôn lớn hơn giá trịƣớc
lƣợng ˆ( | )iiQ Y Xtại phân vịthấp hơn. Tuy nhiên, tính chất này chƣa chắc
đúng khi xét tại những giá trịX bất kỳkhác.Tính chất này đƣợc minh họa trên Hình
1. 3. 3Xem trang 56 của tài liệu Koenker (2005)4Xem trang 56 của tài liệu
Koenker (2005)
20Hình 1. 3:Giá trịhồi quy tăng dầnkhi phân vịtăng dần tại X trung bìnhNguồn: tác
giảtính toán từsốliệu mô phỏngb.6.Ước lượng của hồi quy phânvịlà ước lượng MestimatorƢớc lƣợng M-estimatorđƣợc đềcập lần đầu tiên trong kết quảnghiên cứu
của Gouriéroux và Monfort (2008). Giảsửxét một mô hình tham sốhoặc bán
tham sốvới tham sốvà các quan sát 1,...,( , )i
i i
nXy,một
ƣớc lƣợng đƣợc gọi là M-estimator của một hàm ()gnếu ƣớc lƣợng đólà
lời giải của bài toán cực trị()1min
( , , )niiggiy X g. Một
M-estimator của một hàm đƣợc chứng minh là luôn hội tụvềgiá trịđúngcủa
hàm sốđó nếu thỏa mãn các điều kiện chính quy (regularity conditions)+Các
cặp quan sát ( , )iiXylà i.i.d(independent identically distributed -độc lập và có
cùng phân phối).+()glà một tập mở
là một hàm liên tục theog,kỳvọng có điều kiện của theo các giá trịthực của ( ,
)Xyluôn tồn tại với mọi g+11( , , )niiiy X gnlà hội tụhầu chắc chắn
theo trên ()gvề( , , )X o
i
iE E y X g+Lời giải duy nhất
của bài toán cực trịlà 00()ggtrong đó 0là tham sốcủa hàm phân phối
“đúng” Trong bài toán hồi quy phân vị, ƣớc lƣợng ˆlà lời giải bài toán
cực tiểu (1.17), vì thếˆcó thểcoi là một M-estimator và khimô hình hồi quy
phân vịthỏa mãn các điều kiện chính quy thì nó cũng hội tụvềgiá trịđúng của tham
sốhồi quy cần tìm.b.7.Ước lượng của hồi quy phân vịcó thểxem là xấp xỉcủa ước
lượng GMM (General Method of Moment)Theo Buchinsky(1998b), ƣớc lƣợng
thu đƣợc từ(1.13) của hồi quy phân vịcó thểxem là xấp xỉcủa một ƣớc
lƣợng GMM.Điều này có thếđƣợc từđiều kiện cần (F.O.C –first order
condition)đểhàm số( , )Vđạt cực
trị:0110.iiniYXiXIn(1.30)Biểu thức (1.30) có dạng của
một hàm moment phù hợp với một ƣớc lƣợng GMM.Điều này cho thấy cácƣớc
lƣợng tính đƣợc bằng phƣơng pháphồi quy phân vịcũng có thểxem là ƣớc lƣợng
GMM. Vì vậy,các ƣớc lƣợng ˆtính đƣợc bằng phƣơng pháphồi quy phân
vịcũng có những tính chất mà một ƣớc lƣợng GMM có, đó là tính vững, tính
tiệm cận chuẩn. Riêng tính hiệu quảcủa ˆcó thểcải thiện bằng cách chọn
ma trận trọng sốxác định dƣơng phù hợp. Xét hàm moment0( , , )iii
i
iYXm Y X
X
I(1.31)
22Hàm kỳvọng của (1.31) có dạng00|( , , )
|
(
)iiiii
i
iYXiiYXi
Y X
iE m
y X
E X
IE X
E I
XE X
F
XK
hi phân vịhồi quy đƣợc thực hiện tại phân vị,tham sốnhận giá trịcụthểlà,thì|
()Y X
iFXphải bằng sao cho ( , , ) 0iiE m
y
XKhi đó,các ƣớc lƣợng tham sốcủa hàm hồi quy phân vịtại phân vịcó
thểđƣợc xác định bằng phƣơng pháp GMM với hàm kỳvọng [ ( , , )] 0iiE
m
y X(1.32)Theo Buchinsky(1998), với hàm moment nhƣ trên,ta cóˆ(
)
(0, )dnN
Ma trận phƣơng sai hiệp
phƣơng sai 11(1 )DD
(1.33)Trong
đó|()
|
0 |ii
Y X
ii
i Y
i
ii
i
iD
E X
F
XE X
X f X
XE X X f
X(1.34)
0020( , , ) ( , , )i
i
i
iiii
i
i
iiiY X
Y
XiiYXE m
Y X m
Y XE X
I
X
IE X X
I
Ta có 0iiYXIcó phân phối Bernoulli với trung
bình là và phƣơng sai (1 ). Do vậy(1 )iiE X X
(1.35)Nhƣ vậy,(1.33) có thểđƣợc viết đầy đủ, ˆ(
)
(0, )nN
2311(1 )
(0 | )
[
]
(0 | )i
i
i
i
i
i
i
iE X X f
X
E
XX
E XX f
X
(1.36)Nếu không có hiện tƣợng phƣơng sai thay
đổi, hàm mật độcủa sai sốiđộc lập với X, và do đó (0 | )
(0)iif
X
fthì công thức (1.46) đƣợc viết lại thành 12(1 )[](0)iiE X
Xf(1.37)Trong thực tếtính toán với sốliệu mẫu, []iiE X
Xđƣợc ƣớclƣợng bằng 11niiiXXnHendricks & Koenker(1991) ƣớc lƣợng
(0 | )ifXvà Dbằng các công thức:(
)
(
)2ˆˆˆii
h
hhfX(1.38)11ˆ.ni
i
iiD
f X
Xn(1.39)Kết quảnày cho thấy, khi mật độcủa các quan sát càng dày
đặc thìphƣơng sai của phân vịcàng nhỏ, giá trịphân vịcàng ít biến động. Khi mật
độquan sát càng thƣa thớt thì phƣơng sai của phân vịcàng lớn, giá trịphân vịcàng
biến động nhiều.b.8.Tính vững (consistency)Dựa vào (1.32) cho thấy ƣớc lƣợng
của hồi quy phân vịxấp xỉmột ƣớc lƣợng GMM nên mang tính vững -vốn đã đƣợc
chứng minh luôn xảy ra với các ƣớc lƣợng của GMM (theo Green (2011)). c.Kiểm
định giảthuyết thống kê với hồi quy phân vịTrong tài liệu vềhồi quy phân vịcủa
Koenker(2005),những suy diễn thống kê liên quan đến kiểm định hệsốhồi quy của
hồi quy phân vịcũng đƣợc chứng minh và áp dụng giống nhƣ phƣơng pháp OLS.
Những kiểm định đƣợcKoenker(2005) đềxuất gồm kiểm định Wald5và kiểm định
Likelihood ratio6c.1.Kiểm định Wald5Trang 75 sách “Quantile Regression” của
Koenker (2005)6Trang 92 sách “Quantile Regression” của Koenker (2005)
24Kiểm định 0:H R
rvới Rlà ma trận cấp qKvà rcấp 1q11ˆ0, (1
)dn
N
D D
Dƣới giảthiết 0Hˆˆ(
)
( ( ) )
(0, (1 ) ( ))
dnR
n R
r
N
Trong
đó11()RD D R
12ˆˆˆ( )
( ) ( )
( )
( )(1 )dnn R
r
R
rWq
11ˆRD D R
, với 11DDlà một ƣớc lƣợng vững của
11DDc.2.Kiểm định Likelihood ratioKoenker & Machado (1999) cũng
đã chứng minh đƣợc rằng giảthuyết0:H R
rcũng có thểđƣợc kiểm
định bằng phƣơng pháp Likelihood ratio nhƣ trong hồi quy vớigiá trịtrung
bình thông thƣờng.Cho ˆvà là ƣớc lƣợng của lần lƣợt trong hai trƣờng
hợp có ràng buộc và không có ràng buộc. ˆˆ()VV và ()VV
là các hàm mục tiêu tƣơng ứng. Cho hàm mật độLaplace bất đối xứng()( )
(1 )fe .Hàm hợp lý log-likelihood trong trƣờng hợp này
là 1( , )
log (1 )
(
)nn
i
iiL
n
y X
Khi đó2 lần của tỷlệlog–likelihoodratio là ˆˆ2
( , )
( , )
2nnL
L
V V
Theo Koenker & Machado (1999)21ˆ2()(1
)
(0)
dVVLR
qfd.Ƣu điểm và nhƣợc điểmcủa hồi quy phân vị
25Sau khi Koenker và Bassett (1978) giới thiệu mô hình hồi quy phân vịđầu
tiên, rất nhiều các nghiên cứu đƣợc thực hiện sau đó nhằm khắc phục các
nhƣợc điểm, đồng thời mởrộng hồi quy phân vị. Ngày càng có nhiều các
bài nghiên cứu ứng dụng hồi quyđƣợc thực hiện và công bố, cho thấy hồi quy
phân vịđang ngày càng đƣợc hoàn thiện và ngày càng trởthành công cụđắc
lực trong nghiên cứu kinh tế.Theo Koenker(2005) và Hao& Naiman (2007), hồi
quy phân vịcó những ƣu điểm nhƣ sau. Ưu điểm-Thứnhất, phƣơng pháp hồi quy
phân vịcho phép thểhiện một cách chi tiết vềmối quan hệgiữa biến phụthuộc và các
biến độc lập trên từng phân vịcủa biến phụthuộc, không phải chỉxét mối quan
hệnày trên giá trịtrung bình nhƣ hồi quy OLS.Ƣu điểm này thểhiện rõ trong
Hình 1. 1. Trong đó, Hình 1. 1thểhiện nhiều hàm hồi quy cho nhiều phân vị,cho
thấy tác động khác nhau của biến độc lập X ứng với nhiều phân vịcủa biến
phụthuộc Y. -Thứhai, mặc dù các tính toán thực hiện trong hồi quy phân vịlà
phức tạp và khối lƣợng tính toán nhiều hơn trong OLS,nhƣng với sựphát triển
của toán học, thống kê học cộng với sựhỗtrợcủa công nghệthông tin thì
những tính toán nhƣ quy hoạch tuyến tính, bootstrap,đƣợc thực hiện rất dễdàng
và nhanh chóng. -Thứba, trong hồi quy OLS, các quan sát bất thƣờng(outliers)
thƣờng đƣợc loại bỏđểƣớc lƣợng OLS không bịchệch. Trong khi đó, hồi quy phân
vịcó tính ổn định (robustness), không bịảnh hƣởng bởi sựhiện diện của các
quan sát bất thƣờng đó.-Thứtư, các kiểm định vềtham sốcủa hồi quy phân
vịkhông dựa vào tính chuẩn của sai số.Hơn nữa, các kiểm định này không
dựa trên bất kỳmột giảđịnh nào vềdạng phân phối của sai sốhồi quy. -Thứnăm,
hồi quy phân vịđặc biệt phù hợp khi phân tích trên mô hình hồi quy có sựhiện
diện của phƣơng sai thay đổi hoặc trong mẫu sốliệu mà hàm phân
26phối của biến phụthuộc bất đối xứng quanh giá trịtrung bình. Khi đó, hàm hồi
quy phân vịtrên các phân vịkhác nhau sẽcó sựkhác biệt rõ rệt, cho thấy tác
động không giống nhau của biến độc lập đến biến phụthuộc ởnhững phân
vịkhác nhau. Nhược điểm của hồi quy phân vịBên cạnh các ƣu điểm đã đƣợc nêu
trên, hồi quy phân vịvẫn còn một sốnhƣợc điểm nhƣ sau:-Một là, các tính
toán trong hồi quy phân vịphức tạp hơn so với OLS. Ví dụnhƣ trong OLS, muốn
tìm ƣớc lƣợng tham sốhồi quy sao cho tổng bình phƣơng sai sốlà nhỏnhất thì có
thểáp dụng các công thức tìm cực trịcủa giải tích toán học nhƣ lấy đạo hàm riêng
và giải hệphƣơng trình ứng với điều kiện cầncủa cực trị. Trong khi đó, ƣớc
lƣợng tham sốcủa hồi quy phân vịthực hiện thông qua việc giải bài toán quy
hoạch tuyến tính. Việc này sẽkhó khăn nếu không có sựhỗtrợcủa máy tính. -Hai là,
phải thực hiện nhiều hàm hồi quy trên nhiều phân vịmới cho thấy đƣợc toàn diện
sựtác động của biến độc lập đến biến phụthuộc thay vì chỉcó một hàm hồi
quy trung bình có điều kiện trong OLS.-Ba là, việc áp dụng hồi quy phân
vịcho các dạng hàmphi tuyếncòn khá hạn chế. Các lý thuyết đểxửlý tựtƣơng
quan hoặc nội sinh trong hồi quy phân vịcòn chƣa đƣợc phát triển hoàn
thiện.1.2.1.Tính chệch của ƣớc lƣợng do chọn mẫukhi xây dựng hàm tiền lƣơngvà
phƣơng pháp hiệu chỉnh tính chệch do chọn mẫuSau khi hồi quy phân vịđƣợc
Koenker & Bassett giới thiệu năm 1978,rất nhiều nghiên cứu đã ứng dụng hồi
quy phân vịtrong xây dựng hàm tiền lƣơng cho các quốc gia trên thếgiới. Tuy
nhiên, vấn đềxây dựng hàm tiền lƣơng bằng hồi quy có thểđối mặt với khó khăn
vềvấn đềchọn mẫu do ƣớc lƣợng. Các hàm tiền lƣơng xây dựng bằng hồi quy
phân vịcũng không tránh khỏi những khó khăn này.
27a.Tính chệch do chọn mẫu (Sample selection bias)Heckman(1979) trong một
bài báo nổi tiếng của mình đã chỉra rằng, việc ƣớc lƣợng hàm tiền lƣơng dựa
trên việc chọn mẫu chỉlấy sốliệu ởnhững ngƣời có việc làm và đƣợc nhận lƣơng
mà bỏqua những ngƣời lao động không tham gia làm việc sẽlàm cho ƣớc lƣợng
bình phƣơng nhỏnhất thu đƣợc bịchệch(biased)và không vững(inconsistent).
Heckman gọi đó là tínhchệch do vấn đềchọn mẫu (Sample selection bias).
Giảsửhàm tiền lƣơng cần ƣớc lƣợng có dạng tuyến tính *i
i
iY
X
u(1.40)Trong đó, gọi*iYký hiệu cho biến tiền lƣơng tiềm năng
(potential wage). Đây là mức tiền lƣơng tối thiểu mà ngƣời lao động thứi mong
muốnđểlàm một công việc nào đó. Với những mức lƣơng nhỏhơn mức lƣơng tiềm
năng này, ngƣời lao động sẽchấp nhận thất nghiệp thay vì đi làm.Việc một ngƣời
quyết định nhận một công việc hay thất nghiệp có thểđƣợc xây dựng thành một
hàm lựa chọn nhƣ sau:***1 khi
00 khi
0i
i
iiiiDZDDD(1.41)Việc lựa chọn này phụthuộc vào các yếu
tốthểhiện trong iZ.iZđƣợc giảđịnh là chứa tất cảcác biến trong Xivà thêm một vài
yếu tốkhác. εilà sai sốcủa hàm lựa chọn. Sốliệu củaiZ(vì vậy, của Xi)là thu thập
đƣợc, không phân biệt là ngƣời đó có công việc hay không.Chúng ta không
thểquan sát đƣợc mức lƣơng tiềm năng *iY, chúng ta chỉcó thểbiết đƣợc rằng khi
ngƣời lao động quyết định đi làm, tức Di= 1, thì mức lƣơng tiềm năng đƣợc
thểhiện ra chính là mức lƣơng thực tếYimà ngƣời lao động nhận đƣợc.Khi
đó,*** khi
0,0
khi
0.iiiiYDYDHeckman
chỉranguyên nhângây ra tính chệch của ƣớc lƣợng bằng mô hình Heckman
sau.
28Gọi 2~ (0, )uuN,2~ (0, )Nvới 21,phân phối đồng thời
F(u,ε) cũng là phân phối chuẩn,u,độc lập với ,.XZHệsốtƣơng quan giữa uvà là
u,và khi đó, hiệp phƣơng sai giữa uvà là ,uutức là ( , ) (
)
.i i
u
uCov u
E u
(1.42)Trong các nghiên cứu
thông thƣờng, mẫu chỉđƣợc chọn ứng với 1.iDLấy kỳvọng có điều kiện ởcảhai
vếcủa phƣơng trình (1.40), ta có ( |
1, )
( |
1, ).i
i
i
i
i
i
iE Y D
X
X
Eu D
X
(1.43)Kết hợp với phƣơng trình (1.41),1iD=>
*0iD=>0iiZ=>.iiZSuy ra( |
1, )
( |
, ).i
i
i
i
i
i
i
iE Y D
X
X
Eu
Z X
(1.44)Vìu,độc lập với ,XZnên phƣơng trình (1.44) có thểđƣợc viết lại ( |
1, )
( |
).i
i
i
i
i
i
iE Y D
X
X
Eu
Z
(1.45)Nếu uvà
không tƣơng quan (0u) thì ( |
) 0i
i
iE u
Z , và do đó ƣớc lƣợng thu đƣợc bằng OLS củaphƣơng trình (1.40)
vẫn là ƣớc lƣợng không chệch và vững. Tuy nhiên, do uvà có thểtƣơng
quan với nhau (0u) nên ( |
) 0i
i
iE u
Z , khi đó ƣớc lƣợng sẽbịchệch và không còn là ƣớclƣợngvững
nữa.Sựchệch này là do vấn đềchọn mẫu gây ra, gọi làhiện tƣợng ước lượng
bịchệch do chọn mẫu. Nếu chỉthu thập sốliệu ởnhững ngƣời lao động có đi làm và
đƣợc nhận lƣơng thì hàm tiền lƣơng ƣớc lƣợng đƣợc không phản ánh đúng
hàm tiền lƣơng của tổngthể. Vì trong tổng thểcó cảnhững ngƣời lao động
không đi làm và không nhận lƣơng. Họkhông làm việc vì họđƣợc trảlƣơng thấp
hơn mứclƣơng tiềm năng *iY. Họvẫn có đầy đủcác đặc điểm lao động đƣợc
nghiên cứu trong X.Nếu họđi làm, thậm chí họcó thểđạt đƣợc mức lƣơng cao hơn
những lao động quan sát đƣợc trong
Tính chệch do chọn mẫu (Sample selection bias)Heckman(1979) trong một bài
báo nổi tiếng của mình đã chỉra rằng, việc ƣớc lƣợng hàm tiền lƣơng dựa trên
việc chọn mẫu chỉlấy sốliệu ởnhững ngƣời có việc làm và đƣợc nhận lƣơng mà
bỏqua những ngƣời lao động không tham gia làm việc sẽlàm cho ƣớc lƣợng bình
phƣơng nhỏnhất thu đƣợc bịchệch(biased)và không vững(inconsistent).
Heckman gọi đó là tínhchệch do vấn đềchọn mẫu (Sample selection bias).
Giảsửhàm tiền lƣơng cần ƣớc lƣợng có dạng tuyến tính *i
i
iY
X
u(1.40)Trong đó, gọi*iYký hiệu cho biến tiền lƣơng tiềm năng
(potential wage). Đây là mức tiền lƣơng tối thiểu mà ngƣời lao động thứi mong
muốnđểlàm một công việc nào đó. Với những mức lƣơng nhỏhơn mức lƣơng tiềm
năng này, ngƣời lao động sẽchấp nhận thất nghiệp thay vì đi làm.Việc một ngƣời
quyết định nhận một công việc hay thất nghiệp có thểđƣợc xây dựng thành một
hàm lựa chọn nhƣ sau:***1 khi
00 khi
0i
i
iiiiDZDDD(1.41)Việc lựa chọn này phụthuộc vào các yếu
tốthểhiện trong iZ.iZđƣợc giảđịnh là chứa tất cảcác biến trong Xivà thêm một vài
yếu tốkhác. εilà sai sốcủa hàm lựa chọn. Sốliệu củaiZ(vì vậy, của Xi)là thu thập
đƣợc, không phân biệt là ngƣời đó có công việc hay không.Chúng ta không
thểquan sát đƣợc mức lƣơng tiềm năng *iY, chúng ta chỉcó thểbiết đƣợc rằng khi
ngƣời lao động quyết định đi làm, tức Di= 1, thì mức lƣơng tiềm năng đƣợc
thểhiện ra chính là mức lƣơng thực tếYimà ngƣời lao động nhận đƣợc.Khi
đó,*** khi
0,0
khi
0.iiiiYDYDHeckman
chỉranguyên nhângây ra tính chệch của ƣớc lƣợng bằng mô hình Heckman
sau.
28Gọi 2~ (0, )uuN,2~ (0, )Nvới 21,phân phối đồng thời
F(u,ε) cũng là phân phối chuẩn,u,độc lập với ,.XZHệsốtƣơng quan giữa uvà là
u,và khi đó, hiệp phƣơng sai giữa uvà là ,uutức là ( , ) (
)
.i i
u
uCov u
E u
(1.42)Trong các nghiên cứu
thông thƣờng, mẫu chỉđƣợc chọn ứng với 1.iDLấy kỳvọng có điều kiện ởcảhai
vếcủa phƣơng trình (1.40), ta có ( |
1, )
( |
1, ).i
i
i
i
i
i
iE Y D
X
X
Eu D
X
(1.43)Kết hợp với phƣơng trình (1.41),1iD=>
*0iD=>0iiZ=>.iiZSuy ra( |
1, )
( |
, ).i
i
i
i
i
i
i
iE Y D
X
X
Eu
Z X
(1.44)Vìu,độc lập với ,XZnên phƣơng trình (1.44) có thểđƣợc viết lại ( |
1, )
( |
).i
i
i
i
i
i
iE Y D
X
X
Eu
Z
(1.45)Nếu uvà
không tƣơng quan (0u) thì ( |
) 0i
i
iE u
Z , và do đó ƣớc lƣợng thu đƣợc bằng OLS củaphƣơng trình (1.40)
vẫn là ƣớc lƣợng không chệch và vững. Tuy nhiên, do uvà có thểtƣơng
quan với nhau (0u) nên ( |
) 0i
i
iE u
Z , khi đó ƣớc lƣợng sẽbịchệch và không còn là ƣớclƣợngvững
nữa.Sựchệch này là do vấn đềchọn mẫu gây ra, gọi làhiện tƣợng ước lượng
bịchệch do chọn mẫu. Nếu chỉthu thập sốliệu ởnhững ngƣời lao động có đi làm và
đƣợc nhận lƣơng thì hàm tiền lƣơng ƣớc lƣợng đƣợc không phản ánh đúng
hàm tiền lƣơng của tổngthể. Vì trong tổng thểcó cảnhững ngƣời lao động
không đi làm và không nhận lƣơng. Họkhông làm việc vì họđƣợc trảlƣơng thấp
hơn mứclƣơng tiềm năng *iY. Họvẫn có đầy đủcác đặc điểm lao động đƣợc
nghiên cứu trong X.Nếu họđi làm, thậm chí họcó thểđạt đƣợc mức lƣơng cao hơn
những lao động quan sát đƣợc trong
29mẫu có cùng giá trịcác biến độc lập nhƣ họ. Việc bỏqua nhóm lao động
nàysẽlàm cho ƣớc lƣợng tham sốhồi quy thu đƣợc từmẫu bịchệch và phản ánh sai
mức độtác động các yếu tốtrong iXđến tiền lƣơng iY. b.Hiệu chỉnh tính chệchdo
chọn mẫu -Thủtục Heckman hai bƣớcTừcác phân tích nhƣ trên,
Heckman(1979) xem sựxuất hiện của ( |
)i
i
iE u
Ztrong phƣơng trình (1.45) gây ra tình trạng ƣớc lƣợng chệch và