TRƯỜNG ĐẠI HỌC NGOẠI
THƯƠNG
PHÂN TÍCH ẢNH HƯỞNG CỦA CÁC NHÂN
TỐ ĐẾN TỈ LỆ TỬ VONG Ở TRẺ SƠ SINH
Báo cáo Kinh tế lượng
Hà Nội
Nhóm – Bộ số liệu
TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG
BÁO CÁO KINH TẾ
LƯỢNG
Bộ số liệu 58 – LOWBRTH
PHÂN TÍCH CÁC NHÂN TỐ ẢNH HƯỞNG ĐẾN TỈ LỆ
TỬ VONG Ở TRẺ SƠ SINH
GV hướng dẫn
:
Lớp
:
1
BÁO CÁO KINH TẾ LƯỢNG
Bộ số liệu 58 – LOWBRTH
- Nội dung: Phân tích ảnh hưởng của các nhân tố đến tỉ lệ tử vong ở trẻ sơ sinh.
Đây là một vấn đề nhận được nhiều sự quan tâm ở nhiều quốc gia trên thế giới. Việc
nghiên cứu để giảm tỉ lệ tử vong ở trẻ sơ sinh mang tính xã hội và nhân văn sâu sắc. Nó
khơng chỉ giúp giảm nỗi đau cho các gia đình mà cịn giảm gánh nặng cho xã hội, và quan
trọng hơn cả là cải thiện chất lượng dân số; góp phần cải thiện số lượng và chất lượng
nguồn lao động.
Trong báo cáo thường niên về tình trạng sức khỏe bà mẹ và trẻ sơ sinh State of World
Mothers ra số 14 của tổ chức. Save the Children cho biết tỷ lệ từ vong trẻ sơ sinh tại Việt
Nam đã giảm 48% từ năm 1990 đến 2011. Việt Nam xếp thứ 86 trong bảng xếp hạng về
những nơi tốt nhất cho các bà mẹ. Việt Nam đang trong tiến trình đạt được mục tiêu thiên
niên kỷ về giảm tỷ lệ tử vong ở bà mẹ và trẻ em. Chính vì vậy, việc nghiên cứu về Tỉ lệ tử
vong ở trẻ sơ sinh cùng các nhân tố ảnh hưởng để tìm ra biện pháp hữu hiệu giảm thiểu tỉ lệ
này càng cần thiết hơn bao giờ hết.
- Các biến được chọn:
+ infmort
+ lowbrth
+ popul
+ pcinc
+ afdcpay
+ physicpc
- Bài cáo cáo gồm 4 phần:
+ Phần I: Mô tả biến với lệnh DES, TAB, SUM
+ Phần II: Phân tích hồi quy và tương quan
1. Mơ hình tổng quát
2. Quan hệ tương quan giữa các biến độc lập (Dùng lệnh Corr)
3. Chạy hồi quy
4. Phân tích kết quả chạy hồi quy
5. Một số kiểm định F
+ Phần III: Kiểm tra khuyết tật của mơ hình
1. Kiểm định phương sai sai số thay đổi
2. Kiểm định đa cộng tuyến (bằng phương pháp khác ngoài lệnh Corr)
3. Kiểm định phân phối chuẩn của nhiễu
+ Kết luận
I. Phần I – MÔ TẢ BIẾN
1. Sử dụng lệnh DES
- Thông tin quan trọng nhất thu được khi chạy lệnh Des đó là ý nghĩa của các biến (Variable
label)
des infmort lowbrth popul pcinc afdcpay physicpc
Variable name
infmort
lowbrth
popul
pcinc
afdcpay
physicpc
Storage
type
Display
format
float
float
int
int
int
float
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
%9.0g
Value
label
Variable label
infant mortality rate
perc births low weight
population, 1000s
per capita income
avg monthly AFDC payment
physicians per capita
Bảng I.1. Kết quả chạy lệnh mô tả DES
Sử dụng lệnh des giúp chúng ta hiểu rõ ý nghĩa các biến. Theo kết quả trên thì:
Biến infmort: Tỉ lệ trẻ sơ sinh tử vong.
Biến lowbrth: Tỉ lệ trẻ (sơ sinh) sinh thiếu cân.
Biến popul: Dân số (nghìn người).
Biến pcinc: Thu nhập bình quân trên đầu người.
Biến afdcpay: Trợ cấp trung bình hàng tháng từ AFDC (tổ chức hỗ trợ cho gia đình có con
nhỏ cịn phụ thuộc)
- Biến physicpc: tỷ lệ bác sĩ/ người dân.
-
2. Sử dụng lệnh SUM
- Kết quả của lệnh Sum cho ta biết số quan sát (Obs), giá trị trung bình (Mean), độ lệch
chuẩn (Std. Dev.), giá trị lớn nhất (Max), giá trị nhỏ nhất (Min) của các biến.
sum infmort lowbrth popul pcinc afdcpay physicpc
Bảng I.2. Kết quả chạy lệnh mô tả SUM
Theo kết quả ở bảng trên, ta thấy:
- Infmort: Tỉ lệ tử vong ở trẻ sơ sinh của 100 quan sát có giá trị trung bình là 9.503% với độ
lệch chuẩn là 1.461524%. Tỉ lệ này đạt nhỏ nhất là 6.2% và cao nhất là 13.7%
- Lowbrth: Tỉ lệ trẻ sinh thiếu cân trung bình là 6.707% với độ lệch chuẩn 1.166039; tỉ lệ
nhỏ nhất là 4.8% và lớn nhất lên tới 9.6%.
- Popul: Dân số trung bình là 4910.01 (nghìn người), độ lệch chuẩn là 5317.505 nghìn
người; dân số lúc thấp nhất là 454 nghìn người và lúc cao nhất là 29760 nghìn người.
- Phân tích tương tự với các biến cịn lại.
3. Sử dụng lệnh TAB1
- Sử dụng lệnh Tab1 cho phép miêu tả cùng lúc nhiều biến với các thông tin tần số (Freq.),
tần suất (Percent) của các giá trị của mỗi biến, tổng cộng gộp Si (Cum.)
tab1 infmort lowbrth popul pcinc afdcpay physicpc
tabulation of infmort
infant
mortality
rate
Freq.
Percent
Cum.
6.2
6.4
6.7
7
7.1
7.2
7.3
7.5
…
9.9
…
11.8
11.9
12.1
12.2
12.4
12.7
13.7
1
1
1
1
1
1
1
1
…
2
…
1
1
1
1
1
2
1
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
…
2.00
…
1.00
1.00
1.00
1.00
1.00
2.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
8.00
…
65.00
…
93.00
94.00
95.00
96.00
97.00
99.00
100.00
Total
100
100.00
Bảng I.4. Kết quả chạy lệnh mô tả TAB1 với biến infmort
- Ví dụ về phân tích dữ liệu trong bảng:
+ Tỉ lệ tử vong ở trẻ sơ sinh có giá trị từ 6.2% đến 13.7%
+ Có 65% trong tổng số quan sát mà tỉ lệ tử vong ở trẻ sơ sinh < 9.9%.
tabulation of lowbrth
Perc births
low weight
Freq.
Percent
Cum.
4.8
4.9
5
5.1
5.2
5.3
5.4
5.5
2
3
2
4
1
5
4
3
2.00
3.00
2.00
4.00
1.00
5.00
4.00
3.00
2.00
5.00
7.00
11.00
12.00
17.00
21.00
24.00
…
8.2
8.4
8.6
8.7
9
9.2
9.6
…
3
1
1
3
1
1
1
…
3.00
1.00
1.00
3.00
1.00
1.00
1.00
…
92.00
93.00
94.00
97.00
98.00
99.00
100.00
Total
100
100
Bảng I.3. Kết quả chạy lệnh mô tả TAB1 với biến lowbrth
- Dấu … đại diện cho các dữ liệu ở khoảng giữa nhưng không liệt kê ra do số lượng quan sát
lớn.
- Ví dụ về phân tích dữ liệu trong bảng:
+ Tỉ lệ trẻ sinh thiếu cân có giá trị từ 4.8% đến 9.6% đối với 100 quan sát
+ Ý nghĩa của Cum. : có 24% trong tổng số 100 số quan sát mà tỉ lệ trẻ sinh thiếu cân
< 5.5%.
tabulation of popul
population,
1000s
Freq.
Percent
Cum.
454
490
524
547
550
563
…
4244
…
16781
16987
17835
17990
27653
29760
1
1
1
1
1
1
…
1
…
1
1
1
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
…
1.00
1.00
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
…
60.00
…
95.00
96.00
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.5. Kết quả chạy lệnh mô tả TAB1 với biến popul
- Có 95% trong tổng số quan sát mà dân số < 16781 nghìn người
tabulation of pcinc
Per capita
income
Freq.
Percent
Cum.
10301
11013
11421
11506
11530
11797
11889
…
17422
…
21258
21258
21915
22068
22558
24977
25528
1
1
1
1
1
1
1
…
1
…
1
1
1
1
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
…
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
…
69.00
…
94.00
95.00
96.00
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.6. Kết quả chạy lệnh mô tả TAB1 biến pcinc
tabulation of afdcpay
avg monthly
AFDC payment
Freq.
Percent
Cum.
114
115
117
120
149
165
167
…
571
581
637
651
1
1
1
1
1
1
1
…
1
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
7.00
…
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.7. Kết quả chạy lệnh mô tả TAB1 với biến afdcpay
tabulation of physicpc
physicians
per capita
Freq.
Percent
Cum.
.0081989
.0087513
.0100709
.010302
.0160767
.0168857
…
.2947531
.2987988
.3061674
.4460695
.4493783
1
1
1
1
1
1
…
1
1
1
1
1
1.00
1.00
1.00
1.00
1.00
1.00
…
1.00
1.00
1.00
1.00
1.00
1.00
2.00
3.00
4.00
5.00
6.00
…
96.00
97.00
98.00
99.00
100.00
Total
100
100.00
Bảng I.8. Kết quả chạy lệnh mô tả TAB1 với biến physicpc
II. PHẦN II – HỒI QUY VÀ TƯƠNG QUAN
1. Thiết lập mơ hình tổng qt
a. Mơ hình tổng qt
Hàm hồi quy tổng thể biểu diễn mối liên hệ giữa biến phụ thuộc là lowbrth với các biến
độc lập infmort, popul, pcinc, afdcpay, physicpc có dạng:
������� = 0 + 1 × ������� + 2 × ����� + 3 × ����� + 4
× ������� +
5 × �������� + ��
b. Ý nghĩa các biến
Biến phụ thuộc:
Infmort (Y): Tỷ lệ tử vong ở trẻ sơ sinh (%)
Biến độc lập (��)
Tên biến
Ý nghĩa
Lowbrth
Dấu
kì
vọng
Đơn vị tính
Tỷ lệ trẻ sinh
thiếu cân
+
%
Dân số
+
1000 người
Thu nhập bình
quân
-
USD
Trợ cấp trung
bình hàng tháng
nhận được từ
AFDC
-
USD
Tỷ lệ bác sỹ
trên đầu người
-
%
(��)
Popul (��)
Pcinc (��)
Biến
định
lượng
Afdcpay (��)
Physicpc
(��)
Diễn giải
Tỷ lệ trẻ sinh
thiếu cân càng
cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Dân số càng
cao thì tỉ lệ tử
vong
trung
bình ở trẻ sơ
sinh càng cao
Thu nhập bình
quân càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Trợ cấp hàng
tháng càng cao
thì tỉ lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Tỷ lệ bác sỹ
trên đầu người
càng cao thì tỉ
lệ tử vong
trung bình ở trẻ
sơ sinh càng
thấp
Bảng II.1. Ý nghĩa các biến độc lập
2. Phân tích mối tương quan giữa các biến độc lập
- Sử dụng lệnh:
corr lowbrth popul pcinc afdcpay physicpc
Kết quả thu được:
lowbrth
popul
lowbrth
1.0000
0.1789
popul
1.0000
pcinc
afdcpay
physicpc
pcinc
afdcpay
physicpc
-0.1395
-0.5808
-0.3821
0.2658
0.1798
-0.5520
1.0000
0.6150
0.0094
1.0000
0.2702
Bảng II.2. Kết quả khi chạy lệnh corr giữa các biến đốc lập
1.0000
Theo kết quả ở trên, các hệ số tương quan ��� đều có giá trị tuyệt đối nhỏ hơn 0.8
Khơng có hiện tượng đa cộng tuyến trong mơ hình.
3. Chạy hồi quy
- Sử dụng lệnh
reg infmort lowbrth popul pcinc afdcpay physicpc
Kết quả thu được:
Source |
SS
df
MS
-------------+-----------------------------Model | 110.351338
5 22.0702675
Residual | 101.117751
94 1.07572076
-------------+-----------------------------Total | 211.469089
99
2.1360514
Number of obs
F( 5,
94)
Prob > F
R-squared
Adj R-squared
Root MSE
=
=
=
=
=
=
100
20.52
0.0000
0.5218
0.4964
1.0372
-----------------------------------------------------------------------------infmort |
Coef.
Std. Err.
t
P>|t|
[95% Conf. Interval]
-------------+---------------------------------------------------------------lowbrth |
.7119426
.1230073
5.79
0.000
.4677087
.9561765
popul |
.0000113
.0000265
0.43
0.671
-.0000413
.0000639
pcinc | -.0001369
.0000459
-2.98
0.004
-.0002281
-.0000457
afdcpay |
-.000353
.001489
-0.24
0.813
-.0033094
.0026033
physicpc | -.9808367
1.499449
-0.65
0.515
-3.958029
1.996355
_cons |
7.098026
1.063575
6.67
0.000
4.986273
9.209779
------------------------------------------------------------------------------
Bảng II.3. Kết quả chạy hồi quy
Từ kết quả ở bảng trên, ta có:
- Phương trình hồi quy tổng thể:
������� = 7.098026 + 0.7119426 × ������� + 0.0000113 ×
����� − 0.0001369
× ����� − 0.000353 × ������� − 0.9808367 ×
�������� + �̂�
- Phương trình hồi quy mẫu:
���̂���� = 7.098026 + 0.7119426 × ������� + 0.0000113 ×
����� − 0.0001369
× ����� − 0.000353 × ������� − 0.9808367 ×
Hay
��������
�̂ = 7.098026 + 0.7119426 × �� + 0.0000113 × �� − 0.0001369 ×
�� − 0.000353
× �� − 0.9808367 × ��
4. Phân tích kết quả hồi quy
- Phần tổng bình phương các độ lệch giữa giá trị quan sát Yi với giá trị trung bình của nó TSS
= 211.469089
- Phần tổng bình phương được giải thích bởi mơ hình (biến giải thích) ESS = 110.351338
- Phần tổng bình phương khơng giải thích được (phần dư) RSS = 101.117751
- R2 = 52.18% có nghĩa là các yếu tố: Tỷ lệ trẻ sinh thiếu cân, Dân số, Thu nhập bình quân
đầu người, Trợ cấp trung bình hàng tháng nhận được từ AFDC, Tỷ lệ bác sỹ trên đầu người
đã giải thích được 52.18% tỷ lệ trẻ tử vong ở trẻ sơ sinh.
- Trong
trị p-value
bảng trên,
giáhơn
trị p-value
của biến
lần lượtcác
là giá
0.671,
0.813 vàở0.515
đều lớn
mức ý nghĩa
α =popul,
0.05 afdcpay và physicpc
Khơng có cơ sở để bác bỏ Ho (giả thuyết � = 0). Như vậy ba biến popul, afdcpay
và
physicpc khơng có ý nghĩa thống kê, tức là có thể khơng gây ảnh hưởng đến tỉ lệ tử vong
ở trẻ sơ
- Ý nghĩa
cácsinh.
tham số trong mô hình.
0= 7.098026 có nghĩa là trong điều kiện các nhân tố khác không đổi và giá trị các
biến độc lập bằng 0 thì tỷ lệ tử vong ở trẻ sơ sinh trung bình là 7.098026 %.
1= 0.7119426 có nghĩa là trong điều kiện các nhân tố khác không đổi, nếu tỷ
lệ trẻ
sinh thiếu cân tăng 1 % thì tỷ lệ tử vong trung bình ở trẻ sơ sinh tăng 0.7119426%.
2= 0.0000113, khơng có ý nghĩa thơng kê.
3= -0.0001369 có nghĩa là trong điều kiện các yếu tố khác khơng đổi, nếu thu nhập
bình qn tăng 1 đơn vị thì tỷ lệ tử vong trung bình ở trẻ sơ sinh giảm 0.0001369 %.
4= -0.000353, khơng có ý nghĩa thống kê.
5= -0.9808367, khơng có ý nghĩa thống kê.
5.
Một
định
F của mơ hình.
a. Kiểmsốtrakiểm
sự phù
hợp
2
�0: �
=0
Ta có giả thuyết: {
- Dùng công
�1: �2 ≠
thức:
0
F=
2
⁄
� �
2
(1−� )
0,5218⁄
5
= (1−0,5218)
⁄
⁄
(100−5−1
(�−�−1
)
)
Mà F= 20.514> 2.32 Bác bỏ H0.
0,0
55,94
�
= 2.32
Vậy mơ hình hồi quy tìm được là phù hợp.
- Kiểm tra lại bằng lệnh trong stata :
test lowbrth popul pcinc afdcpay physicpc
Kết quả thu được:
(1) infmort = 0
(2) popul = 0
= 20.514
(3) pcinc = 0
(4) afdcpay = 0
(5) physicpc = 0
F (5, 94) = 20.52
Prob > F = 0.0000
Kiểm định F cho toàn bộ hệ số hồi quy là 20.52; Prob > F có giá trị nhỏ hơn α = 0.05 nên
bác bỏ giả thuyết Ho.
Kết quả thu được từ stata cũng giống với khi dùng công thức.
b. Kiểm định � = 0
� : � = 0
Cặp giả thuyết thống kê: {
�1: � ≠ 0
�
, giá trị của kiểm định này chính là cột t trong bảng kết quả
̂̂�
Sử dụng thống kê �
−
�
�� ̂
=
chạy hồi quy.
Cách
Ho1: Dùng khoảng
H1 tin cậy T
5.79
1 = 0
1 ≠ 0
luận
Kết
Bác bỏ Ho
Không đủ cơ
sở bác bỏ Ho
-0.0000457 Bác bỏ Ho
Không đủ cơ
0.0026033
sở bác bỏ Ho
Không đủ
1.996355
sở bácơ c bỏ
9.209779
Bác bỏ Ho
2 = 0
2 ≠ 0
0.43
Khoảng tin cậy
0.4677087
0.9561765
0.0000639
-0.0000413
3 = 0
3 ≠ 0
-2.98
-0.0002281
4 = 0
4 ≠ 0
-0.24
-0.0033094
5 = 0
5 ≠ 0
-0.56
-3.958029
0 = 0
0 ≠ 0
6.67
4.986273
Bảng II.4. Kiểm định dùng khoảng tin cậy
Như vậy 2, 4, 5 có thể bằng 0.
Cách 2: Sử dụng P-value
Ho
1 =
2 =
3 =
4 =
5 =
0 =
0
0
0
0
0
0
H1
1 ≠
2 ≠
3 ≠
4 ≠
5 ≠
0 ≠
0
0
0
0
0
0
P-value
α
Kết luận
0.000
Bác bỏ Ho
Không đủ cơ sở bác bỏ Ho
0.671
Bác bỏ Ho
0.004
0.05
Không đủ cơ sở bác bỏ Ho
0.813
Không đủ cơ sở bác bỏ Ho
0.515
Bác bỏ Ho
0.000
Bảng II.5. Kiểm định dùng P-value
Cách 3: Sử dụng phương pháp giá trị tới hạn
(��)
Ho
1 = 0
H1
1 ≠ 0
�
=�
���
�.���
T
5.79
= �.
�.���
Miền bác bỏ
Kết luận
Bác bỏ Ho
Không đủ cơ
0.43định dùng phương pháp giá trị tới hạn
2 = 0
2 Bảng
≠ 0 II.6. Kiểm
sở bác bỏ
Kiểm
tra
lại
bằng
stata
Bác bỏ Ho
-2.98
3 = 0
3 ≠ 0
- Dùng lệnh: test [var]
-2.368
2.368
Không đủ cơ
-0.24
4 = 0
4 ≠ 0
sở bác bỏ
Không đủ cơ
-0.56
5 = 0
5 ≠ 0
sở bác bỏ
Bác bỏ Ho
6.67
0 = 0
0 ≠ 0
Bản chất của lệnh test này trong stata là chạy lại mơ hình hồi quy sau khi đã bỏ đi
biến đang cần kiểm định, sau đó tính F.
Ví dụ: Kiểm định 2 = 0
test popul
Kết quả thu được:
(1)popul = 0
F (1,94) =
Prob > F =
0.18
0.6710
Prob > F có giá trị lớn hơn α = 0.05 nên chúng ta khơng có cơ sở bác bỏ Ho, tức là 2 có
thể bằng 0.
� : � = � = 0
c. Kiểm định � = � = 0
Cặp giả thuyết thống kê: {
�1: �ộ� ����� ℎ�� ≠ 0
Ví dụ: Kiểm định �� = �� = �
Cách 1: Chạy hồi quy mơ hình mới
����� = 101.117751
���� = 140.302815
(140.302815 −
101.117751)/2
=
101.117751/(100 − 5 − = 18.2134
(
����� / � − �
1)
Áp dụng công(���
thức:
� −
�����)
/�
� =
− 1)
(2,94)
F > �0.0
(2,94)
�0.0
= 3.10
=> Bác bỏ Ho, tức là có ít nhất một trong hai β có giá trị khác 0.
Cách 2: Dùng lệnh trong stata
test lowbrth popul
Kết quả thu được:
(1)
(2)
infmort = 0
popul = 0
F (2, 94) = 18.21
Prob > F = 0.0000
Prob > F nhỏ hơn α = 0.05 nên bác bỏ Ho, tức là có ít nhất một trong hai 1 ℎ�ặ� 2
khác 0.
III. PHẦN III – KIỂM TRA CÁC KHUYẾT TẬT
1. Kiểm định phương sai sai số thay đổi
a. Dựa vào đồ thị
- Bước 1: Chạy hồi quy mơ hình đầy đủ
- Bước 2: Dùng lệnh rvfplot
Kết quả thu được
Hình III.1. Kết quả chạy lệnh rvfplot
Dựa vào đồ thị trên ta thấy mơ hình bị mắc “bệnh” phương sai sai số thay đổi. Các điểm
phân bố không theo quy luật.
b. Sử dụng lệnh imtest, white
Kết quả thu được:
White's test for Ho: homoscedasticity
against Ha: unrestricted heteroskedasticity
chi2(19) = 47.41
Prob > chi2 = 0.0005
Cameron & Trivedi's decomposition of IM-test
Source
Heteroskedasticity
Skewness
Kurtosis
Total
chi2
df
p
47.41
16.55
1.80
20
5
1
0.0005
0.0054
0.1792
65.76
26
0.0000
Bảng III.1. Kết quả chạy lệnh imtest, white
Prob ( >chi2) = 0.0005 < α=0.05 nên bác bỏ Ho (có phương sai sai số thay đổi).
Như vậy mơ hình có thể có hiện tượng phương sai sai số thay đổi, hay nói cách khác giả
thuyết phương sai thuần nhất không được thỏa mãn.
c. Sử dụng kiểm định Breusch-Pagan
- Lệnh hettest
Kết quả:
Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of lowbrth
chi2(1)
= 3.16
Prob > chi2 = 0.0753
Kết quả của lệnh hettest cũng cho thấy có phương sai sai số thay đổi.
d. Cách sửa: chạy lại hồi quy với lệnh robust
reg infmort lowbrth popul pcinc afdcpay physicpc, robust
Kết quả thu được:
Linear regression
infmort
Coef.
lowbrth
popul
pcinc
afdcpay
physicpc
cons
.7119426
.0000113
-.0001369
-.000353
-.9808367
7.098026
Number of obs = 100
F (5, 94)
= 14.95
Prob > F
= 0.0000
R-squared
= 0.5218
Root MSE
= 1.0372
Robust
Std.
Err.
.1333468
.0000258
.0000372
.0018645
1.636684
1.139736
t
5.34
0.44
0.44
-0.19
-0.60
6.23
P>|t|
0.000
0.663
0.000
0.850
0.550
0.000
[95% Conf. Interval]
.4471794
-.00004
-.0002109
-.0040551
-4.230511
4.835054
Bảng III.2. Kết quả chạy lệnh hồi quy với robust
.9767059
.0000626
-.0000629
.0033491
2.268838
9.360998
Ta thu được ác giá trị se (�� ) mới mà ở đó phương sai sai số thuần nhất.
2. Kiểm định đa cộng tuyến
a. Dùng lệnh corr
Dựa vào bảng kết quả trên có thể thấy các biến�độc lập khơng VIF
có tương quan mạnh với
�� )(��) = �/(� −
�tuyến.
nhau,
mơ
hình
khơng
có
hiện
tượng
đa
cộng
Chạyinflation
hồi quyfactor)
lên ��
�
b. Vif (variance
�
0.4718
1.89322
�1
0.4528
1.82748
�
�2
2
0.4582
1.84570
- Chạy hồi quy phụ�
để
3 tính �
0.6781
3.10655
�4
0.4537
1.83050
�5
Bảng III.3. Kết quả sử dụng phương pháp nhân tử phóng đại phương sai
Các giá trị của VIF < 10 -> Khơng có hiện tượng đa cộng tuyến.
3. Kiểm
định
phân phối chuẩn
Cặp giả
thuyết:
�0: �ó �ℎâ� �ℎố� �ℎ�ẩ�
{
�1: �ℎơ�� �ℎâ� �ℎố� �ℎ�ẩ�
a. Dùng đồ thị
- Bước 1: dùng lệnh predict r, resid
- Bước 2: dùng lệnh kdensity r, normal
Kết quả thu được đồ thị dưới đây
Hình III.2. Đồ thị thu được khi chạy kdensity r, normal
- Dựa vào đồ trị trên ta thấy hai đồ thị không trùng nhau
Nhiễu không phân phối chuẩn.
b. Dùng lệnh Sktest r
Kết quả thu được:
Bảng III.4. Kết quả khi chạy Sktest r
Prob>chi2 = 0.0315 < α = 0.05
Bác bỏ Ho (giả định là phân phối chuẩn)
Như vậy kết quả này giống với cách dùng đồ thị ở trên.
Vậy giả thuyết nhiễu phân phối chuẩn khơng thỏa mãn với mơ hình trên.
- Cách chữa: cần phải chạy lại một mẫu khác.
KẾT LUẬN
Sau khi phân tích số liệu, ta có thể nhận thấy ảnh hưởng của các nhân tố đến tỉ lệ trẻ sơ
sinh bị tử vong và mức độ ảnh hưởng của chúng. Trong đó, quan trọng nhất là 2 nhân tố: tỉ
lệ trẻ sinh thiếu cân và thu nhập bình quân trên đầu người.
● Tỉ lệ trẻ sinh thiếu cân ảnh hưởng tiêu cực đến tỉ lệ trẻ sơ sinh tử vong vì trẻ sinh ra
thiếu cân sẽ rất yếu và có thể khơng đủ sức khỏe để thích nghi ngay được với mơi
trường bên ngồi sau khi chào đời.
● Thu nhập bình quân trên đầu người cũng ảnh hưởng đến tỉ lệ trẻ sơ sinh tử vong. Thu
nhập bình quân trên đầu người phần nào phản ảnh mức độ cuộc sống của người dân một
quốc gia. Thu nhập cao thì các gia đình sẽ có điều kiện đầy đủ hơn, tốt hơn để chăm sóc
sức các thành viên, đặc biệt là đối với người mẹ và trẻ sơ sinh.
Từ bài phân tích trên kết hợp với việc tìm hiểu thơng tin, có thể đưa ra một số phương
pháp để hạn chế tỉ lệ trẻ sơ sinh tử vong:
- Chăm sóc cho bà mẹ đang mang thai theo đúng cách và hợp lí, để trẻ được cung cấp đủ
chất dinh dưỡng và năng lượng, không bị thiếu cân.
- Nâng cao đời sống vật chất cũng như tinh thần của người dân
- Xây dựng cơ sỏ vật chất hiện đại và đầy đủ cho các bệnh viện, cơ sở y tế khám chữa
bệnh để đáp ứng được đủ và tốt nhu cầu khám, chữa bệnh.