<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
38
<b>Ph</b>
ầ
<b>n 3 </b>
<b>Tương quan và Hồi quy với phần mềm SAS </b>
<b>3.1.</b>
<b>T</b>
ươ
<b>ng quan và h</b>
ồ
<b>i quy </b>
ðể
tính h
ệ
s
ố
t
ươ
ng quan và xây d
ự
ng ph
ươ
ng trình h
ồ
i quy, s
ố
li
ệ
u ln ph
ả
i t
ạ
o thành t
ừ
ng
c
ặ
p và
ñượ
c nh
ậ
p vào t
ừ
ng c
ộ
t
ñố
i t
ừ
ng ch
ỉ
tiêu.
<b>Ví d</b>
ụ
<b> 11: Ti</b>
ế
n hành cân kh
ố
i l
ượ
ng (P),
đ
o
đườ
ng kính l
ớ
n (D) và
đườ
ng kính bé (d) c
ủ
a 22
qu
ả
tr
ứ
ng gà. S
ố
li
ệ
u thu
ñượ
c trình bày
ở
b
ả
ng d
ướ
i
đ
ây.
P (gram)
<sub>66,80 60,10 71,20 61,60 61,20 59,00 67,90 59,00 51,50 62,60 64,20 </sub>
D (mm)
<sub>58,37 54,95 60,58 56,73 57,36 53,26 57,07 58,17 52,28 55,62 56,82 </sub>
d (mm)
<sub>45,12 44,35 45,56 44,34 43,57 44,86 46,27 42,82 41,91 44,95 44,79 </sub>
P (gram)
<sub>71,20 54,20 54,50 69,10 55,90 66,00 68,00 62,00 56,70 67,00 53,80 </sub>
D (mm)
<sub>61,15 54,24 54,99 60,99 54,41 58,19 59,93 56,80 55,66 58,49 52,44 </sub>
d (mm)
<sub>46,00 42,58 42,32 44,85 42,62 45,69 45,50 44,20 42,41 45,56 43,38 </sub>
<b>3.1.1.</b>
<b>H</b>
ệ
<b> s</b>
ố
<b> t</b>
ươ
<b>ng quan </b>
Gi
ả
thi
ế
t
ñố
i v
ớ
i ki
ể
m
đị
nh hai phía H
0
:
ρ
= 0 và
đố
i thi
ế
t H
1
:
ρ
≠
0, trong
đ
ó
ρ
là t
ươ
ng quan
gi
ữ
a 2 bi
ế
n nghiên c
ứ
u.
<b>SAS CODE </b>
<b>DATA</b>
SAS12;
INPUT
KL DL DN;
CARDS
;
</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>
39
<b>PROC</b>
<b>CORR</b>
;
VAR
KL DL DN;
<b>RUN</b>
;
<b>K</b>
ế
<b>t qu</b>
ả
<b> t</b>
ừ
<b> SAS: </b>
The CORR Procedure
3 Variables: KL DL DN
Simple Statistics
Variable N Mean Std Dev Sum Minimum Maximum
KL 22 61.97727 5.94426 1364 51.50000 71.20000
DL 22 56.75000 2.61551 1249 52.28000 61.15000
DN 22 44.25682 1.34160 973.65000 41.91000 46.27000
Pearson Correlation Coefficients, N = 22
Prob > |r| under H0: Rho=0
KL DL DN
KL 1.00000 0.89667 0.90527
<.0001 <.0001
DL 0.89667 1.00000 0.64802
<.0001 0.0011
DN 0.90527 0.64802 1.00000
<.0001 0.0011
H
ệ
s
ố
t
ươ
ng quan m
ẫ
u gi
ữ
<b>a kh</b>
ố
<b>i l</b>
ượ
<b>ng và </b>
đườ
<b>ng kính l</b>
ớ
<b>n là 0,89667; kh</b>
ố
<b>i l</b>
ượ
<b>ng và </b>
ñườ
<b>ng kính bé là 0,90527; </b>
đườ
<b>ng kính l</b>
ớ
<b>n và </b>
đườ
<b>ng kính bé là 0,64802. Xác su</b>
ấ
t
ñố
i v
ớ
i
t
ừ
ng h
ệ
s
ố
t
ươ
<b>ng quan (p-values) </b>
đề
u bé h
ơ
n 0,05 (
α
) vì v
ậ
y k
ế
t lu
ậ
n t
ồ
n t
ạ
i m
ố
i quan h
ệ
gi
ữ
a
các ch
ỉ
tiêu này.
<b>3.1.2.</b>
<b>Ph</b>
ươ
<b>ng trình h</b>
ồ
<b>i quy tuy</b>
ế
<b>n tính </b>
Có th
ể
xây d
ự
ng h
ồ
i quy
ñơ
n bi
ế
n y = a + bx ho
ặ
c
ñ
a bi
ế
n y = a + b
1
x
1
+ b
2
x
2
+...+b
n
x
n
. V
ớ
i
ví d
ụ
11, ta có th
ể
xây d
ự
ng ph
ươ
ng trình h
ồ
i tuy
ế
n tính
đơ
n bi
ế
n quy
ướ
c tính kh
ố
i l
ượ
ng
tr
ứ
ng thơng qua
đườ
ng kính l
ớ
n/
đườ
ng kính bé ho
ặ
c
đ
a bi
ế
n thơng qua
đườ
ng kính l
ớ
n và
đườ
ng kính bé.
V
ớ
i SAS CODE sau
ñ
ây ta có th
ể
xây d
ự
ng ph
ươ
ng trình h
ồ
i quy tuy
ế
n tính v
ớ
i bi
ế
n ph
ụ
thu
ộ
c Y là kh
ố
i l
ượ
ng tr
ứ
ng và bi
ế
n
độ
c l
ậ
p X là
đườ
ng kính l
ớ
n:
<b>SAS CODE </b>
<b>PROC</b>
<b>REG</b>
;
MODEL
KL = DL;
</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>
40
<b>K</b>
ế
<b>t qu</b>
ả
<b> t</b>
ừ
<b> SAS </b>
The REG Procedure
Model: MODEL1
Dependent Variable: KL
Analysis of Variance
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 1 596.59551 596.59551 82.05 <.0001
Error 20 145.42313 7.27116
Corrected Total 21 742.01864
Root MSE 2.69651 R-Square 0.8040
Dependent Mean 61.97727 Adj R-Sq 0.7942
Coeff Var 4.35080
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -53.67124 12.78032 -4.20 0.0004
DL 1 2.03786 0.22498 9.06 <.0001
Ph
ươ
ng trình h
ồ
i quy v
ớ
i bi
ế
n ph
ụ
thu
ộ
c - kh
ố
i l
ượ
ng (Y) và bi
ế
n
ñộ
c l
ậ
p -
đườ
ng kính l
ớ
n
(X) t
ừ
ph
ầ
n m
ề
m SAS thu
ñượ
c nh
ư
sau:
Y = -53,7 + 2,04X.
Ph
ầ
n
Parameter Estimates
, cho ta k
ế
t qu
ả
ki
ể
m
ñị
nh các h
ệ
s
ố
c
ủ
a ph
ươ
ng trình h
ồ
i quy. V
ớ
i
xác su
ấ
t P = 0,0004 và P < 0,0001 ta có th
ể
k
ế
t lu
ậ
n các h
ệ
s
ố
trong ph
ươ
ng trình h
ồ
i quy
khác 0 (P < 0,05). H
ệ
s
ố
xác
ñị
nh c
ủ
a ph
ươ
ng trình R² = 80,40%, hi
ệ
u ch
ỉ
nh R² = 79,4%.
Ta c
ũ
ng có th
ể
xây d
ự
ng h
ồ
i quy v
ớ
i 2 bi
ế
n
độ
c l
ậ
p là
đườ
ng kính l
ớ
n và
đườ
ng kính bé v
ớ
i
SAS CODE sau:
<b>SAS CODE </b>
<b>PROC</b>
<b>REG</b>
;
MODEL
KL = DL DN;
<b>RUN</b>
;
<b>K</b>
ế
<b>t qu</b>
ả
<b> t</b>
ừ
<b> SAS: </b>
The REG Procedure
Model: MODEL1
Dependent Variable: KL
</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>
41
Sum of Mean
Source DF Squares Square F Value Pr > F
Model 2 731.05126 365.52563 633.24 <.0001
Error 19 10.96738 0.57723
Corrected Total 21 742.01864
Root MSE 0.75976 R-Square 0.9852
Dependent Mean 61.97727 Adj R-Sq 0.9837
Coeff Var 1.22586
Parameter Estimates
Parameter Standard
Variable DF Estimate Error t Value Pr > |t|
Intercept 1 -116.55512 5.47204 -21.30 <.0001
DL 1 1.21473 0.08323 14.60 <.0001
DN 1 2.47638 0.16226 15.26 <.0001
Ta có k
ế
t qu
ả
hồn tồn t
ươ
ng t
ự
nh
ư
vi
ệ
c xây d
ự
ng ph
ươ
ng trình h
ồ
i quy
đơ
n gi
ả
n.
Y = - 116,55512 + 1.21473X
1
+ 2.47638X
2
Trong
đ
ó:
Y = kh
ố
i l
ượ
ng tr
ứ
ng,
X
1
=
ñườ
ng kính l
ớ
n và
X
2
=
đườ
ng kính bé
ð
i
ề
u khác bi
ệ
t trong tr
ườ
ng h
ợ
p này là h
ệ
s
ố
xác
ñị
nh R² = 98,5% l
ớ
n h
ơ
n nhi
ề
u so v
ớ
i
tr
ườ
ng h
ợ
p
ñơ
n bi
ế
n R² = 80,4%.
V
ớ
i tr
ườ
ng h
ợ
p ph
ươ
ng trình
đượ
c xây d
ự
ng t
ừ
nhi
ề
u bi
ế
n
độ
c l
ậ
p, c
ầ
n ph
ả
i xác
đị
nh rõ vai
trị c
ủ
a t
ừ
ng bi
ế
n. Có nh
ữ
ng bi
ế
n
độ
c l
ậ
p khi
đư
a vào ph
ươ
ng trình
đ
óng góp khơng
đ
áng k
ể
vào mơ hình vì v
ậ
y c
ầ
n lo
ạ
i b
ỏ
khi xây d
ự
ng ph
ươ
ng trình.
ðể
có th
ể
tìm
đượ
c ph
ươ
ng trình
h
ồ
i quy t
ố
t nh
ấ
t c
ầ
n có thêm các l
ệ
nh ph
ụ
khác.
SAS CODE
<b>PROC</b>
<b>REG</b>
;
MODEL
KL = DL DN /
SSE
CP
AIC
SELECTION
=
CP
;
<b>RUN</b>
;
<b>K</b>
ế
<b>t qu</b>
ả
<b> t</b>
ừ
<b> SAS : </b>
The REG Procedure
Model: MODEL1
Dependent Variable: KL
C(p) Selection Method
Number in
Model C(p) R-Square AIC SSE Variables in Model
</div>
<!--links-->