Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
49
Phần III
Mô hình hoá thực nghiệm
Ch-ơng 6
Mô hình hoá thực nghiệm một nhân tố
Phân tích hồi qui và t-ơng quan là tìm mối quan hệ giữa nhân tố X và kết quả Y xem
chúng tuân theo qui luật nào ( có thể đ-ợc mô tả bằng mô hình toán học nào ). Các qui luật đó
đều đ-ợc biểu diễn bằng một hàm số. Trong các t-ơng quan, có t-ơng quan tuyến tính đ-ợc sử
dụng trong nghiên cứu nhiều nhất.
6.1.Hồi qui tuyến tính.
Hồi qui tuyến tính giữa X và Y đ-ợc biểu diễn bằng hàm số có dạng:
Y = aX + b 6.1
Để tìm hệ số a và b ta phải giải hệ ph-ơng trình :
Y = Nb + aX 6.2
XY = bX + aX
Giả hệ ph-ơng trình trên, hệ số a đ-ợc tính theo công thức sau:
N
)X(
X
N
Y.X
YX
)XX(
)YY)(XX(
a
2
i
2
i
ii
ii
N
1i
2
i
i
N
1i
i
6.3
Còn hệ số b đ-ợc tính sau khi biết a theo ph-ơng trình :
b = Y - a X 6.4
Ví dụ 6.1:
Vitamin B
2
đ-ợc xác định trong mẫu huyết thanh. Ta thu đ-ợc các dữ liệu sau. Sử dụng
ph-ơng pháp bình ph-ơng tối thiểu để vẽ đ-ờng thẳng phù hợp nhất. Tính nồng độ vitamin B
2
trong mẫu.
VitaminB
2
x
i
C-ờng độ Fl y
i
2
i
x
x
i
y
i
0,000
0,100
0,200
0,400
0,800
0,0
5,8
12,2
22,3
43,3
0,0000
0,0100
0,0400
0,160
0
0,640
0
0,00
0,58
2,44
8,92
34,6
4
1,500 83,6 0,850
0
46,5
8
x
tb
= 0,300
0
, y
tb
= 16,7
2
. Ta có:
m = 53,7
5
và b = 0,6
0
Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
50
Chú ý là ta cần giữ số chữ số có nghĩa tối đa có thể trong các kết quả trên. Nếu các giá
trị thực nghiệm của y chỉ chính xác đến hàng phần m-ời thì ta có thể làm tròn m và b đến
hàng phần m-ời. Nh- vậy, đ-ờng thẳng đó là y=53,8x+0,6.
Từ đó ta tính đ-ợc nồng độ của vitamin B
2
là 15,4 = 53,8x + 0,6 x = 0,275 mg/l.
Để vẽ đ-ờng thẳng đó, ta chỉ cần lấy 2 giá trị x bất kỳ khá xa nhau rồi tính giá trị y
t-ơng ứng (hoặc ng-ợc lại).
6.2. Hồi qui phi tuyến tính :
Hồi qui phi tuyến giữa 2 nhân tố X và Y là một đ-ờng cong, có thể mô tả bằng đ-ờng
hồi qui Parabon, Hypebon hay Hàm số mũ...
1/Hồi qui Parabon có dạng:
Y = aX
2
+ bX + c 6.5
Để tìm các hệ số a,b, và c, phải giải hệ ph-ơng trình :
Y = aX
2
+ bX + Nc
XY = aX
3
+ bX
2
+ cX 6.6
X
2
= aX
4
+ bX
3
+ cX
2
Để đơn giản hoá việc tính toán, các X
i
đều trừ X , khi đó ta có hệ ph-ơng trình mới
dùng để tính tay đ-ợc các hệ số :
Y = a(X - X )
2
+ b(X - X ) + Nc
Y(X - X ) = a(X - X )
3
+ b(X - X )
2
+ c(X - X ) 6.7
Y(X - X )
2
= a(X - X )
4
+ b(X - X )
3
+ c(X - X )
2
Căn cứ vào các dữ kiện nghiên cứu, lập bảng theo các cột : Y, X, (X - X ), (X - X )
2
,
(X - X )
3
, (X - X )
4
để tính cho nhanh và khỏi nhầm lẫn khi giải hệ ph-ơng trình trên.
2/. Hồi qui Hypebon có dạng :
Y = a/X + b 6.8
Để tìm các hệ số a và b, ta phải giải hệ ph-ơng trình :
Y = a1/X + Nb 6.9
Y/X = a1/X
2
+ b1/X
6.3.Hệ số t-ơng quan Spearson
Hệ số r, đánh giá mức độ t-ơng quan giữa X và Y:
2
i
2
i
y
x
)YY(
)XX(
aar
6.10
N
)Y(
Y}.{
n
)X(
X{
N
YX
YX
r
2
i
2
i
2
i
2
i
ii
ii
6.11
Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
51
Dấu của hệ số t-ơng quan:
r > 0 giữa X và Y có t-ơng quan thuận.
r < 0 gữa X và Y có t-ơng quan nghịch.
ý nghĩa của hệ số t-ơng quan:
0 1 > r > 0.7 thì X và Y rất t-ơng quan.
0.7 > r > 0.5 thì X và Y khá t-ơng quan.
0.5 > r > 0.3 thì X và Y có t-ơng quan.
0.3 > r thì X và Y không t-ơng quan.
6.4. Hệ số t-ơng quan thứ hạng Spearman:
Hệ số , đánh giá mức độ t-ơng quan thứ hạng có tham số hoặc không tham số giữa 2
nhân tố X và Y với N số liệu nghiên cứu, tính theo công thức sau:
)1N(N
)d(6
1rho
2
2
i
6.12
Trong đó:
- di là sự sai khác giữa X
i
và Y
i
theo thứ bậc. Để tính giá trị d
i
, X
i
phải đ-ợc xếp theo
thứ tự từ thấp đến cao hoặc ng-ợc lại, còn Y
i
đ-ợc xếp t-ơng ứng từng cặp với X
i
.
- N là số số liệu nghiên cứu ( số giá trị X
i
hay Y
j
).
Ví dụ 6.2 :
Khảo sát nhân tố X và nhân tố Y xem có sự t-ơng quan tác động lên đối t-ợng Z hay
không, kết quả trình bầy ở bảng sau :
Z
X Y
X
2
Y
2
XxY t.hạng
X
t.hạng
Y
d
t.hạng
d
2
t.hạng
A 30 25 900 625 750 4 6 -2 4
B 34 38 1156 1444 1292 2 2 0 0
C 32 30 1024 900 960 3 4 -1 1
D 47 40 2209 1600 1880 1 1 0 0
E 20 7 400 49 140 9 10 -1 1
F 24 10 576 100 240 7 9 -2 4
G 27 22 729 484 594 5 7 -2 4
H 25 35 625 1225 875 6 3 3 9
I 22 28 484 784 616 8 5 3 9
J 16 12 256 144 192 10 8 2 4
277 247 8359 7355 7539
d= 0 đ
2
=36
a/ Tìm ph-ơng trình hồi qui t-ơng quan tuyến tính,
b/ Tính và so sánh hệ số t-ơng quan Spearson và hệ số t-ơng quan Spearman.
Giải :
a/ Thay các số liệu vào công thức t-ơng ứng, ta đ-ợc :
556,0
1,1254
1,697
10
)247(
7355
10
277247
7539
a
2
b = 27,7 - 0,556 x 24,7 = 13,97
Vây ph-ơng trình hồi qui tuyến tính có dạng : y = 0.556 x + 13,97.
Lê Đức Ngọc Xử lý số liệu và Kế hoạch hoá thực nghiệm- Khoa hoá,ĐHQGHN. 2001
52
b/- Hệ số t-ơng quan spearson:
753,0
1,6831,1254
1,697
]
10
277
8356].[
10
247
7355[
10
277247
7539
sp.r
22
- Hệ số t-ơng quan Spearman:
782,0218,01
990
216
1
)1100(10
366
1rho.r
Kết luận : Tr-ờng hợp này,t-ơng quan thứ hạng spearman chặt chẽ hơn t-ơng quan
Spearson.