TRƯỜNG ĐẠI HỌC CẦN THƠ
KHOA KHOA HỌC TỰ NHIÊN
BỘ MÔN TỐN
-----------
LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
MỘT SỐ MƠ HÌNH HỒI QUY ĐẶC BIỆT
Giáo Viên Hướng Dẫn
Sinh Viên Thực Hiện
ThS. Võ Văn Tài
Nguyễn Thị Nguyệt Thắm
Bộ Mơn Tốn
Tốn Ứng Dụng K32
CẦN THƠ - 05/2010
4
MỤC LỤC
-----------
PHẦN MỞ ĐẦU ................................................................................................ 1
1.Giới thiệu vấn đề nghiên cứu ............................................................................ 1
2. Bố cục của luận văn ......................................................................................... 1
Chương 1 HỒI QUY PHỔ BIẾN ..................................................................... 3
1.1 GIỚI THIỆU ................................................................................................. 3
1.2 SỰ TƯƠNG QUAN CỦA HAI BIẾN ĐỊNH LƯỢNG .................................. 3
1.2.1 Hệ số tương quan đơn ................................................................................. 3
1.2.2 Tỷ tương quan ............................................................................................ 6
1.3 HỒI QUY TUYẾN TÍNH .............................................................................. 9
1.3.1 Hồi quy tuyến tính đơn ............................................................................... 9
1.3.2 Hồi quy tuyến tính bội .............................................................................. 12
1.4 MỘT SỐ DẠNG HỒI QUY PHI TUYẾN ................................................... 17
1.5 PHẦN MỀM R TRONG PHÂN TÍCH HỒI QUY ....................................... 18
1.5.1 Giới thiệu phần mềm R ............................................................................. 18
1.5.2 Sử dụng phần mềm R trong phân tích tương quan ..................................... 19
15.3 Sử dụng phần mềm R trong phân tích hồi quy ........................................... 20
Chương 2 HỒI QUY CĨ BIẾN ĐỊNH TÍNH ............................................... 26
2.1 GIỚI THIỆU ............................................................................................... 26
2.2 SỰ TƯƠNG QUAN CỦA CÁC BIẾN ĐỊNH TÍNH ................................... 26
2.2.1 Khái niệm ................................................................................................. 26
2.2.2 Tương quan của biến định tính.................................................................. 28
2.3 HỒI QUY CĨ BIẾN ĐỊNH TÍNH ............................................................... 35
2.3.1 Quy ước giá trị cho biến định tính............................................................. 35
2.3.2 Xây dựng đường hồi quy mẫu ................................................................... 35
Chương 3 HỒI QUY DẠNG HÀM MŨ VÀ LOGAGIT .............................. 42
3.1 GIỚI THIỆU ............................................................................................... 42
5
3.2 HỒI QUY DẠNG HÀM MŨ ....................................................................... 42
3.2.1 Mơ hình .................................................................................................... 42
3.2.2 Hàm mũ trong dự báo dân số .................................................................... 43
3.2.3 Hàm mũ trong dự báo sinh trưởng lâm nghiệp .......................................... 46
3.3 HỒI QUY LOGISTIC ................................................................................. 50
3.3.1 Odds của một biến cố................................................................................ 50
3.3.2 Hồi quy logistic nhị phân đơn giản ........................................................... 50
3.3.3 Hồi quy logistic bội .................................................................................. 54
3.4 HỒI QUY POISSON ................................................................................... 56
3.4.1 Mơ hình .................................................................................................... 57
3.4.2 Ước lượng hệ số hồi quy ........................................................................... 57
3.4.3 Hồi quy Poisson bội .................................................................................. 59
3.4.4 Ý nghĩa hệ số của đường hồi quy .............................................................. 59
PHẦN KẾT LUẬN .......................................................................................... 62
TÀI LIỆU THAM KHẢO ............................................................................... 63
6
LỜI CẢM ƠN
Tôi xin gởi lời cảm ơn sâu sắc đến Thầy Võ Văn Tài đã dành nhiều thời
gian, tâm huyết hướng dẫn, giúp đỡ tơi hồn thành đề tài tốt nghiệp. Thầy đã đưa
ra nhiều gợi ý sâu sắc và dễ hiểu giúp tơi hồn thành luận văn của mình một cách
đầy đủ và logic.
Tơi xin chân thành cảm ơn quý Thầy Cô trong Khoa Khoa học tự nhiên,
đặc biệt là Thầy Cơ của Bộ mơn tốn đã trang bị những kiến thức nền tảng quan
trọng cho tôi trong suốt q trình học tập.
Xin cám ơn Cơ cố vấn học tập Dương Thị Tuyền, người đã dìu dắt, hướng
dẫn và có những lời khun bổ ích, chân thành mà Cơ dành cho chúng tơi trong
suốt khóa học.
Tơi rất cám ơn tập thể lớp Toán ứng dụng K32, những người bạn đã gắn kết
cùng tôi trong suốt thời gian học tập, cùng trao đổi kiến thức để cùng nhau hoàn
thành tốt chương trình học.
Sau cùng, tơi xin kính gởi đến Gia đình tơi cùng những người thân lịng biết
ơn, lịng kính trọng sâu sắc nhất. Nơi đã cho tơi niềm tin, sự động viên, hỗ trợ, là
chỗ dựa vững chắc cho tôi trong những tháng ngày ở giảng đường đại học.
Mặc dù, tơi đã có nhiều cố gắng hồn thành luận văn bằng tất cả nhiệt
huyết và khả năng của mình, nhưng do kiến thức cịn hạn chế nên khơng tránh
những thiếu sót, rất mong nhận được sự đóng góp quý báu của quý Thầy Cô và
các bạn.
Xin chân thành cảm ơn.
Cần Thơ, tháng 5 năm 2010.
Sinh viên thực hiện
Nguyễn Thị Nguyệt Thắm
7
PHẦN MỞ ĐẦU
1. Giới thiệu vấn đề nghiên cứu
Từ giữa thế kỷ 19, khái niệm về hệ số tương quan (correlation) được ra đời
bởi huân tước Francis Galton (1886), một nhà tốn học và đồng thời là một bác
sĩ. Ơng đã đưa ra những khái niệm đầu tiên về tương quan khi nghiên cứu những
tập tính về chiều cao của hai thế hệ. Ông cũng là cha đẻ của thuật ngữ “Hồi quy”
(regression). Về sau, những khái niệm về tương quan và hồi quy mà Galton đưa
ra đã được nhà toán học Karl Pearson phát triển và đỉnh cao của nó là sự ra đời
của hệ số tương quan mang tên ông (hệ số tương quan Pearson). Ngày nay, hệ số
tương quan và hồi quy được ứng dụng rộng rãi đóng vai trị quan trọng, khơng
thể thiếu trong dự báo ngành kinh tế, các mơ hình trong chuẩn đốn y khoa, dự
báo trong thống kê dân số, và các mô hình sinh trưởng trong sinh học…
Luận văn này tổng kết các mơ hình hồi quy đã được sử dụng. Từ các mơ
hình hồi quy phổ biến như hồi quy tuyến tính đơn và bội, đến các mơ hình hồi
quy phức tạp, đặc biệt hơn như hồi quy có biến định tính, hồi quy dạng hàm mũ,
dạng hàm logarit,… Luận văn cũng trình bày cách sử dụng phần mềm R trong
phân tích tương quan và các mơ hình hồi quy.
2. Bố cục của luận văn
Luận văn gồm có phần mở đầu, phần nội dung, phần kết luận và tài liệu
tham khảo. Phần nội dung gồm 3 chương:
Chương 1: Chương này tìm mối tương quan giữa các đại lượng v à tìm các
hệ số thể hiện sự tương quan đó như: hệ số tương quan đơn, tỷ tương quan,…
Chương này cũng xây dựng các mơ hình hồi quy phổ biến như: mơ hình hồi quy
đơn, mơ hình hồi quy bội hay một số dạng hồi quy phi tuyến thông dụng khác…
được áp dụng với dữ liệu định lượng.
Chương 2: Xây dựng các mơ hình hồi quy khi dữ liệu của chúng ta có sự
xuất hiện của các biến định tính. Việc xây dựng mơ hình này có sự khác biệt
nhưng chủ yếu vẫn dựa vào cách xây dựng các mơ hình hồi quy phổ biến.
8
Chương 3: Trong chương 3 chúng ta sẽ thiết lập các mơ hình hồi quy đặc
biệt khác nhằm giúp cho việc dự báo chính xác hơn khi các mơ hình hồi quy khác
khơng làm được hay có độ chính xác khơng cao. Đó là các dạng hồi quy hàm mũ,
hàm logistic và Poisson.
9
Chương 1
HỒI QUY PHỔ BIẾN
1.1. GIỚI THIỆU
Trong thực tế, các đại lượng thường khơng đứng độc lập mà ln có sự phụ
thuộc qua lại với nhau. Sự phụ thuộc giữa chúng rất đa dạng, được diễn tả dưới
nhiều hình thức khác nhau. Chúng ta có thể đánh giá mức độ cũng như chiều
hướng của sự quan hệ, sự tương quan bằng những hệ số đặc trưng nào đó. Khi dữ
liệu là biến định tính thì sự tương quan giữa các đại lượng được tính dựa trên nền
tảng là sự tương quan của biến định lượng. Khi giữa các đại lượng có sự tương
quan với nhau, chúng ta có thể xây dựng được đường hồi quy để thể hiện mối
quan hệ đó. Từ đó có thể dự báo được biến khó quan sát, khó đo được qua những
biến có thể quan sát và đo được. Có nhiều mơ hình hồi quy khác nhau đã được
thiết lập để diễn tả những quan hệ khác nhau của cuộc sống, tuy nhiên chúng đều
được xây dựng dựa trên các mơ hình hồi quy phổ biến như hồi quy tuyến tính,
hồi quy phi tuyến quen thuộc. Vì vậy để xem xét một số mơ hình hồi quy đặc biệt
trong các chương sau, chương này chúng tơi giới thiệu về những mơ hình hồi quy
phổ biến.
1.2. SỰ TƯƠNG QUAN CỦA HAI BIẾN ĐỊNH LƯỢNG
1.2.1. Hệ số tương quan đơn
Trong nhiều bài toán người ta quan tâm đến mối quan hệ của hai hay nhiều
biến ngẫu nhiên. Giả sử có hai biến ngẫu nhiên X và Y. Vấn đề đặt ra là có hay
khơng mối quan hệ phụ thuộc giữa X và Y? Nếu X và Y độc lập ta có thể xét
riêng từng biến, cịn nếu X và Y phụ thuộc thì sự phụ thuộc và mức độ phụ thuộc
như thế nào? Trong thực tế, mối quan hệ phổ biến của X và Y thường là quan hệ
10
tuyến tính và tham số đặc trưng cho mối quan hệ này được gọi là hệ số tương
quan.
a) Công thức
Hệ số tương quan của hai biến ngẫu nhiên X và Y, kí hiệu ρ xy được xác
định bởi cơng thức
ρ xy =
Cov( X , Y )
Var ( X ) Var (Y )
(1.1)
Trong đó
Var(X), Var(Y) lần lượt là phương sai của X và Y,
Cov( X , Y ) là hiệp phương sai giữa hai biến X và Y và được xác định bởi
công thức sau:
C
( X , Y ) = oE[( X − Ev( X ))(Y − E (Y ))] = E ( X ) − E ( X )Y.E (Y )
Đặt σ xy = Cov( X , Y ) = σ yx .Vì σ x = V a( Xr ) và σ y = V a(Yr) nên công thức
(1.1) được viết lại như sau:
ρ xy =
σ xy
σ x .σ y
(1.2)
b) Ý nghĩa
Hệ số tương quan của hai biến là đại lượng dùng để thể hiện chiều
hướng và độ mạnh hay yếu của mối quan hệ tuyến tính giữa hai biến đó. ρ xy
càng gần 1 thì mối quan hệ tuyến tính càng chặt và ρ xy càng gần 0 thì mối quan
hệ tuyến tính càng yếu đi.
c) Tính chất
Hệ số tương quan ρ xy có các tính chất sau:
i) − 1 ≤ ρ xy ≤ 1
ii) ρ xy <0: X và Y có mối liên hệ tuyến tính nghịch ( ρ = -1 thể hiện một
mối liên hệ tuyến tính nghịch hồn tồn).
iii) ρ xy >0: X và Y có mối liên hệ tuyến tính thuận ( ρ = 1 thể hiện một mối
liên hệ tuyến tính thuận hồn tồn).
iv) ρ xy = 0: X và Y khơng có mối liên hệ tuyến tính.
11
d) Hệ số tương quan tuyến tính mẫu R
Trong thực tế, chúng ta khơng biết được chính xác σ xy , σ x , σ y để tính hệ
số tương quan ρ xy vì khi đó ta phải biết luật phân phối xác suất của các đại lượng
ngẫu nhiên. Do đó, ta phải ước lượng các tham số của tổng thể trong công thức
(1.2) bởi các tham số mẫu đặt trưng. Giả sử từ tổng thể ta chọn ra một mẫu gồm
n phần tử. Quan sát hai biến ngẫu nhiên X và Y trên n phần tử mẫu, ta có số liệu
cụ thể: (x 1 ,y 1 ), (x 2 ,y 2 ),…, (x n ,y n ).
1 n
1 n
1 n
Đặt x = ∑ xi , y = ∑ y i , xy = ∑ xi y i
n i =1
n i =1
n i =1
Khi đó σ xy , σ x , σ y lần lựợt được ước lượng bằng S xy ,
(
n
) (
S x =y ∑ yi xi − x = n x − yx y
Sx ,
S y như sau:
)
i =1
n
(
)
(
)
S x = ∑ xi − x
i =1
n
S y = ∑ yi − y
i =1
2
1 n
= ∑ xi − ∑ xi
n i =1
i =1
n
2
2
1 n
= ∑ yi − ∑ yi
n i =1
i =1
n
2
2
2
Như vậy hệ số tương quan được xác định bởi công thức (1.2) sẽ được ước
lượng bằng hệ số tương quan mẫu (kí hiệu: R)
Sx y
R=
Hay
R=
(
n xy − x y
∑ y 2 − 1 ∑ y
i
i =1 i
n i =1
n
n
(1.3)
Sx S y
2
)
∑ x 2 − 1 ∑ x
i
i =1 i
n i =1
n
n
2
=
(
n xy − x y
)
(1.4)
Sx Sy
Ví dụ 1.1. Bảng sau đây cho số liệu về mức chi tiêu dùng (y–đôla/tuần) và thu
nhập hàng tuần (x–đôla/tuần) của một mẫu gồm 10 hộ gia đình. Giả sử x và y có
mối quan hệ tương quan tuyến tính. Hãy tìm hệ số tương quan giữa x và y.
y i 70
x i 80
65
100
90
120
95
140
110
160
115
180
120
200
140
220
155
240
150
260
Giải
Từ các số liệu quan sát trên, ta có được bảng tính các thơng tin cần thiết để
tìm hệ số tương quan giữa mức chi tiêu dùng và thu nhập hàng tuần như sau:
12
STT
1
2
3
4
5
6
7
8
9
10
Tổng:
10
Ta có n = 10,
∑x
i =1
10
∑x y
i =1
i
i
i
yi
70
65
90
95
110
115
120
140
155
150
1110
= 1700 ,
10
∑y
i =1
= 205500 , x =
i
xi
80
100
120
140
160
180
200
220
240
260
1700
xi yi
yi2
xi2
5600
4900
6400
6500
4225
10000
10800
8100
14400
13300
9025
19600
17600 12100 25600
20700 13225 32400
24000 14400 40000
30800 19600 48400
37200 24025 57600
39000 22500 67600
205500 132100 322000
= 1110 ,
∑x
10
i =1
2
i
= 322000 ,
10
∑y
i =1
2
i
= 132100
1700
1110
205500
= 170 , y =
= 111 , xy =
= 20550
10
10
10
Vậy hệ số tương quan giữa x và y là
R=
10(20550 − 170 x111)
1110 2
132100 −
10
1700 2
322000 −
10
=
16800
293370000
= 0.9808474
Nhận xét: R = 0.9808474 > 0 nên x và y có mối liên hệ tuyến tính thuận.
1.2.2. Tỷ tương quan
Hệ số tương quan đơn chỉ để đo mức độ phụ thuộc tuyến tính giữa hai
biến ngẫu nhiên X và Y. Giữa hai đại lượng ngẫu nhiên X và Y có thể cịn có sự
phụ thuộc phi tuyến. Do đó nếu hệ số tương quan giữa X và Y nhỏ hay thậm chí
bằng khơng thì nếu ta kết luận giữa X và Y khơng có sự tương quan nào là khơng
chính xác, bởi vì giữa chúng vẫn có thể có một hình thức tương quan khác. Vì
vậy, người ta muốn đưa ra một đại lượng mà nó có thể đo mức độ tương quan bất
kỳ giữa hai biến ngẫu nhiên. Đại lượng đó được gọi là tỷ tương quan.
a) Cơng thức
Giả sử Var(Y) >0, khi đó tỷ tương quan của hai đại lượng X và Y (kí hiệu
ηY2 / X ) được xác định bởi công thức sau:
η 2Y / X =
Var ( E (Y / X )) E ( E (Y / X )) 2 − ( E (Y )) 2
=
Var (Y )
E (Y 2 ) − ( E (Y )) 2
(1.5)
13
b) Ý nghĩa
Tỷ số tương quan của hai đại lượng là con số đặc trưng cho mức độ liên
hệ của hai đại lượng này theo một hình thức nào đó. Tỷ số tương quan càng lớn
thì hai đại lượng càng có liên hệ chặc chẽ với nhau và ngược lại.
c) Tính chất
Tỷ tương quan có những tính chất sau:
i) 0 ≤ η 2Y / X ≤ 1 .
ii) Nếu η Y / X = 0 thì Y và X khơng có phụ thuộc tương quan.
iii) Nếu η 2Y / X = 1 thì E (Y − E (Y / X )) 2 = 0 hay E (Y / X ) = E (Y ) với xác
suất bằng 1, có nghĩa là những biến động của X khơng ảnh hưởng gì đến Y. Khi
đó quan hệ phụ thuộc hàm giữa X và Y không rõ rệt.
iv) η Y / X ≥ ρ XY .
Chú ý :
i) Hiệu số η 2Y / X − ρ 2 đo mức độ phụ thuộc phi tuyến giữa Y và X. Nếu hiệu
số này càng lớn thì sự tương quan phi tuyến giữa Y và X càng mạnh và ngược lại.
ii) Nếu η 2Y / X = ρ 2 thì ngồi mối liên hệ tuyến tính, Y khơng có mối liên
hệ phi tuyến nào nữa đối với X.
iii) Nếu η 2Y / X ≠ ρ 2 nhiều thì ngồi mối liên hệ tuyến tính Y cịn có mối liên
hệ phi tuyến đối với X.
iv) Nếu η 2Y / X gần 1, ρ 2 gần 0 thì giữa X và Y có sự phụ thuộc rất chặt chẽ
nhưng mối liên hệ tuyến tính lại rất yếu. Trong trường hợp này ta khơng thể dùng
liên hệ tuyến tính được mà phải dùng quan hệ phi tuyến.
d) Tỷ số tương quan mẫu
Giả sử ta có mẫu ngẫu nhiên cỡ n các quan trắc về véc tơ hai chiều
( x, y ) : ( xi , y i ), i = 1,..., n . Để tính tỷ số tương quan mẫu RY / X ta cần tiến hành các
bước sau:
Bước 1: Sắp xếp xi và y i thành dãy tăng dần
x(1) < x(2) < ... < x(i ) < ... < x( k ) ,
y(1) < y(2) < ... < y( j ) < ... < y(l ) .
k, l ≤ n
14
Bước 2: Đếm nij là số phần tử mẫu ( xi , y i ) , trong đó
k
l
∑∑ nij = n ,
i =1 j =1
Bước 3: Tính
l
∑n
j =1
1
Bước 4: Tính
ni
ij
l
∑ nij = ni. ,
j =1
y ( j ) , i = 1,..., k ,
k
∑n
i =1
l
∑n
j =1
.j
2
l
∑ nij y ( j ) , i = 1,..., k ,
j =1
= n. j
ij
l
y( j ) ,
∑n
j =1
1
∑
i =1 ni
k
.j
y( j )
2
l
∑ nij y ( j )
j =1
2
Bước 5: Tính R 2Y / X bởi công thức
R 2Y / X
2
2
2
1 k
1 k
−
n
x
∑ ni. x(i ).
∑
∑
ij (i )
n i =1
j =1 n. j i =1
l
R 2Y / X =
Hoặc
2
1 l
1 l
∑ nij y ( j ) − ∑ n. j y ( j )
∑
n j =1
i =1 ni . j =1
=
2
l
1 l
2
∑ n. j y ( j )
−
(
)
n
y
∑
( j)
.j
n j =1
j =1
k
1 k
n i . ( x (i ) ) − ∑ n i . x (i )
∑
n i =1
i =1
k
2
2
Ta lập bảng tính tỷ tương quan R 2Y / X như sau:
Bảng 1.1. Bảng tính tỷ số tương quan mẫu R 2Y / X
x(1) … x(i ) … x(k )
n. j
y (1)
n11 … ni1 … nk1
n.1
…
...
…
y( j )
n1 j … nij … n kj
n. j
…
…
…
y (l )
n1l … nil … nkl
n.l
n.i
n1 … ni… nk
n
2
nij y j
n. j y( j )
(Tổng cột)
(Tổng cột)
l
∑n
j =1
1
ni
ij
y( j )
l
∑ nij y ( j )
j =1
(.) … (.)… (.)
2
(.) … (.)… (.)
(Tổng hàng)
Ví dụ 1. 2. Cho hai biến ngẫu nhiên X, Y. Ta tiến hành 216 quan trắc độc lập về
hai biến ngẫu nhiên này được kết quả như sau:
x (i ) :
y( j )
nij
1
: 14
: 10
2
14
84
2
15
12
3
15
7
3
16
28
4
16
6
4
17
6
5
17
9
5
18
12
15
Hãy tính tỷ tương quan của Y theo X.
Giải
Ta thực hiện giải bài tốn theo các bước đã trình bày ở trên như sau:
Bước 1: Sắp xếp xi và y i thành dãy tăng dần
x (i ) : 1
2
3
4
5
16
17 18
y ( j ) : 14 15
Bước 2, bước 3: được tính dựa vào bảng tổng hợp các phép tính sau:
x (i )
y( j )
14
15
16
17
18
ni .
1
2
3
4
5
10
0
0
0
0
10
84
12
0
0
0
96
0
7
28
0
0
35
0
0
6
48
0
54
0
0
0
9
12
21
140
1356
553
912
369
2
n. j
n. j y j
n. j y( j )
94
19
34
57
12
216
1316
285
544
969
216
3330
18424
4275
8704
16473
3888
51764
l
∑n
j =1
ij
y( j )
1 l
∑ nij y ( j )
ni. j =1
2
1960 19154 8737 15403 6484
51737
2
1 l
Bước 4: Tính ∑ ∑ nij y ( j ) = 51737
i =1 ni . j =1
k
Bước 5: Tính R 2 Y / X
1
x 3330 2
216
=
= 0.936694
1
2
51764 −
x 3330
216
51737 −
RY / X = 0.936694 = 0.9678295
Nên
Nhận xét: Ta có RY / X = 0.9678295 , có nghĩa là Y có mối quan hệ rất chặt chẽ đối
với X.
1.3. HỒI QUY TUYẾN TÍNH
1.3.1. Hồi quy tuyến tính đơn
a) Mơ hình
16
Mục đích của phân tích hồi quy là mơ hình hóa mối liên hệ giữa các đại
lượng bằng một mơ hình tốn học tối ưu nhất. Giả sử mỗi giá trị quan sát của Y
có thể được biểu diễn theo mơ hình
Y = β 0 + β1 X + ε
(1.6)
Với
β 0 là hệ số chặn hay hệ số tung độ gốc,
β1 là hệ số gốc hay hệ số dốc,
β 0 + β1 X là thành phần tuyến tính,
ε là thành phần ngẫu nhiên, không chệch giữa Y và E(Y/X), ε có
thể bằng khơng, hoặc lớn hơn khơng, hoặc nhỏ hỏn khơng khi các giá trị nằm
ngay, hoặc phía trên, hoặc phía dưới đường hồi quy.
Chúng ta giả sử E( ε ) = 0 và Var( ε ) = σ 2 hay ε ~N(0, σ 2 ) và ε là những
biến ngẫu nhiên khơng tương quan nhau. Khi đó, mơ hình (1.6) được gọi là mơ
hình hồi quy tuyến tính đơn.
b) Xây dựng mơ hình hồi quy mẫu
Khi chúng ta có n cặp dữ liệu (x 1, y 1 ), (x 2, y 2 ), …, (x n, y n ), để ước lượng
các tham số β 0 , β1 , ta sử dụng phương pháp bình phương cực tiểu.
y i = β 0 + β 1 xi + ε i ,
Ta có
(i =1,2,…,n)
Mơ hình hồi quy tuyến tính mẫu được sử dụng để ước lượng mơ hình hồi quy
tổng thể là
yˆ i = βˆ0 + βˆ1 xi
(1.7)
Tổng bình phương sai số giữa giá trị quan sát thực tế và lý thuyết được xác định
như sau:
(
)
n
n
i =1
i =1
2
n
(
2
L βˆ0 , βˆ1 = ∑ ε i = ∑ ( y i − yˆ i ) = ∑ y i − βˆ0 − βˆ1 xi
(
)
i =1
)
2
(1.8)
Chúng ta cần tìm βˆ0 , βˆ1 sao cho L βˆ0 , βˆ1 nhỏ nhất. Vì vậy hai giá trị này chính
là nghiệm của hệ phương trình
(
)
(
)
n
∂L
2
y i − βˆ0 − βˆ1 xi = 0
=
−
∑
ˆ
i =1
∂β 0
n
∂L = −2
y i − βˆ0 − βˆ1 xi xi = 0
∑
∂βˆ
=
i
1
1
17
Hệ phương trình trên tương đương
n
n 2 ˆ n ˆ
x
β
x
β
xi y i
=
+
∑
∑
∑
i
i
1
0
i =1
i =1
i =1
n
n
∑ x βˆ + nβˆ = ∑ y
0
i
i =1 i 1
i =1
Đây là hệ phương trình tuyến tính bậc nhất với hai ẩn βˆ0 , βˆ1 . Giải hệ phương
trình này ta được
n
n n
−
n
x
y
∑ xi ∑ y i
∑
i i
i =1 i =1
βˆ1 = i =1
2
n
n
2
n∑ xi − ∑ xi
i =1
i =1
1 n
n
βˆ0 = ∑ y i − βˆ1 ∑ xi
n i =1
i =1
Khi tính được βˆ0 , βˆ1 ta viết được mơ hình hồi quy mẫu yˆ i = βˆ0 + βˆ1 xi
Chú ý:
i) βˆ0 và βˆ1 là ước lượng không chệch của β 0 , β1 .
ii) Thông thường để thuận lợi hơn trong việc tính tốn ta thường viết cơng
thức βˆ0 và βˆ1 dưới hình thức
(
)
S xy
^
n xy − x y
=
β 1 = n
2
sx
1 n
2
x
x
−
∑
∑ i
i
n i =1
i =1
^
^
β
β
y
=
−
0
1 x
Trong đó
2
n
(
) (
n
2
1 n 2
1 n
2
s x = ∑ xi − x = ∑ xi − ∑ xi , S x =y ∑ yi xi − x = n x − yx y
i =1
n i =1
n i =1
i =1
)
Ví dụ 1.3. Xét lại ví dụ 1.1. hãy tìm mơ hình hồi quy mẫu cho mức chi tiêu dùng
theo thu nhập của 10 hộ gia đình.
Giải
10
Ta có n = 10,
∑ xi = 1700 ,
i =1
10
∑x y
i =1
i
i
= 205500 , x =
10
∑ yi = 1110 ,
i =1
10
∑ xi = 322000 ,
i =1
2
10
∑y
i =1
2
i
= 132100
205500
1700
1110
= 20550
= 170 , y =
= 111 , xy =
10
10
10
18
Do đó ta có
^ 10(20550 − 170.111)
= 0.5091
β 1 =
1700 2
322000 −
10
^
β = 111 − 0.5091.170 = 24.4545
0
Vậy mơ hình hồi quy tuyến tính mẫu của mức chi tiêu dùng theo thu nhập là
yˆ = 24.4545 + 0.5091x
Nhận xét: Nếu thu nhập hàng tuần của các hộ gia đình tăng 1 đơla/tuần thì mức
chi tiêu dùng của các hộ gia đình tăng khoảng 0.5091 đơla/tuần.
1.3.2. Hồi quy tuyến tính bội
a) Mơ hình
Trong mơ hình hồi quy tuyến tính đơn, chúng ta chỉ đơn thuần xây dựng
mối quan hệ tuyến tính của hai biến X và Y. Nhưng trong thực tế, chúng ta
thường gặp không chỉ biến X ảnh hưởng đến Y mà còn các biến khác cũng ảnh
hưởng đến Y. Khi đó để dự báo Y được tốt chúng ta cần xây dựng mơ hình hồi
quy bội của Y qua tất cả các biến.
Giả sử Y phụ thuộc vào k biến độc lập X 1 , X 2 ,…, X k , mỗi giá trị quan sát
của Y có thể được biểu diễn theo mơ hình
Y = β 0 + β1 X 1 + β 2 X 2 + . +. β k. X k + ε
Trong đó
(1.9)
β 0 là hệ số tung độ gốc,
β1 là hệ số dốc của Y theo biến X 1 khi các biến X 2 , X 3 ,…, X k không đổi,
β 2 là hệ số dốc của Y theo biến X 2 khi các biến X 1 , X 3 ,…, X k không
đổi,
………………
β k là hệ số dốc của Y theo biến X k khi các biến X 1 , X 2 ,…, X k-1 không
đổi,
2
ε là thành phần ngẫu nhiên với E( ε ) = 0 và Var( ε ) = σ .
Nếu ε là biến ngẫu nhiên không tương quan thì mơ hình (1.9) được gọi là mơ
hình hồi quy tuyến tính bội.
b) Xây dựng mơ hình hồi quy mẫu
19
Giả sử chúng ta có n quan sát, mỗi quan sát có k giá trị (y i , x 1i , x 2i, …, x ki ),
i = 1, 2, …, n. Khi đó
y i = β 0 + β1 x1i + β 2 x 2i + . +. β k. x k +i ε i
Cụ thể hơn ta có
(i=1,2,…,n)
y1 = β 0 + β1 x1 + 1β 2 x 2 + 1. +. β k.x k1 + ε 1
y 2 = β 0 + β1 x1 +2β 2 x 2 +2. +. β k.x k 2 + ε 2
(1.10)
……………………………………….
y n = β 0 + β1 x1n + β 2 x 2 n + . +. β k.x k +nε n
Hệ phương trình (1.10) được viết dưới dạng ma trận
y = Xβ + ε
Trong đó
y1
β0
1
y
β
1
1
2
β=
y=
X =
... ,
... ,
. . .
yn
β k
1
x1 1 x 2 1 . . . x k1
ε 1
ε
x1 2 x 2 2 . . . x k 2
ε = 2
,
...
. . . . . . . . . . . .
x1n x 2 n . . . x k n
ε n
Chúng ta vẫn dùng phương pháp bình phương tối tiểu để ước lượng các
tham số β 0 , β1 ,..., β k bằng các hệ số βˆ0 , βˆ1 ,…, βˆ k . Mơ hình hồi quy tuyến tính
bội của mẫu được sử dụng để ước lượng mơ hình hồi quy tổng thể là
yˆ i = βˆ0 + βˆ1 x1i + ... + βˆ k x ki
(1.11)
Phương trình (1.11) cũng được viết dưới dạng ma trận
yˆ = Xβˆ
βˆ0
yˆ1
ˆ
yˆ
β
2
ˆ
, β = 1
Với yˆ =
...
...
βˆ k
yˆ n
Trong đó yˆ , X, βˆ lần lượt là ma trận cỡ (n x 1), (n x p) và (p x 1).
Bình phương giữa giá trị thực tế và lý thuyết được xác định như sau:
n
L = ∑ ( y i − yˆ )
i =1
2
= ∑ (y
i =1
)
2
n
i
− βˆ0 − βˆ1 x1i − ... − βˆ k x ki
Chúng ta cần tìm các hệ số βˆ0 , βˆ1 , …, βˆ k sao cho L đạt giá trị cực tiểu
Ta ký hiệu XT, βˆ T , ε T là các ma trận chuyển vị của X, βˆ , ε thì L được
viết lại như sau:
20
(
n
L = ∑ ε 2 = ε T ε = y − Xβˆ
i =1
) (y − Xβˆ ) = (y
T
T
)(
− X T βˆ T y − Xβˆ
)
= y T y − y T Xβˆ − X T βˆ T y + X / βˆ T Xβˆ
(1.12)
(
)
Do X T βˆ T y là một ma trận cỡ (1 x 1), βˆ T βˆ = βˆ 2 và X T βˆ T y = y T Xβˆ nên (1.12)
trở thành
L = y T y − 2 X T βˆ T y + X T Xβˆ 2
Lấy đạo hàm L theo βˆ và cho nó bằng 0 ta có
∂L
= −2 X T y + 2 X T Xβˆ = 0
ˆ
∂β
X T Xβˆ = X T y
Hay
Giải phương trình này ta được
βˆ = (X T X ) X T y
−1
Trong đó
n
n
x
1i
X T X = ∑
i =1
...
n
∑ x ki
i =1
n
i =1
n
∑x
∑x
1i
i =1
...
i =1
x 2i
...
n
∑x
x
ki 1i
i =1
ki
∑x
...
i =1
n
2
n
∑x
n
∑ x 2i
1i
i =1
i =1
n
... ∑ x1i x ki là ma trận vuông cỡ (p x p),
i =1
...
...
n
2
... ∑ x ki
i =1
n
∑ x1i
x 2i
ki
n
n
y
∑
i
∑ y i
i =1
i =1
x
y
x
y
...
x
y
+
+
+
12 2
1n n
S1 y
11 1
là ma trận cỡ (p x 1).
XTy =
=
x 21 y1 + x 22 y 2 + ... + x 2 n y n S 2 y
...
...
x y + x y + ... + x y S ky
k2 2
kn n
k1 1
Mặc khác ta cũng có thể tìm các hệ số của đường hồi quy tuyến tính bội từ
phương trình (X T X )βˆ = X T y . Cụ thể giải phương trình
n
n
x
1i
∑
i =1
...
n
∑ x ki
i =1
n
n
∑x
1i
i =1
n
∑x
i =1
n
i =1
n
∑x
1i
i =1
...
∑x
i =1
2
1i
∑x
x 2i
...
n
x
ki 1i
∑x
i =1
ki
n
ˆ ∑ y i
β0
i =1
i =1
n
ˆ S
... ∑ x1i x ki β 1 = 1 y
S
i =1
2y
...
...
...
n
βˆ ...
2
... ∑ x ki k S
ky
i =1
n
2i
x 2i
...
c) Ý nghĩa của hệ số hồi qui tuyến tính bội
∑x
ki
21
Xét mơ hình hồi quy bội
Y = β 0 + β1 x1 + β 2 x 2 + ... + β k x k + ε
Chúng ta nhận thấy E(Y) = β khi x i = 0 và
βi =
∂Y
∂xi
Từ kết quả này có thể giải thích ý nghĩa của β i ( ∀i = 1, k ) như sau: trong
điều kiện các nhân tố khác không đổi, khi x i tăng lên một đơn vị (theo đơn vị
của x i ) thì Y sẽ tăng bình quân β i đơn vị (theo đơn vị của Y).
Ví dụ 1.4. Nghiên cứu về mối liên hệ giữa độ tuổi, tỉ trọng cơ thể được ước tính
bằng cơng thức tính BMI là lấy trọng lượng (tính bằng kg) chia cho chiều cao
bình phương (tính bằng m2) và cholesterol trong máu của 18 đối tượng nam. Kết
quả đo lường như sau:
STT
1
2
3
4
5
6
7
8
9
Độtuổi
(age)
x 1i
46
20
52
30
57
25
28
36
22
BMI
(bmi)
x 2i
25.4
20.6
26.2
22.6
25.4
23.1
22.7
24.9
19.8
Cholesterol
(chos)
yi
3.5
1.9
4
2.6
4.5
3
2.9
3.8
2.1
STT
10
11
12
13
14
15
16
17
18
Độtuổi
(age)
x 1i
43
57
33
22
63
40
48
28
49
BMI
(bmi)
x 2i
25.3
23.2
21.8
20.9
26.7
26.4
21.2
21.2
22.8
cholesterol
(chos)
yi
3.8
4.1
3
2.5
4.6
3.2
4.2
2.3
4
Giải
Từ các số liệu quan sát trên, ta có được bảng tính các thơng tin cần thiết để
xây dựng mơ hình hồi quy như sau:
STT
1
2
3
Độ
tuổi
(age)
x 1i
46
20
52
BMI Cholesterol
(bmi)
(chos)
x 2i
yi
25.4
20.6
26.2
3.5
1.9
4
x 1i . y i
x 2i . y i
x 1i 2
x 2i 2
yi2
161
38
208
88.9
39.14
104.8
2116
400
2704
645.16
424.36
686.44
12.25
3.61
16
22
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Tổng:
Trung
Bình:
30
57
25
28
36
22
43
57
33
22
63
40
48
28
49
699
22.6
25.4
23.1
22.7
24.9
19.8
25.3
23.2
21.8
20.9
26.7
26.4
21.2
21.2
22.8
420.2
2.6
4.5
3
2.9
3.8
2.1
3.8
4.1
3
2.5
4.6
3.2
4.2
2.3
4
60
78
58.76
256.5
114.3
75
69.3
81.2
65.83
136.8
94.62
46.2
41.58
163.4
96.14
233.7
95.12
99
65.4
55
52.25
289.8 122.82
128
84.48
201.6
89.04
64.4
48.76
196
91.2
2511.6 1422.44
38.83
23.34
3.33
139.53
79.02
900
3249
625
784
1296
484
1849
3249
1089
484
3969
1600
2304
784
2401
30287
510.76
645.16
533.61
515.29
620.01
392.04
640.09
538.24
475.24
436.81
712.89
696.96
449.44
449.44
519.84
9891.78
6.76
20.25
9
8.41
14.44
4.41
14.44
16.81
9
6.25
21.16
10.24
17.64
5.29
16
211.96
1682.61
549.54
11.78
Ta có n = 18
18
18
i =1
18
i =1
18
18
18
i =1
i =1
∑ x1i = 699 , ∑ yi = 60 , ∑ x1i = 30287 , ∑ x1i yi = 2511.6 , ∑ x1i x2i = 16669.7 ,
∑x
i =1
2i
= 420.2 ,
2
i =1
18
∑x
i =1
2
2i
= 9891.78 ,
18
∑x
i =1
2i
y i = 1422.44
Dựa vào các cơng thức tính ma trận X T X và ma trận X T y ở trên ta tính được
699
420.2
18
X X = 699
30287 16669.7
420.2 16669.7 9891.78
Nên ma trận khả nghịch của X T X là
T
(X X )
T
−1
0.0370797600 − 0.441437240
8.92073200
= 0.0370797600 0.0006096853 − 0.002602584
− 0.441437240 − 0.002602584 0.023239116
Và ma trận X T y được tính ra kết quả như sau:
60
X y = 2511.6
1422.44
T
Để tìm được mơ hình hồi quy tuyến tính mẫu thì ta phải tính các βˆ và βˆ được
tính theo công thức sau:
βˆ = (X T X ) X T y
−1
23
0.0370797600 − 0.441437240 60
8.92073200
= 0.0370797600 0.0006096853 − 0.002602584 2511.6
− 0.441437240 − 0.002602584 0.023239116 1422.44
0.45545759
ˆ
β = 0.05405192
0.03336380
Vậy mơ hình hồi quy bội thể hiện độ cholesterol trong máu theo độ tuổi, tỉ trọng
cơ thể của 18 đối tượng nam là
yˆ = 0.45545759 + 0.05405192.x1 + 0.03336380.x 2
Nhận xét: Trong điều kiện độ BMI của các đối tượng không đổi, nếu độ tuổi
tăng 1 tuổi thì độ cholesterol trong máu tăng khoảng 0.054 mg/l. Và trong điều
kiện độ tuổi của các đối tượng không đổi, nếu độ BMI tăng 1 kg/m2 thì độ
cholesterol trong máu tăng khoảng 0.03336 mg/l.
1.4. MỘT SỐ DẠNG HỒI QUY PHI TUYẾN
Tùy theo mối quan hệ giữa đại lượng Y với các đại lượng độc lập khác mà
mơ hình quan hệ được biễu diễn dưới nhiều hình thức khác nhau. Các mơ hình
được trình bày ở trên đã thể hiện hầu hết các mối quan hệ trong thực tế. Tuy
nhiên ngoài những mơ hình hồi quy thơng dụng cịn rất nhiều mơ hình hồi quy
phi tuyến khác. Có thể kể ra một số trường hợp cụ thể sau:
i) Hồi quy dạng lũy thừa
Phương trình hồi quy tổng thể là
β
β
Y = αX 1 1 X 2 2 ... X k
βk
+ε
(1.13)
Lấy logarit hai vế của (1.13) ta được
l Y n= l α n+ β1 l Xn1 + β 2 l Xn2 + . +.β k l. Xnk
(1.14)
ii) Hồi quy logarit
Ta có mơ hình
ln Y = β 0 + β1 ln X 1 + β 2 ln X 2 + ... + β k ln X k + ε
(1.15)
iii) Hồi quy lượng giác
Ta có mơ hình lượng giác tổng thể của hai biến X và Y là
Y = β 0 + β1 sin X + β 2 cos X + ε
iv) Hồi quy parabol
(1.16)
24
Ta có mơ hình parabol Y = aX 2 + bX + c + ε
(1.17)
v) Hồi quy hyperbol bội
Ta có mơ hình hyperbol bội là
Y = β0 +
β1
X1
+
β2
X2
+ ... +
vi) Hồi quy đa thức bậc k một biến
βk
Xk
+ε
(1.18)
Ta có mơ hình đa thức bậc k một biến là
Y = β 0 + β1 X + β 2 X 2 + ... + β k X k + ε
(1.19)
Chú ý:
a) Các mơ hình (1.14), (1.15), (1.17), (1.18), (1.19) có thể đưa về dạng
tuyến tính. Cụ thể
i) Đặt ln α = β 0 , ln X i = Ti với i = 1, k và ln Y = U thì (1.14) trở thành
U = β 0 + β1T1 + β 2T2 + ... + β k Tk + ε
ii) Đặt ln Y = U , ln X i = Ti với i = 1, k thì (1.15) trở thành
U = β 0 + β1T1 + β 2T2 + ... + β k Tk + ε
iii) Đặt: X2 = T 1 , X = T 2 thì (1.17) trở thành
Y = c + aT1 + bT2 + ε
iv) Đặt
1
= Ti với i = 1, k thì (1.18) trở thành
Xi
Y = β 0 + β1T1 + β 2T2 + ... + β k Tk + ε
v) Đặt X i = Ti với i = 1, k thì (1.19) trở thành
U = β 0 + β1T1 + β 2T2 + ... + β k Tk + ε
b) Việc tìm biểu thức tường minh xác định các hệ số của mơ hình hồi quy
phi tuyến rất phức tạp, vì vậy trong thực tế, các hệ số của mơ hình hồi quy phi
tuyến được xác định từ các phần mềm thống kê. Trong luận văn này, chúng tôi sử
dụng phần mềm R. Trong phần tiếp theo (phần 1.5.) chúng tơi sẽ trình bày chi
tiết về vấn đề này.
1.5. PHẦN MỀM R TRONG PHÂN TÍCH HỒI QUY
25
1.5.1. Giới thiệu phần mềm R
Ngày nay, có thể nói rằng kĩ năng phân tích số liệu bằng máy tính là một
kĩ năng không thể thiếu của một nhà nghiên cứu. Trước những cơng trình nghiên
cứu với hàng ngàn số liệu, vấn đề đặt ra là làm thế nào để phân tích những số liệu
một cách khoa học. Khoa học thống kê cung cấp cho chúng ta một số mô hình và
phương pháp có ích cho việc phân tích số liệu.
Các phần mềm thông dụng được sử dụng để phân tích số liệu và vẽ biểu đồ
như: Excel, SPSS,… là những phần mềm được sử dụng cho giảng dạy và nghiên
cứu. Tuy nhiên chi phí để sử dụng các phần mềm này tương đối đắt tiền (có khi
lên đến hàng trăm ngàn đô-la mỗi năm), một số trường đại học ở các nước đang
phát triển (và ngay cả ở một số nước đã phát triển) khơng có khả năng tài chính
để sử dụng chúng một cách lâu dài. Nên trong một bài báo qu an trọng về tính
tốn thống kê của hai nhà thống kê học Ross Ihaka và Robert Gentleman thuộc
Trường đại học Auckland, New Zealand năm 1996 đã sáng tạo ra một ngơn ngữ
mới cho phân tích thống kê và họ đặt tên là R. Sáng kiến n ày được rất nhiều nhà
thống kê học trên thế giới truy cập và tải toàn bộ phần mềm để sử dụng vì nó
hồn tồn miễn phí.
Phần mềm R cũng được sử dụng như là một ngơn ngữ máy tính đa năng.
Chúng ta có thể sử dụng R cho nhiều mục tiêu khác nhau, từ tí nh tốn đơn giản,
tốn học giải trí, tính tốn ma trận, cho đến các phân tích xác suất thống kê phức
tạp. Ngồi ra, nó cịn có thể sử dụng để lập trình ra các phần mềm chuyên môn
nhằm thực hiện một công việc cụ thể nào đó, đặc biệt R có thể phân tích sự tương
quan giữa các đại lượng và xây dựng các mô hình hồi quy để dự báo. Đa số các
ứng dụng của R là rất sát với nội dung kiến thức toán kinh tế, y khoa. Từ việc
chọn mẫu sao cho thật ngẫu nhiên cho tới phân tích các luật phân phối xác suất
hay việc ước lượng và kiểm định giả thiết và dự báo. Nhiều vấn đề phức tạp của
toán kinh tế, y khoa đã được đơn giản hoá rất nhiều.
Trong phần này, chúng ta nghiên cứu về ứng dụng của phần mềm R này để
phân tích tương quan và hồi quy.
1.5.2. Sử dụng phần mềm R trong phân tích tương quan
Hệ số tương quan đơn (hệ số tương quan Pearson)
26
Để sử dụng phần mềm R trong phân tích tương quan chúng ta cần nhập số
liệu vào R với những lệnh thông thường sau:
i) Tạo số thứ tự bằng lệnh
> id <- 1: n
ii) Khai báo các biế n cần sử dụng theo đề bài bằng cách sử dụng function c
(trong ngoặc là số liệu của biến cần khai báo)
> x i <- c (x 1 , x 2 , …, x n )
> y i <- c (y 1 , y 2 , …, y n )
iii) Hợp các biến tạo thành bộ dữ liệu của đề theo lệnh:
> data <- data.frame(id, x i , y i )
iv) Để ước tính hệ số tương quan giữa các biến x i và y i , chúng ta sử dụng
hàm cor (viết tắc từ correlation) như sau:
> cor(x i , y i )
Ví dụ 1.5. Trong ví dụ 1.1. sử dụng phần mềm R ta làm như sau:
> id <- 1: 10
> x i <- c (80, 100, 120, 140, 160, 180, 200, 220, 240, 260)
> y i <- c (70, 65, 90, 95, 110, 115, 120, 140, 155, 150)
> data <- data.frame(id, x i , y i )
> cor(x i , y i )
Kết quả: [1] 0.9808474.
Hay hệ số tương quan R = 0.9808474.
1.5.3. Sử dụng phần mềm R trong phân tích hồi quy
a) Mơ hình hồi quy tuyến tính đơn
i) Nhập số liệu vào R với những lệnh thông thường như phần 1.5.2.
ii) Dùng hàm lm (viết tắc của từ linear model) và đặt tên là reg (viết tắt từ
regression) như sau:
> reg <- lm (y i ~ x i )
> reg
Chú ý:
Chúng ta có thể vẽ đường biểu diễn cho mơ hình hồi quy tuyến tính đơn
bằng lệnh plot và lệnh abline
27
> plot (y i ~ x i , xlab="tên bến x i ", ylab="tên biến y i ",
main="tên biểu đồ", pch=16)
> abline (reg)
Ví dụ 1.6. Trong ví dụ 1.1. sử dụng phần mềm R để tìm mơ hình hồi quy ta làm
như sau:
>reg <- lm (y i ~ x i )
> reg
Kết quả:
Call:
lm(formula = y i ~ x i )
Coefficients:
(Intercept)
xi
24.4545
0.5091
Nhận xét: “y i ~ x i ” có nghĩa là mô tả y i là một hàm theo x i , hay là mức chi tiêu
dùng của các hộ gia đình được mơ tả theo thu nhập hàng tuần. Kết quả hàm lm
cho thấy βˆ0 = 24.4545 và βˆ1 = 0.5091 . Ta có thể xây dựng được mơ hình hồi quy
tuyến tính mẫu để ước lượng mức chi tiêu dùng của các hộ gia đình theo thu nhập
hàng tuần là
yˆ = 1.08922 + 0.05779 x
Hình 1.1. Mối liên hệ giữa mức chi tiêu dùng (Y–đôla/tuần) và thu nhập
hàng tuần (X–đơla/tuần) của 10 hộ gia đình.
b) Mơ hình hồi quy tuyến tính bội