Tải bản đầy đủ (.pdf) (212 trang)

Stata 12 và thực hành kinh tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (9.81 MB, 212 trang )

THỰC HÀNH
KINH TẾ LƯỢNG
VỚI STATA 12
LÊ DUY KHÁNH

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam


Chương 1. Giới thiệu Stata

Lời nói đầu
Bạn đọc thân mến,
Cuốn sách bạn đang xem ban đầu chỉ là một cuốn sổ tay, được lưu hành nội bộ trong một
nhóm nhỏ chúng tơi, những người có cùng sở thích về ứng dụng Stata trong giải quyết
các vấn đề của thống kê, kinh tế lượng phục vụ cho mục đích nghiên cứu khoa học. Tuy
nhiên, sự động viên của đồng nghiệp và nhu cầu chia sẻ đã đưa cuốn sổ tay đến với đông
đảo người đọc hơn.
Cuốn sách này được biên soạn dựa trên cuốn Using Stata For Principles Of
Econometrics, ấn bản số 3 của các tác giả R. Carter Hill, William E. Griffiths and
Guay C. Lim (2008) vốn được viết cho việc sử dụng Stata 8, chứ không phải Stata 12.
Tác giả đã cải biên để cuốn sách phù hợp với Stata 12, và sẽ tiếp tục cải biên để phù hợp
với phiên bản Stata mới nhất.
Bạn đọc sẽ tìm thấy trong cuốn sách này những nội dung cần thiết, được chắt lọc cho đối
tượng người dùng là sinh viên các trường cao đẳng, đại học, nhưng cũng phù hợp với
sinh viên cao học và nghiên cứu sinh. Những người có nhu cầu nghiên cứu về thống kê,
kinh tế lượng. Các nhà nghiên cứu cũng sẽ tìm được những thơng tin, kiến thức và kỹ
năng cần thiết cho việc học tập, nghiên cứu của mình. Cuốn sách đặc biệt thích hợp cho
những người có nhu cầu và khả năng tự nghiên cứu.
Tuy vậy, những kỹ năng xử lý thống kê, kinh tế lượng trên Stata 12 được đề cập trong
cuốn sách này vẫn ở mức cơ bản mà một người làm nghiên cứu khoa học trong lĩnh vực
kinh tế đều phải biết. Vì vậy, cuốn sách sẽ tiếp tục được cập nhật những nội dung chuyên


sâu hơn trong thời gian tới.
Cuốn sách được hoàn thành với sự tài trợ của nhãn hàng Tấm lót và Ga chống thấm
VIETMAT (vietmat.vn). Vì vậy, tác giả xin gửi lời tri ân đến nhãn hàng này và những
bạn bè, đồng nghiệp đã giúp đỡ để cuốn sách đến được với bạn đọc một cách miễn phí.
Mọi thiếu sót của cuốn sách và mọi vấn đề liên quan đều thuộc trách nhiệm của tác giả.
Góp ý xin gửi về email:
Tác giả
Thành phố Hồ Chí Minh, tháng 7/2019
LÊ DUY KHÁNH

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

2


Chương 1. Giới thiệu Stata

Chương 1. GIỚI THIỆU STATA
1.1 Giới thiệu Tập đoàn Stata
Stata là một phần mềm được sử dụng phổ biến trong khoa học thống kê và kinh tế lượng.
Đây là phần mềm có bản quyền và được nắm giữ bởi tập đoàn Stata (StataCorp LP).
StataCorp LP được sáng lập bởi William (Bill) Gould, hiện nắm giữ vị trí chủ tịch. Ơng
là đồng sáng lập và phục vụ với tư cách phó chủ tịch của Computing Resource Center
vào năm 1982. Năm 1990, Bill Gould trở thành chủ tịch của Computing Resource
Center, và năm 1993 Computing Resource Center đổi tên thành StataCorp LP.
StataCorp LP có trụ sở tại 4905 Lakeway Drive College Station, Texas 77845-4512
Mỹ, và có mạng lưới phân phối phần mềm Stata trên phạm vi toàn cầu. Tuy vậy,
StataCorp LP chưa có đại lý tại Việt Nam nên nếu người dùng tại Việt Nam muốn mua
phần mềm có bản quyền, Stata sẽ phân phối trực tiếp từ trụ sở chính đến địa chỉ của
khách hàng. Stata có thể sử dụng trên các hệ điều hành Windows, Mac OS X, Unix, hay

Linux.
StataCorp LP cịn có tạp chí Stata Journal, được phát hành hàng quý, công bố những
nghiên cứu về thống kê, phân tích số liệu, phương pháp giảng dạy, và sử dụng hiệu quả
ngôn ngữ Stata. Đây là tạp chí khoa học chun ngành thống kê rất có uy tín trên thế
giới. Hiện nay, theo Journal Citation Reports of the ISI Web of Knowledge mới nhất thì
Stata Journal xếp thứ 4 trong nhóm tạp chí về các phương pháp toán học khoa học xã
hội (Social Sciences Mathematical Methods) xét về chỉ số ảnh hưởng (impact factor)
trong vòng 5 năm, chỉ sau Structural Equation Modeling, Econometrica, và The Review
of Economics and Statistics.
Bên cạnh đó, Stata Press, một bộ phận của StataCorp LP là đơn vị chuyên phát hành
sách, sổ tay hướng dẫn, các bài báo khoa học về phần mềm Stata và về các chủ đề thống
kê nói chung cho các nhà nghiên cứu chuyên nghiệp ở tất cả các ngành.
1.2 Khởi động và kết thúc phiên làm việc Stata
Trong tài liệu này, Stata phiên bản 12 (icon là
) được sử dụng để xử lý đối với toàn bộ
các nội dung. Số liệu để minh họa cho các nội dung thực hành các bạn có thể tải theo
đường dẫn: vietmat.vn > tin tức > Dữ liệu phục vụ sách “Thực hành kinh tế lượng
với Stata 12”.

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam


Chương 1. Giới thiệu Stata

1.2.1 Khởi động Stata
Người dùng có thể khởi động Stata theo nhiều cách.
-

Cách 1. Nhấp double chuột trái vào icon Stata 12 trên desktop của máy tính hoặc
nhấp chuột trái vào icon Stata 12 trên Taskbar.

Cách 2. Vào Start > All programs > Stata 12
Cách 3. Chọn một tệp tin Stata bất kỳ, nhấp double chuột trái để mở. Trường hợp
này thì khi Stata khởi động, tệp dữ liệu này cũng được mở đồng thời, và trở thành
dữ liệu hiện hành của phiên làm việc. Trong khi sử dụng cách 1 và 2 thì chỉ Stata
khởi động mà chưa có tệp dữ liệu nào được mở.

Sau khi khởi động, các cửa sổ quan trọng của Stata 12 bao gồm:
-

-

-

-

-

Cửa sổ lệnh (command), tức cửa sổ để gõ lệnh: đây là cửa sổ để người dùng gõ
các lệnh khi xử lý thống kê hay kinh tế lượng.
Cửa sổ kết quả (results): kết quả xử lý các lệnh do người dùng nhập vào ở cửa sổ
lệnh sẽ được hiển thị ở cửa sổ này. Đây là cửa sổ trung tâm, và là cửa sổ lớn nhất
của Stata.
Cửa sổ xem lại (review): nằm ở góc trái của màn hình. Cửa sổ này hiển thị những
lệnh mà người dùng đã gõ vào cửa sổ lệnh bất kể lệnh đó đúng hay sai. Khi người
dùng cần sử dụng lại bất kỳ một lệnh nào đã được thực hiện trước đó, có thể nhấp
chuột vào lệnh đó ở cửa sổ này, lệnh đó sẽ được hiển thị lại ở cửa sổ lệnh để người
dùng sử dụng hoặc chỉnh sửa mà không cần phải gõ lại.
Cửa sổ biến (variables): nằm ở góc phải, phía trên của màn hình. Cửa sổ này sẽ
hiển thị tất cả các biến của dữ liệu hiện hành. Tuy nhiên, các biến chỉ hiển thị tên
mà thôi.

Cửa sổ thông tin chi tiết của biến và dữ liệu (properties): cửa sổ này nằm phía dưới
cửa sổ biến, bao gồm hai cửa sổ nhỏ hơn: cửa sổ thông tin chi tiết của biến
(variables) và cửa thông tin chi tiết của dữ liệu (data).
o Cửa sổ thông tin chi tiết của biến hiển thị các thông tin về biến như: tên (name),
nhãn (label), loại dữ liệu của biến (type), format của biến (format), giá trị của
nhãn (value label) và ghi chú (notes).
o Cửa sổ thông tin chi tiết của dữ liệu hiển thị các thông tin về dữ liệu như: tên
của tệp dữ liệu (filename), đường dẫn đến tệp dữ liệu (full path), nhãn (label),
ghi chú (notes), tổng số lượng biến của dữ liệu (variables), tổng số quan sát của
dữ liệu (observations), kích thước của dữ liệu (size) và bộ nhớ (memory).
Đường dẫn (path) đến thư mục làm việc (directory): góc trái dưới của giao diện
Stata hiển thị đường dẫn đến thư mục, nơi mà các kết quả của phiên làm việc sẽ
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

4


Chương 1. Giới thiệu Stata

được lưu lại. Người dùng có thể thay đổi đường dẫn này nhằm lưu các kết quả làm
việc tại thư mục mong muốn.

1.2.2 Kết thúc phiên làm việc
Khi muốn kết thúc phiên làm việc, người dùng có thể đóng Stata bằng một trong ba cách:
-

Cách 1. Ở cửa sổ lệnh, gõ lệnh exit và nhấn Enter.

-


Cách 2. Vào File trên thanh menu, chọn exit.
Cách 3. Nhấn tổ hợp phím tắt Alt + F4

1.3 Mở một tệp tin (file) Stata
1.3.1 Mở một file Stata đang có trên máy tính của bạn
Có nhiều cách để mở một file Stata cho phiên làm việc. Trước tiên, hãy để ý đường dẫn
(path) đến nơi chứa các file cần mở của phiên làm việc.
Cách 1. Bạn thay đổi thư mục làm việc bằng lệnh cd "tên thư mục", sau đó gõ lệnh use
tên file (file có trong thư mục cần mở).
Ví dụ, file có tên là solieu đang được lưu tại thư mục data trên ổ đĩa E của máy tính. Để
mở file Stata này, hãy tuần tự thực hiện các bước sau:
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

5


Chương 1. Giới thiệu Stata

Bước 1: gõ lệnh cd “e:data”. Lệnh cd là viết tắt của change directory, nghĩa là thay đổi
thư mục làm việc1. Sau lệnh này thì đường dẫn mới đã xuất hiện ở góc trái, phía dưới của
giao diện Stata.
Bước 2: gõ lệnh use solieu, khi đó tệp tin solieu sẽ được mở. Các biến (variables) của tệp
tin đã xuất hiện ở góc phải của giao diện.

Cách 2. Tại thanh menu, vào biểu tượng open, tìm đến tệp tin cần mở và nhấp double
chuột trái (cách này giống với cách mở một file word/excel mà chúng ta vẫn thực hiện
mỗi ngày).

Khi mở tệp tin theo cách này, tại cửa sổ kết quả xuất hiện dòng kết quả sau: use
"E:\data\solieu.dta", clear. Điều này cho thấy cách làm này thực tế cũng là dùng lệnh use

như cách 1. Chữ clear ở đây hàm ý rằng tất cả các dữ liệu đang có trong bộ nhớ của Stata
đã bị xóa.
Lệnh cd có thể dùng để chuyển đến thư mục con, trở về thư mục cha, trở về thư mục gốc, hay có thể đến bất kỳ thư
mục nào.
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam
1

6


Chương 1. Giới thiệu Stata

Cách 3. Như đã giới thiệu trong phần khởi động Stata, có thể chọn một file Stata bất kỳ
đang có máy tính, nhấp double chuột trái để mở.
1.3.2 Mở một file Stata đang có trên Internet
Đây là một tính năng đặc biệt của Stata. Giả sử bạn có một file theo định dạng Stata,
đang lưu tại địa chỉ bạn muốn tải file dữ liệu
này về máy để thực hành, chỉ cần gõ use vào
cửa sổ command, file này sẽ được mở giống như mở một file Stata có sẵn trên máy tính.
1.4 Cửa sổ các biến
Cửa sổ biến ở Stata 12 hiển thị như sau:

Cửa sổ biến ở góc phải phía trên hiển thị 2 nội dung, bao gồm tên của biến (variable)
và nhãn của biến (label). Ở hình trên, các biến chỉ bao gồm tên mà chưa có nhãn. Vì
tên biến thường viết ngắn gọn, khơng có khoảng trắng nên thường khó hiểu được
chính xác nội dung, do đó nhãn là cách giải thích cụ thể biến đó là biến gì.
Có thể thêm nhãn cho các biến bằng các cách sau:
Cách 1. Dùng lệnh label variable tên biến "nhãn của biến". Ví dụ, muốn đặt nhãn
cho biến roa là tỷ lệ sinh lời trên tài sản, hãy gõ vào cửa sổ command lệnh label
variable roa "ty le sinh loi tren tai san". Có thể thay variable bằng var, tức chỉ cần

gõ lệnh label var tên biến "nhãn của biến" là đủ.

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

7


Chương 1. Giới thiệu Stata

Cách 2. Dùng menu: Data > Data utilities > Label utilities > Label variable. Cách
này có thể dùng để thêm hoặc bỏ nhãn của các biến.

Cửa sổ sau sẽ hiện ra, bạn có thể chọn Attach a label to a variable để thêm nhãn cho
biến hoặc Remove a label from a variable để bỏ nhãn của biến.

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

8


Chương 1. Giới thiệu Stata

Sau đó chọn biến cần thêm nhãn hoặc bỏ nhãn. Nếu chọn thêm nhãn thì gõ nhãn của
biến vào ô New variable lable: (may be up to 80 characters). Nhãn của biến có thể dài
đến 80 ký tự. Nếu chọn bỏ nhãn thì ơ New variable lable: (may be up to 80
characters) sẽ không hiển thị. Sau đó nhấn OK.

Lưu ý: có thể đặt nhãn cho cả tệp tin trong trường hợp có nhiều tệp tin khác nhau để
tránh nhầm lẫn. Khi đó, gõ label data "nhãn của tệp tin đang sử dụng". Ví dụ,


Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

9


Chương 1. Giới thiệu Stata

chúng ta đang thao tác trên tệp tin solieu, hãy đặt nhãn cho tệp tin này là du lieu ngan
hang. Khi đó, gõ label data “du lieu ngan hang”.
Cũng có thể dùng menu để quản lý một cách tồn diện các thơng tin liên quan đến tất
cả các biến như thêm nhãn, bỏ nhãn, thay đổi loại dữ liệu (type)... bằng cách sau:
Trên thanh menu, vào Data > Variable Manager, giao diện sau sẽ hiện ra:

Nếu cần thay đổi thông tin liên quan đến biến nào, hãy nhấp chuột vào biến đó, khi đó
bên phía phải, phần Variable Properties (được đóng khung) cho phép thay đổi các
thông tin liên quan đến biến. Sau khi thay đổi hãy nhấn Apply. Bỏ thay đổi hãy nhấn
Reset.
1.5 Xem mô tả dữ liệu
Để xem mơ tả của tồn bộ hoặc một biến nào đó của file dữ liệu hiện hành, tại cửa sổ
command gõ: describe hoặc des

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

10


Chương 1. Giới thiệu Stata
. des
Contains data from solieu.dta
obs:

156
vars:
13
size:
9,516

variable name

storage
type

bank
roa
year
depositgrowth
loan_asset
liqui_asset
loss_loan
cost_asset
equity_asset
inflation
foreignowner
bnk
nim

str15
float
int
float
float

float
float
float
float
float
float
float
float

display
format

dulieu
15 Dec 2015 01:06

value
label

%15s
%8.0g
%ty
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
%8.0g
%9.0g

%8.0g

variable label
ngan hang
ty le sinh loi tren tong tai san
nam
tang truong tien gui
du no tren tong tai san
tai san thanh khoan tren tong tai san
du phong rui ro tren tong tai san
chi phi tren tong tai san
von tren tong tai san
lam phat
so huu cua nuoc ngoai
group(bank)
ty le lai can bien

Với lệnh này, có thể xem tên biến (variable name), loại dữ liệu (type), format của
biến, giá trị của nhãn (value label) và nhãn của biến (variable label). Bên cạnh đó một
số thơng tin khác có thể xem như số quan sát (obs, ở đây là 156 quan sát), số lượng
biến (vars, ở đây là 13) hay kích thước của file dữ liệu (size, ở đây là 9,516 KB), tên
của file dữ liệu (file dữ liệu đang sử dụng có tên dulieu) và thời gian thực hiện lệnh
(15/12/2015, lúc 01:06 phút).
Để xem mô tả thống kê các giá trị tối đa (max), tối thiểu (min), trung bình (mean), độ
lệch chuẩn (std. Dev) và số quan sát của tất cả các biến đang có, gõ summarize vào
cửa sổ command và nhấn Enter

kết quả như sau:
. summarize
Variable


Obs

Mean

bank
roa
year
depositgro~h
loan_asset

0
156
156
156
156

0
2010.5
.4505222
.5045899

liqui_asset
loss_loan
cost_asset
equity_asset
inflation

156
156

156
156
156

foreignowner
bnk
nim

156
156
156

Std. Dev.

Min

Max

0
1.713325
.8364263
.1524628

0
2008
-.808699
.156097

0
2013

8.68105
.944218

.2512515
.0136215
.0855018
.1213026
.1152267

.111836
.0064162
.0245697
.0852926
.0566027

.033777
.0019344
.024384
.042556
.06036

.640126
.0378056
.14508
.614083
.19891

.0821819
13.5
.0281628


.1094145
7.524155
.0144204

0
1
-.003794

.3
26
.096073

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

11


Chương 1. Giới thiệu Stata

Nếu chỉ cần xem mô tả thống kê của một biến hay nhiều biến cụ thể nào đó, gõ
summarize [tên các biến đó]. Ví dụ, chỉ xem mô tả thống kê của biến inflation trong
dữ liệu hiện có.

kết quả:
. summarize

inflation

Variable


Obs

Mean

inflation

156

.1152267

Std. Dev.
.0566027

Min

Max

.06036

.19891

Nếu dùng menu, hãy thực hiện theo thứ tự sau: Statistics > Summaries, tables, and
tests > Summary and descriptive statistics > Summary statistics.

Hộp trên sẽ xuất hiện. Nếu trường variables để trống thì Stata sẽ thực hiện thống kê tóm
tắt đối với tất cả các biến. Có thể chọn một/nhiều biến ở ơ này. Phần Options, nếu
Standard display được chọn thì thống kê tóm tắt của biến sẽ bao gồm số quan sát (obs),
trung bình (mean), độ lệch chuẩn (Std. Dev), giá trị lớn nhất (max) và giá trị nhỏ nhất
(min). Người dùng có thể lựa chọn các Options khác để có thêm các thơng tin thống kê

tóm tắt của các biến. Sau khi lựa chọn, nhấn OK, kết quả sẽ được hiển thị ở cửa sổ kết
quả.
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

12


Chương 1. Giới thiệu Stata

1.6 Hệ thống hỗ trợ của Stata
Đây là hệ thống hỗ trợ người dùng cực kỳ hữu hiệu của Stata. Với cách vận hành chủ yếu
dựa trên câu lệnh (command) và hệ thống menu phức tạp, gần như người dùng nào cũng
sẽ phải sử dụng hệ thống này của Stata. Hiện Stata có thể hỗ trợ người dùng ở nhiều khía
cạnh.
1.6.1 Hỗ trợ chung (contents)
Stata chia sự hỗ trợ thành các chủ đề khác nhau. Vì là những chủ đề chung nên nội dung
chi tiết trong các chủ đề này là rất rộng. Nếu có thời gian, người dùng nên tìm hiểu nội
dung chi tiết của từng chủ đề này, bằng cách thực hiện theo trình tự Help > Contents tại
menu.
Khi đó, hộp thoại như bên dưới sẽ hiện ra. Bạn thấy danh sách các chủ đề được liệt kê, là
các mục có chữ màu xanh, nhấp chuột vào các chủ đề này sẽ có những nội dung chi tiết
hơn cho bạn tham khảo. Tuy nhiên, vì nội dung các chủ đề này rộng nên ít được sử dụng
mà người dùng thường sử dụng các hỗ trợ khác của Stata.

1.6.2 Hỗ trợ theo từ khóa (keywords)
Tại menu thực hiện theo trình tự: Help > Search… Khi đó hộp thoại sau sẽ xuất hiện,
bạn hãy gõ nội dung cần tìm thơng tin vào ơ Keywords.

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam


13


Chương 1. Giới thiệu Stata

Hộp thoại này có 3 lựa chọn tìm kiếm. Lựa chọn đầu tiên Search documentation and
FQAs sẽ cho các kết quả là các tệp tin hỗ trợ chính thức được Stata chấp nhận (official
help files), các câu hỏi thường gặp liên quan đến nội dung bạn đang tìm kiếm (FQAs Frequently Asked Questions), các ví dụ (examples) hoặc thông tin lấy từ các bản tin kỹ
thuật của Stata (STBs – Stata Technical Bulletins). Lựa chọn thứ hai, Search net
resources, sẽ cho kết quả là nguồn web từ Stata và các nguồn khác liên quan đến nội
dung mà người dùng đang cần tìm kiếm (nguồn từ Stata Journal và Stata Technical
Bulletins sẽ được liệt kê trước). Lựa chọn cuối cùng, Search all, sẽ cho kết quả là kết hợp
của cả hai lựa chọn trên.
1.6.3 Hỗ trợ tìm câu lệnh (command)
Đây là một trong những nội dung hỗ trợ thường được người dùng Stata sử dụng nhất. Khi
bạn đang cần thực hiện một lệnh nào đó nhưng khơng nhớ chính xác cấu trúc của câu
lệnh, hãy thực hiện theo trình tự: Help Stata > command, sau đó gõ từ khóa của câu
lệnh bạn đang cần vào ơ sau:

Chẳng hạn, gõ từ summarize, kết quả sẽ thực sự hữu ích khi người dùng được cung cấp
cấu trúc câu lệnh, giải thích cụ thể cách sử dụng, các options đi kèm câu lệnh và đặt biệt
là các ví dụ để người dùng thực hành.
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

14


Chương 1. Giới thiệu Stata

Hỗ trợ tìm câu lệnh có thể được thực hiện ở cửa sổ command bởi câu lệnh: help [từ khóa

của câu lệnh]. Ví dụ:

Kết quả tương tự như thực hiện theo trình tự tại thanh menu: Help Stata > Command.
1.7 Câu lệnh trong Stata
Hầu hết người dùng Stata đều sử dụng câu lệnh để thực hiện các thủ tục thống kê hơn là
sử dụng các thẻ trên thanh menu. Do đó, để bảo đảm thực hiện đúng câu lệnh, đòi hỏi
người dùng phải nắm vững cấu trúc của câu lệnh trong Stata. Các câu lệnh trong Stata
thường dễ hiểu và dễ thực hiện, tuy nhiên có phân biệt giữa chữ thường và chữ hoa (tức
Y và y là khác nhau). Một câu lệnh trong Stata thường có cấu trúc tổng quát như sau:
command [varlist] [if] [in] [weight] [, options]
Trong đó command là phần bắt buộc, trong khi trong các dấu ngoặc vuông [] là các lựa
chọn mà người dùng có thể sử dụng.
command: là nội dung bắt buộc phải có trong một câu lệnh của Stata. Đây thường là
những động từ (tất nhiên không phải luôn ln như vậy). Câu lệnh Stata thường có thể
viết tắt mà khơng cần phải viết đầy đủ. Ví dụ, thay vì gõ đầy đủ regress (lệnh dùng để hồi
quy, sẽ đề cập chi tiết ở các phần sau) thì có thể chỉ cần sử dụng lệnh reg. Để biết được
câu lệnh có thể viết tắt như thế nào, trong kết quả tìm kiếm của Stata command (giới
thiệu ở phần 1.6.3 - Hỗ trợ tìm câu lệnh), phần gạch dưới trong cú pháp (Syntax) chính là
phần có thể dùng để viết tắt của câu lệnh đó.

Hình trên là kết quả hỗ trợ khi gõ từ khóa summarize vào Stata command trong phần
Help ở thanh menu. Minh họa cho thấy có thể viết tắt lệnh summarize là su. Lưu ý rằng
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

15


Chương 1. Giới thiệu Stata

các ký tự được gạch dưới là các ký tự tối thiểu để Stata hiểu đúng về một lệnh nào đó, vì

vậy người dùng có thể dùng nhiều hơn các ký tự này mà Stata vẫn hiểu đúng về một lệnh
cần thực hiện. Chẳng hạn, người dùng có thể gõ sum, summ, summa, summar, summari,
summariz để thực hiện lệnh summarize.
varlist: thường đi kèm theo sau cstrongly balance cho ta biết tất cả
các quốc gia đều có đủ dữ liệu ở các năm; nếu một năm nào đó bị thiếu dữ liệu thì dữ liệu
sẽ là unbalanced.
Trong nhiều trường hợp khi thiết lập dữ liệu bảng, kết quả thông báo như sau:
. xtset countries
varlist: countries:
r(109);

string variable not allowed

thì Stata báo cho chúng ta biết rằng biến countries là biến chuỗi, vì vậy chúng ta phải đưa
biến chuỗi này thành biến numeric. Có thể thay đổi kiểu dữ liệu của biến countries bằng
cách tạo ra một biến numeric:
egen countries1 = group(countries) hoặc encode countries, gen(countries1)

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

188


Chương 10. Dữ liệu bảng

Sau đó, khai báo biến countries1 này bằng lệnh xtset:
xtset countries1
Kết quả như sau:
. xtset countries1
panel variable:


countries1 (balanced)

Tiếp theo ta khai báo biến thời gian (year), tại cửa sổ command gõ: xtset countries1
year, kết quả như sau:
. xtset countries1 year
panel variable: countries1 (strongly balanced)
time variable: year, 1999 to 2013
delta: 1 unit

Như vậy, ta đã khai báo dữ liệu bảng đối tệp tin chuong10.dta với chiều N: countries1 và
chiều T: year.
Cách 2: Dùng menu: ta thực hiện theo trình tự sau: Statistics > Longitudinal/panel data
> Setup and utilities > Declare dataset to be panel data. Hộp thoại sau đây sẽ xuất
hiện:

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

189


Chương 10. Dữ liệu bảng

Tại hộp thoại này, chọn biến đối tượng (chiều N) và biến thời gian (chiều T), sau đó chọn
OK.
Một số lệnh có thể sử dụng để xử lý đối với dữ liệu bảng:
-

xtline: dùng để vẽ biểu đồ của một biến nào đó trong mẫu nghiên cứu theo dạng
đường (line). Chẳng hạn muốn vẽ đồ của cpi của tất cả các quốc gia đang nghiên

cứu bằng lệnh xtline cpi:

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

190


Chương 10. Dữ liệu bảng

-

xtsum: mơ tả tóm tắt các biến trong mẫu nghiên cứu. Nếu lệnh xtsum đứng một
mình thì tất cả các mẫu nghiên cứu sẽ được tóm tắt, nếu lệnh xtsum đi liền với một
biến cụ thể thì chỉ biến đó mới được tóm tắt. Ví dụ gõ xtsum tại cửa sổ lệnh:

. xtsum
Variable

Mean

countr~s overall
between
within

Std. Dev.

Min

Max


Observations

.

.
.
.

.
.
.

.
.
.

N =
n =
T =

0
0
.

year

overall
between
within


2006

4.329523
0
4.329523

1999
2006
1999

2013
2006
2013

N =
n =
T =

240
16
15

m

overall
between
within

.1836987


.184635
.0863019
.164555

-.1635
.0892867
-.2888879

1.2755
.3400867
1.119112

N =
n =
T =

240
16
15

cpi

overall
between
within

.0618693

.0831378
.0448486

.0708401

-.085253
.0206997
-.0769145

.857426
.1683757
.7509196

N =
n =
T =

240
16
15

countr~1 overall
between
within

8.5

4.619406
4.760952
0

1
1

8.5

16
16
8.5

N =
n =
T =

240
16
15

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

191


Chương 10. Dữ liệu bảng

-

Nếu chỉ dùng lệnh sum thì kết quả như sau:

. sum
Variable

Obs


Mean

countries
year
m
cpi
countries1

0
240
240
240
240

2006
.1836987
.0618693
8.5

Std. Dev.

4.329523
.184635
.0831378
4.619406

Min

Max


1999
-.1635
-.085253
1

2013
1.2755
.857426
16

10.2 Các phương pháp được sử dụng để ước lượng dữ liệu bảng
10.2.1 Pooled OLS
Đối với dữ liệu bảng, các phương pháp ước lượng thường được sử dụng là Pooled OLS,
Fixed effect và Random effect. Phần này sẽ hướng dẫn sử dụng các phương pháp này
trong Stata 12. Các phương pháp ước lượng khác đối với dữ liệu bảng sẽ được cập nhật
trong lần tái bản.
Để ước lượng dữ liệu bảng bằng phương pháp Pooled OLS, câu lệnh được sử dụng là
regress depvar (biến phụ thuộc) indepvars (các biến độc lập). Chẳng hạn, khi cần ước
lượng lạm phát (cpi) theo cung tiền (m) đối với dữ liệu trong chuong10.dta, ta gõ lệnh
sau:
regress cpi m
Kết quả như sau:
. reg

cpi m
Source

SS

df


MS

Model
Residual

.189107869
1.46283325

1
238

.189107869
.006146358

Total

1.65194112

239

.006911888

cpi

Coef.

m
_cons


.1523498
.0338829

Std. Err.
.027466
.0071461

t
5.55
4.74

Number of obs
F( 1,
238)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

240
30.77
0.0000
0.1145

0.1108
.0784

P>|t|

[95% Conf. Interval]

0.000
0.000

.0982422
.0198052

.2064573
.0479606

Như vậy, cung tiền có tác động lên lạm phát dựa trên giá trị p-value.
Khi ước lượng các mơ hình với Stata, độ tin cậy thường mặc định là 95% (95% Conf.
Interval). Có thể thay đổi độ tin cậy bằng cách thêm lựa chọn level vào sau câu lệnh.
Chẳng hạn, ta muốn ước lượng bằng phương pháp Pooled OLS với độ tin cậy 99%, hãy
dùng lệnh sau: regress cpi m, level (99)
Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

192


Chương 10. Dữ liệu bảng
. regress cpi m, level (99)
Source


SS

df

MS

Model
Residual

.189107869
1.46283325

1
238

.189107869
.006146358

Total

1.65194112

239

.006911888

cpi

Coef.


m
_cons

.1523498
.0338829

Std. Err.
.027466
.0071461

t
5.55
4.74

Number of obs
F( 1,
238)
Prob > F
R-squared
Adj R-squared
Root MSE

=
=
=
=
=
=

240

30.77
0.0000
0.1145
0.1108
.0784

P>|t|

[99% Conf. Interval]

0.000
0.000

.0810303
.015327

.2236693
.0524387

Nếu muốn kiểm tra biến m có thực sự tác động lên biến cpi hay khơng, có thể thực hiện
lệnh sau: test m. Đây là kiểm định với cặp giả thiết:
-

H0: hệ số của m = 0, tức m khơng có tác động lên cpi.
H1: hệ số của m ≠ 0, tức m có tác động đến cpi.

Kết quả của kiểm định này như sau:
. test
( 1)


m
m = 0
F(

1,
238) =
Prob > F =

30.77
0.0000

Như vậy, giá trị p-value =0, ta bác bỏ giả thiết H0, tức m có tác động đến cpi.
10.2.2 Fixed effect (ước lượng tác động cố định)
Cách 1. Dùng câu lệnh: để thực hiện ước lượng tác động cố định đối với dữ liệu bảng,
câu lệnh được sử dụng là xtreg và lựa chọn fe, chi tiết câu lệnh như sau:
xtreg depvar [indepvars] [if] [in] [weight], fe
Như vậy, để ước lượng tác động của m lên cpi bằng phương pháp ước lượng tác động cố
định thì gõ lệnh xtreg cpi m, fe. Kết quả ước lượng như sau:

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

193


Chương 10. Dữ liệu bảng
. xtreg cpi m, fe
Fixed-effects (within) regression
Group variable: countries1

Number of obs

Number of groups

=
=

240
16

R-sq:

Obs per group: min =
avg =
max =

15
15.0
15

within = 0.0424
between = 0.5882
overall = 0.1145

corr(u_i, Xb)

F(1,223)
Prob > F

= 0.3088

cpi


Coef.

m
_cons

.0885971
.0455942

sigma_u
sigma_e
rho

.03929209
.07176749
.23061949

F test that all u_i=0:

Std. Err.
.0282109
.0069511

t

P>|t|

3.14
6.56


0.002
0.000

=
=

9.86
0.0019

[95% Conf. Interval]
.033003
.031896

.1441913
.0592923

(fraction of variance due to u_i)
F(15, 223) =

4.07

Prob > F = 0.0000

Như vậy, m có tác động lên cpi theo phương pháp hồi quy ước lượng tác động cố định.
Nếu muốn hồi quy với độ tin cậy khác 95% (giá trị mặc định), chẳng hạn 99%, thì sử
dụng lệnh sau:
xtreg cpi m, fe level (99)
Cách 2: dùng menu: thực hiện theo trình tự sau: Statistics > Longitudinal/panel data >
Linear models > Linear regression (FE, RE, PA, BE). Hộp thoại sau đây sẽ xuất hiện:


Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

194


Chương 10. Dữ liệu bảng

Chọn biến phụ thuộc tại trường Dependent variable và các biến độc lập tại trường
Independent variables, sau đó chọn phương pháp ước lượng tác động cố định tại trường
Fixed-effect, rồi nhấn OK.
Nếu muốn thay đổi khoảng tin cậy, chọn tab Reporting tại hộp thoại, sau đó chọn độ tin
cậy tại trường Confidence level theo minh họa sau:

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

195


Chương 10. Dữ liệu bảng

10.2.3 Random effect (ước lượng tác động ngẫu nhiên)
Cách 1: Dùng câu lệnh: để ước lượng dữ liệu bảng bằng phương pháp tác động ngẫu
nhiên, câu lệnh được sử dụng vẫn là xtreg, nhưng lựa chọn là re, chi tiết câu lệnh như
sau:
xtreg depvar [indepvars] [if] [in] [weight], re

Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

196



Chương 10. Dữ liệu bảng
. xtreg

cpi m, re

Random-effects GLS regression
Group variable: countries1

Number of obs
Number of groups

=
=

240
16

R-sq:

Obs per group: min =
avg =
max =

15
15.0
15

within = 0.0424
between = 0.5882

overall = 0.1145

corr(u_i, X)

Wald chi2(1)
Prob > chi2

= 0 (assumed)

cpi

Coef.

m
_cons

.1168227
.0404092

sigma_u
sigma_e
rho

.02332613
.07176749
.0955468

Std. Err.
.0274546
.0091232


z
4.26
4.43

=
=

18.11
0.0000

P>|z|

[95% Conf. Interval]

0.000
0.000

.0630127
.0225281

.1706328
.0582902

(fraction of variance due to u_i)

Kết quả cho thấy m là yếu tố có tác động đến cpi, theo phương pháp ước lượng tác động
ngẫu nhiên.
Cách 2: dùng menu: thực hiện theo trình tự sau: Statistics > Longitudinal/panel data >
Linear models > Linear regression (FE, RE, PA, BE). Hộp thoại sau đây sẽ xuất hiện:


Vietmat.vn – Tấm lót và Ga chống thấm số 1 Việt Nam

197


×