9/15/21, 2:52 PM
Tạo biến giả (dummy variable) trong STATA – How to STATA
How to STATA
A set of guides and tutorials for beginners on using Stata
effectively
Tạo biến giả (dummy variable) trong STATA
Posted on March 31, 2020April 11, 2020 by Chung Mai
Biến giả đã trở nên khá quen thuộc trong các nghiên cứu rồi phải ko mọi người. Đây là biến sẽ nhận giá trị 0
và 1, thường được sử dụng với mục đích kiểm sốt tác động của một sự kiện, đặc tính nào đó đến biến đầu
ra.
Để tạo biến giả trong STATA thì chúng ta sẽ dùng lênh GENERATE (hoặc viết tắt là GEN hoặc GE đều được).
Có một số lưu ý/tip khi sử dụng biến giả mình muốn chia sẻ như sau:
1. Giả sử, các bạn muốn tạo biến giả D1 nhận giá trị 1 nếu bien_A>=3000 thì lệnh chúng ta dùng sẽ là:
gen D1 = (bienA>=3000)
Như vậy, biến D1 sẽ nhận giá trị 1 nếu biến A có giá trị lớn hơn hoặc bằng 3000 và nhận giá trị 0 nếu biến A
nhỏ hơn 3000.
Một trong những LƯU Ý mà các bạn cần nhớ khi tạo biến giả là các MISSING VALUE, đặc biệt là với điều
kiện như trên. Bởi vì, STATA sẽ ngầm hiểu các missing value là các giá trị lớn và sẽ gán giá trị 1 cho các
missing value đó. Nếu dữ liệu khơng có missing data thì ko sau, nhưng nếu có thì chúng ta nên bổ sung thêm
điều kiện trong câu lệnh trên như sau:
/>
1/3
9/15/21, 2:52 PM
Tạo biến giả (dummy variable) trong STATA – How to STATA
gen D1 = (bienA>=3000) if bienA != .
Dấu != nghĩa là khác hoặc khơng bằng, cịn dấu . là missing value nha mọi người.
2. Nếu điều kiện là khoảng giá trị của biến A (ví dụ 3000 <= bienA <= 5000) thì chúng ta nên tạo biến giả D2
với điều kiện INRANGE như sau:
gen D2 = inrange(bienA,3000,5000)
3. Nếu biến A là biến string, mang các giá trị định tính (Ví dụ là tên của các tỉnh thành) thì lệnh của chúng ta
sẽ viết như sau:
gen D3 = (bienA == “Đà Nẵng”)
Lưu ý:
Khi kê khai điều kiện thì chúng ta phải dùng dấu == thì STATA mới hiểu đó là dấu =
Nếu giá trị ko phải là số thì chúng ta bỏ trong dấu ngoặc kép, nhớ là phải đúng chính tả, đúng viết hoa viết
thường ln nhé.
4. Biến giả thường dùng để định nghĩa các hạng mục (category) của một biến định tính nào đó. Ví dụ biến C
nhận các giá trị là 1,2,3,4,5,6,7. Mỗi giá trị đại diện cho một nhóm đối tượng. Khi kê khai biến giả, chúng ta
cần lưu ý vấn đề sau:
– Số biến giả phải ít hơn số hạng mục một đơn vị. Ví dụ, chúng ta có 7 hạng mục thì chỉ kê khai 6 biến giả
thôi. Tác động của hạng mục cịn lại sẽ được kiểm sốt trong hệ số chặn alpha của mơ hình.
– Nếu mơ hình khơng có hệ số chặn, ta có thể kê khai cả 7 biến giả.
Việc này sẽ giúp kết quả của mơ hình khơng bị ảnh hưởng bởi đa cộng tuyến.
Các bạn nhớ các lưu ý này để thao tác với biến giả trên STATA nhé.
Posted in STATA fundamentalsTagged dummy, tạo biến giả
3 thoughts on “Tạo biến giả (dummy variable) trong STATA”
1. hntien says:March 18, 2021 at 10:24 pm
Xin hỏi Ad: Khi nhập bảng dữ liệu trong excel, các biến Dummy có thể mặc định là 0 và 1 ln thì khi
import vào stata, stata có hiểu đó là biếm dummy khơng? (Ví dụ khí theo dõi sức khỏe hàng ngày thì biến
“uống cafe” thì gán giá trí = 1 là có uống và =0 là không uống; hoặc là mặc định biến “tập thể dục” gán
giá trị = 0 là đi bộ <2km, =1 đi bộ =2km đến 4km; = 2 đi bộ trên 4km)?
Reply
Chung Mai says:March 19, 2021 at 12:12 am
Có nhé, nhưng Stata chỉ biết đó là biến thơi, cịn dummy là cách mình gọi để biết đó là biến chỉ nhận
giá trị 0 và 1.
Reply
/>
2/3
9/15/21, 2:52 PM
Tạo biến giả (dummy variable) trong STATA – How to STATA
2. Hảo says:May 5, 2021 at 5:11 pm
Chị ơi, cho em hỏi là mình muốn xử lý/điều chỉnh yếu tố mùa vụ của chuỗi dữ liệu trong stata thì thực
hiện như thế nào ạ? (em thấy trên Eview có hướng dẫn bằng phương pháp X-11, X-12…). Em cảm ơn.
Reply
Website Powered by WordPress.com.
/>
3/3