Hướng dẫn sử dụng
Stata 8.0
Khởi động Stata 8.0
•
Vào Start – Programs – Medistat – Stata 8
•
Màn hình Stata bao gồm:
–
3 thanh:
•
Thanh tiêu đề
•
Thanh menu
•
Thanh công cụ:
–
4 cửa sổ:
•
Lệnh (command); Kết quả (results); xem lại
(review) và biến số (variable)
Thanh tiêu đề
Thanh menu
Thanh công cụ
Lệnh
Biến số
Xem lại
Kết quả
•
Sắp xếp các cửa sổ sao cho tiện việc sử dụng và lưu các cửa sổ này với menu
Prefs :: Save Windows Preferences
•
Nhật kí kết quả (lưu giữ kết quả): log
cần thực hiện trước khi thực hiện bất kì phân tích thống kê nào với Stata
•
Quan sát (observation) và biến (variable)
•
Tên biến (name) và nhãn biến (label)
•
Format: string, general và date
•
Biến định tính và biến định lượng
Bài tập
•
Nhập số liệu của 5 người (3 nam và 2
nữ) dưới đây vào Stata:
Giới Đường huyết
–
Nam 80
–
Nam 90
–
Nữ 100
–
Nữ 110
–
Nam 120
•
Hãy tính tần suất của giới tính, giá
trị đường huyết trung bình, và giá trị
đường huyết trung bình phân tầng theo
giới
•
Stata phân biệt chữ hoa và chữ thường;
cần lưu ý để gõ đúng lệnh của Stata
(thường là chữ thường)
•
Tên biến (name of variable)
–
Bắt đầu bằng chữ cái
–
Các kí tự tiếp theo có thể là chữ cái, chữ số hay gạch dưới
(_). Không cho phép các kí tự đặc biệt như dấu trừ (-) hay
dấu trắng( )
•
Lưu ý: do Stata không hiển thị được
font tiếng Việt (unicode, ABC, TCVN3,
v.v)
•
Biến số: đặc tính hay đại lượng của đối tượng
–
Đặc tính: biến số định tính
–
Đại lượng: biến số định lượng
•
Thống kê mô tả: sum (định lượng) và tab1 (định tính)
•
Để mô tả phân tầng sử dụng lệnh bysort
•
edit
•
tab1 gioi
•
sum duonghuyet
•
bysort gioi : sum duonghuyet
•
Đặc điểm của cửa sổ Variable: Khi nhấp vào một variable, tên biến sẽ xuất
hiện ở cửa sổ lệnh
•
Đặc điểm của cửa sổ Review: Khi nhấp vào một lệnh cũ, lệnh này sẽ xuất hiện ở
cửa sổ lệnh
•
Obs: (observation) Quan sát
•
Mean: trung bình
•
Std. Dev. (Standard deviation) độ lệch
chuẩn
•
Min: số tối thiểu
•
Max: số tối đa
•
Freq: (Frequency) tần suất
•
Percent: phần trăm
•
Cum: cummulative Percent: Phần trăm cộng
dồn
Các menu
•
File:
–
Làm số liệu mới (New), mở số liệu (Open), Lưu (Save),
In ấn (Print), xem kết quả
•
Edit
–
Cắt (Cut), Sao chép (Copy), Dán (Paste), Bỏ hành động
(Undo), Làm lại (Redo)
•
Pref
–
Sắp xếp các cửa sổ, màu sắc và font của chương trình
Stata
Các menu
•
Data
–
Thêm đối tượng (insert case), thêm biến (insert
variable), bớt biến số
•
Graphics
–
Để vẽ các biểu đồ đồ thị (tổ chức đồ, biểu đồ hình thanh,
phân tán đồ,…)
•
Statistics
–
Tiến hành các thống kê mô tả và phân tích
Các menu
•
User
•
Windows:
–
Mở các cửa sổ
•
Help:
–
Trợ giúp
Các bước phân tích số
liệu
•
Chuẩn bị:
–
Mở tập tin số liệu (ivf_v)– Log để lưu giữ kết quả
–
Xem số bản ghi (số đối tượng) và các biến số
–
Xác định mục tiêu nghiên cứu, các biến số và phân loại biến số,
kế hoạch phân tích
•
Thao tác số liệu:
–
Giúp số liệu dễ nhìn dễ hiểu
–
Rà soát các số liệu sai
–
Tạo biến số mới
–
Lưu tập tin với tin mới (ivf_v2)
•
Thống kê mô tả
•
Thống kê phân tích
Log (lưu kết quả)
•
Đặt một tên mới: một tập tin mới sẽ được tạo ra để lưu kết quả phân tích
•
Chọn một tên cũ: chương trình sẽ hỏi chúng ta muốn
–
View existing file (chỉ muốn xem lại kết quả)
–
Append to existing file (lưu kết quả tiếp theo kết quả
cũ)
–
Overwriting existing file (bỏ kết quả cũ và viết kết quả
mới từ đầu)
Các bước phân tích số
liệu
•
Mục tiêu:
Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng
thai
Các bước phân tích số
liệu
•
Mục tiêu:
Đánh giá tác động của cao huyết áp trong thai kì và tuổi thai lên trọng lượng
thai
•
Biến số
Biến số phụ thuộc: trọng lượng thai
Biến số độc lập: tuổi thai và cao huyết áp
Biến số gây nhiễu: tuổi mẹ, giới tính
ID: identification mã số nhận dạng cá nhân
•
Thống kê: kiểm định t và hồi quy
Các bước phân tích số
liệu
•
Thao tác số liệu (data processing)
–
Dễ nhìn, dễ hiểu (thay đổi định dạng số liệu, value labels)
không cần thiết nếu nhập liệu bằng EpiData
–
Phát hiện sai sót bằng rà soát (browsing) hay thống kê mô
tả
•
bảng tần suất của biến số định tính (tab1)
•
trung bình, ĐLC của biến số định lượng (sum)
–
Tạo biến số mới theo yêu cầu phân tích
•
Lưu (Save as) số liệu với một tên mới
Rút gọn biến định lượng thành
định tính
tuổi thai (gestwks)-> sinh non hay không(gescat)
•
Tạo biến mới (create new variable)
•
Phân nhóm cho biến số mới (recode categorical variable)
(min/36.99=1) (37/max=2)
Không recode 2 lần nếu không số liệu bị sai
•
Tạo nhãn (define label)
•
Dán nhãn (assign label)
Các bước phân tích số
liệu
•
Phân tích số liệu: thống kê mô tả
–
bảng tần suất của biến số định tính
–
trung bình, ĐLC của biến số định lượng
–
Vẽ biểu đồ, đồ thị
•
Phân tích số liệu:
–
Phân loại biến số
–
Rút gọn biến số
–
Chọn phương pháp đo lường tác động
–
Phân tích đơn biến
–
Kiểm soát yếu tố gây nhiễu
Những trở ngại khi phân
tích
•
Thử nghiệm ngẫu nhiêu
–
Cân bằng giữa 2 nhóm can thiệp
–
Không cân bằng: khử nhiễu
•
Nhiều so sánh
•
Phân tích nhóm nhỏ
•
So sánh được chỉ định bởi kết quả phân tích
•
log: lưu giữ kết quả
•
cmdlog: lưu giữ câu lệnh
•
save: Lưu giữ số liệu
•
save graph: lưu giữ đồ thị
Save: đã có kết quả rồi mới lưu (Thực hiện –
Save)
Log: chỉ định sẽ ghi lại kết quả, do đó phải
ra lệnh log trước khi thực hiện các lệnh
phân tích (Log –Thực hiện)