Tải bản đầy đủ (.pdf) (48 trang)

NHẬP môn SPSS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.55 MB, 48 trang )

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

I. Các khái niệm và thao tác cơ bản 2
A. Chạy SPSS và đóng SPSS 2
B. File dữ liệu 2
C. Các loại file chính 3
D. Mở file, lưu file, đóng file 3
E. Cửa sổ biến và cửa sổ dữ liệu 4
F. Cách tạo một biến mới 5
G. Quy định kiểu. Type 5
H. Quy định độ rộng (dài). Width 6
I. Số chữ số thập phân. Decimal 7
J. Nhãn của biến. Label 7
K. Nhãn của giá trị. Values 7
L. Dữ liệu bị thiếu. Missing 7
M. Độ rộng của cột. Column 8
N. Canh dòng. Alignment 8
O. Thang độ đo. Measure. 8
II. Nhập, sửa dữ liệu 9
A. Nhập 9
B. Sửa 9
C. Hủy việc nhập hoặc sửa 9
D. Chọn các ô 10
E. Chọn cả cột 10
F. Chọn cả hàng 10
G. Xóa dữ liệu 10
H. Xóa một hàng (1 trường hợp) 10
I. Xóa một cột (1 biến) 10
J. Copy dữ liệu 10
K. Cắt dữ liệu 11
L. Di chuyển vị trí các biến 11


III. Các thao tác chung 12
A. Hủy lệnh mới làm 12
B. Lấy lệnh đã hủy 12
C. Lưu các sửa đổi 13
D. Câu hỏi 13
E. Bài tập: 13
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

IV. Mã hóa lại (recode) 15
A. Recode lại chính X 15
B. Recode qua một biến khác 18
C. Giải thích thêm về Old Value và New Value 22
V. Tính toán dữ liệu (compute) 25
A. Ghi chú về cách gõ công thức 28
VI. Sắp xếp 29
VII. Chọn các trường hợp 30
A. Chọn các trường hợp thỏa mãn điều kiện nào đó 30
B. Hủy chọn 33
VIII. Tần suất (frequency) 33
A. Riêng biệt Error! Bookmark not defined.
B. Tính tần suất của biến này trong biến kia 36
IX. Lặp lại lệnh đã thực hiện 36
A. Gọi lại lệnh bằng Recall 36
B. Lưu lệnh bằng file syntax 37
X. Chương III: Thống kê mô tả Error! Bookmark not defined.

I. Các khái niệm và thao tác cơ bản
A. Ch
ạy SPSS
v

à đóng SPSS

B. File d
ữ liệu

Dữ liệu được lưu vào file có đuôi là sav.

Hình 1. Các file dữ liệu của SPSS
Cách lưu file dữ liệu:
File
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Save
Đặt tên file
Bấm nút Save

File sẽ có đuôi là sav
C. Các lo
ại file chính

1. File dữ liệu (data)
Như đã nói ở trên.
2. File kết quả (output)
Là file chứa kết quả sau khi phân tích.
3. File cú pháp (syntax)
Là file chứa các dòng lệnh.
D. M
ở file, lưu file, đóng file

Mở:

File
Open
Lưu
File
Save
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Đóng
File
Close
E. C
ửa sổ biến v
à c
ửa sổ dữ liệu

1. Các khái niệm
Variable: Biến. một tính chất của các trường hợp cần nghiên cứu: mã, tuổi, giới, tình trạng hôn
nhân…
Case: một trường hợp trong nghiên cứu, ví dụ : mỗi người bệnh là một trường hợp…
Case còn được gọi là một quan sát (Observation).

Hình 2. Case

Hàng ; Variable

Cột
2. Cửa sổ biến
Dùng để định nghĩa các biến (tên biến, kiểu là số hay chữ…).
Bấm chuột vào Variable View ở dưới


Cửa sổ biến như sau:

Name: Tên biến
Type: Kiểu là số (numeric) hay chuỗi chữ (string)
Width: Độ rộng của chuỗi chữ hay độ lớn của số.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Decimals : Số chữ số thập phân.
Label : Nhãn của biến (để dễ hiểu hơn) và nó sẽ xuất hiện trong các phân tích Phân biệt với
tên biến.
Values : Định nghĩa nhãn cho từng giá trị (để dễ hiểu hơn), ví dụ 0 là DB, 1 là MN. Phân biệt
với giá trị thực của các biến.
Missing : Xử lý các trường hợp không có dữ liệu.
F. Cách t
ạo
m
ột biến mới

1. Đặt tên. Name
Vào cửa sổ biến
Gõ tên vào cột Name.
Quy tắc:
Không quá 8 ký tự. Không có dấu cách. Không bắt đầu bằng con số.
Thông báo khi đặt tên sai:

Hình 3. “Biến chứa ký tự đầu tiên không hợp lệ”

Hình 4. “Biến chứa ký tự không hợp lệ”
 Ghi chú: Nên cân nhắc khi đặt tên biến. Tên biến có thể dựa vào mã của bảng điều
tra, chẳng cau1, cau2… để việc nhập dữ liệu được thuận lợi. Nhất thiết phải dùng

Label để tránh nhầm lẫn.

 Tên biến là Cau1, Label là Gioi tinh Tên biến là Cau2, Label là Tuoi
G.
Quy định kiểu
. Type
Ban đầu biến mặc nhiên có kiểu là Numeric.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Để đổi kiểu, bấm vào nút chấm chấm bên cạnh:

Xuất hiện cửa sổ để chọn kiểu

Chọn kiểu và bấm OK.
 Ghi chú:
 1) Kiểu số nhập nhanh hơn và không gây nhầm lẫn bằng kiểu chuỗi chữ.
 Nghĩa là trong khi thu thập số liệu nên mã hóa trước bằng số
 Ví dụ nghề nghiệp có thể mã hóa thành
 1- Nông 2-Buôn bán 3- Công chức
 Còn để diễn giải các giá trị để dễ hiểu ta dùng tính chất Values để gán nhãn cho các
giá trị.
 2) Trong khi phân tích SPSS sẽ kèm theo một hình để ta biết đó là biến số hay biến ký
tự

 Trong hình trên ta biết Ma bn [id] là kiểu số. Dia chi [diachi] là kiểu chuỗi.
H.
Quy định độ rộng
(dài). Width
Gõ con số vào cột Width.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


Ví dụ chuỗi có giá trị là 8 thì người nhập không gõ tiếp được chữ số thứ 9 nếu số chữ đã gõ đã
đến 8.
I. S
ố chữ số thập phân
. Decimal
Gõ con số vào Decimal
Ví dụ biến tuổi, biến huyết áp tối đa nên có Decimal là 0. Cân nặng (kg) có decimal là 1
Chiều cao (m) có decimal là 2, nhưng tính bằng cm thì có decimal là 0 (?).
J. Nhãn c
ủa biến
. Label
Gõ tên nhãn vào cột Label.
 Ghi chú: Nhãn sẽ xuất hiện kèm theo, hoặc thay thế tên biến trong các thao tác, đặc
biệt là kết quả phân tích.
K. Nhãn c
ủa giá trị. Values

Giả sử muốn quy ước giá trị 0 là Nam, 1 là Nữ cho biến c2

Bấm vào nút ở cột Values.
Gõ Value là 0 (sẽ là giá trị nhập vào).
Gõ Value Label (sẽ là nhãn của giá trị 0).
Bấm vào nút Add.

Gỡ bỏ nhãn đã có : Chọn nhãn, bấm Remove.
Sửa nhãn đã có : Chọn nhãn, bấm Change.
 Ghi chú : Phân biệt giá trị và nhãn của giá trị. Người dùng phải nhập 0, 1 mà không
nhập Nam, Nu nhưng khi phân tích thì xuất hiện là Nam, Nu.
L. D

ữ liệu bị thiếu
. Missing
1. System missing
Nếu không nhập thì ô bị trống (có dấu chấm nếu là số).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


Hình 5. Hàng thứ nhất và thứ ba ở cau4 là system missing.
2. User missing
Biến nhận giá trị nhưng ta cho là missing.
Ví dụ:
Câu 10: Theo Anh, Chị chương trình học là:
1- Quá nặng 2-Vừa phải 3- Rất nhẹ 4-Không trả lời.
Có hai kiểu missing xảy ra:
Câu này không được ghi nhận (không nhập liệu, vì không đánh dấu vào lựa chọn nào cả); tức
là xem như bỏ sót câu này. Đây là system missing
Người được phỏng vấn từ chối trả lời và lựa chọn 4 được ghi nhận.
Khi phân tích ta có thể xem 4 là giá trị missing. Đây là user missing.
M.
Độ rộng của cột. Column

Là độ rộng để hiển thị của cột trong cửa sổ Data View. Không liên quan đến độ rộng (width)
của biến.
N. Canh dòng. Alignment
O.
Thang độ đo. Measure.


Hình 6. Các loại thang độ đo
Scale: Nhận các con số liên tục (có thể xếp thứ tự, có thể đánh giá lớn hơn, nhỏ hơn, ví dụ

huyết áp, chiều cao…)
Nominal: Định danh (không có thứ bậc, ví dụ giới tính)
Ordinal: Định danh nhưng có thứ bậc, ví dụ: Thu nhập thấp, thu nhập trung bình, thu nhập
cao. Học lực giỏi, học lực trung bình, học lực kém
Chú ý:
Cần xác định rõ thang độ đo của biến vì các phân tích bao giờ cũng kèm theo điều kiện biến
đưa vào là theo kiểu gì.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

 Biến có kiểu số chưa chắc là Scale, đó là các trường hợp dùng cách mã hóa. Chẳng
hạn nếu quy ước 1 là nam 2 là nữ, thì biến sẽ nhận giá trị 1, 2. Nhưng biến này là
kiểu Nominal (định danh không thứ bậc), nói cách khác ở đây ta không thể cho là 2
lớn hơn 1 và ngược lại không thể cho là 1 nhỏ hơn 2.
 Có một loại gọi là Dischotomous (nhị nguyên) chỉ nhận hai giá trị, là 0 và 1. Loại
biến này hay gặp để diễn tả một tính chất chỉ có hai giá trị (có bệnh hay không có
bệnh, nam hay nữ, có gia đình hay không có gia đình)…
II. Nhập, sửa dữ liệu
Chuyển qua cửa sổ dữ liệu
Bấm nút Data View.

A. Nh
ập

Nhập vào ô,
Bấm enter hoặc bấm nút mũi tên.
B. S
ửa

Chọn ô muốn sửa.
Bấm F2 và sửa.

Phân biệt giữa việc sửa và nhập:
Khi nhập thì giá trị cũ của ô sẽ biến mất.
Khi sửa thì giá trị cũ của ô còn đó, ta chỉ sửa mà thôi.
C. H
ủy việc nhập hoặc sửa

Bấm phím Esc
Dữ liệu trở về như cũ (hoặc trống, nếu trước đó chưa có).
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

D. Ch
ọn các ô

Nhấn phím Shift.
Bấm phím mũi tên theo chiều thích hợp.
E. Ch
ọn cả cột

Đưa chuột lên đầu cột
Bấm chuột
F. Ch
ọn cả h
àng
Đưa chuột ra đầu hàng.
Bấm chuột.
G. Xóa d
ữ liệu

Chọn ô (hoặc nhiều ô) muốn xóa.
Bấm phím Delete.

H. Xóa m
ột hàng (1 trường hợp)

Chọn hàng muốn xóa.
Bấm phím Delete.
Ghi chú: Xóa một hàng là xóa cả một trường hợp (case). Xóa các ô (đã có dữ liệu) của một
hàng chỉ có nghĩa là xóa dữ liệu của trường hợp đó, nhưng trường hợp này vẫn còn (vẫn còn
được tính trong các phân tích).
I. Xóa m
ột cột (1 biến)

Chọn cột muốn xóa.
Bấm phím Delete.
Ghi chú:
Xóa một cột là xóa cả một biến, đương nhiên dữ liệu kèm theo biến đó cũng bị mất luôn. Xóa
các ô (đã có dữ liệu) của một cột chỉ có nghĩa là xóa dữ liệu của biến đó, nhưng biến này vẫn
còn.
J. Copy d
ữ liệu

Chọn ô (hoặc nhiều ô) muốn copy.
Bấm Ctrl + C
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

K. C
ắt dữ liệu

Chọn ô (hoặc nhiều ô) muốn cắt.

Bấm Ctrl + X (dữ liệu sẽ biến mất).
Bấm chuột vào ô muốn chép.
Bấm Ctrl + V
Ghi chú:
Động tác này được xem như chuyển chỗ.
L. Di chuy
ển vị trí các biến

Vào cửa sổ Variable View
Bấm chọn một hàng
Nhấn giữ chuột
Kéo chuột lên trên hoặc xuống.
Ví dụ sau chuyển biến “tuoi” lên trên biến “gioi”



Ghi chú:
Có thể thực hiện việc này ở cửa sổ Data View nhưng lúc này lại chọn cả cột và kéo qua trái
hoặc phải.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

III. Các thao tác chung
A. H
ủy lệnh mới l
àm
Bấm chuột vào nút Undo.

B. L
ấy lệnh đ
ã h

ủy

Bấm chuột vào nút Redo
Ví dụ:
1. Nhập 9
2. Nhập 10

Undo lần đầu (hủy thao tác nhập 10)

Undo lần nữa: (hủy thao tác nhập 9)
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


Redo một lần: lấy lại thao tác mới hủy, tức thao tác nhập 9, kết quả là:

Redo lần nữa: lấy lại thao tác đã hủy tiếp đó tức là thao tác nhập 10, kết quả là

 Ghi chú: Không phải lệnh nào cũng undo được.
C.
Lưu các sửa đổi

Nếu dữ liệu thay đổi thì phải lưu (nếu muốn) bằng cách bấm Ctrl + S
Ghi chú về bài tập: Nghiên cứu 200 bệnh nhân được chẩn đoán là cao huyết áp vô căn. Mục
tiêu nghiên cứu là đánh giá tỉ lệ mắc bệnh và các yếu tố liên quan, số liệu được lấy từ phiếu
khám (xem bảng số liệu).
D. Câu h
ỏi

E. Bài t
ập

:
1) Chạy SPSS
Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2) Lưu file với tên là HA
3) Chọn Variables View và
Tạo các biến sau
Tên biến Kiểu Độ rộng Số số lẻ Nhãn biến Nhãn giá trị
ID Số 8 0 Ma bn
Cau1 Số 8 0 Gioi tinh 0: Nam
1: Nu
Cau2 Số 8 0 Tuoi
Cau3 Chữ 10 0 Dia chi
Cau4 Số 8 0 Nghe nghiep 0: Nong
1: Cong nhan
2: Buon ban
3: CNVC
Cau5 Số 8 1 Chieu cao
Cau6 Số 8 1 CanNang
Cau7 Số 8 0 HA tam thu
Cau8 Số 8 0 HA tam truong

4) Vào Data View và
Nhập 20 dữ liệu sau:


5) Nhận xét về biến Cau3 (Địa chỉ)
6) Đóng file lại
7) Đóng SPSS
8) Chạy lại SPSS

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

9) Mở file HA nói trên.
IV. Mã hóa lại (recode)
Recode là công đoạn cần làm sau khi nhập dữ liệu, vì các lý do sau:
- Dữ liệu nhập bị nhầm.
- Nhóm các dữ liệu thành các nhóm, ví dụ quy định các nhóm tuổi dựa vào tuổi cụ thể
của mỗi người.
Khi recode một biến X thì có thể:
- Recode lại chính X: Thay đổi luôn dữ liệu của biến X. Trường hợp này có thể xem
Recode là thao tác thay đổi dữ liệu hàng loạt.
- Recode và đưa dữ liệu mới vào biến mới Y, (X vẫn như cũ).
A. Recode l
ại chính X

Giả sử, ở biến Cau3 ta cần đổi T Binh thành TB, Duy xuye thành DX…
Transform
Recode
Into Same Variables

Bấm chọn biến Cau3

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Bấm nút mũi tên, biến DiaChi[cau3] xuất hiện bên phải.

Bấm chọn Old and New Values.
Gõ giá trị cũ ở khung Old Value và giá trị mới khung New Value.

Bấm nút Add thì ở khung Old  New có dòng ‘Duy Xuye’  ‘DX’ cho biết giá trị cũ Duy

Xuye sẽ thành giá trị mới DX.

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

Làm tương tự với các giá trị khác

Nếu không muốn tiến hành đổi một giá trị nào đó thì bấm ở khung Old  New và chọn
Remove.

Sau khi xác định các giá trị cần đổi. Bấm Continue.
Bấm OK

Bs Trần Quý Phi-Trường CĐYT Quảng Nam

B. Recode qua m
ột biến k
hác
Recode biến X thành biến Y. X vẫn như cũ. Nên sử dụng cách này vì 2 lý do :
- Giữ lại dữ liệu gốc. Nếu Recode nhầm X thì có nguy cơ không truy lại được dữ liệu
gốc.
- Recode chỉ có mục đích phân nhóm, chẳng hạn recode tuổi thành các nhóm tuổi, thì
tuổi vẫn nên giữ lại, để sử dụng phân tích sau này (chẳng hạn tính tuổi trung bình, lớn
nhất, nhỏ nhất v.v…).
Giả sử, ta cần phân nhóm tuổi theo quy định sau :
1- 19 gộp thành nhóm 1
20-29 gộp thành nhóm 2
30-39 gộp thành nhóm 3
40-49 gộp thành nhóm 4
50-59 gộp thành nhóm 5
60-69 gộp thành nhóm 6

70 trở lên gộp thành nhóm 7
Ta sẽ Recode biến Cau2 và phân thành nhóm vào biến mới gọi DoTuoi.
Transform
Recode
Into Different Variables

Chọn Tuoi[cau2]
Bấm nút mũi tên
Bs Trần Quý Phi-Trường CĐYT Quảng Nam




Trong Output Variable (biến đầu ra) gõ DoTuoi. Bấm nút Change.

Lúc này dòng cau2  ? sẽ trở thành cau2  Dotuoi, nghĩa là dữ liệu (độ tuổi) sẽ được vào
biến mới là Dotuoi
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


Bấm nút Old and New Values…
a) Đổi từ 1 đến 19 vào nhóm 1:
Old Value:
Bấm nút Range (dãy), Gõ 1 (through, đến) 19
New Value:
Bấm nút Value, Gõ 1

Bấm nút Add.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam



Trong khung Old  New ta có dòng 1 thru 20  1 có nghĩa là các giá trị 1 đến 20 ở biến
Cau2 sẽ được chuyển thành 1 ở biến Dotuoi.
v.v…
Tiếp tục làm như vậy cho các nhóm khác

Riêng nhóm cuối cùng (từ 70 trở lên) thì:
Old Value:
Bấm chọn Range (ở through highest) và gõ 70,
New Value
Chọn Value gõ 7.
Nghĩa là dãy từ 70 đến các số lớn hơn, được quy thành nhóm 7 trong Dotuoi
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


Bấm Continue.
Bấm OK.
Lưu ý: Khi recode xong thì hai biến không còn liên hệ gì với nhau. Ví dụ ban đầu tuổi bệnh
nhân (biến Tuoi) là 30, ta ra lệnh recode qua biến DoTuoi là nhóm 3. Thì sau này nếu có sửa
tuổi thành 50 (DoTuoi là 5) thì phải Recode lại. Kinh nghiệm cho thấy là các lệnh Recode nên
lưu lại trong file syntax để sau này chạy lại cho nhanh.
Xem mục Lặp lại lệnh.
C. Gi
ải thích th
êm v
ề Old Va
lue và New Value
1. Đổi 1 giá trị Old Value cụ thể thành 1 giá trị New Value
Recode giá trị 1 (old value) ở biến X thành 2 (new value) ở biến Y


Bs Trần Quý Phi-Trường CĐYT Quảng Nam

2. Đổi các giá trị Old Value trong một giới hạn thành 1 giá trị New Value.
Recode các giá trị từ 10 đến 20 (old value) ở biến X thành 3 (new value) ở biến Y

3. Đổi các giá trị Old Value nhỏ hơn một giới hạn thành 1 giá trị New
Value
Recode các giá trị nhỏ hơn hoặc bằng 30 (old value) ở biến X thành 7 (new value) ở biến Y

4. Đổi các giá trị Old Value từ một giới hạn trở lên thành 1 giá trị New
Value
Recode các giá trị từ 70 (old value) trở lên ở biến X thành 9 (new value) ở biến Y
Bs Trần Quý Phi-Trường CĐYT Quảng Nam


5. Đổi tất cả các giá trị Old Value còn lại thành 1 giá trị New Value.
Ví dụ: Ta có các huyện (biến DiaChi) sau: TM, TP, TK, DX, DL
Ta quan tâm đến 2 vùng miền núi và đồng bằng.
Cách nhanh nhất là Recode vào biến Vung bằng cách:
Đổi TM, TP thành MN.
Các giá trị còn lại là DB

6. Biến mới (new value) là biến chuỗi
Ban đầu, biến mới mặc định là biến số.
Muốn cho ra biến chuỗi, Ví dụ:
Dưới 20 gộp thành nhóm có tên ‘Duoi 20’ thay vì là nhóm 1
20-29 gộp thành nhóm có tên là ‘20 den 29’ thay vì là nhóm 2
v.v…
ta phải chọn Output Variables are string, và gõ độ dài của biến vào ô Width.
Bs Trần Quý Phi-Trường CĐYT Quảng Nam



Bài tập 2:
1) Chạy SPSS
2) Mở file Cao huyet ap
3) Recode lại dữ liêu của biến cau3 thành các tên tắt của Huyện cho vào biến diachi1
4) Xóa biến diachi1.
5) Đổi tên biến diachi1 thành cau3.
6) Phân các nhóm tuổi thành 2 loại cho vào biến Tuoi1 với quy định dưới 50 là nhóm 0 và
từ 50 trở lên là nhóm 1.
7) Chuyển vị trí biến Tuoi1 cho nằm bên cạnh biến cau2.
8) Phân các nhóm tuổi thành các loại cho vào biến Tuoi2 với quy định sau:
Dưới 20 gộp thành nhóm có tên ‘Duoi 20’
20-29 gộp thành nhóm có tên là ‘20 den 29’
30-39 gộp thành nhóm có tên là ‘30 den 39’
40-49 gộp thành nhóm có tên là ‘40 den 49’
50-59 gộp thành nhóm có tên là ‘50 den 59’
60-69 gộp thành nhóm có tên là ‘60 den 69’
70 trở lên gộp thành nhóm có tên là ’70 tro len’
9) Lưu file và thoát SPSS
V. Tính toán dữ liệu (compute)
Đôi khi cần phải tạo ra các biến mới, dựa trên dữ liệu của một hay nhiều biến cũ, nhưng giá trị
mới là một biểu thức phức tạp thì không dùng Recode mà phải dùng Compute.
Ví dụ: Cần tạo ra biến mới là BMI (chỉ số khối cơ thể) dựa trên Cân nặng và Chiều cao của
mỗi đối tượng nghiên cứu.

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×