Tải bản đầy đủ (.doc) (49 trang)

Ứng dụng phân tích phương sai trong phần mềm SPSS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.41 MB, 49 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH
LÊ HỮU NHẤT
ỨNG DỤNG PHÂN TÍCH PHƯƠNG SAI
TRONG PHẦN MỀM SPSS
LUẬN VĂN THẠC SỸ TOÁN HỌC
Vinh, 2014
2
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC VINH
LÊ HỮU NHẤT
ỨNG DỤNG PHÂN TÍCH PHƯƠNG SAI TRONG PHẦN MỀM SPSS
Chuyên ngành: Lý thuyết Xác suất và thống kê toán
Mã số: 60.46.01.06
LUẬN VĂN THẠC SĨ TOÁN HỌC
Người hướng dẫn khoa học: Tiến sĩ Nguyễn Trung Hòa
3
Vinh, 2014.
MỤC LỤC
MỤC LỤC 4
Mở đầu 5
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ 8
1.1.Mẫu ngẫu nhiên và mẫu quan sát 8
1.1.1.Định nghĩa 1: 8
1.1.2.Định nghĩa 2: 8
1.2.Véctơ ngẫu nhiên 8
1.2.1.Định nghĩa 8
1.2.2.Ví dụ: 8
1.3. Trung bình mẫu và phương sai mẫu 9
1.3.1. Trung bình mẫu 9
1.3.2.Phươg sai mẫu 9


1.4. Phân tích phương sai 10
1.4.1. Khái niệm 10
1.4.2. Nguyên lý của phân tích phương sai 10
1.4.3. So sánh các giá trị trung bình 12
CHƯƠNG 2. PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU TRONG SPSS 14
2.1.Giới thiệu về phần mềm SPSS 14
2.1.1. Cài đặt phần mềm SPSS 14
2.1.2. Các dạng màn hình của Phần mềm SPSS 24
2.1.3. Chức năng chính của SPSS 25
2.1.4. Nội dung chủ yếu của SPSS 26
2.1.5. Một số lĩnh vực ứng dụng chính của SPSS 26
2.2. Cấu trúc, tổ chức dữ liệu trong SPSS 27
2.2.1. Dữ liệu đầu vào và xử lý thô 27
2.2.2. Kiểm tra và hiệu đính dữ liệu 27
2.2.3. Mã hoá dữ liệu 30
2.2.4. Làm sạch dữ liệu 31
2.3. Phân tích ANOVA 34
2.3.1. Phân tích phương sai một chiều (One way ANOVA) 34
2.3.2. Kỹ thuật hậu kiểm (Post hoc procedures) 41
2.3.3. Ứng dụng phân tích phương sai (Anova) điều tra giáo dục 42
KẾT LUẬN 47
TÀI LIỆU THAM KHẢO 48
4
Mở đầu
Khoa học thống kê là một lĩnh vực của khoa học toán học liên quan tới việc
thu thập, phân tích và diễn giải hay giải thích và trình bày số liệu. Các nhà thống
kê giúp cải thiện chất lượng của số liệu với việc thiết kế thực nghiệm và lấy mẫu
nghiên cứu. Xác suất thống kê cũng cung cấp những công cụ để dự đoán và dự
báo bằng việc sử dụng số liệu và các mô hình thống kê. Xác suất thống kê được
ứng dụng vào nhiều lĩnh vực học thuật khác nhau, bao gồm khoa học tự nhiên và

xã hội, quản lý của chính phủ và kinh doanh.
Các phương pháp thống kê có thể được sử dụng để tóm tắt hay mô tả tập
hợp của số liệu, gọi là thống kê mô tả (descriptive statistics). Điều này rất hữu
ích trong nghiên cứu, khi nhà nghiên cứu muốn phổ biến kết quả nghiên cứu
hoặc thực nghiệm của họ. Hơn nữa, các mẫu trong số liệu có thể được mô hình
hóa theo cách mà có thể kiểm soát được tính ngẫu nhiên và tính không chắc chắc
trong quan sát, và sau đó được sử dụng để đưa ra các suy luận về quá trình hay
về tổng thể (population) được nghiên cứu; cái này được gọi là thống kê suy luận
(inferential statistics). Suy luận là không thể thiếu được trong khoa học khách
quan vì nó mang lại những dự đoán (dựa trên số liệu) một cách lôgic. Nhằm xác
định tính chính xác của những dự đoán này, những ước đoán này cũng được
kiểm tra, là một phần của phương pháp khoa học.
Các nhà nghiên cứu giáo dục học và khoa học xã hội cần biết và sử dụng
xác suất thống kê, nhưng họ không cần biết quá sâu về toán học. Vì hiện nay các
chương trình phần mềm xác suất thống kê ngày càng phổ biến và mạnh mẽ (như
SPSS, SAS và STATA), và các công thức tính đã được lập trình sẵn, thì yêu cầu
về khả năng toán học không phải là chủ chốt. Nhưng những phần mềm này chỉ
giúp được rất ít trong việc lên kế hoạch nghiên cứu, lựa chọn kỹ thuật phù hợp
và diễn giải kết quả. Vì vậy, đối với các nhà nghiên cứu, hiểu ý nghĩa của những
thuật toán và mô hình thống kê khác nhau trong những khung cảnh khác nhau
mới là điều quan trọng.
5
Trong số nhiều phần mềm đã và đang được sử dụng cho mục đích thống
kê, phần mềm SPSS đã cho thấy những ưu điểm của nó. SPSS là một chương
trình mà nhiều người sử dụng yêu thích do nó rất dễ sử dụng. SPSS có một giao
diện giữa người và máy cho phép sử dụng các menu thả xuống để chọn các lệnh
thực hiện. Khi thực hiện một phân tích chỉ đơn giản chọn thủ tục cần thiết và
chọn các biến phân tích và bấm OK là có kết quả ngay trên màn hình để xem
xét. SPSS cũng có một ngôn ngữ cú pháp có thể học bằng cách dán cú pháp lệnh
vào cửa sổ cú pháp từ một lệnh vừa chọn và thực hiện, nhưng nói chung khá

phức tạp và không trực giác. Với rất nhiều những bài toán thuộc phạm trù thống
kê được thiết lập thuật toán trên phần mềm này, SPSS giúp ta nhanh chóng có
được các kết quả phân tích thống kê một cách chính xác, hiệu quả. Để có thể
hiểu hơn về phần mềm này và ứng dụng phân tích phương sai, trong khuôn khổ
của luận văn thạc sĩ tôi đã quyết định chọn đề tài “ỨNG DỤNG PHÂN TÍCH
PHƯƠNG SAI TRONG PHẦN MỀM SPSS”.
Mục tiêu nghiên cứu của đề tài đó là:
• Trình bày các kiến thức trong lý thuyết xác suất liên quan đến bài toán
phân tích phương sai
• Trình bày thuật toán phân tích phương sai một yếu tố
• Trình bày những hiểu biết cơ bản về phần mềm SPSS
• Trình bày chi tiết các bước tiến hành giải quyết bài toán phân tích phương
sai một yếu tố trên phần mềm SPSS
• Trình bày bài toán thực tế và đọc kết quả kết xuất từ phần mềm
Về phương pháp nghiên cứu, trong đề tài này cơ bản được sử dụng các
phương pháp sau:

Phân tích và tổng hợp tài liệu

Tìm hiểu phần mềm

Suy luận toán học
6

Mô hình hóa và thuật toán
Nội dung của luận văn gồm 2 chương:
Chương I: Kiến thức chuẩn bị.
Trong chương này tôi trình bày những kiến thức cơ bản về Xác suất thống
kê cần thiết cho việc thể hiện nội dung của chương 2.
Chương II: Phân tích phương sai một chiều trong SPSS.

Đây là phần thể hiện nội dung chính của luận văn. Trong chương này tôi
trình bày các hiểu biết cơ bản về phần mềm SPSS và ứng dụng phân tích
phương sai một yếu tố (One way Anova) của phần mềm để thực hiện việc kiểm
nghiệm kết quả học tập của học sinh ở một trường phổ thông.
Cuối cùng là kết luận về các nội dung nghiên cứu của đề tài.
Để hoàn thành được Luận văn này, tôi xin bày tỏ lòng biết ơn sâu sắc tới
TS. Nguyễn Trung Hoà đã giao đề tài và tận tình hướng dẫn, luôn quan tâm,
tạo mọi điều kiện giúp đỡ tôi trong suốt quá trình nghiên cứu và thực hiện Luận
văn này.
Đồng thời tôi xin chân thành cảm ơn Ban Giám hiệu, Phòng Sau Đại học,
Ban chủ nhiệm khoa Toán, các thầy cô giáo và cán bộ trường ĐH Vinh đã
truyền thụ cho tôi những kiến thức, kinh nghiệm quý báu giúp tôi hoàn thành tốt
luận văn này.
Tôi xin chân thành cảm ơn các thầy cô giáo và các em học sinh trường
THPT Nam Tiền Hải, huyện Tiền Hải, tỉnh Thái Bình đã giúp đỡ và tạo mọi
điều kiện để tôi hoàn thành Luận văn này.
Tôi cũng xin gửi lời cảm ơn tới gia đình, bạn bè và đồng nghiệp đã động
viên, giúp đỡ tôi trong suốt quá trình học tập và thực hiện Luận văn.
Nghệ An, tháng 10 năm 2014
7
CHƯƠNG 1. KIẾN THỨC CHUẨN BỊ
1.1. Mẫu ngẫu nhiên và mẫu quan sát
1.1.1. Định nghĩa 1:
Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n
biến ngẫu nhiên X
1
, X
2
, , X
n

độc lập, có cùng phân phối xác suất với X, ký
hiệu là W=(X
1
, X
2
, , X
n
).
Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc
Các biến ngẫu nhiên X
i
được gọi là bản sao của X
1.1.2. Định nghĩa 2:
Mẫu quan sát là thể hiện cụ thể của mẫu ngẫu nhiên W=(X
1
, X
2
, , X
n
), đó
chính là tập hợp các số liệu cụ thể, gọi tắt là các số liệu thực nghiệm.
• Phương pháp nghiên cứu không toàn bộ là phương pháp nghiên cứu thông
qua mẫu ngẫu nhiên và mẫu quan sát.
1.2. Véctơ ngẫu nhiên
1.2.1. Định nghĩa.
Cho U = (X
1
, X
2
, ,X

n
) là một véc tơ thuộc không gian thực R
n
. Nếu X
i

các biến ngẫu nhiên thì U gọi là một véc tơ ngẫu nhiên n chiều, các biến X
1
,
X
2
, ,X
n
là các thành phần ngẫu nhiên của véc tơ ngẫu nhiên U.
1.2.2. Ví dụ:
Chọn ngẫu nhiên một người từ đám đông. Gọi X là chiều cao, Y là trọng
lượng của người được chọn. Véc tơ U = (X, Y) là một véc tơ ngẫu nhiên hai
chiều.
• Nếu các thành phần X
i
của véc tơ ngẫu nhiên U(X
1
, , X
n
) là các biến
ngẫu nhiên rời rạc thì U(X
1
, , X
n
) gọi là véc tơ ngẫu nhiên rời rạc. Nếu các

thành phần đó là các biến ngẫu nhiên liên tục thì U(X
1
, , X
n
) gọi là véc tơ ngẫu
nhiên liên tục.
8
1.3. Trung bình mẫu và phương sai mẫu
1.3.1. Trung bình mẫu
1.3.1.1. Trung bình mẫu (ngẫu nhên)
Định nghĩa.
Giả sử (X
1
, X
2
, , X
n
) là một mẫu ngẫu nhiên kích thước n, khi đó trung
bình mẫu ký hiệu là
X
được xác định bởi:
X
=
n
X
n
i
i

=1

.
Trung bình mẫu là một biến ngẫu nhiên, mang tính lý thuyết.
Vì mỗi X
i
là một bản sao của BNN gốc X nên chúng đều có cùng kỳ vọng
và cùng phương sai với X, do đó nếu X có kỳ vọng m và phương sai
σ
2
thì kỳ
vọng và phương sai của trung bình mẫu là:
Nhận xét: Trung bình mẫu là phương pháp đo được sử dụng phổ biến nhất
đế xác định vị trí trung tâm trong thống kê. Điểm yếu duy nhất đối với trung
bình mẫu đó chính là nó có thể bị ảnh hưởng ngược lại do các gíá trị cực trị.
1.3.1.2. Trung bình mẫu quan sát
Định nghĩa:
Trung bình mẫu quan sát là số cụ thể, ký hiệu là x, là một thể hiện của
trung bình mẫu.
Cách tính: Với số liệu (mẫu) quan sát w=(x
1
,x
2
,…,x
n
),
Nếu chưa thu gọn thì:
Nếu là bảng thu gọn
k x
1
x
2

… x
i
… x
k

N n
1
n
2
… n
i
… n
k

thì trung bình mẫu quan sát sẽ được tính theo công thức:
1.3.2. Phươg sai mẫu
1.3.2.1. Phương sai mẫu (ngẫu nhiên)
9
2
( ) , ( ) .E X m D X
n
σ
= =
1
1
;
n
i
i
x x

n
=
=

1
1
.
k
i i
i
x n x
n
=
=

Giả sử (X
1
, X
2
, , X
n
) là một mẫu ngẫu nhiên kích thước n với trung bình
mẫu
X
, khi đó phương sai mẫu ký hiệu là S
2
được xác định bởi:
2
2
1

( )
.
1
n
i
i
X
S
X
n
=

=


S
2
cũng là một biến ngẫu nhiên
1.3.2.2. Phương sai mẫu quan sát
Với số liệu (mẫu) quan sát đã được thu gọn thì giá trị quan sát của S
2
sẽ được tính theo công thức
1.4. Phân tích phương sai
1.4.1. Khái niệm
Phân tích phương sai như tên gọi, là một số phương pháp phân tích thống
kê mà trọng điểm là phương sai (thay vì trung bình). Thay vì xem xét trực tiếp
các giá trị trung bình, ta đi phân tích phương sai và từ đó kết luận về giá trị trung
bình của các mẫu quan sát.
Phân tích phương sai cung cấp các công cụ chính thức để biện minh cho
những phán đoán trực giác. Phân tích phương sai được sử dụng như một công cụ

để thăm dò và giải thích.
Cơ sở lý thuyết của phương pháp thường được xây dựng dựa trên lý thuyết
vectơ toán. Những lý thuyết này vượt quá những kiến thức toán được trang bị
cho những người được đào tạo theo các chuyên ngành kinh tế. Do đó, bản chất
của phương pháp rất khó được lĩnh hội, việc vận dụng vì vậy sẽ kém chính xác.
1.4.2. Nguyên lý của phân tích phương sai
ANOVA xem xét biến thiên của tất cả các quan sát với số đại trung bình và
phân chúng ra làm 2: biến thiên nội nhóm và biến thiên giữa các nhóm. Nếu số
trung bình của các nhóm khác nhau nhiều thì sự biến thiên giữa chúng và đại
trung bình (biến thiên giữa các nhóm) sẽ đáng kể hơn so với các biến thiên giữa
các quan sát trong 1 nhóm với trung bình của nhóm (biến thiên nội nhóm). Nếu
10
2
qs
S
2 2
1
1
( ) .
1
k
i i
i
S n x x
n
=
= −


số trung bình của các nhóm không khác nhau nhiều thì biến thiên giữa các nhóm

sẽ không lớn hơn so với biến thiên nội nhóm. Phép kiểm định giả thuyết về 2
phương sai, F-test, có thể được sử dụng để kiểm định tỉ số phương sai giữa các
nhóm và phương sai nội nhóm. Giả thuyết của F-test cho rằng 2 phương sai này
bằng nhau; nếu H
0
(giả thuyết trung bình của các nhóm là bằng nhau) đúng thì
có nghĩa là biến thiên giữa các nhóm sẽ không lớn hơn so với biến thiên nội
nhóm. Trong tình huống này, không thể kết luận là các trung bình khác lẫn nhau
(không có 1 cặp trung bình nào khác nhau). Ngược lại, nếu từ chối được H
0
thì
kết luận được là không phải tất cả các trung bình đều bằng nhau (có ít nhất 1 cặp
trung bình khác nhau).
Thí dụ minh họa: Thời gian nằm viện của các bệnh nhân đã được tiểu phẫu
không có biến chứng được so sánh với nhau theo ba bác sĩ điều trị (A, B, C).
Chọn 1 mẫu ngẫu nhiên bao gồm 8 bệnh án cho từng bác sĩ, số liệu như sau:
Bảng 1. Thời gian nằm viện của bệnh nhân theo bác sĩ điều trị
A A
2
B B
2
C C
2
4 16 4 16 5 25
5 25 5 25 3 9
5 25 4 16 3 9
4 16 3 9 3 9
6 36 4 16 3 9
6 36 5 25 3 9
4 16 3 9 4 16

5 25 3 9 5 25
∑A = 39 ∑A
2
= 195 ∑B = 31 ∑B
2
= 125 ∑C = 29 ∑C
2
= 111
4,875A
=
3,875B
=
3,625C
=
4,125X
=
Biến số (yếu tố) để so sánh chỉ độc nhất là thời gian nằm viện của bệnh
nhân (tính bằng ngày). Số liệu được phân bố với các ký hiệu như sau:
B/n của BS. A: x
1A
= 4, x
2A
= 5, …………………………… , x
8A
= 5
B/n của BS. B: x
1B
= 4, x
2B
= 5, …………………………… , x

8B
= 3
B/n của BS. C: x
1C
= 5, x
2C
= 3, …………………………… , x
8C
= 5
ij
x
: quan sát thứ i thuộc nhóm j.
X
: đại trung bình (số trung bình tính được từ 24 b/n).
11
, ,A B C
: số trung bình của các nhóm A, B, và C (tính từ 8 b/n của mỗi nhóm).
Chọn x
2A
làm mẫu:
(x
2A

X
) = (5 – 4,125) = 0,875.
Hiệu 0,875 có thể được tách ra làm 2:
(x
2A

X

) = (x
2A

A
) + (
A X−
) = (5 – 4,875) + (4,875 – 4,125)
= (0,125) + (0,750) = 0,875.
1.4.3. So sánh các giá trị trung bình
T-test (Student’s t test)
T-test được dùng để so sánh giá trị trung bình của hai nhóm. Ví dụ, nhà
nghiên cứu muốn tìm hiểu xem phương pháp dạy học X và Y có hiệu quả khác
nhau hay không. Sau khi bố trí một cách ngẫu nhiên (randomly) 50 học sinh lớp
11 học môn Hóa học theo phương pháp X và 50 học sinh lớp 11 học môn Hóa
học theo phương pháp Y. Sau một số buổi dạy hoặc khi hết học kỳ, họ tổ chức
đánh giá hiệu quả dạy học bằng cách cho hai nhóm học sinh làm cùng bài kiểm
tra tự luận hoặc trắc nghiệm. Sau khi có được điểm trung bình của hai nhóm,
nhà nghiên cứu sẽ dùng t-test để kiểm tra xem hai điểm trung bình của hai nhóm
(với các điều kiện ban đầu như học lực, hứng thú là như nhau) có khác nhau một
cách có ý nghĩa thống kê (statistical significant) hay không. Từ đó họ có thể suy
ra hai phương pháp dạy học đó hiệu quả khác nhau không và cũng tìm ra
phương pháp nào hiệu quả hơn.
Anova F test
T-test dùng để tìm xem có sự khác biệt hay không giữa hai nhóm. Tuy
vậy, nhiều khi nhà nghiên cứu lại muốn tìm hiểu xem có sự khác biệt hay không
giữa ba hoặc hơn ba nhóm. Ví dụ, ba nhóm học sinh được dạy theo phương pháp
12
Biến thiên
giữa 1 quan
sát thuộc

nhóm A và
đại trung
bình
Biến thiên
giữa 1 quan
sát thuộc
nhóm A và
trung bình
của nhóm A
Biến thiên
giữa trung
bình của
nhóm A và
đại trung bình
X, Y và Z. Trong tình huống này, họ có thể dùng ba t-test để so sánh: X,Y – Y,Z
và Z,X. Nhưng cách so sánh này không giúp đối chiếu cả ba phương pháp cùng
một lúc hay cho biết phương pháp nào là hiệu quả nhất. Phân tích phương sai,
hay ANOVA (viết tắt của analysis of variance) có thể giúp nhà nghiên cứu trả
lời câu hỏi này.
ANOVA đặc biệt hữu ích trong so sánh các phương pháp học tập, dạy học
khác nhau ở những khách thể khác nhau. Có nhiều mô hình ANOVA khác nhau
tùy thuộc vào số lượng các phương pháp dạy và học và đối tượng nghiên cứu.
ANOVA một chiều (one-way ANOVA) được sử dụng để kiểm tra sự khác
nhau giữa hai (hoặc nhiều hơn) nhóm độc lập. Thường thì người ta dùng
ANOVA một chiều để so sánh sự khác nhau giữa ít nhất là ba nhóm, vì so sánh
hai nhóm có thể được thực hiện bởi T-test (Gossett, 1908). Khi chỉ so sánh hai
nhóm, T-test và F-test chỉ là một, khi đó mối liên hệ giữa ANOVA và t là F = t
2
.
ANOVA giai thừa (factorial ANOVA) được sử dụng khi nhà nghiên cứu muốn

tìm hiểu về hiệu quả của hai (hoặc nhiều hơn) phương pháp dạy học khác nhau.
Hình thức thông dụng nhất của ANOVA giai thừa là 2x2, trong đó có hai biến
độc lập và mỗi biến có hai mức độ giá trị phân biệt. ANOVA giai thừa cũng có
thể ở đa cấp như 3x3, hoặc cao hơn như 2x2x2. Nhưng ANOVA ở các cấp cao
như vậy khó có thể làm bằng tay bởi các phép tính rất dài và phức tạp. Nhưng do
sự phổ biến của các phần mềm thống kê, việc sử dụng ANOVA trong nghiên
cứu trở nên khá phổ biến và thông dụng.
13
CHƯƠNG 2. PHÂN TÍCH PHƯƠNG SAI MỘT CHIỀU TRONG
SPSS
2.1. Giới thiệu về phần mềm SPSS
SPSS (Statistical Product and Services Solutions - Sản phẩm thống kê và
giải pháp dịch vụ) là một phần mềm thống kê, thường được sử dụng trong
nghiên cứu xã hội đặc biệt là trong tâm lý học, tiếp thị và xã hội học. Nó cũng
được sử dụng thường xuyên trong nghiên cứu thị trường. SPSS cung cấp một hệ
thống quản lý dữ liệu và khả năng phân tích thống kê với giao diện thân thiện
cho người dùng trong môi trường đồ hoạ, sử dụng các trình đơn mô tả và các
hộp thoại đơn giản. Năm 1968, Norman H. Nie, C. Hadlai (Tex) Hull và Dale H.
Bent đã phát triển SPSS.
SPSS là phần mềm chuyên dụng xử lý thông tin sơ cấp (thông tin được thu
thập trực tiếp) từ đối tượng nghiên cứu (người trả lời bảng câu hỏi) thông qua
một bảng câu hỏi được thiết kế sẵn.
Hiện nay, SPSS là một trong những phần mềm phân tích số liệu phổ biến
và mạnh nhất với trên 250.000 khách hàng trên toàn thế giới.
2.1.1. Cài đặt phần mềm SPSS
Hình 1. Các Thư mục trong đĩa CD SPSS16
Hình 1.
Bước 1: Nhấp chuột vào biểu tượng Keygen (Xem Hình 2)
14
→ Hình 3 xuất hiện.

Hình 2: Biểu tượng Keygen ở thư mục E:\KEYGEN
Hình 3: Hộp thoại SPSSv16.Keygen:

Hình 3.
Trong Hình 3, ta có thể bấm vào nút Generate. Keygen sẽ cung cấp cho ta:
- Serial Number và Authorization Code (Con số của ta có thể khác với số
trong Hình 3).
- Trong ví dụ này, Serial Number là 9850150046 và Authorization Code là:
32AC429E342387705258.
Ta hãy Bôi đen con số 9850150046 và bấm CTRL-C (để lát nữa dán vào
nơi yêu cầu).
Còn mã 32AC429E342387705258, lát nữa ta sẽ sử dụng đến nó.
15
Bước 2: Chọn biểu tượng trong thư mục gốc của ổ đĩa E:\ (Xem Hình 1)
→ Hình 4 xuất hiện:
Hình 4.
Chọn Install SPSS 16.0 → Hình 5:

Hình 5.
Chọn Single user license, và bấm Next → Hình 6:

Hình 6.
16
Chọn I accept the terms in the license agreement, bấm Next → Hình 7:
Hình 7.
Chọn Next → Hình 8:

Hình 8.
Trong hình 8, Vùng User Name, và Organization ta có thể tự nhập.
Vùng Serial Number: ta hãy nhấp chuột vào đó và bấm CTRL-V để dán số

Serial Number mà Keygen đã cung cấp cho ta (ở Hình 3).
Chọn Next → Hình 9:
Hình 9.
17
Chọn Next → Hình 10:
Hình 10.
Chọn Install → Hình 11:
Hình 11.
Bây giờ ta đợi vài phút để Install các thành phần của SPSS vào máy tính,
khi nào nút Next đậm lên, ta sẽ bấm Next.

Hình 12.
18
Trong quá trình Install sẽ có Hộp thoại như Hình 12 xuất hiện, ta hãy bỏ
dấu chọn ở mục Register with spss.com, rồi bấm OK → Hinh13:
Hình 13.
Khi hộp thoại Hình 13 xuất hiện, mặc định chọn License my product now
(recommended), rồi Next → Hình 14:

Hình 14.
Chọn Next → Hình 15:
19

Hình 15.
Khi Hình 15, xuất hiện, ta hãy Quay trở lại Keygen (Hình 1) và Copy mã
Authorization Code là 32AC429E342387705258 và dán vào mục Enter
Code, Chọn Next → Hình 16:
Hình 16.
Trong Hình 16, ta hãy chọn Telephone, rồi bấm Next → Hình 17:
Hình 17.

20
Trong hình này SPSS đã cung cấp Lock Code là 100-2138B (Số của ta có thế
khác), ta hãy bôi đen con số 2138B bấm CTRL-C và chọn Next → Hình 18:
Hình 18.
Hình 18 yêu cầu ta phải nhập License Code.
Nhưng làm sao ta có được License Code bây giờ? → Hãy Quay trở lại hộp
thoại Keygen.

Hộp thoại Keygen, Vùng Lock Code + Product/Feature , Số 100 đã có sẵn,
ta hãy CTRL-V để dán số 2138B vào ô trống, rồi bấm nút Generate (ở phía
dưới), sẽ có một mã số dài thật dài xuất hiện:
21
4PNUPQJ2PZHTK68SC4KDZHFOK58PDKGLSWWDTUADDLFNDY
GYDQTJ4LHGR8XU6IUDM3GII8AANV3BYV6PZ7IR3H#.
Ta hãy đánh dấu khối toàn bộ mã số này rồi Copy vào mục License Code
của Hình 18 → Hình19:
Hình 19.
Bây giờ chọn Next → Hình 20:
Hình 20.
Chọn Next → Hình 21:
22
Hình 21.
Chọn Finish.
Như vậy SPSS 16 đã cài đặt xong.
Để khởi động SPSS 16 ta có thể thao tác như Hình 22:
Hình 22.
23
2.1.2. Các dạng màn hình của Phần mềm SPSS
SPSS có tất cả 4 dạng màn hình:
Màn hình quản lý dữ liệu (data view):

Là nơi lưu trữ dữ liệu nghiên cứu với một cấu trúc cơ sở dữ liệu bao gồm
cột, hàng và các ô giao nhau giữa cột và hàng.
- Cột (Column): Đại diện cho biến quan sát. Mỗi cột sẽ chứa đựng tất cả
các câu trả lời trong một câu hỏi được thiết kế trong bảng câu hỏi.
- Hàng (Row): Đại diện cho một trường hợp quan sát (người trả lời), Ta
phỏng vấn bao nhiêu người (tùy thuộc vào kích thước mẫu) thì ta sẽ có bấy
nhiêu hàng. Mỗi hàng chứa đựng tất cả những câu trả lời (thông tin) của một đối
tượng nghiên cứu.
- Ô giao nhau giữa cột và hàng (cell): Chứa đựng một kết quả trả lời
tương ứng với câu hỏi cần khảo sát (biến) và một đối tượng trả lời cụ thể (trường
hợp quan sát).
Màn hình quản lý biến (variables view):
Là nơi quản lý các biến cùng với các thông số liên quan đến biến. Trong
màn hình này mỗi hàng trên màn hình quản lý một biến, và mỗi cột thể hiện các
thông số liên quan đến biến đó.
- Tên biến (name): Là tên đại diện cho biến, tên biến này sẽ được hiển thị
trên đầu mỗi cột trong màn hình dữ liệu.
- Loại biến (type): Thể hiện dạng dữ liệu thể hiện trong biến. Dạng số, và
dạng chuỗi.
- Số lượng con số hiển thị cho giá trị (Width): Giá trị dạng số được phép
hiển thị bao nhiêu con số.
- Số lượng con số sau dấu phẩy được hiển thị (Decimals).
24
- Nhãn của biến (label): Tên biến chỉ được thể hiện tóm tắt bằng ký hiệu,
nhãn của biến cho phép nêu rõ hơn về ý nghĩa của biến.
- Giá trị trong biến (Values): Cho phép khai báo các giá trị trong biến với
ý nghĩa cụ thể (nhãn giá trị).
- Giá trị khuyết (Missing): Do thiết kế bảng câu hỏi có một số giá trị chỉ
mang tính chất quản lý, không có ý nghĩa phân tích, để loại bỏ các biến này ta
cần khai báo nó như là giá trị khuyết (user missing). SPSS mặc định giá trị

khuyết (system missing) là một dấu chấm và tự động loại bỏ các giá trị này ra
khỏi các phân tích thống kê.
- Kích thước cột (columns): Cho phép khai báo độ rộng của cột.
- Ví trí (align): Vị trí hiển thị các giá trị trong cột (phải, trái, giữa).
- Dạng thang đo (measures): Hiển thị dạng thang đo của giá trị trong biến.
Màn hình hiển thị kết quả (output):
Các phép phân tích thống kê sẽ cho ra các kết quả như bảng biểu, đồi thị
và các kết quả kiểm nghiệm, các kết quả này sẽ được truy xuất ra một màn hình,
và được lưu giữ dưới một tập tin khác (có đuôi là .SPO). Màn hình này cho phép
ta xem và lưu giữ các kết quả phân tích.
Màn hình cú pháp (syntax):
Màn hình này cho phép ta xem và lưu trữ những cú pháp của một lệnh
phân tích. Các cú pháp được lưu trữ sẽ được sử dụng lại mà không cần thao tác
các lệnh phân tích lại.
2.1.3. Chức năng chính của SPSS
- Nhập và làm sạch dữ liệu;
- Xử lý biến đổi và quản lý dữ liệu;
- Tóm tắt, tổng hợp dữ liệu và trình bày dưới các dạng biểu bảng, đồ thị, bản đồ;
- Phân tích dữ liệu, tính toán các tham số thống kê và diễn giải kết quả.
25

×