Bài 3
THỐNG KÊ MÔ TẢ
1. Kiểm tra dữ liệu (Explore)
2. Bảng phân bố tần suất
3. Mô tả dữ liệu (Descriptive)
4. Lập bảng nhiều chiều cho các biến một trả lời
5. Lập bảng cho biến nhiều trả lời
6. Tác vụ xoay bảng trên Ouput Viewer
Download trọn bộ SPSS 19+crack và ebooks – articles tại
/>
Bài tập tình huống.
• Dưới đây là số liệu về độ tuổi của các bệnh nhân đến khám
ở bệnh viện A vào ngày 20/8/2008
32
45
53
60
79
73
73
53
61
48
51
49
62
72
37
70
38
66
52
33
78
45
65
47
64
47
61
75
57
64
Yêu cầu :
Xây dựng biểu đồ thân lá
Xây dựng bảng phân bố tần số thích hợp
Vẽ các đồ thị biểu diễn tần số và tần số tích lũy, tần suất tích lũy
Cho nhận xét về phân bố tuổi của các bệnh nhân nói trên
1. Kiểm tra dữ liệu
(Explore)
Để nhận dạng và phát hiện sai sót trong dữ liệu, ta có ba
cách hiển thị dữ liệu như sau:
• Biểu đồ Histogram
• Sơ đồ cành và lá (Stem-and-leaf plot)
• Sơ đồ Boxplot (hộp ria mèo)
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Sử dụng công cụ
Statistics
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Để kiểm tra dữ liệu
Chọn trên menu Analyze/Descriptive Statistic/Explore… để mở
hộp thoại Explore: Các biến trong tập dữ liệu xuất hiện trong hộp bên
trái. Chọn một hay nhiều biến đưa vào ô Dependent list, các biến cần
quan sát sẽ được liệt kê trong ơ này. Chúng ta cũng có thể tách các quan
sát thành các nhóm nhỏ riêng biệt để kiểm tra dựa vào các giá trị của các
biến kiểm sốt sẽ được đưa vào ơ Factor List.
Có thể lần ra các quan sát này
bằng cách gán nhãn cho nó
bằng gía trị của một biến nào
đó, biến này sẽ được đưa vào
trong ơ label cases by.
Ơ Display, cho phép chúng ta
chọn cách hiễn thị kết quả, các
tham sô thống kê (Statistic),
hoặc đồ thị (Plot), SPSS mặc
định là hiễn thị cả hai
Để kiểm tra dữ liệu (tt)
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Sử dụng công cụ Statistics cho phép
lựa chọn các thống kê hiển thị
Descriptives: Cho phép ta hiễn thị các giá trị thống kê như giá trị trung
bình, khoảng tin cậy, trung vị, trung bình giãn lược, giá trị nhỏ nhất, lớn
nhất, khoảng biến thiên, các bách phân vị
M-estimators: Hiễn thị giá trị trung bình theo trọng số (gán các trọng số
khác nhau cho các giá trị quan sát tùy theo khoảng cách của nó đến giá
trị trung bình, càng xa trọng số càng nhỏ)
Outliers: Hiễn thị các quan sát với 5 giá trị nhỏ
nhất và 5 giá trị lớn nhất, gọi là Extreme Values
Percentiles: Hiển thị các giá trị vị phân
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Sử dụng công cụ Plots
Để lựa chọn dạng đồ thị (Histogram), biểu đồ chuẩn tắc, các
phép kiểm tra về phân phối chuẩn, tính đồng đều của
phương sai:
Boxplots: Điều kiện để hiễn thị của Boxplots là ta phải đang quan
sát nhiều hơn một biến phụ thuộc (hiễn thị trong ô dependent list).
Factor levels together đưa ra một hiển thị riêng biệt cho mỗi biến
phụ thuộc. Trong phạm vi một hiển thị, Boxplots được hiển thị cho
mỗi một nhóm được phân ra theo giá trị của biến điều khiển (factor
variable).
Dependents together đưa ra một hiển
thị riêng biệt theo mỗi nhóm được phân
theo các giá trị trong biến điều khiển.
Trong phạm vi của hiễn thị, boxplots được
đưa ra lần lượt cho mỗi biến phụ thuộc
Descriptive: Cho phép lựa chọn hiển thị
dạng đồ thị Histogram hay dạng cành lá
(stem-and-leaf plots)
Sử dụng công cụ Plots
Normality plots with tests. Đưa ra các dạng đồ thị về phân
phối chuẩn. Đồng thời cung cấp một kiểm nghiệm thống kê
Kolmogorov-Smirnov statistic, với mức tin cậy Lilliefors dùng để
kiểm nghiện tính chuẩn của phân phối mẫu đang quan sát.
Spread vs. Level with Levene Test. Cho phép chúng ta kiểm
tra tính đồng đều của phương sai giữa các mẫu trong dữ liệu gốc
hay dữ liệu đã được biến đổi.
Kiểm định Kolmogorov-Smirnov (Lilliefors)
Kiểm định Lilliefors là một dạng kiểm định Kolmogorov-Smirnov,
dùng để kiểm định tính chuẩn của một mẫu hay hai mẫu. Với giá
trị sig. nhỏ hơn mức ý nghĩa (0.05) là kết quả bác bỏ giả thuyết
phân phối mẫu là phân phối chuẩn..
Kiểm định Levene
Kiểm định Levene là phép kiểm định tính đồng nhất của phương
sai. ở đây ta kiểm định giả thuyết cho rằng phương sai của giữa
các mẫu quan sát là bằng nhau. Kiểm định cho ta kết quả Sig. nhỏ
hơn mức tin cậy (5%) ta kết luận không chấp nhận giả thuyết cho
rằng phương sai mẫu thì bằng nhau.
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Áp dụng vào bài tập tình
huống.
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
2. Bảng phân bố tần suất
Bảng phân phối tần suất được thể hiện với tất cả các biến định
tính (rời rạc) với các thang đo định danh, thứ bậc và các biến định
lượng (liên tục) với thang đo khoảng cách hoặc tỉ lệ.
Từ thanh menu chọn:
Analyze / Descriptive Statistics / Frequencies…
Download trọn bộ IBM SPSS v19+crack và ebooks – articles tại
/>
Frequencies
Chọn một hoặc một số biến định lượng hoặc định tính
•Nhắp Statistics để có các thống kê mơ tả đối với biến định lượng
•Nhắp Charts để có đồ thị thanh, đồ thị trịn, và biểu đồ tần suất.
•Nhắp Format để có trật tự mà các kết quả được thể hiện.
Frequencies Statistics
Percentile Values. Các trị số của một
biến định lượng chia dữ liệu có thứ bậc
vào thành các nhóm sao cho một tỷ lệ
% cụ thể là nằm trên nó và một tỷ lệ %
khác nằm dưới nó. Các số tứ phân vị
chia các quan sát ra thành 4 nhóm có
cùng số lượng quan sát. Nếu muốn một
số lượng các nhóm lớn hơn 4, hãy chọn
Cut points for n equal groups. Cũng có
thể xác định các số phân vị riêng biệt
(ví dụ, phân vị thứ 95, là trị số mà nằm
dưới nó là 95% số lượng quan sát).
Central Tendency. Các thống kê mô tả trung tâm của một phân bố bao
gồm trung bình, trung vị, mode, và tổng mọi trị số.
Dispersion. Các thống kê đo đạc độ lớn của sự biến thiên bao gồm độ lệch
chuẩn, phương sai, phạm vi, trị số lớn nhất, nhỏ nhất, và sai số chuẩn của
trung bình.
Distribution. Skewness {Độ lệch} và Kurtosis {độ nhọn} là các thống kê
mơ tả hình dạng và độ cân xứng của một phân bố.
Value are group midpoints. Nếu các trị số trong dữ liệu là điểm giữa của
các nhóm, hãy chọn tuỳ chọn này để ước lượng trung vị và các phân vị cho
dữ liệu thơ, khơng nhóm gộp.
Frequencies Charts
Chart Values. Đối với đồ thị thanh, trục
thang đo có thể được đặt nhãn bởi số lượng
hoặc tỷ lệ %.
Chart Type: Một đồ thị tròn {pie chart}
thể hiện phân bố của các bộ phận trong
toàn bộ. Từng miếng của đồ thị trịn tương
ứng với một nhóm được xác định bởi một
biến lập nhóm. Một đồ thị thanh {bar
chart} thể hiện số lượng/tần số của từng trị
số riêng biệt hoặc từng nhóm như là một
thanh riêng, cho phép bạn so sánh
các nhóm dưới dạng hình ảnh. Một biểu đồ tần số {Histogram} cũng có
các thanh, nhưng chúng được vẽ dọc theo một thang đo khoảng bằng
nhau. Chiều cao của từng thanh là số lượng của các trị số của một biến
định lượng rơi vào trong khoảng. Một biểu đồ tần suất thể hiện hình dạng,
trung tâm, và độ trải rộng của phân bố. Một đường cong chuẩn đặt
chồng thêm vào một biểu đồ tần suất giúp bạn xét đoán liệu chừng dữ
liệu có phân bố chuẩn.
Áp dụng vào bài tập tình
huống.
Áp dụng vào bài tập tình
huống.
• Sau đó chúng ta có thể áp dụng Excel để làm lại bảng
và trình bày cho đẹp như bên dưới
Độ tuổi
Tần số
Tần suất (%)
Tần số tích lũy
Tần suất tích lũy(%)
30-35
2
6.67
2
6.67
35-40
2
6.67
4
13.33
40-45
0
0
4
13.33
45-50
6
20
10
33.33
50-55
4
13.33
14
46.67
55-60
1
3.33
15
50
60-65
6
20
21
70
65-70
4
6.67
23
76.67
70-75
2
13.33
27
90
75-80
3
10
30
100
Tổng
30
100
/
/
Áp dụng vào bài tập tình
huống.
3. Mô tả dữ liệu (Descriptive)
Sử dụng Statisticts\Summaries\Descriptives để mở hộp thoại mô tả
thống kê
Đây là một dạng công cụ khác có thể được dùng để tóm tắc dữ liệu và chỉ
cho phép thao tác trên dạng dữ liệu định lượng (thang đo khoảng và tỷ lệ).
Được dùng để thể hiện xu hướng tập trung của dữ liệu (central tendency)
thông qua giá trị trung bình của các giá trị trong biến (mean), và mô tả sự
phân tán của dữ liệu thông qua phương sai và độ lệch chuẩn. Chuyển các
biến cần tóm tắt vào hộp thoại variables và nhấp thanh options để lựa
chọn các thông số thống kê cần mô tả, như giá trị trung bình–mean, giá trị
tối thiểu, giá trị tối đa, phương sai và độ lệch chuẩn…
4. Lập bảng nhiều chiều cho các
biến một trả lời
Bảng nhiều chiều là dạng bảng chéo thể hiện tần suất xuất hiện của một
biến này trong mối quan hệ với một hay nhiều biến khác. Bảng chéo còn
cung cấp nhiều loại kiểm định thống kê và đo lường mối quan hệ và
tương quan giữa các biến trong bảng
Chọn trên menu Statistics/Summaries/Crosstabs
Các biến trong tập dữ liệu được
hiển thị bên hộp bên trái. Chọn các
biến hàng đưa vào hộp Row(s) và
các biến cột đưa vào hộp
Column(s). Thông thường biến phụ
thuộc hay biến cần quan sát
thường được đưa và hàng (rows) và
biến độc lập hay biến kiểm soát
được đưa và cột (columns).
Crosstabs
- Ngồi ra, chúng ta có thể đưa thêm vào bảng chéo
các biến điều khiển (layer) để tạo ra các bảng biến
chéo nhiều chiều. Mỗi bảng chéo riêng biệt sẽ được
tạo ra ứng với mỗi giá trị của mỗi biến điều khiển. Mỗi
biến điều khiển sẽ chia bảng chéo thành nhiều nhóm
nhỏ hơn. Có thể thêm tối đa 8 biến điều khiển. Việc
đưa vào các biến điều khiển này cho phép ta xem xét
các mối quan hệ mà lúc ban đầu không thể thấy
ngay.
- Công cụ Cells trong hộp thoại cho phép ta tính tốn
các hệ số đo lường mối quan hệ giữa các biến đó như
% hàng, % cột, % Total tuỳ thuộc vào yêu cầu nghiên
cứu.