Chương 7
XỬ LÝ VÀ
PHÂN TÍCH DỮ LIỆU PHẦN 1
1
Mục tiêu chương 7
Chương này giúp học viên:
• Hiểu được các khái niệm về xử lý dữ liệu
• Phân biệt các phương pháp xử lý dữ liệu
• Biết được quy trình xử lý dữ liệu bằng SPSS
• Giải thích được ý nghĩa kết quả nghiên cứu
2
Nội dung chương
5.1
Khái niệm về xử lý dữ liệu
5.2
Chuẩn bị dữ liệu
5.3
Mã hóa dữ liệu
5.4
Làm sạch dữ liệu
5.5
Xử lý và phân tích dữ liệu
3
7.1 Khái niệm về
phương pháp
xử lý dữ liệu
4
Khái niệm
Xử lý dữ liệu là công việc diễn ra sau
quá trình thu thập dữ liệu
Nhiệm vụ của việc xử lý dữ liệu là
chuyển các dữ liệu dưới dạng thô
thành dữ liệu tinh
5
Quá trình chuyển hóa dữ liệu
Dữ liệu
thô
Dữ liệu
tinh
6
Các phương pháp xử lý dữ liệu
Phương pháp thủ công
- Phương pháp kiểm đếm (Tallying)
- Phương pháp lựa ra và đếm (Sorting
and Counting)
7
Các phương pháp xử lý dữ liệu
Phương pháp xử lý bằng máy tính
- Sử dụng các chuyên viên xử lý dữ liệu
- Sử dụng các phần mềm xử lý dữ liệu
trọn gói
- Phát triển các phần mềm riêng
8
Quy trình xử lý dữ liệu
1. Giá trị hóa dữ liệu
2. Mã hóa các câu trả lời
Chuẩn bị
dữ liệu
3. Nhập dữ liệu vào máy tính
4. Làm sạch dữ liệu
5. Lưu trữ dữ liệu để phân tích
Lưu trữ
và
Phân tích
6. Phân tích dữ liệu
9
7.2 Chuẩn bị dữ liệu
10
Công việc chuẩn bị dữ liệu
Kiểm tra tính hợp lệ của dữ liệu
Hiệu chỉnh dữ liệu
11
Kiểm tra tính hợp lệ của dữ liệu
Kiểm tra bảng câu hỏi đã được trả lời:
tính đầy đủ của bảng câu hỏi, việc ghi
chép câu trả lời…
Kiểm tra tính logic của các câu trả lời
Xem xét những chỉ dẫn về thủ tục phỏng
vấn
Kiểm tra tính trung thực của các câu trả lời
12
Hiệu chỉnh dữ liệu
Liên hệ trực tiếp phỏng vấn viên để làm
sáng tỏ vấn đề: các câu trả lời không
đọc được, không rõ ý…
Gặp và phỏng vấn lại đáp viên
Suy luận từ các câu trả lời khác
Loại bỏ toàn bộ bản câu hỏi và tiến hành
phỏng vấn lại
13
7.3 Mã hóa dữ liệu
14
Khái niệm
Mã hóa dữ liệu (coding) là quá trình chuyển
đổi các trả lời thành dạng mã số để nhập và
xử lý dễ dàng
Được thực hiện trước hoặc sau khi phỏng
vấn
Các ký hiệu mã hóa cho các biến và các trả
lời được trình bày trong một sổ mã (code
book)
Dữ liệu mã hóa xong được nhập vào máy
dưới dạng một ma trận gọi là ma trận dữ liệu
15
Mã hóa dữ liệu trên bảng câu
hỏi
Mã hóa câu hỏi đóng
Mã hóa câu hỏi mở
• Gán các con số cho
các câu trả lời được
liệt kê sẵn trên bảng
câu hỏi
• Nhóm các câu trả lời có
cùng ý nghĩa
• Gán các con số cho các
nhóm trả lời
16
Mã hóa dữ liệu trên bảng câu
hỏi
Câu hỏi một lựa chọn (SA)
Câu hỏi nhiều lựa chọn(MA)
•
- Phương pháp multiple dichotomy
Thực hành ví dụ:
Bạn đánh giá mức thu nhập hiện
nay của bạn như thế nào?
quá thấp
thấp
trung bình
cao
rất cao
không trả lời
- Phương pháp multiple category
•
Ví dụ:
Bạn hãy đánh dấu vào nhóm phần mềm
mà bạn có thể sử dụng được:
Quản lý cơ sở dữ liệu
Phần mềm soạn thảo văn bản
Phần mềm bản tính
Phần mềm tài chính kế toán
Phần mềm truyền thông
Phần mềm khác (xin nêu rõ):
17
Danh bạ mã hóa
hay sổ mã hóa
•
Biến các trả lời thành các mã số, ký hiệu
mà máy tính hiểu được
•
Giúp cho việc nhập liệu dễ dàng hơn
•
Giúp nhà nghiên cứu trong việc phân tích
và diễn giải dữ liệu
18
Nội dung trong danh bạ mã hóa
Số thứ tự của câu hỏi.
Vấn đề của câu hỏi (thường là tóm tắt nội dung
câu hỏi).
Tên của biến số phát sinh từ câu hỏi
Nhãn của biến số (variable label)
Các giá trị mã hóa: là các giá trị mà biến số có thể
nhận được để biểu diễn thông tin được trả lời
Nhãn giá trị mã hoá (Value Label) thường dùng
để mô tả ý nghĩa của các giá trị mã hóa.
19
STT
câu
hỏi
Vấn đề
câu hỏi
Tên
biến số
1
Vùng
phỏng vấn
REGI
2
Có sử dụng
sữa rửa
mặt không
USE
3
Sử dụng
nhãn hiệu
nào?
4
Sử dụng
sữa rửa
mặt vào khi
nào?
Mô tả
biến số
Vùng địa lý
Các giá trị
mã hóa
Mô tả các giá trị mã
hóa
1
2
3
4
Hà Nội
Đà Nẵng
TP.HCM
Cần Thơ
1
2
Có
Không
BRAND
Nhãn hiệu
đang dùng
1
2
3
4
5
6
7
Pond’s
Hazeline
Biore
Lana
Nivea
Naco
Loại khác
TIME
Thời điểm
sử dụng
1
2
3
4
5
Sáng sớm khi thức dậy
Buổi sáng
Buổi trưa
Buổi chiều
20
Tối trước khi ngủ
Câu hỏi
(biến)
Ý nghĩa câu hỏi
Q1
Giới tính đáp viên
1
2
Nam
Nữ
Q2
Nghề nghiệp đáp viên
1
2
3
4
5
6
7
Bác sĩ
Giáo viên
Nhân viên văn phòng
Công nhân
Hưu trí
Học sinh-sinh viên
Khác-----
-----------
-----------------
-----------
------------------------------
Q22a
Đánh giá về bao bì
sản phẩm
Đánh giá về chất
lượng sản phẩm
Q20b
Giá trị
mã hóa
1
2
3
Mô tả giá trị mã hóa
Kém
Trung bình
Tốt
21
Ma trận dữ liệu
– Cột: là nơi quản lý các biến (các câu hỏi có
trong bảng câu hỏi)
– Loại câu hỏi một trả lời: chỉ cần một cột chứa
các giá trị trả lời
– Loại biến nhiều trả lời: nhiều cột chứa nhiều giá
trị trả lời có thể có
– Dòng: là nơi quản lý tất cả các quan sát (bằng
kích cỡ mẫu)
– Ô giao nhau giữa cột và dòng: là nơi chứa
đựng giá trị trả lời của một câu hỏi trong một
quan sát cụ thể.
22
23
7.4 Làm sạch dữ liệu
24
Làm sạch dữ liệu
Dữ liệu sau khi nhập xong, chưa
thể đưa ngay vào xử lý
Nhằm phát hiện các sai sót do
người kiểm soát chưa phát hiện
ra hoặc do nhập liệu
25