Tải bản đầy đủ (.pdf) (59 trang)

Bài giảng Nghiên cứu marketing: Chương 7 - ThS. Vũ Thịnh Trường

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (38.93 MB, 59 trang )

Chương 7

XỬ LÝ VÀ
PHÂN TÍCH DỮ LIỆU PHẦN 1

1


Mục tiêu chương 7
Chương này giúp học viên:
• Hiểu được các khái niệm về xử lý dữ liệu
• Phân biệt các phương pháp xử lý dữ liệu
• Biết được quy trình xử lý dữ liệu bằng SPSS
• Giải thích được ý nghĩa kết quả nghiên cứu

2


Nội dung chương
5.1

Khái niệm về xử lý dữ liệu

5.2

Chuẩn bị dữ liệu

5.3

Mã hóa dữ liệu


5.4

Làm sạch dữ liệu

5.5

Xử lý và phân tích dữ liệu
3


7.1 Khái niệm về
phương pháp
xử lý dữ liệu

4


Khái niệm
 Xử lý dữ liệu là công việc diễn ra sau
quá trình thu thập dữ liệu
 Nhiệm vụ của việc xử lý dữ liệu là
chuyển các dữ liệu dưới dạng thô
thành dữ liệu tinh

5


Quá trình chuyển hóa dữ liệu

Dữ liệu

thô

Dữ liệu
tinh

6


Các phương pháp xử lý dữ liệu
 Phương pháp thủ công
- Phương pháp kiểm đếm (Tallying)
- Phương pháp lựa ra và đếm (Sorting
and Counting)

7


Các phương pháp xử lý dữ liệu
 Phương pháp xử lý bằng máy tính
- Sử dụng các chuyên viên xử lý dữ liệu
- Sử dụng các phần mềm xử lý dữ liệu
trọn gói
- Phát triển các phần mềm riêng

8


Quy trình xử lý dữ liệu
1. Giá trị hóa dữ liệu
2. Mã hóa các câu trả lời


Chuẩn bị
dữ liệu

3. Nhập dữ liệu vào máy tính
4. Làm sạch dữ liệu
5. Lưu trữ dữ liệu để phân tích

Lưu trữ

Phân tích

6. Phân tích dữ liệu
9


7.2 Chuẩn bị dữ liệu

10


Công việc chuẩn bị dữ liệu
 Kiểm tra tính hợp lệ của dữ liệu
 Hiệu chỉnh dữ liệu

11


Kiểm tra tính hợp lệ của dữ liệu
 Kiểm tra bảng câu hỏi đã được trả lời:

tính đầy đủ của bảng câu hỏi, việc ghi
chép câu trả lời…
 Kiểm tra tính logic của các câu trả lời
 Xem xét những chỉ dẫn về thủ tục phỏng
vấn
 Kiểm tra tính trung thực của các câu trả lời
12


Hiệu chỉnh dữ liệu
 Liên hệ trực tiếp phỏng vấn viên để làm
sáng tỏ vấn đề: các câu trả lời không
đọc được, không rõ ý…
 Gặp và phỏng vấn lại đáp viên
 Suy luận từ các câu trả lời khác
 Loại bỏ toàn bộ bản câu hỏi và tiến hành
phỏng vấn lại
13


7.3 Mã hóa dữ liệu

14


Khái niệm
 Mã hóa dữ liệu (coding) là quá trình chuyển
đổi các trả lời thành dạng mã số để nhập và
xử lý dễ dàng
 Được thực hiện trước hoặc sau khi phỏng

vấn
 Các ký hiệu mã hóa cho các biến và các trả
lời được trình bày trong một sổ mã (code
book)
 Dữ liệu mã hóa xong được nhập vào máy
dưới dạng một ma trận gọi là ma trận dữ liệu
15


Mã hóa dữ liệu trên bảng câu
hỏi
Mã hóa câu hỏi đóng

Mã hóa câu hỏi mở

• Gán các con số cho
các câu trả lời được
liệt kê sẵn trên bảng
câu hỏi

• Nhóm các câu trả lời có
cùng ý nghĩa
• Gán các con số cho các
nhóm trả lời

16


Mã hóa dữ liệu trên bảng câu
hỏi

Câu hỏi một lựa chọn (SA)

Câu hỏi nhiều lựa chọn(MA)



- Phương pháp multiple dichotomy

Thực hành ví dụ:

 Bạn đánh giá mức thu nhập hiện
nay của bạn như thế nào?
quá thấp
thấp
trung bình
cao
rất cao
không trả lời

- Phương pháp multiple category


Ví dụ:

 Bạn hãy đánh dấu vào nhóm phần mềm
mà bạn có thể sử dụng được:
Quản lý cơ sở dữ liệu
Phần mềm soạn thảo văn bản
Phần mềm bản tính
Phần mềm tài chính kế toán

Phần mềm truyền thông
Phần mềm khác (xin nêu rõ):
17


Danh bạ mã hóa
hay sổ mã hóa


Biến các trả lời thành các mã số, ký hiệu
mà máy tính hiểu được



Giúp cho việc nhập liệu dễ dàng hơn



Giúp nhà nghiên cứu trong việc phân tích
và diễn giải dữ liệu

18


Nội dung trong danh bạ mã hóa
 Số thứ tự của câu hỏi.
 Vấn đề của câu hỏi (thường là tóm tắt nội dung
câu hỏi).
 Tên của biến số phát sinh từ câu hỏi
 Nhãn của biến số (variable label)

 Các giá trị mã hóa: là các giá trị mà biến số có thể
nhận được để biểu diễn thông tin được trả lời
 Nhãn giá trị mã hoá (Value Label) thường dùng
để mô tả ý nghĩa của các giá trị mã hóa.
19


STT
câu
hỏi

Vấn đề
câu hỏi

Tên
biến số

1

Vùng
phỏng vấn

REGI

2

Có sử dụng
sữa rửa
mặt không


USE

3

Sử dụng
nhãn hiệu
nào?

4

Sử dụng
sữa rửa
mặt vào khi
nào?

Mô tả
biến số
Vùng địa lý

Các giá trị
mã hóa

Mô tả các giá trị mã
hóa

1
2
3
4


Hà Nội
Đà Nẵng
TP.HCM
Cần Thơ

1
2


Không

BRAND

Nhãn hiệu
đang dùng

1
2
3
4
5
6
7

Pond’s
Hazeline
Biore
Lana
Nivea
Naco

Loại khác

TIME

Thời điểm
sử dụng

1
2
3
4
5

Sáng sớm khi thức dậy
Buổi sáng
Buổi trưa
Buổi chiều
20
Tối trước khi ngủ


Câu hỏi
(biến)

Ý nghĩa câu hỏi

Q1

Giới tính đáp viên


1
2

Nam
Nữ

Q2

Nghề nghiệp đáp viên

1
2
3
4
5
6
7

Bác sĩ
Giáo viên
Nhân viên văn phòng
Công nhân
Hưu trí
Học sinh-sinh viên
Khác-----

-----------

-----------------


-----------

------------------------------

Q22a

Đánh giá về bao bì
sản phẩm
Đánh giá về chất
lượng sản phẩm

Q20b

Giá trị
mã hóa

1
2
3

Mô tả giá trị mã hóa

Kém
Trung bình
Tốt
21


Ma trận dữ liệu
– Cột: là nơi quản lý các biến (các câu hỏi có

trong bảng câu hỏi)
– Loại câu hỏi một trả lời: chỉ cần một cột chứa
các giá trị trả lời
– Loại biến nhiều trả lời: nhiều cột chứa nhiều giá
trị trả lời có thể có
– Dòng: là nơi quản lý tất cả các quan sát (bằng
kích cỡ mẫu)
– Ô giao nhau giữa cột và dòng: là nơi chứa
đựng giá trị trả lời của một câu hỏi trong một
quan sát cụ thể.
22


23


7.4 Làm sạch dữ liệu

24


Làm sạch dữ liệu
 Dữ liệu sau khi nhập xong, chưa
thể đưa ngay vào xử lý
 Nhằm phát hiện các sai sót do
người kiểm soát chưa phát hiện
ra hoặc do nhập liệu

25



×