84
Sai số không lấy mẫu (sai số khác)
Sai số không lấy mẫu liên quan đến bất kỳ sự việc gì (ngoài sai số lấy mẫu) có thể làm xuất
hiện các sai số hay độ chệch trong kết quả nghiên cứu. Những sai số này bao gồm:
- Lập báo cáo không chính xác.
- Xác định vị trí hiện tại của người trả lời không đúng.
- Lý giải sai các vấn đề do dùng từ ngữ mập mờ.
- Người tr
ả lời bỏ dỡ nửa chừng do cảm thấy quá lâu, quá vô vị.
- Người phỏng vấn chỉ dẫn, hoặc giải thích các hướng dẫn sai; ghi chép không đầy đủ.
- Do sai lầm khi hiệu chỉnh và mã hóa dữ liệu.
Để giảm thiểu các sai số khi lấy mẫu này, Lipstein đã cung cấp một số hướng dẫn tổng quát như
sau:
- Dùng mẫu điều tra càng dễ tiến hành điều tra càng tốt.
- Sử dụng phương pháp chọn mẫu thích hợp với đối tượng nghiên cứu.
- Chỉ giới hạn các câu hỏi cần thiết cho những vấn đề chính của cuộc điều tra.
- Kiểm tra trước các câu hỏi.
- Cố gắng giảm thiểu sự mệt mỏi của những người tham gia trả lời.
- Cố gắng xoay quanh các câu hỏi then chốt để phát hiện xem khi nào thì người trả
lời bắt đầu
thấy mệt mỏi.
- Thiết lập những cách thức để khiến cả người trả lời và người phỏng vấn tập trung tâm trí của
mình vào cuộc nghiên cứu.
- Không đặt câu hỏi khi người được hỏi thật sự không thể trả lời được; không yêu cầu họ
những điều không thể làm được.
CÁC PHƯƠNG PHÁP CHỌN MẪU
Phương pháp chọn m
ẫu phi xác suất
Chọn mẫu thuận tiện
Theo cách chọn mẫu này, người nghiên cứu chọn ra các đơn vị lấy mẫu dựa vào “sự thuận tiện”
hay “tính dễ tiếp cận”. Với phương pháp chọn mẫu thuận tiện, rất khó xác định tính đại diện
của mẫu. Sự lựa chọn các đơn vị mẫu mang tính chủ quan của người nghiên cứu, vì thế độ
chính xác và độ tin cậ
y không cao, ít được sử dụng rộng rãi.
Chọn mẫu tích lũy nhanh
Theo phương pháp này, những đơn vị lấy mẫu (hay phần tử) ban đầu được lựa chọn bằng cách
sử dụng các phương pháp xác suất, nhưng những đơn vị bổ sung tiếp đó được xác định từ thông
tin được cung cấp bởi các đơn vị lấy mẫu ban đầu (quy nguyên). Dù phương pháp xác suất nào
được sử dụng để l
ựa chọn những đơn vị lấy mẫu ban đầu, thì toàn bộ mẫu vẫn được coi là mẫu
phi xác suất vì những quy nguyên theo sau được chứa đựng trong mẫu ấy.
Kích thước mẫu và thời gian hao phí giảm đi là những thuận lợi chủ yếu của kỹ thuật lấy mẫu
tích lũy nhanh. Tuy nhiên cách chọn mẫu “nhờ giới thiệu” này có thể có sai lệch vì những
người được giới thiệu ra thườ
ng có một số đặc điểm tương đồng về nhân khẩu học hay tâm lý,
85
sở thích. Do đó, phương pháp này chỉ được sử dụng khi các phần tử mà chúng ta muốn nghiên
cứu rất khó tìm.
Chọn mẫu phán đoán
Theo phương pháp chọn mẫu phán đoán, những đơn vị của mẫu được chọn dựa vào điều mà
nhà chuyên môn suy nghĩ có thể thỏa mãn một tiêu chuẩn nào đó. Có hai hình thức lựa chọn
phán đoán: lấy mẫu theo dư luận và phán đoán thống kê.
Chọn mẫu ki
ểm tra tỷ lệ
Chọn mẫu kiểm tra tỷ lệ là phương pháp chọn mẫu mà trong đó người nghiên cứu cố gắng bảo
đảm mẫu được lựa chọn có một tỷ lệ tương ứng với tỷ lệ tổng thể theo các tham số quan trọng
nào đó (tuổi tác, giới tính, nghề nghiệp ). Các phần tử trong mẫu cũng được chọn theo chủ ý
của người nghiên cứu ch
ứ không phải dựa vào quy luật ngẫu nhiên. Chẳng hạn, nếu xác định
kích thước mẫu cần điều tra là 100, và giới tính là một tham số quan trọng đối với nội dung
điều tra (chẳng hạn việc sử dụng kẹo sôcola); khi đó, nếu biết được tỷ lệ giới tính nữ - nam của
tổng thể là 51:49 (tỷ lệ bách phân) thì mẫu được chọn sẽ có 51 nữ và 49 nam. Đây là một ví dụ
đơn giản; trong thực tế, tùy thuộc nội dung điều tra, người ta xác định tỷ lệ theo nhiều tham số:
tuổi tác - giới tính - thu nhập
Phương pháp chọn mẫu xác suất
Phương pháp chọn mẫu xác suất thực hiện việc chọn các phần tử của mẫu dựa trên việc sử dụng
các quy luật phân phối xác suất trong thống kê toán. Tuy nhiên, trong phần này do đối tượng
nghiên cứu của môn học nên không trình bày tỉ
mỉ như trong thống kê học, mà chủ yếu giới
thiệu phương pháp để trên cơ sở đó có thể lựa chọn phương pháp chọn mẫu thích hợp cho từng
mục tiêu nghiên cứu marketing.
Chọn mẫu ngẫu nhiên đơn giản
Chọn mẫu ngẫu nhiên là một quá trình chọn lựa mẫu sao cho mỗi đơn vị lấy mẫu trong cấu trúc
có một cơ hội hiện diện trong mẫu bằ
ng nhau.
Chọn mẫu ngẫu nhiên có hai loại: chọn mẫu ngẫu nhiên có sự thay thế hoặc là không có sự thay
thế. Trong lấy mẫu ngẫu nhiên có sự thay thế thì một phần tử đã được chọn luôn luôn được thay
thế trước khi thực hiện sự lựa chọn kế tiếp. Cách này có khả năng lấy trên cùng một cá thể
nhiều lần. Do vậy, trong nghiên cứu marketing, lấy mẫu ngẫu nhiên không thay thế được sử
dụng chủ yếu.
Ưu điểm của phương pháp chọn mẫu ngẫu nhiên đơn giản là dễ hiểu, dễ thực hiện; trung bình
mẫu là một sự tính toán khách quan của trung bình tổng thể nghiên cứu; phương pháp tính toán
đơn giản, dễ dàng.
Nhược điểm của phương pháp chọn mẫu ngẫu nhiên:
- Trong nhiều trường hợp, sự biến thiên của tổng thể nghiên cứu rất r
ời rạc và không theo quy
tắc, thì lấy mẫu ngẫu nhiên không được dùng đến vì nó kém chính xác; mẫu có thể không
mang tính đại diện, hoặc bị lệch.
- Để lựa chọn các phần tử, cần phải đánh dấu và lập danh sách tòan bộ tổng thể để sử dụng
bảng số ngẫu nhiên, bốc thăm, quay số, công việc này khó thực hiện được khi tổng thể là
qúa lớn.
- Mẫu được chọn có th
ể bị phân tán, do vậy tốn kém chi phí và khó khăn trong đi lại khi thu
thập dữ liệu.
86
Phương pháp chọn mẫu ngẫu nhiên đơn giản được áp dụng có kết quả khi tổng thể nghiên cứu
không phân tán quá rộng về mặt địa lý; các phần tử trong tổng thể có khá nhiều sự đồng nhất về
đặc điểm muốn nghiên cứu.
Chọn mẫu ngẫu nhiên phân tầng
Khi tổng thể nghiên cứu được cấu tạo bởi nhiều tập hợp không đồng nhất liên quan đến nhữ
ng
đặc điểm nghiên cứu, để thực hiện lấy mẫu cần phải phân tầng tổng thể nghiên cứu thành từng
nhóm có những đặc điểm tương đồng. Lấy mẫu phân tầng là chọn một mẫu ngẫu nhiên đơn
giản từ mỗi nhóm trong tổng thể nghiên cứu.
Tùy theo đặc điểm nghiên cứu, tổng thể có thể được phân tầng theo nhiều tiêu thức khác nhau;
và có thể phân t
ầng một cấp (một tiêu thức) hoặc nhiều cấp (nhiều tiêu thức); và khi chọn mẫu
ngẫu nhiên phân tầng có thể theo tỷ lệ (tỷ lệ mẫu tương ứng với tỷ lệ tổng thể) hoặc không theo
tỷ lệ.
Ưu điểm của phương pháp chọn mẫu ngẫu nhiên phân tầng: sự phân nhóm có thể làm gia tăng
mức độ chính xác của việc đánh giá các đặc đi
ểm tổng thể nghiên cứu; thực hiện thuận tiện,
phân tích số liệu khá toàn diện.
Nhược điểm của phương pháp này là cần phải lập danh sách các đơn vị lấy mẫu theo từng nhóm;
tốn kém chi phíđi lại, đặc biệt khi tổng thể nghiên cứu trải rộng trên một vùng địa lý rộng lớn.
Với những ưu điểm và nhược điểm trên, phương pháp chọn m
ẫu ngẫu nhiên phân tầng thường
được áp dụng khi tổng thể nghiên cứu có sự phân bố của đặc điểm nghiên cứu rất rời rạc, hay
tập trung trên những điểm nhỏ bị phân tán của tổng thể.
Chọn mẫu có hệ thống
Chọn mẫu có hệ thống với sự bắt đầu ngẫu nhiên là một phương pháp chọn mẫu được tiến hành
bằng cách l
ấy từng đơn vị thứ k từ một tổng thể nghiên cứu có thứ tự. Đơn vị đầu tiên được
chọn một cách ngẫu nhiên, k được gọi là khoảng cách lấy mẫu, số nghịch đảo 1/k là tỷ lệ lấy
mẫu.
Ưu điểm của phương pháp chọn mẫu có hệ thống là mẫu được thiết lập dễ dàng, dễ thực hiện
trên hiệ
n trường (điều tra theo đường phố), mẫu được phân tán đều khắp tổng thể nghiên cứu và
kết quả tính toán chính xác hơn so với lấy mẫu ngẫu nhiên đơn giản.
Nhược điểm của phương pháp chọn mẫu này là: có thể một mẫu được lấy chỉ bao gồm những
đơn vị có cùng một dạng, và cần thiết phải có danh sách các đơn vị lấy mẫu theo thứ tự
.
Vì thế phương pháp chọn mẫu có hệ thống thường được áp dụng khi thứ tự của các đơn vị lấy
mẫu là ngẫu nhiên, gần như có sự phân nhóm trong tổng thể nghiên cứu.
Chọn mẫu theo cụm
Chọn mẫu theo cụm là phương pháp chọn mẫu được tiến hành bằng cách lấy những nhóm riêng
biệt hoặc những cụm của những đơn vị nhỏ hơn. Nhữ
ng cụm của mẫu có thể được chọn bằng
cách lấy mẫu ngẫu nhiên hay lấy mẫu có hệ thống với một sự khởi đầu ngẫu nhiên.
Tương tự với nhóm trong lấy mẫu ngẫu nhiên phân tầng, các cụm là các nhóm phụ riêng biệt
với nhau cùng tạo nên tổng thể nghiên cứu. Tuy nhiên, không giống như nhóm, các cụm được
tạo nên bởi những phần tử dị biệt, không đồng nhất, miễ
n sao mỗi nhóm sẽ là đặc trưng của
tổng thể nghiên cứu. Ví dụ, nghiên cứu về sinh viên trong một trường đại học, thay vì chọn các
phần tử là sinh viên theo kích thước mẫu, có thể chọn đơn vị lấy mẫu là lớp; do vậy không cần
phải lập danh sách sinh viên, mà lập danh sách các lớp. Khi thực hiện điều tra, thì tất cả sinh
viên trong một lớp được chọn đều được tiếp xúc.
87
Ưu điểm của phương pháp chọn mẫu theo cụm là không cần thiết phải xây dựng một danh sách
tất cả các phần tử trong tổng thể nghiên cứu, mà cấu trúc đối với lấy mẫu theo cụm là một danh
sách các cụm. Ngay cả khi danh sách các phần tử đã có sẵn, việc lấy mẫu theo cụm vẫn ít tốn
kém hơn về chi phí.
Nhược điểm của phương pháp này là ở chỗ trong th
ực tế, lấy mẫu theo cụm không hiệu quả
bằng lấy mẫu ngẫu nhiên hay phân tầng. Chẳng hạn, những hộ gần kề nhau thường có đặc điểm
tương tự nhau hơn những hộ riêng biệt. Điều này sẽ ảnh hưởng đến tính đại điện của mẫu, và
được thể hiện qua sai số chọn mẫu tăng.
Phương pháp chọn mẫ
u theo cụm được áp dụng khi danh sách đầy đủ các phần tử trong tổng
thể nghiên cứu không có sẵn, hoặc khi chi phí điều tra thấp được xem là quan trọng hơn so với
yêu cầu về sự chính xác.
Chọn mẫu nhiều giai đoạn
Việc chọn mẫu được thực hiện qua hai hay nhiều giai đoạn. Trước hết, tổng thể nghiên cứu
được phân ra thành những đơn vị của giai đoạn đầu tiên, từ đó tiến hành chọn mẫu, và sau đó
có thể tăng thêm nhiều giai đoạn qua việc phân chia tổng thể nghiên cứu thành nhiều cấp bậc
của những đơn vị lấy mẫu tương ứng với mỗi giai đoạn lấy mẫu khác nhau.
Ví dụ: Giả định muốn chọn một mẫu 30 hộ từ một thành phố nào đó, và thành phố được phân
thành 10 khu phố, mỗi m
ột khu phố có 10 hộ. Cách làm như sau:
(1) Đánh số các khu phố từ 1 - 10.
(2) Dùng bảng số ngẫu nhiên lấy 5 số ngẫu nhiên; tương ứng là các khu phố được chọn.
(3) Đánh số thứ tự các hộ, liên tục từ 1 đến 10 trong cấu trúc của các khu phố được chọn.
(4) Lấy 5 nhóm số ngẫu nhiên, với mỗi nhóm gồm 6 số trong từng khu phố được chọn.
(5) Chọn 6 hộ theo nhóm số ngẫu nhiên ban đầ
u; sau đó chọn 6 hộ ở nhóm số ngẫu nhiên tiếp
theo đến khi đủ 30.
Ưu điểm của phương pháp lấy mẫu này là có tính hiệu quả và linh hoạt hơn lấy mẫu một giai
đoạn. Ngoại trừ những đơn vị của giai đoạn thứ nhất, cấu trúc mẫu chỉ yêu cầu đối với những
đơn vị đã chọn để lấy những đơn vị phụ.
Nhược điểm: Lý thuyết phức tạp khi áp dụng trên hiện trường; qui trình tính toán khó khăn cho
những người không phải là chuyên viên thống kê.
Phương pháp lấy mẫu theo nhiều giai đoạn được áp dụng khi danh sách của các đơn vị lấy mẫu
không có sẵn, tổng thể nghiên cứu trải rộng trên vùng rộng lớn.
Những lưu ý đối với việc chọn mẫu
Hiệu quả l
ấy mẫu
Một mẫu được coi là có hiệu quả thống kê hơn một mẫu khác (theo phương pháp chọn mẫu
khác nhau) khi có cùng một kích thước mẫu nhưng sai số trung bình nhỏ hơn. Nói cách khác,
một mẫu có hiệu quả thống kê hơn, khi ở mức chính xác đã cho (sai số tiêu chuẩn) thì có kích
thước mẫu nhỏ hơn.
Một mẫu được coi là có hiệu quả kinh tế hơn mẫu khác, khi với một độ chính xác mong muốn,
phí tổn điều tra là thấp hơn. Một cách lý tưởng, người nghiên cứu luôn muốn đạt được độ chính
xác cao với một phí tổn thấp. Tuy nhiên, trên thực tế, sự chính xác có liên quan kích thước mẫu,
nghĩa là sự chính xác càng lớn thì phí tổn càng cao.
88
Kích thước mẫu trong chọn mẫu phi xác suất
Quyết định về kích thước mẫu trong chọn mẫu phi xác suất thường được xác định một cách chủ
quan chứ không dựa theo công thức tính toán như chọn mẫu xác suất. Người nghiên cứu quyết
định kích thước mẫu mà theo cảm tính của họ là đại diện cho tổng thể. Trong nhiều cuộc nghiên
cứu, sự hạn chế về tài chính là yếu tố quan trọng nhấ
t đối với việc xác định kích thước mẫu
thích hợp.
Khảo sát một tham số và khảo sát nhiều tham số
Khi xác định kích thước mẫu trong phương pháp xác suất, điều quan trọng là lựa chọn tham số
nào để tính toán, bởi vì kích thước mẫu được xác định theo tham số này chưa chắc chắn là phù
hợp với tham số khác.
Trên thực tế, khi sử dụng bản câu hỏi, người nghiên cứu thường chọn m
ột vấn đề mà họ cho là
quan trọng nhất (vấn đề then chốt của cuộc nghiên cứu), và dựa trên vấn đề đó, sẽ xác định kích
thước mẫu tương xứng.
Vấn đề về tỷ lệ trả lời
Hiếm có một cuộc điều tra nào mà số lượng bản câu hỏi gửi đi (theo kích thước mẫu được
chọn) bằng với số lượng bả
n câu hỏi thu về, tức là tỷ lệ không trả lời luôn luôn tồn tại, và do
vậy sẽ làm giảm kích thước mẫu, tương ứng là sai số gia tăng. Sự không trả lời có thể do là bản
câu hỏi không đến được nơi nhận hoặc người nhận được bảng câu hỏi từ chối trả lời. Chính vì
thế, các nỗ lực nhằm gia tăng tỷ lệ trả lời luôn là vấn
đề quan trọng để giảm bớt sai số do không
trả lời. Sau đây là một số giải pháp nhằm cố gắng gia tăng tỷ lệ trả lời:
- Gửi thư trước để thông báo cho người phỏng vấn và đề nghị họ hợp tác.
- Khi gửi thư, cần lưu ý hình thức và chất lượng bao thư, tem.
- Sự động viên bằng tiền hoặc tặng phẩm sẽ làm gia tă
ng tỷ lệ trả lời.
- Đối với các vấn đề riêng tư cần đảm bảo việc dấu tên hay giữ bí mật.
- Nên có những cuộc tiếp xúc sau khi người trả lời đã nhận được bản câu hỏi.
- Huấn luyện, tuyển chọn nhân viên phỏng vấn kỹ lưỡng sẽ góp phần tăng hiệu quả tiếp xúc.
TỔ CHỨC THU THẬP DỮ LIỆU
Sau khi lập kế hoạch thu thập dữ liệu và chọn mẫu nghiên cứu hoàn tất, việc thu thập dữ liệu
bắt đầu. Trong giai đoạn thu thập dữ liệu cần đạt được hai mục tiêu:
- Phải tối đa hóa việc thu thập dữ liệu từ các đối tượng được hỏi ý kiến.
- Cố gắng giảm đến mức tối thiểu những sai sót thuộc nhiều đố
i tượng khác nhau.
Để đạt được những mục tiêu trên, người nghiên cứu phải luôn đối phó với ba vấn đề sau:
- Thời gian: Thời gian để tiến hành thu thập dữ liệu luôn bị hạn chế và chi phối đến khả năng
tiếp xúc được các đối tượng cần hỏi ý kiến.
- Ngân sách: Chi phí có thể không đủ để trang trải hoặc bị cắt giảm nên khó có thể thực hiện
được công vi
ệc một cách đầy đủ theo ý muốn.
- Môi trường thu thập dữ liệu: Con người rất khác nhau về trí nhớ, động cơ hành động, mức độ
tích cực, sự tự cao và sự nghi ngờ. Tất cả các biến số kể trên đều có thể làm giảm tính chính
xác của những thông tin thu thập được.
Trong phần này, chúng ta sẽ đề cập đến công tác thu thập dữ liệu tại hiện trường.
89
Tổ chức thu thập dữ liệu tại hiện trường
Có nhiều cách để thu thập dữ liệu ban đầu như đã được trình bày trong chương III, phần này tập
trung vào việc phác thảo quy trình thực hiện một phương pháp thu thập dữ liệu đã được quyết
định lựa chọn trong dự án nghiên cứu.
Quan sát
Chương trình quan sát:
Chương trình quan sát có thể được xác định chi tiết gồm việc trả lời các câu hỏi sau:
- Ai? Nhà nghiên cứu phải cung cấp những đặc điểm để có thể xác định đối tượng quan sát.
- Cái gì? Xác định các chi tiết cơ bản để quan sát viên biết phải ghi chép điều gì.
- Khi nào? Thời gian được chỉ định để quan sát. Quan sát vào một ngày hay một tuần đặc biệt,
quan sát trong một khoảng thời gian nhất định (ví dụ một giờ quan sát 30 phút).
- Ở đâu? Quan sát viên phải được biết c
ần quan sát ở đâu, địa chỉ, địa điểm quan sát.
- Cách nào? Cách hành động để quan sát đối tượng, có thể cho biết hay không cho biết sự hiện
diện của quan sát viên.
Phỏng vấn cá nhân trực tiếp
Phỏng vấn cá nhân trực tiếp là sự tiếp xúc cá nhân qiữa người phỏng vấn và đối tượng phỏng
vấn. Đây là phương pháp thuận lợi nhất để thu thập thông tin, đồng thời cũng là ph
ương pháp
đắt tiền và tốn thời gian, đôi khi dễ phạm sai lầm nhất.
Bản chất của việc phỏng vấn là một tiến trình tiếp xúc giữa hai cá nhân, trong đó một người cố
gắng rút ra những dữ liệu hay phản ứng, quan điểm của một người khác (đối tượng).
Quá trình phỏng vấn cá nhân trực tiếp bao gồm nhiều công việc có thể tóm tắt như sau:
- Thực hi
ện một chương trình mẫu trên một vùng được xác định và gặp gỡ những người được
chọn phỏng vấn.
- Phân phát những bảng câu hỏi phù hợp với bản hướng dẫn.
- Ghi chép những phản ứng của người trả lời một cách chính xác theo những phương thức đã
được hướng dẫn.
- Chuyển dữ liệu thu thập được về trung tâm xem xét và xử lý trong thời gian qui định.
- Hoàn thành công tác nghiên cứu trên hiện trường theo kinh phí đã cấp.
Phỏng vấn bằng điện thoại
Với phương pháp này, người phỏng vấn và đối tượng chỉ tiếp xúc qua giọng nói. Việc phỏng
vấn qua điện thoại được tiến hành qua các bước công việc như sau:
- Gọi số điện thoại được liệt kê trong chương trình lấy mẫu, tìm gặp người đã được xác định
trong chương trình đó.
- Khi gặp người đó truyền đạt bản câu hỏi kèm với bản hướng dẫn.
- Ghi chép chính xác phản ứng của đối tượng theo cách được trình bày trong bản hướng dẫn.
- Chuyển câu hỏi đã được trả lời hoàn tất cho người có trách nhiệm xử lý dữ liệu.
90
Phỏng vấn bằng thư tín
Trong điều tra bằng thư tín, việc tiếp xúc với đối tượng được thực hiện qua bưu điện, không sử
dụng người phỏng vấn - trung gian nên việc truyền thông trực tiếp và đơn giản hơn. Tất cả công
việc được chuyển cho những người ở văn phòng trung tâm và được tiến hành cụ thể như sau:
- Sưu tầm hoặ
c mua danh sách, địa chỉ của các loại đối tượng cần thiết cư trú trong vùng được
chọn làm mẫu.
- Ghi địa chỉ lên bì thư, bỏ bản câu hỏi và những tài liệu khác vào và gửi cho những người
được chọn để phỏng vấn. Trong một thời gian qui định, với những đối tượng không trả lời thì
gửi thư lần nữa với bản câu hỏi kèm theo và lời yêu cầu gửi thư tr
ả lời.
- Xem xét các bản câu hỏi nhận được và chuẩn bị xử lý dữ liệu.
Sự thành công của việc nghiên cứu bằng thư tín phụ thuộc vào hai yếu tố:
- Bản câu hỏi được soạn thảo và những thông tin hướng dẫn.
- Sự giám sát của nhà nghiên cứu.
Những sai lầm thường xảy ra khi nghiêm cứu thực địa
Hai mục tiêu của nghiên cứu tại hiện trường là khai thác tối đa nguồn dữ liệu thích hợp và giảm
thiểu những sai sót của người phỏng vấn. Trong phần này chúng ta bàn đến những sai lầm có
khả năng xảy ra là việc bóp méo và diễn tả vô căn cứ những thông tin mà đối tượng đã cung
cấp. Nếu nhà nghiên cứu hiểu biết về những loại sai lầm có thể có ở hiện trường, họ có thể ngăn
ngừa để giả
m bớt những sai lầm đó.
Trong nghiên cứu hiện trường thường mắc những sai lầm do những nguyên nhân sau đây:
Sai lầm do lựa chọn đối tượng
Việc lựa chọn thành phần thực hiện mẫu có thể đưa đến 3 loại sai lầm:
- Thu thập thông tin ở nơi không thích hợp.
- Thu thập thông tin ở những người không thích hợp.
- Bỏ qua những thông tin của những người lẽ ra phả
i được phỏng vấn trong mẫu.
Đối với từng loại thông tin (trực tiếp, qua điện thoại và qua thư tín), khả năng xảy ra các loại sai
lầm này có thể khác nhau:
- Phỏng vấn cá nhân trực tiếp phải đối phó với những sai lầm do phỏng vấn sai chỗ và sai đối
tượng, nhưng loại sai làm này có thể giám sát trong chừng mực nhất định nào đó.
- Phỏng vấn qua điện thoại có nhiề
u rủi ro do phỏng vấn nhầm người. Cần phải có những câu
hỏi khởi đầu để xác định đúng đối tượng, tuy nhiên việc kiểm tra này khó thực hiện được
trong việc phỏng vấn bằng thư.
Sai lầm do thực hiện không đầy đủ
Sai lầm này phổ biến cả 3 phương pháp nghiên cứu:
- Trong phương pháp thư tín thường có những thư được trả về do không có người nhậ
n và điều
này không thể sửa được. Trong chừng mực nào đó sai lầm này có thể tránh được bằng cách
loại những địa chỉ lỗi thời ra khỏi danh sách.
- Trong phương pháp phỏng vấn trực tiếp, không thực hiện đầy đủ vẫn xảy ra do người phỏng
vấn bỏ sót một số đơn vị dân cư hoặc cố lãng tránh một số đơn vị khác.
91
- Trong phương pháp điều tra bằng điện thoại, người phỏng vấn có thể không tiếp xúc được
với tất cả các đối tượng phỏng vấn qua điện thoại do có một số người không có ở nhà và có
những hộ không có điện thoại. Khi những người này đóng vai trò quan trọng trong dự án
nghiên cứu thì sai lầm do không thực hiện đầy đủ này trở nên đáng kể, ảnh hưởng
đến độ
chính xác của kết quả.
Sai lệch do không trả lời
Không trả lời là những sai lệch thường gặp nhất trong lấy mẫu tại hiện trường. Lý do là:
- Không tiếp xúc được với đối tượng do họ vắng mặt hoặc không nỗ lực tiếp xúc với họ.
- Người được tiếp xúc không cung cấp những thông tin mong muốn.
Do những sai lệch nêu trên nên trong mọi cuộc nghiên cứu việc lấ
y mẫu chính xác là vấn đề cần
luôn được quan tâm và xem xét cẩn thận.
Với phương pháp phỏng vấn bằng điện thoại thì sai lệch không trả lời ít xảy ra và ít phức tạp
hơn, tỷ lệ trả lời thường cao hơn. Còn đối với phương pháp phỏng vấn qua thư, tỷ lệ trả lời
thường rất thấp, khoảng từ 15 - 30% và thông thường thì dữ liệu thu thập được có th
ể không có
tính tiêu biểu và không đúng đối tượng (người trả lời thư chưa hẳn là đối tượng mà cuộc phỏng
vấn hướng đến, ví dụ con cái trả lời thay bố, mẹ )
Các phương pháp nâng cao tỷ lệ trả lời và giảm các sai sót:
- Đối với phỏng vấn cá nhân trực tiếp: Trong phỏng vấn cá nhân trực tiếp thường gặp hai khó
khăn là: tìm địa chỉ và đến nhà người đã chọn m
ẫu phỏng vấn; và khi đã tìm được, họ có
chấp thuận cho phỏng vấn hay không?
Có thể giải quyết bằng hai cách:
+ Gọi điện thoại báo trước: Cách này tốn kém nhưng trong trường hợp phỏng vấn những
nhân vật có vai trò quan trọng đối với cuộc nghiên cứu thì nên làm.
+ Viết thư báo trước cho người sẽ được phỏng vấn về tính chất, tên người phỏng vấn và thời
gian phỏng vấ
n.
Để được chấp thuận trả lời phỏng vấn, đơn vị tổ chức nghiên cứu có thể sử dụng các thủ
thuật và các biện pháp thích hợp cho từng trường hợp như:
+ Trả tiền cho người được phỏng vấn trong mỗi cuộc phỏng vấn.
+ Điện thoại xin phỏng vấn chỉ một số ít câu hỏi mà thôi. Nếu được đồng ý nhân viên phỏng
vấ
n đến và có thể hỏi nhiều hơn đã giao hẹn.
+ Gọi điện thoại vào những thời điểm khác nhau trong ngày hoặc xếp lịch phỏng vấn trước
để giảm chi phí.
Khi phỏng vấn chung nhiều người với một mẫu tổng quát, có thể đi đến những nơi có nhiều
người mua sắm và tiến hành phỏng vấn thật nhanh và gọn (không dùng trong trường hợp
phải lấy ý ki
ến của những khách hàng đặc biệt).
- Đối với phỏng vấn bằng điện thoại:
Phỏng vấn bằng điện thoại gặp khó khăn lớn nhất là những số điện thoại được chọn lại không
có trong danh bạ. Phương pháp xử lý trong trường hợp này đơn giản là chọn lại, cũng theo
phương pháp ngẫu nhiên.
- Đối với thăm dò ý kiến bằng th
ư:
92
Nhược điểm chính của phương pháp này là tỷ lệ không hồi đáp cao. Cách khắc phục:
+ Có những nỗ lực theo dõi bằng gửi thư nhắc (từ 2 - 3 lần), gửi thiệp nhắc, hoặc dùng điện
thoại nhắc (cần hết sức tế nhị).
+ Tiến hành thu thập dữ liệu tập trung vào một nhóm người đã có quan hệ với công ty trước,
sẵn sàng hợp tác với công ty.
+ Nế
u kết hợp phương pháp khảo sát bằng thư với phương pháp bằng sổ ghi chép thì độ
chính xác sẽ tăng lên.
Những sai sót trong giao tiếp giữa người phỏng vấn và người được phỏng vấn
Trong quá trình hỏi và trả lời, người phỏng vấn đặt câu hỏi và người được phỏng vấn trả lời,
khi đó những sai lầm trong giao tiếp giữa hai bên có thể xảy ra và ảnh hưởng đến tính chính xác
của cuộc điều tra. Những sai sót này bao gồm:
- Nếu không có mối quan hệ tốt giữa hai bên, đối tượng phỏng vấn sẽ e dè không trả lời, hoặc
không chú ý đến câu hỏi. Có thể tạo tin tưởng bằng giấy giới thiệu của công ty.
- Nếu hai bên quen biết nhau khá rõ thì người được phỏng vấn sẽ bị ảnh hưởng của người
phỏng vấn và ngược lại, làm giảm tính khách quan của cuộc
điều tra.
- Người phỏng vấn không theo sát yêu cầu hướng dẫn của bảng câu hỏi, không giải thích về
tính chất của cuộc điều tra, hoặc có giải thích nhưng không chính xác.
- Các câu hỏi có thể bị bỏ bớt vì quá vội hay vì cẩu thả.
- Người được phỏng vấn trả lời không sát với yêu cầu, cung cấp những thông tin không cần
thiết, trả lời không nhất quán hoặc không đủ khả
năng để trả lời (khả năng diễn đạt).
Những sai sót trong lúc ghi chép
Trong quá trình ghi chép, người phỏng vấn có thể có quá ít thời gian hoặc không đủ chỗ để ghi
mà phải dùng cách viết tắt hoặc ghi thật nhanh nên đã xảy ra một số sai sót làm ảnh hưởng đến
nội dung của cuộc phỏng vấn. Những sai sót thường gặp là:
- Người phỏng vấn dùng câu trả lời của mình thay cho câu trả lời của ng
ười được phỏng vấn
hoặc sửa đổi theo cách nhìn, cách hiểu của mình.
- Đánh dấu sai sót trong các câu hỏi trắc nghiệm.
- Trong những cuộc phỏng vấn có tính cách thân mật phải chờ đến khi kết thúc mới bắt đầu
ghi chép, thì khi đó việc ghi chép rất dễ mắc sai lầm (không thể nhớ hết nội dung).
- Những câu hỏi có nhiều cách trả lời trên điện thoại gây nhiều khó khăn cho việc ghi chép vì
người phỏng vấn vừa phải lôi cuốn sự chú ý của người trả lời vừa phải ghi chép.
Sự giả mạo
- Đôi khi người phỏng vấn đưa ra những câu hỏi giả vờ vì họ thấy rằng người trả lời không thể
trả lời hoặc bỏ sót câu hỏi.
- Làm giả cuộc phỏng vấn. Việc làm giả cuộc phỏng vấn thường xảy ra khi người phỏng vấn
phải thu thập dữ liệu tại vùng quá xa xôi mà người tổ chức nghiên cứu không thể giám sát
được. Có thể hạn chế sự giả mạo bằng cách tuyển chọn những người đáng tin cậy và dùng
những phương pháp quản trị hữu hiệu.
93
Quản trị việc thu thập dữ liệu tại hiện trường
Quản trị tốt giữ vai trò quan trọng trong sự thành công của công tác phỏng vấn. Các chương
trình nghiên cứu sử dụng phương pháp phỏng vấn cá nhân trực tiếp phải được quản lý thật tốt vì
nơi phỏng vấn có thể ở xa, số lượng người phỏng vấn nhiều do đó có thể làm tăng khả năng
sai l
ầm và giảm tính hiệu quả.
Việc quản trị thực hiện theo 5 giai đoạn sau:
(1) Khảo sát thử.
(3) Tuyển chọn nhân viên.
(4) Hướng dẫn nhân viên.
(5) Giám sát.
(6) Kiểm tra.
Khảo sát thử
Khảo sát thử là việc áp dụng toàn bộ những phương pháp thu thập dữ liệu đối với một nhóm
người được lựa chọn giống như việc tiến hành một dự án nghiên cứu trong thực tế.
Qua khảo sát thử, người chỉ đạo việc thu thập dữ liệu có thể khám phá ra những điểm cần điều
chỉnh như: việc trình bày mục đích phỏng vấn không rõ ràng, sắp xếp các câu hỏi không đúng
thứ tự, dùng những từ khó hiểu, hỏi những câu hỏi không có trong bảng câu hỏi, không đủ khả
năng kích thích việc trả lời và tiến hành việc điều chỉnh bằ
ng cách tuyển chọn lại những
người phỏng vấn cho phù hợp với thực tế, loại bỏ những hướng dẫn không rõ ràng và sửa chữa
những khuyết điểm, sai sót khác.
Tuyển chọn nhân viên
Người phỏng vấn được giao nhiệm vụ thu thập dữ liệu nên đòi hỏi họ phải có nghiệp vụ phỏng
vấn vững thì chất lượng, tính chính xác của dữ liệu thu thậ
p mới cao.
Những tiêu chuẩn sau đây cần được xem xét khi tuyển chọn nhân viên phỏng vấn:
(1) Học vấn: Phải đọc và viết khá, có trình độ phổ thông hoặc đại học.
(2) Giới tính : Nữ được ưu tiên hơn nam. Đa số người phỏng vấn là nữ vì công việc phỏng vấn
thường có tính chất không thường xuyên và làm việc ngoài giờ.
(3) Giọng nói: Giọng phải êm nhẹ, dễ nghe khiến người được phỏng vấ
n cảm thấy dễ chịu lúc
tiếp xúc và làm việc.
(4) Kinh nghiệm: Người có kinh nghiệm được ưu tiên vì làm công việc hiệu quả hơn và việc
đào tạo thêm đỡ mất thời gian.
Hướng dẫn nhân viên
Việc hướng dẫn nhân viên nên bao gồm cả lý thuyết và thực hành. Tài liệu phải được viết rõ
ràng, dễ hiểu và thường bao gồm những điểm sau:
- Mục đích của cuộc nghiên cứ
u (không được cho biết người hoặc cơ quan tài trợ).
- Thời điểm bắt đầu và kết thúc.
- Số lượng người sẽ được phỏng vấn; chọn người ở đâu và cách chọn như thế nào; phải làm gì
để giải quyết những trường hợp người được phỏng vấn không có ở nhà.
- Cách tự giới thiệu và mở đầu cuộc phỏng vấn.
94
- Cách đặt câu hỏi, thứ tự câu hỏi.
- Phương pháp gợi ý và cách ghi nhớ.
- Cách xác định nội dung chính,những điểm cần quan tâm của một vấn đề.
- Cách nghiên cứu và sửa đổi một bảng câu hỏi trước khi nộp.
- Xử lý một bảng câu hỏi đã được trả lời.
- Khi nào người được phỏng vấn được trả lương, bao nhiêu?
- Tiêu chuẩn đánh giá chấ
t lượng công việc.
Qua quá trình huấn luyện, học viên sẽ được cung cấp những kiến thức và kỹ năng cần thiết. 4
phương pháp sau thường được các tổ chức sử dụng để huấn luyện nhân viên phỏng vấn:
- (1) Dùng tài liệu viết, sổ tay hướng dẫn.
- (2) Dùng các bài nói chuyện và các buổi phỏng vấn làm mẫu.
- (3) Thực tập trên lớp: Học viên thay nhau đóng vai trò người phỏng vấn và người tr
ả lời.
- (4) Thực tập thực tế: Đây là giai đoạn giúp người học viên làm quen với cộng việc cụ thể từ
cách gõ cửa đến cách rời nhà sau khi phỏng vấn.
Tổ chức huấn luyện trực tiếp tập trung là cách lý tưởng nhất, tuy nhiên trong một số trường hợp
có thể huấn luyện theo lối hàm thụ, hoặc không cần huấn luyện trực tiếp (công việc không có gì
mớ
i và người phỏng vấn đã có kinh nghiệm). Trong thực tế thường áp dụng cả hai phương
pháp. Thời gian huấn luyện thường thay đổi tùy theo từng dự án, có thể từ một vài giờ đến một
vài ngày.
Để đơn giản hóa quá trình thực hiện, trong quá trình thực hiện, chúng ta có thể áp dụng một số
biện pháp sau đây:
- (1) Người phỏng vấn có thể được trang bị thêm các bản giải thích, bản giới thiệ
u Các tài
liệu trên cùng với các biểu đồ, tranh ảnh, bản trắc nghiệm, các yêu cầu phải được trả lời sẽ
được trao cho người đi phỏng vấn.
- (2) Người đi phỏng vấn không cần đặt câu hỏi bằng lời mà chỉ đưa bản câu hỏi in sẵn để
người được phỏng vấn điền vào. Có thể đợi lấy hoặc trở lại nhận bản tr
ả lời sau một thời gian
nào đó.
- (3) Dùng băng ghi âm để giảm nhẹ công việc cho người phỏng vấn và làm cho việc ghi nhận
chính xác hơn, đặc biệt là trong những cuộc phỏng vấn có tính chuyên môn cao.
- (4) Hẹn trước bằng điện thoại trước khi đến nhà phỏng vấn.
- (5) Để tăng tính chính xác có thể áp dụng nhiều cách khác nhau để cải tiến cách soạn thảo
các câu hỏi làm cho người đọc dể hi
ểu hơn.
Tóm lại, khóa huấn luyện phải cung cấp cho học viên tất cả các kỹ năng, kiến thức có liên quan
đến công việc, làm cho họ hiểu rõ mục đích của cuộc phỏng vấn và cách để giải quyết những
tình huống bất ngờ.
Giám sát - Kiểm tra
Nhiệm vụ của những nhân viên giám sát:
- Huấn luyện, giúp đỡ, quan sát công việc.
- Sắp đặt chương trình và có thể lập bảng đị
a chỉ đến phỏng vấn.
95
- Mượn một số nhân viên phỏng vấn ở địa phương làm giúp nếu ở xa văn phòng trung tâm.
Người giám sát phải liên lạc thường xuyên với nhân viên phỏng vấn đang làm việc ở các địa
phương khác nhau, đồng thời phải báo cáo với công ty. Nhiệm vụ quan trọng nhất của công tác
giám sát là thu thập được những thông tin cần thiết để đánh giá việc hoạt động của nhân viên
phỏng vấn.
Đánh giá nhân viên phỏng vấn:
Nhân viên phỏng vấn có thể được đánh giá theo một số tiêu thức sau đây:
- Chi phí: Chi phí bao gồm thời gian (dùng để phỏng vấn, đi lại, giải quyết những công việc
hành chính), năng suất (được đánh giá qua một số lượng các cuộc phỏng vấn hoàn tất) và
cước phí đi đường.
- Tỷ lệ trả lời: Việc đánh giá tỷ lệ trả lời phải được thự
c hiện kịp thời, đúng lúc để có thể đề ra
các biện pháp sửa chữa kịp thời, thích hợp, do đó các bản báo cáo định kỳ về tỷ lệ từ chối là
rất quan trọng. Trong trường hợp một số người từ chối quá mức qui định, người giám sát
phải góp ý cho nhân viên ngay lập tức.
Phương pháp giám sát :
Trong phỏng vấn tại hiện trường, có 2 phương pháp để giám sát:
- Cùng đi vớ
i nhân viên phỏng vấn và quan sát.
- Nghe một số nhân viên phỏng vấn giới thiệu mở đầu.
Trong hai trường hợp trên, người giám sát có thể đưa ra những gợi ý để giải quyết các khó khăn
khi chúng xuất hiện.
- Chất lượng dữ liệu: Đánh giá chất lượng dữ liệu thông qua các yếu tố: dễ đọc, theo đúng
hướng dẫn, ghi đúng những gì người được phỏng vấn trả lờ
i và tóm tắt nội dung, ghi chép
đầy đủ giúp cho việc mã hóa được dễ dàng.
- Chất lượng cuộc phỏng vấn: Để biết cách nhân viên phỏng vấn thu thập dữ liệu, người giám
sát phải trực tiếp quan sát quá trình phỏng vấn và chú ý đến những điểm sau đây:
+ Giới thiệu thích hợp.
+ Hỏi câu hỏi chính xác.
+ Cách gợi ý trả lời tế nhị.
+ Mối quan hệ giữa hai bên.
TÓM TẮT
Để nghiên cứ
u các đặc điểm của một tổng thể, người ta có thể thực hiện điều tra toàn bộ. Tuy
nhiên ngân sách và thời gian thường có hạn, qui mô tổng thể lại thường lớn nên thích hợp hơn
là sử dụng một mẫu để điều tra.
Trong lấy mẫu người ta phân biệt giữa các kỹ thuật lấy mẫu theo phương pháp xác suất và các
kỹ thuật lấy mẫu theo phương pháp phi xác suất. Các k
ỹ thuật lấy mẫu theo phương pháp phi
xác suất dựa vào sự phán đoán của nhà nghiên cứu, những ước lượng không được dùng suy ra
cho tổng thể. Các kỹ thuật lấy mẫu phi xác suất thường dùng là lấy mẫu tiện lợi, lấy mẫu theo
phán đoán, lấy mẫu tích luỹ nhanh và lấy mẫu kiểm tra tỷ lệ. Trong phương pháp lấy mẫu xác
suất, các đơn vị điều tra được chọn ngẫ
u nhiên. Lấy mẫu theo phương pháp này, các ước lượng
96
có thể suy diễn thống kê cho tổng thể. Các kỹ thuật lấy mẫu phi xác suất bao gồm lấy mẫu
ngẫu nhiên đơn giản, lấy mẫu ngẫu nhiên phân tầng, lấy mẫu hệ thống, lấy mẫu theo cụm, chọn
mẫu nhiều giai đoạn.
Để có được kết quả cao trong nghiên cứu marketing, vấn đề đặt ra cho người làm công tác
nghiên cứu marketing là làm sao giảm thiểu những sai sót gặp phải trong thu thập dữ
liệu tại
hiện trường, tạo điều kiện cho việc xử lý cũng như tối đa hóa thông tin thu thập được. Để làm
được điều đó, đòi hỏi phải thiết kế chương trình thu thập thông tin một cách đầy đủ và khả thi.
Quá trình thu thập dữ liệu tại hiện trường có thể tạo ra những sai số trong nghiên cứu là do: lựa
chọn sai đối tượng; không thực hiệ
n được đầy đủ; không trả lời; sai sót do quá trình giao tiếp
giữa người phỏng vấn và người được phỏng vấn; sai sót xảy ra do ghi chép. Cần phải có các
biện pháp để giảm bớt những sai sót khi thực hiện thu thập dữ liệu do từ phí người trả lời như
gọi điện, viết thư báo trước, trả tiền, tặng quà cho người được phỏng vấn để tránh những sức
ép tâm tâm lý hoặ
c kích thích sự hứng thú khi tham gia phỏng vấn.
Sự thành công của của việc thu thập dữ liệu còn liên quan đến xác định đúng đối tượng hỏi và
đảm bảo chất lượng người phỏng vấn nên quản trị tốt thu thập dữ liệu là một công việc quan
trọng nhằm giảm thiểu những sai lầm và tăng tính hiệu quả trong công tác thu thập. Quản trị thu
thập dữ liệu bao gồm các n
ội dung: khảo sát thử (khám phá những điều cần điều chỉnh và điều
chỉnh thích hợp, loại bỏ những sai sót), đơn giản hóa thủ tục làm việc, tuyển mộ nhân viên
(người nhân viên phải có trình độ tay nghề, có một số khả năng riêng phù hợp với công tác thu
thập thông tin), hướng dẫn nhân viên (cả lý thuyết và thực hành), giám sát, kiểm tra quá trình
thực hiện.
CÂU HỎI
1. Tại sao phải thự
c hiện điều tra theo mẫu mà không điều tra toàn bộ tổng thể?
2. Những kỹ thuật lấy mẫu xác suất và phi xác suất?
3. Các loại sai số thường gặp trong nghiên cứu? Mô tả những lý do chính của sai số liên quan
đến thu thập dữ liệu tại hiện trường?
4. Làm thế nào để hạn chế được sai số liên quan đến thu thập dữ liệu tại hiện trường?
5. Kênh truyền hình VTV3 muốn biết được đánh giá của khán giả đối với các chương trình
của kênh. Hãy cho biết tổng thể của nghiên cứu này? Kỹ thuật lấy mẫu nào sẽ được chọn?
6. Một cửa hàng dụng cụ thể thao cao cấp muốn biết thái độ của khách hàng về sản phẩm và
dịch vụ khách hàng của họ. Hãy cho biết tổng thể của nghiên cứu này? Kỹ thuậ
t lấy mẫu nào sẽ
được chọn?
7. Các nguyên nhân gây sai lầm trong nghiên cứu thực địa và những phương pháp khắc phục
các sai lầm đó.
8. Tại sao cần phải quản trị việc thu thập dữ liệu tại hiện trường.
9. Người phỏng vấn phải có được những tiêu chuẩn nào?
10. Hãy soạn thảo một vài chỉ dẫn liên quan đến vấn đề thực hiệ
n thu thập dữ liệu thực địa cho
nhóm sinh viên thực hiện một nghiên cứu bằng cách phỏng vấn cá nhân tại nhà.
97
TÀI LIỆU THAM KHẢO
Donald H. Sanders, Statistics: A First Course (New York: McGraw Hill, 1995), 173.
Adamantios Diamantopoulos and Bodo B. Schlegelmilch, Taking the Fear Out of Data Analysis
(London: The Dryden Press, 1997), 120–121.
P.J. Lavrakas, “Telephone survey methods: Sampling, selection, and supervision,” Applied Social
Research Method Series, vol. 7 (Newbury Park, Calif.: Sage, 1987).
Shiraz Mishra, David Dooley, Ralph Catalano, and Seth Serxner, “Telephone health surveys: Potential
bias from
noncompletion,” American Journal of Public Health, vol. 83, no. 1 (January, 1993): 94–99.
Thomas T. Semon, “A good sample of accounts may not always be a good sample of your customers,”
Marketing News (April 25, 1994): 8.
Barbara A. Bailar, “Does sampling work?” Business Economics, vol. 32, no. 1 (January, 1997): 47–53.
Niels Schillewaert, Fred Langerak, and Tim Duhamel, “Non-probability sampling for WWW surveys: A
comparison of methods,” Journal of the Market Research Society, vol. 40, no. 4 (October, 1998):
307–322.
98
CHƯƠNG BẢY
7
CHUẨN BỊ DỮ LIỆU VÀ XỬ LÍ DỮ LIỆ
U
NỘI DUNG CHÍNH
Chương này đề cập đến các nội dung chính sau:
- Chuẩn bị dữ liệu để xử lý
- Các phương pháp và nguyên tắc mã hoá dữ liệu
- Một số vấn đề liên quan đến xử lý và diễn giải dữ liệu
- Bảng phân phối tần suất và bảng so sánh
- Ước lượng tham số
- Ứng dụng tin học vào phân tích dữ liệu nghiên cứu Marketing
- Phân tích thống kê mô tả
99
CHUẨN BỊ DỮ LIỆU
Quy trình phân tích và xử lí bắt đầu sau khi dữ liệu đã được thu thập. Nhưng trước khi xử lí phải
diễn giải các dữ liệu ra một dạng thích hợp vì những dữ liệu mới được thu thập vẫn còn ở dạng
''thô'' chưa thể xử lí ngay được mà chúng cần được sắp xếp, được mã hóa theo những cách thức
nhất định để dễ dàng cho việc sử dụng máy vi tính trợ giúp xử lí dữ liệu sau này.
Làm cho dữ liệu có giá trị
Sau khi thu thập dữ liệu phải kiểm tra các dữ liệu để bảo đảm chúng có ý nghĩa, tức là có giá trị
đối với việc xử lý và phân tích. Việc làm cho dữ liệu có giá trị tiến hành theo hai bước:
- Bước thứ nhất: Tiến hành xem xét một cách kỹ lưỡng các phương pháp và các biện pháp đã
được sử dụng để thu thập dữ liệu (tức kiểm tra các công cụ dùng để thu thập dữ liệu)
- Bước thứ hai: Tiến hành nghiên cứu kỹ các bảng câu hỏi đã được phỏng vấn và những chỉ dẫn
về thủ tục phỏng vấn để phát hiện ra những nguyên nhân dẫn đến các sai sót.
Hiệu chỉnh dữ liệu
Do những nguyên nhân khách quan và chủ quan, quá trình thu thập dữ liệu dù được chuẩn bị chu
đáo vẫn còn có thể tồn tại những sai sót, vì vậy phải hiệu chỉnh để dữ liệu có ý nghĩa đối với quá
trình nghiên cứu. Hiệu chỉnh dữ liệu là sửa chữa các sai sót về ghi chép hoặc ngôn từ phát hiện
được qua kiểm tra. Trong khi hiệu chỉnh cần sửa chữa những sai sót phổ biến sau:
- Những cuộc phỏng vấn giả tạo do người đi phỏng vấn “phịa” ra
- Như câu trả lời không đầy đủ (là những câu trả lời không rõ ý hoặc trả lời nửa chừng)
- Những câu trả lời thiếu nhất quán.
- Những câu trả lời không thích hợp.
- Những câu trả lời không đọc được.
Có 3 cách tiếp cận được sử dụng để xử lí các dữ liệu ''xấu'' từ các tình huống đó.
Quay trở lại người đi phỏng vấn hay người trả lời câu hỏi để làm sáng tỏ vấn đề
Việc liên hệ với các cá nhân để tìm câu trả lời đúng làm nảy sinh hai vấn đề:
- Làm tăng chi phí và sẽ quá đắt nếu cuộc khảo sát có quy mô vì chi phí phỏng vấn này đã được
tính trong dự án nghiên cứu. Theo kinh nghiệm, ngwời nghiên cứu có thể không cần tìm cách
thu thập thêm dữ liệu nếu tỉ lệ các câu hỏi nghi vấn tương đối nhỏ và / hoặc quy mô của mẫu
tương đối lớn (tỉ lệ các câu hỏi nghi vấn nhỏ hơn 20% và mẫu lớn hơn 500).
- Nếu quyết định đi ngược trở lại để thu thập dữ liệu, những dữ liệu mới có thể sẽ khác với dữ
liệu đã được thu thập trong cuộc phỏng vấn đầu tiên do các cá nhân có thể không nhớ thông tin
cần thiết, cũng như có thể do sử dụng phương pháp khác và điều này ảnh hưởng rất lớn đến kết
quả của câu trả lời (liên quan đến độ tin cậy của cuộc điều tra).
Suy luận từ những câu trả lời khác
Theo cách này, người hiệu chỉnh phỏng đoán từ các dữ liệu khác để làm rõ câu trả lời nào đúng.
Nhưng đây là cách làm đầy rủi ro. Khó có thể minh định được các quy luật để suy luận các câu
trả lời. Do đó để an toàn khi hiệu chỉnh dữ liệu, người nghiên cứu cần hết sức thận trọng với
phương pháp này, và không nên suy luận một câu trả lời trừ phi biết tương đối chắc chắn về ý
định của người trả lời.
Loại toàn bộ câu trả lời
100
Đây là việc dễ thực hiện nhất. Theo cách này, người hiệu chỉnh chỉ việc loại đi những câu trả lời
có nghi vấn. Trong trường hợp quy mô của mẫu tương đối lớn, người hiệu chỉnh có thể loại bỏ
toàn bộ các câu trả lời nếu thông tin thiếu nhất quán và người hiệu chỉnh không thể giải quyết vấn
đề thiếu nhất quán đó trong các dữ liệu được thu thập từ các đối tượng phỏng vấn. Tuy nhiên,
khuyết điểm trong cách tiếp cận này là sự thiên vị trong kết quả nếu những người trả lời thiếu
nhất quán đó bị loại ra khỏi cuộc nghiên cứu, khi đó kết quả đạt được sẽ bị lệch nếu ý kiến những
người trả lời bị loại này khác với những người còn được giữ lại trong mẫu điều tra.
Một cách giải quyết khác là tập hợp một báo cáo riêng các loại dữ liệu bị thiếu hoặc không nhất
quán, không rầng nếu người nghiên cứu thật sự tin rằng các dữ liệu đó có thể có ích cho việc ra
quyết định của các nhà lãnh đạo.
CẤU TRÚC VÀ MÃ HÓA DỮ LIỆU
Mã hóa dữ liệu là một quá trình liên quan tới việc nhận diện và phân loại mỗi câu trả lời trên một
ký hiệu được chỉ định (ký hiệu có thể bằng số hoặc bằng chữ). Dữ liệu này phải được mã hóa thì
máy điện toán mới đọc và xử lý được.
Cấu trúc dữ liệu
Cấu trúc của dữ liệu là cách sắp xếp thông tin đã được trả lời vào vị trí ô lưu trữ dữ liệu của máy
điện toán. Do đó các nhà nghiên cứu phải tổ chức các dữ liệu được mã hóa thành một cấu trúc
thích ứng của các dữ liệu.
Mã hóa dữ liệu
Việc mã hóa có thể được thực hiện vào một trong hai thời điểm, là mã hóa trước và mã hóa sau:
Mã hóa trước
Mã hóa trước là việc quyết định chọn các mã số cho các câu hỏi và các phương án trả lời từ khi
thiết kế bản câu hỏi, và do vậy có thể in ngay các mã số lên bảng câu hỏi. Hình thức mã hóa này
thích hợp cho các câu hỏi dạng luận lý (chỉ chọn một trong hai cách trả lời: có, không) hay dạng
chọn một trong các câu trả lời ghi sẵn. Đối với các câu hỏi này người nghiên cứu đã định rõ được
câu trả lời và do đó dễ dàng ký hiệu cho các câu trả lời đó. Việc mã hóa này có tác dụng làm
giảm đi rất nhiều khối lượng công việc trong bước chuẩn bị dữ liệu.
Để làm rõ ta hãy xem xét ví dụ về một phần trong bảng câu hỏi về sản phẩm ti vi sau đây:
Q1. Bà/ cô có TV hoặc xem ti vi không ?
Không
(0)
→
chấm dứt và sang phần kế.
Có
(1)
→
hỏi tiếp từ Q2a
Q2a. Bà/ cô thường bao lâu xem TV một lần ?
Mỗi ngày/ hầu như mỗi ngày
(1)
4-5 ngày/ tuần
(2)
2-3 ngày/tuần
(3)
1 lần/ tuần
(4)
2-3 ngày/ tháng
(5)
1 lần/ tháng
(6)
Không thường xuyên
(7)
Không xem
(8)
→
chuyển sang câu hỏi tiếp theo
Q2b. Lần gần đây nhất bà/ cô xem TV khi nào ?
Ngày hôm qua
(1)
Trước ngày hôm qua
(2)
101
Q2c. Trung bình, một ngày bình thường trong tuần bà/cô xem chương trình TV trong bao lâu?
Ít hơn 1 giờ
(1)
Từ 1 đến 3 giờ
(2)
Từ 3 đến 5 giờ
(3)
Từ 5 đến 7 giờ
(4)
Từ 7 đến 9 giờ
(5)
Trên 9 giờ
(6)
Q2d. Ngày cuối tuần (thứ bảy, chủ nhật) thì bà/cô xem TV bao lâu ?
Ít hơn 1 giờ
(1)
Từ 1 đến 3 giờ
(2)
Từ 3 đến 5 giờ
(3)
Từ 5 đến 7 giờ
(4)
Từ 7 đến 9 giờ
(5)
Trên 9 giờ
(6)
Mã hóa sau
Khi các câu trả lời thuộc câu hỏi mở, người nghiên cứu phải tốn nhiều công biên tập vì các câu
trả lời theo tình huống tự do, không định sẵn. Khi phỏng vấn, người phỏng vấn phải ghi nguyên
văn câu trả lời, và vì thế để chuyển các dữ liệu như vậy sang một hình thức mà máy điện toán có
thể đọc được cần phải phân các câu trả lời theo những loại giống nhau và gán cho chúng các ký
hiệu mã hóa.
Có hai cách:
- Cách thứ nhất: Người nghiên cứu tiến hành mã hóa các câu trả lời trước khi nghiên cứu thực
địa. Trường hợp này, người nghiên cứu phải dự kiến về mặt lý thuyết các câu trả lời hoặc sử
dụng kinh nghiệm của các cuộc nghiên cứu trước, đồng thời mất thời gian huấn luyện những
người đi phỏng vấn cách phân loại các câu trả lời được ghi nguyên văn đúng loại mã hóa đã dự
kiến.
- Cách thứ hai: Chờ đến khi thu thập xong dữ liệu mới tiến hành mã hóa. Khi đó, người nghiên
cứu phải xem xét ngẫu nhiên 30% các bản câu hỏi đã được trả lời để tính toán các loại tình
huống trả lời và mã hóa nó. Trước khi mã hóa, phải rà soát lại toàn bộ các câu hỏi đã phỏng
vấn để xem xét có còn tình huống trả lời nào khác không. Để tiện lợi cho việc phân tích, không
nên phân loại quá 10 tình huống trả lời cho một vấn đề.
Các nguyên tắc thiết lập kiểu mã hóa
Để làm cho chức năng mã hóa được tốt hơn cần phải tuân thủ các nguyên tắc sau đây trong việc
thiết lập các kiểu mã hóa.
- Số “ kiểu mã hóa” thích hợp: số kiểu mã cần phải đủ lớn để bao quát hết được các sự khác biệt
trong dữ liệu. Nếu số lượng mã quá ít thì có thể một số thông tin quan trọng sẽ không được bao
quát.
- Những thông tin trả lời được sắp xếp trong cùng một “ loại mã hóa” thì phải tương tự nhau về
đặc trưng nghiên cứu.
- Ranh giới rõ ràng giữa các “loại mã hóa”
Với các đặc trưng đang được nghiên cứu, những sự khác biệt về thông tin trả lời giữa các “loại
mã” phải không giống nhau đến mức đủ xếp vào cùng một “loại mã”.
Ví dụ: Chúng ta đang nghiên cứu đặc trưng về tuổi tác của người được hỏi, giả sử cần tiến hành
mã hóa các tình huống trả lời như sau:
102
- Nhỏ hơn 20 tuổi
- Từ 21 tuổi đến 30 tuổi.
- Trên 30 tuổi
Nếu có một câu trả lời là 20 tuổi 4 tháng thì sẽ không rõ phải được xếp vào loại nào vì ở khoảng
thứ nhất phải là 20 tuổi và thứ 2 phải là từ 21 tuổi đến 30 tuổi. Khi đó người nghiên cứu phải
làm tròn theo nguyên tắc là 20 tuổi như vậy được xếp vào loại thứ 1.
- Nguyên tắc loại trừ giữa các loại mã hóa: các loại mã hóa phải không được chồng chéo lên
nhau, cần phải thiết lập chúng như thế nào để bất cứ tình huống trả lời nào cũng chỉ được xếp
vào một loại mã hóa thôi. (đã được xếp vào loại mã này thì không xếp vào mã khác)
- Nguyên tắc toàn diện: theo nguyên tắc này, cấu trúc của một loại mã phải bao quát được tất cả
các tình huống trả lời nhằm đảm bảo tất cả các tình huống đều được mã hóa.
- Nguyên tắc “đóng kín” những khoảng cách lớp: theo nguyên tắc này, không được “để mở”
khoảng cách lớp của mã hóa, bởi vì việc không chỉ rõ những giới hạn về khoảng cách lớp sẽ
làm lu mờ đi những giá trị phân tán ở hai đầu mút của dãy phân phối và do đó sẽ không cho
phép tính toán được giá trị trung bình của những quan sát trong mỗi khoảng cách lớp.
Ví dụ, xem xét việc mã hóa câu hỏi về thu nhập bình quân đầu người của những người được
phỏng vấn:
Mức thu nhập Mã hóa
Từ 100USD - 200USD 1
Trên 200USD - 300USD 2
Trên 300USD - 400USD 3
Trên 400USD -500 USD 4
Có thể nhận thấy nếu mã hóa như trên thì sẽ chưa đảm bảo “đóng kín” những khoảng cách
lớp vì với các tình huống trả lời có thu nhập dưới 100USD hoặc trên 600USD chưa được mã
hóa mặc dù tần suất xuất hiện các giá trị ở hai đầu mút này rất nhỏ.
- Nguyên tắc về những khoảng cách lớp: Khoảng cách các lớp nên được quy định tương đương
nhau thì tốt hơn là để chúng có độ rộng thay đổi. Nếu không tuân thủ các nguyên tắc này có
thể đưa đến tình trạng khoảng cách lớp thiếu sự dàn trải phù hợp. Tuy nhiên, có thể chấp nhận
các khoảng cách có độ rộng không tương đương nhau khi đã định rõ các “loại mã” chứa đựng
các phần tương đối nhỏ của tổng thể mà những đặc trưng trả lời từ những phần nhỏ đó có thể
không cung cấp những thông tin hữu ích nào cả.
- Nguyên tắc định điểm giữa các khoảng cách lớp: đối với những câu hỏi mà khi trả lời người ta
hay làm tròn số thì những khoảng cách lớp cần được thiết kế sao cho những con số được làm
tròn (lớn hơn) đó rơi vào những điểm giữa của khoảng cách lớp.
Lập danh bạ mã hóa
Danh bạ mã hóa gồm nhiều cột, trong từng cột chứa đựng những lời giải thích về những mã hiệu
đã được sử dụng trong những trường dữ liệu (data fields) và những mối liên hệ của chúng đối với
những câu trả lời của các câu hỏi.
Chức năng của danh bạ mã hóa là giúp người làm mã hóa thực hiện việc làm biến đổi từ câu trả
lời ra một ký hiệu thích hợp mà máy điện toán có thể đọc được, giúp các nhà nghiên cứu nhận
diện các loại biến số khi in bản phân tích bằng máy điện toán.
103
Lượng thông tin tối thiểu được chứa đựng trong một danh bạ mã hóa đối với một câu hỏi bao
gồm: số của câu hỏi, số cột cần có trong máy điện toán, tên của biến số, vấn đề của câu hỏi và mã
hiệu đã được sử dụng.
- Có phải chỉ cần mô tả bề mặt của các tình huống nào đó hay không?
- Có phải chúng ta đang tìm kiếm một ngoại lệ hay một dạng nào đó trong tình huống hay không?
- Cần dự đoán trạng thái tương lai hay giá trị của một biến hay không?
- Nếu có những mối liên hệ quá khứ giữa các biến nào đó thì có cần làm rõ không? Nếu như vậy
chúng ta có phải quan tâm đến những mối liên hệ bên trong giữa các biến hay không?
- Chúng ta có muốn thăm dò cấu trúc bên trong của một hiện tượng bề ngoài về phản ứng của
người tiêu dùng, qua đó tìm hiểu được hoặc chứng minh cho các nguyên nhân bên trong hay
không ?
- Nếu dùng mô hình thử nghiệm thì (1) có những biến thiên cùng chiều nào giữa các biến thích
hợp? (2) các biến đặc biệt nào là nguồn nhập cho từng phương pháp hay cho các bảng tính, (3)
việc tính toán được thực hiện theo trình tự nào?
- Những tính toán nào phụ thuộc vào kết quả tính toán của các bước trước?
- Những tính toán nào phải chờ đợi những kết quả của các tính toán khác thì mới đi đến quyết
định kết quả của chúng có ý nghĩa hay không?
- Những câu trả lời cho câu hỏi thứ (3) đòi hỏi những phép toán thống kê phải được lập thành
một trình tự logic nhất định. Khi thiết lập những trình tự như thế cần nêu rõ những thứ tự ưu
tiên tính toán và những gì còn đang nghi vấn đối với kết quả đưa ra.
Ví dụ, có thể lập một danh bạ mã hóa cho mẫu phỏng vấn sản phẩm tivi như sau:
Q1. Có hoặc không xem tivi
Không
0
Có
1
Q2a. Số lần xem tivi
Mỗi ngày/ hầu như mỗi ngày 1
4-5 ngày/ tuần 2
2-3 ngày/tuần 3
1 lần/ tuần 4
2-3 ngày/ tháng 5
1 lần/ tháng 6
Không thường xuyên 7
Không xem 8
Q2b. Lần xem tivi gần đây nhất
Ngày hôm qua 1
Trước ngày hôm qua 2
Q2c. Thời gian xem tivi ngày thường
Ít hơn 1 giờ 1
Từ 1 đến 3 giờ 2
Từ 3 đến 5 giờ 3
Từ 5 đến 7 giờ 4
Từ 7 đến 9 giờ 5
Trên 6
Q2d. Thời gian xem tivi ngày cuối tuần