Tải bản đầy đủ (.pdf) (20 trang)

quản lý số liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.69 MB, 20 trang )

Quản lý số liệuQuản lý số liệu
Nguyễn Thị Trang NhungNguyễn Thị Trang Nhung
Mục tiêu bài họcMục tiêu bài học
Sau khi hoàn thành bài học này sinh viên có thể:Sau khi hoàn thành bài học này sinh viên có thể:
1.1. Thực hiện được việc mã hóa số liệu thànhThực hiện được việc mã hóa số liệu thành
dạng số để nhập vào máy tínhdạng số để nhập vào máy tính
2.2. Hiểu được các chiến lược nhập số liệuHiểu được các chiến lược nhập số liệu
3.3. Hiểu được chiến lược và thực hiện được cácHiểu được chiến lược và thực hiện được các
thao tác làm sạch số liệuthao tác làm sạch số liệu
Sau khi hoàn thành bài học này sinh viên có thể:Sau khi hoàn thành bài học này sinh viên có thể:
1.1. Thực hiện được việc mã hóa số liệu thànhThực hiện được việc mã hóa số liệu thành
dạng số để nhập vào máy tínhdạng số để nhập vào máy tính
2.2. Hiểu được các chiến lược nhập số liệuHiểu được các chiến lược nhập số liệu
3.3. Hiểu được chiến lược và thực hiện được cácHiểu được chiến lược và thực hiện được các
thao tác làm sạch số liệuthao tác làm sạch số liệu
Quản lý số liệuQuản lý số liệu
 Mã hóa số liêuMã hóa số liêu
 Nhập số liệuNhập số liệu
 Kiểm tra và làm sạch số liệuKiểm tra và làm sạch số liệu
Mã hóaMã hóa
Mã hoá số liệu là quá trình chuyển đổi các sốMã hoá số liệu là quá trình chuyển đổi các số
liệu thuliệu thu thậpthập được(vd: từcácđược(vd: từcác bộbộ câu hỏicâu hỏi) thành) thành
các dạng dữ kiện phù hợp với các phần mềmcác dạng dữ kiện phù hợp với các phần mềm
phânphân tíchtích thống kêthống kê
Mã hoá số liệu là quá trình chuyển đổi các sốMã hoá số liệu là quá trình chuyển đổi các số
liệu thuliệu thu thậpthập được(vd: từcácđược(vd: từcác bộbộ câu hỏicâu hỏi) thành) thành
các dạng dữ kiện phù hợp với các phần mềmcác dạng dữ kiện phù hợp với các phần mềm
phânphân tíchtích thống kêthống kê
Mã hóaMã hóa –– bảng hỏibảng hỏi
Điều tra chấn thương giao thông quốc gia năm 2003Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _ Vùng :Mã hộ: _ _ _ _ _ _ _ _ Vùng :


Ngày phỏng vấn:Ngày phỏng vấn:
Thông tin về người trả lờiThông tin về người trả lời
1. Anh/chị bao nhiêu tuổi (tính tròn năm)?1. Anh/chị bao nhiêu tuổi (tính tròn năm)?
2. Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?2. Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
NamNam NữNữ
3. Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :3. Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :
Thành phốThành phố Nông thônNông thôn
4. Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?4. Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không đi họcKhông đi học Tiểu học Dưới THCSTiểu học Dưới THCS Trên THCS Học nghề Đại học TrênTrên THCS Học nghề Đại học Trên
đại họcđại học Trẻ nhỏTrẻ nhỏ
5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộngLàm ruộng CBCNVC Buôn bán nhỏCBCNVC Buôn bán nhỏ Làm chủLàm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ OtherHọc sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ Other
Điều tra chấn thương giao thông quốc gia năm 2003Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _ Vùng :Mã hộ: _ _ _ _ _ _ _ _ Vùng :
Ngày phỏng vấn:Ngày phỏng vấn:
Thông tin về người trả lờiThông tin về người trả lời
1. Anh/chị bao nhiêu tuổi (tính tròn năm)?1. Anh/chị bao nhiêu tuổi (tính tròn năm)?
2. Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?2. Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
NamNam NữNữ
3. Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :3. Anh/chị sống ở đâu? (Khoanh vào lựa chọn phù hợp) :
Thành phốThành phố Nông thônNông thôn
4. Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?4. Anh/chị đã học đến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không đi họcKhông đi học Tiểu học Dưới THCSTiểu học Dưới THCS Trên THCS Học nghề Đại học TrênTrên THCS Học nghề Đại học Trên
đại họcđại học Trẻ nhỏTrẻ nhỏ
5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộngLàm ruộng CBCNVC Buôn bán nhỏCBCNVC Buôn bán nhỏ Làm chủLàm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ OtherHọc sinh Nghề thủ công Nghỉ hưu Mất sức Thất nghiệp Trẻ nhỏ Other
Lưu trữ trong số liệuLưu trữ trong số liệu
IDID SexSex

001001 11
002002 22
003003 11
003003 11
004004 22
1: nam 2 : nữ1: nam 2 : nữ
Các chiến lược mã hóa số liệuCác chiến lược mã hóa số liệu
1.1. Tất cả số liệu nên để dạng sốTất cả số liệu nên để dạng số
Ví dụ: Giới tính của người được phỏng vấnVí dụ: Giới tính của người được phỏng vấn
Nam NữNam Nữ √√
Mã hóa:Mã hóa:
1: Nam1: Nam
2: Nữ2: Nữ
Sử dụng codebook để ghi nhớ mãSử dụng codebook để ghi nhớ mã
1.1. Tất cả số liệu nên để dạng sốTất cả số liệu nên để dạng số
Ví dụ: Giới tính của người được phỏng vấnVí dụ: Giới tính của người được phỏng vấn
Nam NữNam Nữ √√
Mã hóa:Mã hóa:
1: Nam1: Nam
2: Nữ2: Nữ
Sử dụng codebook để ghi nhớ mãSử dụng codebook để ghi nhớ mã
Chiến lược mã hóa số liệuChiến lược mã hóa số liệu
2. Các mã số liệu không được trùng nhau2. Các mã số liệu không được trùng nhau
Ví dụ 1: Giới tính của người phỏng vấn:Ví dụ 1: Giới tính của người phỏng vấn:
1 : nam1 : nam
2 : Nữ2 : Nữ
Ví dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừVí dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừ
phương tiện thông tin đại chúng (tivi, đài)phương tiện thông tin đại chúng (tivi, đài)
1.1. Từ sách báo tạp chíTừ sách báo tạp chí
2.2. Từ hệ thống phát thanh của phườngTừ hệ thống phát thanh của phường

3.3. Từ cán bộ y tế/ cán bộ phụ nữTừ cán bộ y tế/ cán bộ phụ nữ
4.4. Bạn bè/người thânBạn bè/người thân
5.5. Khác (…)Khác (…)
2. Các mã số liệu không được trùng nhau2. Các mã số liệu không được trùng nhau
Ví dụ 1: Giới tính của người phỏng vấn:Ví dụ 1: Giới tính của người phỏng vấn:
1 : nam1 : nam
2 : Nữ2 : Nữ
Ví dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừVí dụ 2: Nguồn thông tin về cách phòng chống HIV/AIDSTừ
phương tiện thông tin đại chúng (tivi, đài)phương tiện thông tin đại chúng (tivi, đài)
1.1. Từ sách báo tạp chíTừ sách báo tạp chí
2.2. Từ hệ thống phát thanh của phườngTừ hệ thống phát thanh của phường
3.3. Từ cán bộ y tế/ cán bộ phụ nữTừ cán bộ y tế/ cán bộ phụ nữ
4.4. Bạn bè/người thânBạn bè/người thân
5.5. Khác (…)Khác (…)
Chiến lược mã hóa số liệuChiến lược mã hóa số liệu
3. Mỗi biến của các trường hợp phải nằm trên3. Mỗi biến của các trường hợp phải nằm trên
cùng một cột của SPSScùng một cột của SPSS
4. Mỗi biến của mỗi quan sát phải có giá trị của4. Mỗi biến của mỗi quan sát phải có giá trị của
biếnbiến
5. Áp dụng một quy tắc thống nhất cho cả bộ số5. Áp dụng một quy tắc thống nhất cho cả bộ số
liệu khi mã hóaliệu khi mã hóa
6. Nên sử dụng giá trị cao thì nhận giá trị tích6. Nên sử dụng giá trị cao thì nhận giá trị tích
cực trong câu hỏi ( không đồng ýcực trong câu hỏi ( không đồng ý rất đồng ý)rất đồng ý)
3. Mỗi biến của các trường hợp phải nằm trên3. Mỗi biến của các trường hợp phải nằm trên
cùng một cột của SPSScùng một cột của SPSS
4. Mỗi biến của mỗi quan sát phải có giá trị của4. Mỗi biến của mỗi quan sát phải có giá trị của
biếnbiến
5. Áp dụng một quy tắc thống nhất cho cả bộ số5. Áp dụng một quy tắc thống nhất cho cả bộ số
liệu khi mã hóaliệu khi mã hóa
6. Nên sử dụng giá trị cao thì nhận giá trị tích6. Nên sử dụng giá trị cao thì nhận giá trị tích

cực trong câu hỏi ( không đồng ýcực trong câu hỏi ( không đồng ý rất đồng ý)rất đồng ý)
Nhập số liệuNhập số liệu
 Dùng các phần mềm quản lý số liệu chuyênDùng các phần mềm quản lý số liệu chuyên
nghiệpnghiệp
 Dùng Epi Data hoặc Epi Info cho các số liệuDùng Epi Data hoặc Epi Info cho các số liệu
nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)
 Dùng các phần mềm quản lý số liệu chuyênDùng các phần mềm quản lý số liệu chuyên
nghiệpnghiệp
 Dùng Epi Data hoặc Epi Info cho các số liệuDùng Epi Data hoặc Epi Info cho các số liệu
nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)nhỏ (miễn phí, dễ cài đặt và dễ sử dụng)
Các cách nhập số liệuCác cách nhập số liệu
 Hai người nhập số liệu và tiến hành so sánh.Hai người nhập số liệu và tiến hành so sánh.
Nếu lượng thông tin sai khác của hai ngườiNếu lượng thông tin sai khác của hai người
quá lớn thì tiến hành nhập lạiquá lớn thì tiến hành nhập lại
 Một người nhập số liệu rồi lấy ra ngẫu nhiênMột người nhập số liệu rồi lấy ra ngẫu nhiên
khoảng 20% phiếu để kiểm tra. Nếu thấy saikhoảng 20% phiếu để kiểm tra. Nếu thấy sai
khác quá nhiều cũng phải nhập lạikhác quá nhiều cũng phải nhập lại
 Dùng các thiết bị hiện đại: Máy quét tự động.Dùng các thiết bị hiện đại: Máy quét tự động.
 Hai người nhập số liệu và tiến hành so sánh.Hai người nhập số liệu và tiến hành so sánh.
Nếu lượng thông tin sai khác của hai ngườiNếu lượng thông tin sai khác của hai người
quá lớn thì tiến hành nhập lạiquá lớn thì tiến hành nhập lại
 Một người nhập số liệu rồi lấy ra ngẫu nhiênMột người nhập số liệu rồi lấy ra ngẫu nhiên
khoảng 20% phiếu để kiểm tra. Nếu thấy saikhoảng 20% phiếu để kiểm tra. Nếu thấy sai
khác quá nhiều cũng phải nhập lạikhác quá nhiều cũng phải nhập lại
 Dùng các thiết bị hiện đại: Máy quét tự động.Dùng các thiết bị hiện đại: Máy quét tự động.
Kiểm tra và làm sạchKiểm tra và làm sạch
1 Kiểm tra loại biến1 Kiểm tra loại biến
2. Kiểm tra dạng đo lường của biến2. Kiểm tra dạng đo lường của biến
Dựa vào mã của các giá trị bên cột mã biến:
hãy chuyển kiểu đo lường cho tất cả các biến trong

bộ số liệu Chilumba. Sav thành dạng thích hợp
3. Kiểm tra và dán nhãn cho biến3. Kiểm tra và dán nhãn cho biến
Dựa vào mã của các giá trị bên cột mã biến: hãy dánDựa vào mã của các giá trị bên cột mã biến: hãy dán
nhãn cho tất cả các biến trong bộ số liệu Chilumba.nhãn cho tất cả các biến trong bộ số liệu Chilumba.
SavSav
4 Xử lý đối với biến bị missing4 Xử lý đối với biến bị missing
Hiện thị codebookHiện thị codebook
Lệnh Descriptives để kiểm tra biến liên tụcLệnh Descriptives để kiểm tra biến liên tục
Lệnh Frequency để kiểm tra biến phân loạiLệnh Frequency để kiểm tra biến phân loại
Làm sạch số liệuLàm sạch số liệu
 Kiểm tra các mã không phù hợp của biến phânKiểm tra các mã không phù hợp của biến phân
loạiloại
 Kiểm tra giá trị bất thường của biến liên tụcKiểm tra giá trị bất thường của biến liên tục
 Kiểm tra mã ID không phù hợp hoặc trùngKiểm tra mã ID không phù hợp hoặc trùng
 Kiểm tra tính phù hợp trong từng bộ số liêuKiểm tra tính phù hợp trong từng bộ số liêu
 Kiểm tra định dạng của biến ngày thàng.Kiểm tra định dạng của biến ngày thàng.
 Kiểm tra các mã không phù hợp của biến phânKiểm tra các mã không phù hợp của biến phân
loạiloại
 Kiểm tra giá trị bất thường của biến liên tụcKiểm tra giá trị bất thường của biến liên tục
 Kiểm tra mã ID không phù hợp hoặc trùngKiểm tra mã ID không phù hợp hoặc trùng
 Kiểm tra tính phù hợp trong từng bộ số liêuKiểm tra tính phù hợp trong từng bộ số liêu
 Kiểm tra định dạng của biến ngày thàng.Kiểm tra định dạng của biến ngày thàng.
Tài liệu đọcTài liệu đọc
 Chương 2, Thống kê y tế công cộng phần 2Chương 2, Thống kê y tế công cộng phần 2
 Các tài liệu tham khảo SPSS khácCác tài liệu tham khảo SPSS khác

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×