Tải bản đầy đủ (.pdf) (12 trang)

KHÁI NIỆM về THỐNG KÊ Y HỌC và CÁCH SẮP XẾP & TỔ CHỨC SỐ LIỆU pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (162.27 KB, 12 trang )

KHÁI NIỆM về THỐNG KÊ Y HỌC và
CÁCH SẮP XẾP & TỔ CHỨC SỐ LIỆU


I. MỘT SỐ KHÁI NIỆM CƠ BẢN :
Thống kê học (Statistics): là môn học về cách :

1
thu thập, tổ chức, tóm tắt và phân tích số liệu

2
rút ra những suy diễn cho toàn bộ (số liệu) từ kết quả khảo sát 1 phần
của số liệu.
Thống kê sinh học (Biostatistics): là thống kê học có số liệu phân tích có
nguồn gốc sinh hoặc y học.
Biến số (Variable): là đặc tính có thể mang nhiều giá trị khác nhau ở người,
nơi chốn, vật khác nhau.
– Biến số định lượng (Quantitative variable): là biến số có thể đo đạc được
bằng các phép đo lường thông thường. Số đo thực hiện trên các biến số
định lượng chuyển tải thông tin về số (khối) lượng.
– Biến số định tính (Qualitative variable) : là biến số không thể được đo
bằng những phép đo lường thông thường, mà chỉ có thể được nhóm loại
(categorized). Số đo thực hiện trên các biến số định tính chuyển tải thông
tin về thuộc tính.
– Biến số ngẫu nhiên (Random variable): là biến số mà các giá trị có được
là kết quả của các yếu tố mang tính cơ hội (chance factors) không thể
tiên đoán chính xác trước được. Các giá trị có được qua các phương pháp
đo lường được gọi là các quan sát (observations) hoặc số đo easurements)
– Biến số ngẫu nhiên rời (Discrete random variable): là biến số đặc trưng bởi
các khoảng trống giữa các giá trị.
 Biến số ngẫu nhiên liên tục (Continous random variable): là biến số không


có các khoảng trống giữa các giá trị.
DÂN SỐ (Quần thể – Population): là tập hợp lớn nhất các thực thể mà ta quan
tâm ở 1 thời điểm xác định.
Nếu đo một biến số trên từng thực thể của dân số, chúng ta sẽ có 1 dân số các
giá trị của biến số đó. Dân số các giá trị là tập hợp lớn nhất các giá trị của 1 biến
số ngẫu nhiên mà ta quan tâm ở 1 thời điểm xác định.
MẪU (Sample): là 1 phần (bộ phận) của 1 dân số.
II. SỰ ĐO LƯỜNG và THANG ĐO LƯỜNG (Measurement & Measurement
Scale)
Sự đo lường được định nghĩa là sự gán con số cho các vật thể hoặc biến cố
theo 1 hệ thống qui tắc. Do việc đo lường được thực hiện với nhiều hệ thống qui
tắc khác nhau nên phải có nhiều thang đo lường khác nhau.
1. Thang định danh (Nominal Scale): là thang đo lường (ở mức độ) thấp
nhất và chỉ bao gồm việc “đặt tên” cho các quan sát hoặc phân loại chúng vào
các nhóm độc lập hỗ tương (mutually exclusive). Thí dụ: các chẩn đoán y khoa
(bệnh cao huyết áp, bệnh nội tiết, v.v.), các thực thể nhị phân như nam-nữ,
bệnh-khỏe, v v
2. Thang thứ tự (Ordinal Scale): là thang đo lường bao gồm không chỉ việc
định danh mà còn phân hạng (rank) các nhóm loại theo 1 số tiêu chuẩn nào đó.
Thí dụ: bệnh (rất nặng, nặng, vừa, nhẹ), tình trạng kinh tế (cao, vừa, kém),
v v
Lưu ý là mức độ khác biệt giữa các 2 số đo thuộc 2 nhóm loại đã phân hạng
không được biết là bằng bao nhiêu.

3. Thang khoảng (Interval Scale): tinh vi hơn thang thứ tự ở chỗ khoảng
cách giữa hai số đo bất kỳ được biết rõ. Thí dụ: hiệu của số đo 20 và 30 bằng
với hiệu của số đo 30 và 40. Thang khoảng dùng 1 đơn vị về khoảng cách và
một điểm zero được chọn tùy ý. Tuy nhiên điểm zero trong trường hợp này
không phải là zero thật sự (chỉ thị sự hoàn toàn không có khối lượng đang được
đo). Thí dụ rõ nhất về thang khoảng là cách đo nhiệt độ, trong đó 0

0
C không
đồng nghĩa với việc hoàn toàn không có nhiệt lượng nào.Thang khoảng là một
thang định lượng.
4. Thang Tỉ số (Ratio Scale): là thang đo lường ở mức độ cao nhất, đặc
trưng bởi sự bằng nhau của các tỉ số cũng như của các khoảng có thể được định
rõ. Điểm cơ bản của thang tỉ số là có điểm zero thật. Thí dụ: chiều cao, cân
nặng, chiều dài,v.v.
III. CHUỖI THỐNG KÊ (Ordered array) :
là danh mục các giá trị của 1 tập hợp số liệu xếp theo thứ tự từ giá trị nhỏ đến
giá trị lớn.

IV. PHÂN PHỐI TẦN SỐ (Frequency Distribution)
1. Phân nhóm số liệu: số liệu có thể được tổ chức, sắp xếp bằng cách phân
vào nhiều nhóm (Khoảng cách lớp – KCL).

Cách tính số KCL
Số KCL của 1 tập hợp số liệu thường không nên nhỏ hơn 6 và không lớn
hơn 15. Để chính xác hơn, có thể dùng công thức Sturges để tính số KCL :
k = 1 + 3,322 (log
10
n)
với k : số KCL & n : số giá trị có được
Thí du: có tập hợp số liệu gồm 57 giá trị, nên phân vào bao nhiêu KCL thì vừa?
n = 57 log
10
57 = 1,7559
k = 1 + 3,322 (1,7559)  7

Cách tính độ rộng của KCL

w : độ rộng của KCL
w =
k
R
với R : biên độ của chuỗi số liệu
Thí du: có tập hợp số liệu gồm 57 giá trị, giá trị lớn nhất là 79 và giá trị nhỏ
nhất là 12. Tính độ rộng của các KCL?
w =
79 12
9,6
7

  10
Tập hợp 57 giá trị là cân nặng tính bằng ounces của 57 khối u ác tính lấy ra từ
bụng của 57 bệnh nhân :

68 63 42 27 30 36 28 32 79 27 22 23
24 25 44 65 43 25 74 51 36 42 28 31
28 25 45 12 57 51 12 32 49 38 42 27
31 50 38 21 16 24 69 47 23 22 43 27
49 28 23 19 46 30 43 49 12


2. Lập bảng phân phối tần số

KCL Tần số

10 – 19 5
20 – 29 19
30 – 39 10

40 – 49 13
50 – 59 4
60 – 69 4
70 – 79 2

57
3. Lập bảng phân phối tần số, tần số dồn, tần số tương đối, tần số tương
đối dồn

KCL Tần số Tần số dồn Tần số Tần số
tương đối tương
đối dồn

10 – 19 5 5 0,0877 0,0877
20 – 29 19 24 0,3333 0,4210
30 – 39 10 34 0,1754 0,5964
40 – 49 13 47 0,2281 0,8245
50 – 59 4 51 0,0702 0,8947
60 – 69 4 55 0,0702 0,9649
70 – 79 2 57 0,0351 1,0000

57 1,0000
Lưu ý: Tùy theo nhu cầu mà chọn cột (tần số, tần số tương đối, tần số dồn, tần số
tương đối dồn) để trình bày. Thông thường nhất là trình bày tần số và tần số
tương đối (tính
bằng %) trong cùng 1 bảng.
4. Lập biểu đồ Histogram
Histogram là biểu đồ phân phối tần số hình que (cột) đặc biệt của các biến số
liên tục. Do là biểu đồ là của biến số liên tục nên khi trình bày cần phải dùng
các giới hạn thật của các KCL. Tìm giới hạn thật của 1 KCL bằng cách trừ đi ½

đơn vị đối với giới hạn
dưới và cộng thêm ½ đơn vị đối với giới hạn trên.
Bảng phân phối tần số dùng giới hạn thật (để vẽ histogram)

Giới hạn thật Tần số
của KCL

9,5 – 19,5 5
19,5 – 29,5 19
29,5 – 39,5 10
39,5 – 49,5 13
49,5 – 59,5 4
59,5 – 69,5 4
69,5 – 79,5 2




5. Lập biểu đồ đa giác tần số
Taàn soá
X
2
4
6
8
10
12
14
16
18

20
9,5
19,5
29,5
39,5
49,5
59,5
69,5
79,5
Biểu đồ đa giác tần số được thiết lập dựa trên histogram. Bằng cách nối trung
điểm
của các mặt trên của từng ô chữ nhật tượng trưng cho tần số của các KCL, ta
sẽ có 1
đa giác tần số.



6. Lập biểu đồ thân–và–lá (Stem-and-leaf)
Thân Lá
1 2 2 6 9
2 1 2 2 3 3 3 4 4 5 5 5 7 7 7 7 8 8 8 8
3 0 0 1 1 2 2 6 6 8 8
4 2 2 2 3 3 3 4 5 6 7 9 9 9
5 0 1 1 7
Tần ố

X

2
4

6
8
10

12

14

16

18

20

9,5 19,5
29,5

39,5 49,5
59,5

69,5

79,5
6 3 5 8 9
7 4 9


×