Trường hợp dữ liệu có tần số
• Phương sai mẫu hiệu chỉnh:
s
2
= s
2
n−1
=
1
n − 1
k
i=1
n
i
(x
i
− ¯x)
2
=
1
n − 1
k
i=1
n
i
x
2
i
−
n
n − 1
¯x
2
.
• Độ lệch chuẩn: là căn bậc hai của phương sai
mẫu hiệu chỉnh
s =
√
s
2
.
Trường hợp dữ liệu có tần số
Example
Bảng tần số sau cho biết tuổi của các thành viên
trong 1 dàn nhạc giao hưởng dành cho lứa tuổi trẻ
Tuổi Số người
15 2
16 5
17 11
18 9
19 14
20 13
Tính trung bình mẫu, phương sai mẫu và độ lệch
chuẩn tuổi của 54 thành viên của dàn nhạc này.
Các đặc trưng khác của mẫu
Median (trung vị) là giá trị sao cho 50% quan sát
trong mẫu có giá trị nhỏ hơn giá trị này.
Mode là giá trị của quan sát có tần số lớn nhất
trong mẫu.
Example
Tính median và mode của tập dữ liệu trong ví dụ
3.
Chương 4: Mẫu trong thống kê
Định nghĩa Mẫu trong thống kê
Tần số và tỷ lệ mẫu
Các đặc trưng của mẫu
Biểu diễn dữ liệu bằng đồ thị
Định lý giới hạn trung tâm
Phân phối của các đặc trưng mẫu
Đồ thị tần số
Đồ thi tần số thường được dùng để biểu diễn tập
dữ liệu có số lượng tương đối nhỏ các giá trị khác
nhau và được cho dưới dạng bảng tần số.
Example
Mức lương khởi điểm của 42 sinh viên mới ra
trường của ngành kỹ sư điện được cho trong bảng
sau (lương khởi điểm được tính theo đơn vị ngàn
$ /năm)
Đồ thị tần số
Example
Lương Tần số Lương Tần số
47 4 53 0
48 1 54 5
49 3 56 2
50 5 57 3
51 8 60 1
52 10
Vẽ đồ thị tần số về mức lương khởi điểm của sinh
viên ngành điện.
Đồ thị tần số
Hình: Biểu đồ tần số dạng cột (line graph)
Đồ thị tần số
Hình: Biểu đồ tần số dạng cột (bar graph)
Đồ thị tần số
Hình: Biểu đồ tần số dạng đường (frequency polygon)
Biểu đồ tròn
Biểu đồ tròn được dùng để biểu diễn tập dữ liệu
có số lượng tương đối nhỏ các giá trị khác nhau
và được cho dưới dạng bảng tỷ lệ (table of
relative frequency).
Example
Bảng sau thống kê các dạng bệnh ung thư cùng
với số bệnh nhân gần đây nhất bị mắc bệnh. Có
200 bệnh nhân đuợc khảo sát trong thống kê này
Dạng bệnh Số bệnh nhân Tần suất
Lung 42 0.21
Breast 50 0.25
Colon 32 0.16
Prostate 55 0.275
Melanoma 9 0.045
Bladder 12 0.06