Tổng hợp Xác suất thống kê - Mai Huy Sơn
Bài 1:
Gọi mu1 là mức tiêu thụ xăng trung bình của động cơ cũ
Gọi mu2 là mức tiêu thụ xăng trung bình của động cơ mới
H0: mu1 <= mu2 (dự đoán không có cơ sở)
H1: mu1 > mu2 (dự đoán có cơ sở)
> t.test(Cu,Moi,mu=0,alt="g")
p-value = 0.9467 > 0.05 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, dự đoán của nhà sản xuất là không có cơ sở
Bài 3:
a) > t.test(Thang1,conf.level=0.96)
[77.73251 , 139.76749]
b) Gọi p là tỷ lệ người dùng điện thoại lớn hơn 300 trong tháng 1
H0: p >= 10%
H1: p < 10%
> sum(Thang1>300)
[1] 0
> length(Thang1)
[1] 20
> prop.test(0,20,p=0.1,correct=T,alt="l")
p-value = 0.1318 > 0.05 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, tỷ lệ người dùng điện thoại lớn hơn 300 trong tháng 1
chiếm ít nhất 10%
c) Gọi mu là tiền điện thoại trung bình tháng 1
H0: mu = 200
H1: mu # 200
> t.test(Thang1, mu=200, alt="t")
p-value = 3.249e-06 < 0.05 => bác bỏ H0, chấp nhận H1
Vậy tại mức ý nghĩa 5%, tiền điện thoại trung bình tháng 1 không phải là 200
d) Gọi mu1 là tiền điện thoại trung bình trong tháng 1 của nhóm ly hôn
Gọi mu2 là tiền điện thoại trung bình trong tháng 1 của nhóm đang có gia đình
H0: mu1 <= mu2
H1: mu1 > mu2
> n1=subset(Thang1, TinhTrangHonNhan=="Da ly hon")
> n2=subset(Thang2, TinhTrangHonNhan=="Dang co gia dinh")
> t.test(n1, n2, mu=0, alt="g")
p-value = 0.5617 > 0.05 => chấp nhận H0, bác bỏ H1
1
Tổng hợp Xác suất thống kê - Mai Huy Sơn
Vậy tại mức ý nghĩa 10% trung bình những người dùng tiền điện thoại tháng 1
trong nhóm đã ly hôn không cao hơn trong nhóm đang có gia đình
e) Gọi mu1, mu2, mu3 lần lượt là tiền sử dụng điện thoại tháng 1 trung bình của 3
nhóm chưa lập gia đình, đã ly hôn, đang có gia đình
H0: mu1 = mu2 = mu3
H1: tồn tại mui # muj với i,j = 1:3
> anova(lm(Thang1~TinhTrangHonNhan))
p-value = 0.538 > 0.05 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, tiền điện thoại trung bình 3 loại tình trạng hôn nhân là
như nhau
Nguồn
biến Tổng bình phương
thiên
Giữa các nhóm
5291
Nội bộ các nhóm
69923
Tổng cộng
75214
Bậc tự do
Phương sai
Tỷ số F
2
17
19
2645.3
4113.1
0.6431
Fth=qf(1-0.05,2,17)
[1] 3.591531
F-value < Fth => chấp nhận H0, bác bỏ H1
Bài 4:
a) > table(GioiTinh,KhuVuc)
KhuVuc
GioiTinh HaiDao MienNui NongThon ThanhPho
Nam
Nu
6
6
13
13
10
10
26
16
b) H0: khu vực sống và giới tính không có mối liên hệ với nhau
H1: khu vực sống và giới tính có mối liên hệ với nhau
> a=table(GioiTinh,KhuVuc)
> chisq.test(a)
p-value = 0.7067 > 0.05 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, khu vực sống và giới tính không có mối liên hệ với
nhau
Bài 5:
Gọi mu là trọng lượng trung bình của các gói đường kính xuất khẩu
H0: mu = 1
H1: mu < 1
2
Tổng hợp Xác suất thống kê - Mai Huy Sơn
Cách 1:
> x=rep(c(0.9,0.95,0.98,1,1.01,1.02),c(5,10,15,10,5,5))
> t.test(x,mu=1,alt="l")
p-value = 8.578e-06 < 0.05 => bác bỏ H0, chấp nhận H1
Vậy tại mức ý nghĩa 5%, trọng lượng trung bình của các gói đường xuất khẩu là
nhỏ hơn 1 kg
Cách 2:
> tth=qt(1-0.05,49)
> tth
[1] 1.676551
tkd = -4.7663
tkd < -tth => bác bỏ H0, chấp nhận H1
Bài 6:
H0: các loại xe ô tô được ưa chuộng như nhau
H1: các loại xe ô tô không được ưa chuộng như nhau
> x=c(32,35,45,40)
> p0=c(0.25,0.25,0.25,0.25)
> chisq.test(x,p=p0)
p-value = 0.4612 > 0.05 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, các loại xe ô tô được ưa chuộng như nhau
Bài 7:
Tìm ước lượng điểm cho tỷ lệ cho chỉ số IQ>120
> sum(ChiSoIQ>120)
[1] 18
> length(ChiSoIQ)
[1] 200
> 18/200
[1] 0.09
Tìm ước lượng điểm cho trung bình IQ
> mean(ChiSoIQ)
[1] 99.97
Tìm khoảng tin cậy 95% cho chỉ số IQ trung bình
3
Tổng hợp Xác suất thống kê - Mai Huy Sơn
> t.test(ChiSoIQ,conf.level=0.95)
[ 97.71837 , 102.22163]
Tìm khoảng tin cậy 96% cho tỷ lệ IQ>130
> sum(ChiSoIQ>130)
[1] 4
> length(ChiSoIQ)
[1] 200
> prop.test(4,200,correct=T,conf.level=0.96)
[0.006148167 , 0.055846647]
Tìm ước lượng điểm cho phương sai chỉ số IQ (tính phương sai như bình thường var)
> var(ChiSoIQ)
[1] 260.7529
Bài 8:
Gọi md1, md2, md3 lần lượt là trung vị trọng lượng bao gạo đo được ở 3 máy
H0: md1 = md2 = md3
H1: tồn tại mdi # mdj với i,j = 1:3
> m1=c(20.2,20.3,19.8,19.7,20.3,20.4)
> m2=c(20.5,20.1,20.7,19.9,19.2,19.9)
> m3=c(19.5,19.7,19.8,19.4,19.7,19.6)
> kruskal.test(list(m1,m2,m3))
p-value = 0.03477 < 0.05 => bác bỏ H0, chấp nhận H1
Vậy tại mức ý nghĩa 5%, trọng lượng bao gạo đo được ở cả 3 máy là khác nhau
Bài 9:
a) > table(VungGui)
VungGui
KhuVuc1 KhuVuc2 KhuVuc3 NoiTinh
75 67
62
96
b) H0: tỷ lệ bưu phẩm gửi đi các vùng không thay đổi
H1: tỷ lệ bưu phẩm gửi đi các vùng thay đổi
4
Tổng hợp Xác suất thống kê - Mai Huy Sơn
> x=c(75,67,62,96)
> p0=c(0.2,0.25,0.3,0.25)
> chisq.test(x,p=p0)
p-value = 0.0002492 => bác bỏ H0, chấp nhận H1
Vậy tại mức ý nghĩa 5%, tỷ lệ bưu phẩm gửi đi các vùng thay đổi
Bài 10:
Gọi mu1 là huyết áp trung bình của bệnh nhân trước khi dùng Timolol
Gọi mu2 là huyết áp trung bình của bệnh nhân sau khi dùng Timolol
H0: mu1 - mu2 <= 30
H1: mu1 - mu2 > 30
> t.test(truoc,sau,mu=30,alt="g",paired=T,var.equal=T)
p-value = 0.9943 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, không thể kết luận hàm lượng timolol trước điều trị lớn hơn
sau điều trị đúng 30.
Bài 11:
Gọi p1 là tỷ lệ nam yêu thích thể thao ở mức 3
Gọi p2 là tỷ lệ nữ yêu thích thể thao ở mức 4
H0: p1 <= p2
H1: p1 > p2
> sum(GioiTinh=="Nam" & TheThao=="3")
[1] 31
> sum(GioiTinh=="Nu" & TheThao=="4")
[1] 37
> table(GioiTinh)
GioiTinh
Nam Nu
227 248
> x=c(31,37)
> n=c(227,248)
> prop.test(x,n,correct=F,alt="g")
p-value = 0.6527 => chấp nhận H0, bác bỏ H1
5
Tổng hợp Xác suất thống kê - Mai Huy Sơn
Vậy tại mức ý nghĩa 5%, tỷ lệ nam thích thể thao ở mức 3 không cao hơn tỉ lệ nữ thích
thể thao ở mức 4.
Bài 12:
Gọi p1 là tỷ lệ sản phẩm bj lỗi từ dây chuyền thứ nhất
Gọi p2 là tỷ lệ sản phẩm bị lỗi từ dây chuyền thứ hai
H0: p1 = p2
H1: p1 # p2
> x=c(50,60)
> n=c(600,650)
> prop.test(x,n,correct=F,alt="t")
p-value = 0.5758 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, chất lượng 2 dây chuyền là như nhau
Bài 12’:
H0: phân phối của số lần bán được hàng thực sự tuân theo pp nhị thức
H1: phân phối của số lần bán được hàng không tuân theo pp nhị thức
> x=c(10,41,60,20,6,3)
> p0=dbinom(0:5,5,0.4)
> chisq.test(x,p=p0)
p-value = 0.0356 => bác bỏ H0, chấp nhận H1
Vậy tại mức ý nghĩa 5%, phân phối của số lần bán được hàng không tuân theo pp nhị
thức
Bài 13:
H0: chiều cao của người dân việt nam có tuân theo phân phối chuẩn
H1: chiều cao của người dân việt nam không tuân theo phân phối chuẩn
Bài 15:
Gọi md1 là trung vị hàm lượng cholesterol đo được trước khi tham gia chương trình
Gọi md2 là trung vị hàm lượng cholesterol đo được sau khi tham gia chương trình
6
Tổng hợp Xác suất thống kê - Mai Huy Sơn
H0: md1 >= md2
H1: md1 < md2
> truoc=c(265,240,258,295,251,245,287,314,260,279)
> sau=c(229,231,227,240,238,241,234,256,247,239)
> wilcox.test(truoc,sau,mu=0,alt="l",paired=T)
p-value = 0.9979 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, không đủ cơ sở cho rằng khi tham gia chương trình thì hàm
lượng cholretrol trong máu sẽ giảm
Bài 16:
a) Kiểm định xem mức độ đồng đều chỉ số IQ của nam có cao hơn mức độ đồng
đều chỉ số IQ của nữ hay không tại mức ý nghĩa 5%
Gọi S12 là phương sai chỉ số IQ của nam
Gọi S22 là phương sai chỉ số IQ của nữ
H0: S12 >= S22
H1: S12 < S22
> var.test(nam,nu,mu=0,alt="l")
p-value = 0.6484 => chấp nhận H0, bác bỏ H1
Vậy tại mức ý nghĩa 5%, mức độ đồng đều chỉ số IQ của nam không cao hơn
mức độ đồng đều chỉ số IQ của nữ
b) Xem độ biến động Trí Tuệ IQ của nam có thấp hơn độ biến động Trí Tuệ IQ của
nữ hay không?
Gọi S12 là phương sai chỉ số IQ của nam
Gọi S22 là phương sai chỉ số IQ của nữ
H0: S12 >= S22
H1: S12 < S22
7