Tải bản đầy đủ (.pdf) (6 trang)

Giao trinh bai tap đề bài tập lớn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (268.8 KB, 6 trang )

ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA KHOA HỌC - KỸ THUẬT MÁY TÍNH

CẤU TRÚC RỜI RẠC CHO KHMT (CO1007)
Đề bài tập lớn cho Nhóm n

Thống kê mô tả và
Xác suất rời rạc với R

GVHD:
SV thực hiện:

Nguyễn An Khương
Huỳnh Tường Nguyên
Nguyễn Văn A – 22102134
Trần Văn B – 88471475
Lê Thị C – 36811334
Phạm Ngọc D – 97501334
Kiều Thị E – 12341334

Tp. Hồ Chí Minh, Tháng .../2016


Trường Đại Học Bách Khoa Tp.Hồ Chí Minh
Khoa Khoa Học và Kỹ Thuật Máy Tính

Mục lục
1 Hướng dẫn và yêu
1.1 Hướng dẫn . .
1.2 Yêu cầu . . . .


1.3 Nộp bài . . . .

cầu
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2
2
2
2

2 Đề bài

2

3 Cách đánh giá và xử lý gian lận
3.1 Đánh giá . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Xử lý gian lận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

4
4
4

Tài liệu

4

Đề bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016


Trang 1/5


Trường Đại Học Bách Khoa Tp.Hồ Chí Minh
Khoa Khoa Học và Kỹ Thuật Máy Tính

1

Hướng dẫn và yêu cầu

1.1

Hướng dẫn

• Cài đặt đồng thời cả R và Rstudio.
• Đọc kĩ và xử lý lại tất cả những thí dụ đã có trong file mẫu.
• Tìm hiểu kĩ cách soạn thảo văn bản bằng LaTeX và cách sử dụng phần mềm R trong các
file hướng dẫn và tìm hiểu thêm trong các tài liệu khác.
• Tạo chung một folder chung chứa mọi thứ cần thiết để share giữa các thành viên trong
nhóm trên các cloud services như Google Drive hay Dropbox,...
• Dùng Doodle để lên kế hoạch họp nhóm.
• Dùng Trello để quản lý project.
• Đối với Bài toán 4, cần tham khảo kĩ cú pháp để tính ra các số liệu bằng website Wolfram
Alpha đã được nhúng liên kết vô kết quả trong Bài tập mẫu số 3.

1.2

Yêu cầu

• Thời gian làm bài: Từ 12/12/2015-29/1/2016.

Đối với mỗi bài toán, yêu cầu sinh viên trình bày lời giải theo lối truyền thống, sử dụng
các công thức, kết quả lý thuyết trong phần kiến thức chuẩn bị. Đồng thời, sau đó trình
bày kết quả tính toán và biểu đồ minh họa bằng R.
• Trình bày cả code R và kết quả tính toán trong R gống như file mẫu.
• Viết báo cáo theo đúng bố cục như trong file mẫu bằng LaTeX.
• Mỗi nhóm khi nộp bài cần phải nộp theo file log (nhật ký) ghi rõ: tiến độ công việc,
phân công nhiệm vụ, trao đổi của các thành viên,...

1.3

Nộp bài

• SV chỉ nộp bài qua hệ thống Sakai: nén tất cả các file cần thiết (file .tex, file .R, . . . ) thành
một file tên là “BTL-CO1007-MT151-Nhom-n.zip” và nộp trong mục Assignment.
• Lưu ý: mỗi nhóm chỉ cần một thành viên là nhóm trưởng nộp bài.

2

Đề bài

Bài toán 1. Trong gói mistat, tập tin FILMSP.csv chứa dữ liệu được thu thập từ 217 cuộn
phim. Dữ liệu chứa tốc độ phim được đo trong một phòng đặc biệt.
Các lệnh R sau sẽ cài đặt các gói mistat, đọc tập dữ liệu FILMSP về tốc độ phim đo được,
và hiển thị chúng trên màn hình máy tính.
> # Sau dấu này là một comment
> install.packages("mistat",
# Cài đặt gói mistat
dependencies=TRUE) # và tất cả các gói có liên quan đến nó

Đề bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016


Trang 2/5


Trường Đại Học Bách Khoa Tp.Hồ Chí Minh
Khoa Khoa Học và Kỹ Thuật Máy Tính

>
>
>
>

library(mistat) # Gọi ra các tập dữ liệu và hàm có trong gói
data(FILMSP)
# Gọi ra tập dữ liệu về tốc độ phim đo được
help(FILMSP)
# Đọc tất cả các thông tin hỗ trợ về tập dữ liệu FILMSP
FILMSP
# Đưa ra các số liệu FILMSP trên màn hình máy tính

1. Hãy trích xuất ra tốc độ phim đo được của 30 cuộn phim đầu tiên trong số 217 cuộn phim
trong tập dữ liệu kể từ cuộn phim thứ 100 + n? (n là số thứ tự của nhóm.)
2. Tính tần số, tần suất và tần suất tích lũy của mẫu 30 cuộn phim trên.
3. Vẽ biểu đồ tần số của mẫu 30 cuộn phim trên.
4. Vẽ biểu đồ tần suất của mẫu 30 cuộn phim trên.
5. Vẽ biểu đồ tần suất tích lũy của mẫu 30 cuộn phim trên.
6. Tính tốc độ trung bình, trung vị mẫu, cực đại mẫu, cực tiểu mẫu của 30 cuộn phim trên.
7. Hãy đo mức độ phân tán của tộc độ phim (xung quanh giá trị trung bình) của 30 cuộn
phim trên.
8. Tính độ méo lệch (skewness), và độ nhọn (kurtosis) của dữ liệu trong 30 cuộn phim trên.

9. Tính tứ phân vị (quartile) thứ nhất (Q1 ) và thứ ba (Q3 ) của mẫu 30 cuộn phim trên.
10. Tính phân vị thứ (100 − n)%, phân vị thứ n%, phân vị thứ (50 ± n2 )% của mẫu 30 cuộn
phim trên.
Bài toán 2. Một cái máy dùng để kiểm tra tình trạng của một món hàng (khiếm khuyết D,
hoặc tốt G) có thể bị lỗi. Xác suất các lỗi được cho như sau
P(A|G) = (100 −
P(A|D) =

n
)%,
1000

2n
,
1000

trong đó A là biến cố “món hàng đó được xem là tốt (G) sau khi kiểm tra”. Nếu P(G) =
3n
)%, thì xác suất của D khi biết A là bao nhiêu?
(100 − 1000
Bài toán 3. Có 1000 − n bo mạch điện tử được đựng trong một hộp, biết rằng có 3 bo mạch
bị lỗi. Lấy ngẫu nhiên không hoàn lại lần lượt từng bo mạch. Tính xác suất để tìm thấy chính
xác 100 − n bo mạch tốt giữa lần rút được bo lỗi đầu tiên và lần rút được bo lỗi thứ hai?
Bài toán 4. Một khối tín hiệu gồm 256 bit được dẫn theo một kênh truyền với xác suất bị lỗi
của mỗi bit là p = n × 10−3 . Biết rằng khả năng bị lỗi của mỗi bit độc lập với nhau.
1. Số bit lỗi của khối tín hiệu đó tuân theo luật phân phối xác suất nào? Nói cách khác, nó
tuân theo mô hình xác suất nào? Vì sao?
2. Hãy vẽ biểu đồ minh họa phân phối xác suất (điểm) của số bit lỗi trong khối tín hiệu đó
với X ≤ 30?
3. Hãy vẽ đồ thị của hàm phân phối xác suất (tích lũy) của số bit lỗi trong khối tín hiệu đó

với X ≤ 30?
Đề bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016

Trang 3/5


Trường Đại Học Bách Khoa Tp.Hồ Chí Minh
Khoa Khoa Học và Kỹ Thuật Máy Tính

4. Tính xác suất để khối tín hiệu đó có ít nhất 100 − n bit lỗi?
5. Tính xác suất để khối tín hiệu đó có tối đa n + 10 bit lỗi?
6. Tính xác suất để khối tín hiệu đó có nhiều hơn n + 5 bit lỗi?
7. Tính xác suất để khối tín hiệu đó có đúng 100 + n bit lỗi?
8. Tính xác suất để khối tín hiệu có từ 100 đến 200 − n bit lỗi?
9. Tính số bit lỗi trung bình trong khối tín hiệu đó?
10. Tính độ phân tán của số bit lỗi trong khối tín hiệu đó?
Bài toán 5. Một❤lô hàng gồm✭N = 5000 − n sản phẩm có chứa M = 150 − n sản phẩm lỗi. Lấy
❤❤
✭✭lại n + 50 sản phẩm. Tính xác suất có nhiều hơn n sản phẩm lỗi


mẫu ngẫu nhiên ✭
không
hoàn
✭✭❤
❤❤
trong mẫu?
Bài toán 6 (Tùy chọn). 1 Đọc kỹ “Birthday Problem” và “Birthday Attack” trong slides Chương
7 (từ slide 7.18-7.22). Sau đó, hãy tìm công thức tính xác suất và công thức xấp xỉ bằng hàm
mũ của công thức đó cho một biến thể của “Bài toàn sinh nhật” dưới đây.

Có một nhóm gồm k nam giới và một nhóm khác gồm phụ nữ (k, ≥ 1). Hãy tính xác suất
để có ít nhất một đôi nam nữ có cùng ngày sinh.

3

Cách đánh giá và xử lý gian lận

3.1

Đánh giá

Mỗi bài làm sẽ được đánh giá như sau.
Nội dung
Giải đúng các bài toán bằng công thức và lập luận
Các lệnh (hàm) R được sử dụng đúng đắn và hợp lý
Trình bày kiến thức chuẩn bị rõ ràng, phù hợp
Trình bày văn bản đẹp, đúng chuẩn

3.2

Tỉ lệ điểm (%)
30%
30%
20%
20%

Xử lý gian lận

Bài tập lớn phải được sinh viên (nhóm) TỰ LÀM. Sinh viên (nhóm) sẽ bị coi là gian lận nếu:
• Có sự giống nhau bất thường giữa các bài thu hoạch (nhất là phần kiến thức chuẩn bị).

Trong trường hợp này, TẤT CẢ các bài nộp có sự giống nhau đều bị coi là gian lận. Do
vậy sinh viên (nhóm) phải bảo vệ bài làm của mình.
• Sinh viên (nhóm) không hiểu bài làm do chính mình viết. Sinh viên (nhóm) có thể tham
khảo từ bất kỳ nguồn tài liệu nào, tuy nhiên phải đảm bảo rằng mình hiểu rõ ý nghĩa của
tất cả những gì mình viết.
Bài bị phát hiện gian lận thì sinh viên sẽ bị xử ý theo quy định của nhà trường.
1 Đây là bài làm thêm, dành cho những bạn yêu thích tổ hợp. Có thể nộp riêng theo từng SV để lấy điểm
thưởng.

Đề bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016

Trang 4/5


Trường Đại Học Bách Khoa Tp.Hồ Chí Minh
Khoa Khoa Học và Kỹ Thuật Máy Tính

Tài liệu
[Dal]

Dalgaard, P. Introductory Statistics with R. Springer 2008.

[K-Z]

Kenett, R. S. and Zacks, S. Modern Industrial Statistics: with applications in R,
MINITAB and JMP, 2nd ed., John Wiley and Sons, 2014.

[Ker]

Kerns, G. J. Introduction to Probability and Statistics Using R, 2nd ed., CRC 2015.


Đề bài tập lớn môn Cấu trúc Rời rạc cho KHMT (CO1007) - Niên khóa 2015-2016

Trang 5/5



×