ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
Đề tài:
ÁP DỤNG THUẬT TOÁN GỢI Ý VÀO XÂY
DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM
Sinh viên thực hiện: PHẠM VIỆT HOÀNG
Mã số sinh viên: 20182547
Lớp: ĐIỆN TỬ 02 – K63
TS. NGUYỄN XUÂN DŨNG
Giảng viên hướng dẫn: PGS.TS. TRẦN QUANG VINH
Hà Nội, 03-2023
ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
Đề tài:
ÁP DỤNG THUẬT TOÁN GỢI Ý VÀO XÂY
DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM
Sinh viên thực hiện: PHẠM VIỆT HOÀNG
Giảng viên hướng dẫn: Lớp Điện tử 02 – K63
Cán bộ phản biện: TS. NGUYỄN XUÂN DŨNG
PGS.TS. TRẦN QUANG VINH
Hà Nội, 03-2023
ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP
(DÀNH CHO CÁN BỘ HƯỚNG DẪN)
Tên đề tài: Áp dụng thuật toán gợi ý vào xây dựng ứng dụng đề xuất phim
Họ tên SV: Phạm Việt Hoàng MSSV: 20182547
Cán bộ hướng dẫn: TS. Nguyễn Xuân Dũng , PGS. TS. Trần Quang Vinh
STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí
1 Thái độ làm Nghiêm túc, tích cực và chủ động trong quá trình làm ĐATN
việc
(2,5 điểm) Hoàn thành đầy đủ và đúng tiến độ các nội dung được GVHD giao
Trình bày đúng mẫu quy định, bố cục các chương logic và hợp lý:
Bảng biểu, hình ảnh rõ ràng, có tiêu đề, được đánh số thứ tự và được
Kỹ năng viết giải thích hay đề cập đến trong đồ án, có căn lề, dấu cách sau dấu
2 quyển ĐATN chấm, dấu phẩy, có mở đầu chương và kết luận chương, có liệt kê tài
(2 điểm) liệu tham khảo và có trích dẫn, v.v.
Kỹ năng diễn đạt, phân tích, giải thích, lập luận: Cấu trúc câu rõ ràng,
văn phong khoa học, lập luận logic và có cơ sở, thuật ngữ chuyên
ngành phù hợp, v.v.
Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn
đề và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ
quy trình nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên
cứu/ giải quyết vấn đề, kết quả đạt được, đánh giá và kết luận.
Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được
3 kết quả đạt phân tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ
được phỏng/ phần mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả
(5 điểm) trước đó có liên quan.
Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng
thời cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện
trong tương lai. Hàm lượng khoa học/ độ phức tạp cao, có tính
mới/tính sáng tạo trong nội dung và kết quả đồ án.
Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH
giải 3 cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc
Điểm thành tế từ giải 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)
Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH
4 tích
(1 điểm) nhưng không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong
cuộc thi khoa học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng
dụng có tính hồn thiện cao, yêu cầu khối lượng thực hiện lớn. (0,5
điểm)
Điểm tổng các tiêu chí:
Điểm hướng dẫn:
Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm hướng dẫn làm tròn thành 10
Nhận xét khác của cán bộ hướng dẫn
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
Ngày: … / … / 20…
Cán bộ hướng dẫn
(Ký và ghi rõ họ tên)
ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP
(DÀNH CHO CÁN BỘ PHẢN BIỆN)
Tên đề tài: Áp dụng thuật toán gợi ý vào xây dựng ứng dụng đề xuất phim
Họ tên SV: Phạm Việt Hoàng MSSV: 20182547
Cán bộ phản biện: …………………………………………………………………………
STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí
Đồ án trình bày đúng mẫu quy định, bố cục các chương logic và hợp lý:
Bảng biểu, hình ảnh rõ ràng, có tiêu đề, được đánh số thứ tự và được giải
Trình bày thích hay đề cập đến trong đồ án, có căn lề, dấu cách sau dấu chấm, dấu
1 quyển ĐATN phẩy, có mở đầu chương và kết luận chương, có liệt kê tài liệu tham khảo và có trích dẫn, v.v.
(4 điểm) Kỹ năng diễn đạt, phân tích, giải thích, lập luận: cấu trúc câu rõ ràng, văn
phong khoa học, lập luận logic và có cơ sở, thuật ngữ chuyên ngành phù
hợp, v.v.
Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn đề
và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ quy trình
nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên cứu/ giải
quyết vấn đề, kết quả đạt được, đánh giá và kết luận.
Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được phân
2 kết quả đạt tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ phỏng/ phần
được mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả trước đó có liên
(5,5 điểm) quan.
Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng thời
cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện trong tương
lai. Hàm lượng khoa học/ độ phức tạp cao, có tính mới/ tính sáng tạo trong
nội dung và kết quả đồ án.
Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH giải 3
cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc tế từ giải
Điểm thành 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)
3 tích Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH nhưng
(1 điểm) không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong cuộc thi khoa
học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng dụng có tính hồn
thiện cao, yêu cầu khối lượng thực hiện lớn. (0,5 điểm)
Điểm tơng các tiêu chí:
Điểm phản biện:
Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm phản biện làm tròn thành 10
Nhận xét khác của cán bộ phản biện
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
Ngày: … / … / 20…
Cán bộ phản biện
(Ký và ghi rõ họ tên)
ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ
ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP
(DÀNH CHO CÁN BỘ THÀNH VIÊN HỘI ĐỒNG)
Hội đồng số: ……………………………………………………………………………………
Họ tên SV: PHẠM VIỆT HOÀNG MSSV: 20182547
Cán bộ thành viên HĐ: …………………………………………………………………………
STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí
Chất lượng Sử dụng các minh họa hỗ trợ: Hình ảnh, biểu đồ rõ nét và phù hợp, dễ
1 slides/Bản hiểu
vẽ kỹ thuật Không quá nhiều từ, biết sử dụng từ khoá; bố cục logic, có đánh số
(1,5 điểm) trang
Kỹ năng Tự tin, làm chủ nội dung trình bày, đúng thời gian quy định
2 thuyết trình
(1,5 điểm) Dễ hiểu, dễ theo dõi, lô-gic, lôi cuốn.
Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn
đề và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ
quy trình nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên
cứu/ giải quyết vấn đề, kết quả đạt được, đánh giá và kết luận.
Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được phân
3 kết quả đạt tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ phỏng/ phần
được mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả trước đó có
(4 điểm) liên quan.
Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng
thời cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện
trong tương lai. Hàm lượng khoa học/ độ phức tạp cao, có tính mới/ tính
sáng tạo trong nội dung và kết quả đồ án.
Trả lời câu Trả lời ngắn gọn, chính xác, đi thẳng vào vấn đề của câu hỏi.
4 hỏi Nắm vững kiến thức cơ bản liên quan đến lĩnh vực nghiên cứu/ công
(2,5 điểm) việc của đồ án.
Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH
giải 3 cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc
Điểm thành tế từ giải 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)
5 tích Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH nhưng
(1 điểm) không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong cuộc thi
khoa học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng dụng có
tính hồn thiện cao, u cầu khối lượng thực hiện lớn. (0,5 điểm)
Điểm tổng các tiêu chí:
Điểm bảo vệ:
Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm phản biện làm tròn thành 10
Nhận xét khác của cán bộ thành viên hội đồng
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
Ngày: … / … / 20…
Cán bộ thành viên hội đồng
(Ký và ghi rõ họ tên)
LỜI NÓI ĐẦU
Cuộc sống của con người ngày càng được hỗ trợ nhiều mặt bằng các giải pháp công
nghệ mới cùng với các hệ thống thông minh phụ trợ. Chất lượng cuộc sống của con
người ngày càng được cải thiện kéo theo nhu cầu về các hoạt động giải trí ngày càng
tăng. Có ngày càng nhiều phim được ra mắt làm cho người dùng đứng trước rất nhiều
sự lựa chọn.
Từ nhu cầu thực tế, nhằm đem tới cho người dùng những lựa chọn bộ phim phù hợp
nhất cho bản thân đề tài Áp dụng thuật toán đề xuất vào xây dựng ứng dụng đề xuất
phim để giải quyết vấn đề này.
Qua đây, em cũng xin chân thành cảm ơn thầy TS. NGUYỄN XUÂN DŨNG và
PGS.TS. TRẦN QUANG VINH đã trực tiếp định hướng đồ án và tận tình hướng dẫn
trong suốt thời gian thực tập ở trên lab. Em cũng xin chân thành cảm ơn các thành viên
trong phòng nghiên cứu SANSLAB – Smart Applications and Network System
Laboratory đã tận tình hỗ trợ, giúp đỡ em trong việc giải quyết những vấn đề gặp phải
trong quá trình làm đồ án. Trong quá trình làm đồ án, do kiến thức của em còn nhiều
hạn chế, hiểu biết chưa rộng nên đồ án khơng tránh khỏi thiếu sót. Em rất mong nhận
được sự chỉ bảo và nhận xét quý báu của các thầy cô.
Em xin chân thành cảm ơn!
Hà Nội, ngày 05 tháng 03 năm 2023.
Sinh viên
Phạm Việt Hoàng
LỜI CAM ĐOAN
Tôi tên là Phạm Việt Hoàng, là sinh viên K63 trường Điện – Điện tử có mã số sinh
viên 20182547, người hướng dẫn là TS. NGUYỄN XUÂN DŨNG và PGS.TS.TRẦN
QUANG VINH đều tuân thủ các quy định về sở hữu trí tuệ, các tài liệu tham khảo được
liệt kê rõ ràng. Tơi xin chịu hồn tồn trách nhiệm trước những nội dung được viết trong
đồ án này.
Hà Nội, ngày 05 tháng 03 năm 2023.
Sinh viên
Phạm Việt Hoàng
i
MỤC LỤC
LỜI NÓI ĐẦU......................................................................................................................i
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................................vi
DANH MỤC KÝ HIỆU TOÁN HỌC .............................................................................vii
DANH MỤC HÌNH VẼ...................................................................................................viii
DANH MỤC BẢNG BIỂU................................................................................................. x
TĨM TẮT ĐỒ ÁN.............................................................................................................xi
ABSTRACT .....................................................................................................................xiii
PHẦN MỞ ĐẦU ............................................................................................................... xv
1.1 Lý do chọn đề tài ..................................................................................................... xv
1.2 Mục đích nghiên cứu.............................................................................................. xv
1.3 Nhiệm vụ nghiên cứu ............................................................................................ xvi
1.4 Phương pháp nghiên cứu...................................................................................... xvi
1.5 Kết quả đã đạt được ............................................................................................... xvi
1.6 Kết luận .................................................................................................................. xvi
CHƯƠNG 2. TỔNG QUAN ĐỀ TÀI ................................................................................ 1
2.1 Giới thiệu về hệ thống gợi ý......................................................................................1
2.2 Các thành phần của một hệ thống gợi ý .................................................................. 3
2.3 Tìm hiểu một số phương pháp gợi ý ........................................................................ 5
2.3.1 Hệ thống gợi ý dựa theo lọc cộng tác ................................................................ 5
2.3.2 Hệ thống gợi ý dựa theo nội dung......................................................................6
2.3.3 Hệ thống gợi ý dựa trên cơ sở tri thức ............................................................... 6
2.3.4 So sánh các phương pháp gợi ý ......................................................................... 7
2.4 Phân loại các phương pháp lọc cộng tác.................................................................8
2.4.1 Phương pháp Lọc cộng tác dựa theo người dùng (User-Based CF) .................. 8
2.4.2 Phương pháp Lọc cộng tác dựa theo hạng mục (Item-Based CF) ................... 16
2.5 Các thuật toán được sử dụng trong Lọc cộng tác ................................................. 23
2.5.1 Kỹ thuật Phân rã ma trận (Matrix factorization - MF).....................................23
2.5.2 Kỹ thuật Máy Boltzmann Hạn chế (RBM) ...................................................... 25
2.6 Các thuật tốn có thể sử dụng trong hệ thống đề xuất phim................................26
2.6.1 Pearson Correlation degree .............................................................................. 26
2.6.2 CosineSimilarity .............................................................................................. 27
iii
2.6.3 Spearman rank correlation coefficient............................................................. 27
2.6.4 Log-likelihood similarity................................................................................. 27
2.6.5 Mahattan distance ............................................................................................ 28
2.6.6 TanimotoCoefficient ........................................................................................ 28
2.7 Các công cụ được sử sụng trong đề tài ................................................................. 28
2.7.1 Ngơn ngữ lập trình python và mơi trường lập trình ........................................ 28
2.7.2 Cài đặt môi trường sử dụng Python................................................................. 31
2.8 Kết luận chương ..................................................................................................... 32
CHƯƠNG 3. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU VỀ PHIM ĐƯỢC SỬ DỤNG.... 33
3.1 Bộ dữ liệu dùng để đánh giá giải thuật lọc cộng tác ............................................ 33
3.1.1 Bộ dữ liệu MovieLens 100k ............................................................................ 33
3.1.2 Bộ dữ liệu EachMovie..................................................................................... 33
3.2 Thu Thập cơ sở dữ liệu dùng cho hệ thống gợi ý ................................................. 34
3.2.1 Thu thập dữ liệu từ TMDB .............................................................................. 34
3.2.2 Kỹ thuật scrap data từ TMDB ......................................................................... 36
3.2.3 Phân loại dữ liệu và các thuộc tính.................................................................. 40
3.3 Kết luận chương ..................................................................................................... 41
CHƯƠNG 4. TÌM KIẾM THUẬT TỐN PHÙ HỢP VÀ ÁP DỤNG CHO FILM
RECOMMENDATION SYSTEM ........................................................................................ 42
4.1 Đánh giá và lựa chọn giải thuật phù hợp ............................................................. 42
4.1.1 Quá trình train các bộ dữ liệu .......................................................................... 42
4.1.2 Đánh giá kết quả và lựa chọn giải thuật phù hợp ............................................ 42
4.2 Architecture và Similarity Score ............................................................................ 46
4.2.1 Architecture ..................................................................................................... 46
4.2.2 Similarity Score ............................................................................................... 46
4.2.3 Cosine Similarity ............................................................................................. 46
4.3 Thuật toán được sử dụng trong hệ thống ............................................................. 47
4.4 Áp dụng các thuật toán vào film recomendation system ...................................... 47
4.4.1 Load dữ liệu từ dataset .................................................................................... 47
4.4.2 Demographic Filtering..................................................................................... 48
4.4.3 Cosine Similarity ............................................................................................. 51
4.4.4 Thuật toán gợi ý phim dựa theo Collaborative Filtering ................................. 57
CHƯƠNG 5. XÂY DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM ......................................... 59
5.1 Use case và Diagram .............................................................................................. 59
5.1.1 Use Case của web ............................................................................................ 59
5.1.2 UML diagram .................................................................................................. 60
5.2 Xây dựng web xem phim trực tuyến Moonflix...................................................... 60
5.2.1 Chức năng tạo tài khoản và đăng nhập............................................................ 60
5.2.2 Chức năng cập nhật thông tin .......................................................................... 62
5.2.3 Chức năng hiển thị phim và TV series thịnh hành và top rate ........................ 64
5.2.4 Chức năng xem thông tin phim........................................................................65
5.2.5 Chức năng viết bình luận, đánh giá..................................................................66
5.2.6 Chức năng tạo list các bộ phim yêu thích ........................................................ 67
5.2.7 Chức năng gợi ý các bộ phim liên quan...........................................................68
5.2.8 Chức năng tìm kiếm phim dựa theo tiêu đề ..................................................... 69
5.3 Kết luận chương...................................................................................................... 70
CHƯƠNG 6. KẾT QUẢ THỰC NGHIỆM....................................................................71
6.1 Kết quả khi thực hiện thuật toán gợi ý .................................................................. 71
6.1.1 Kết quả khi thực hiện Demographic Filtering ................................................. 71
6.1.2 Kết quả khi sử dụng cosin similarity ............................................................... 74
6.1.3 Kết quả gợi ý sử dụng Collaborative Filtering................................................. 80
6.1.4 Đánh giá sai số ................................................................................................. 82
6.2 Đánh giá kết quả.....................................................................................................84
6.3 Kết luận chương...................................................................................................... 84
KẾT LUẬN ....................................................................................................................... 85
Kết luận chung .............................................................................................................. 85
Hướng phát triển .......................................................................................................... 85
Lời cảm ơn .................................................................................................................... 85
TÀI LIỆU THAM KHẢO................................................................................................87
PHỤ LỤC .......................................................................................................................... 89
v
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT
KÍ HIỆU TIẾNG ANH TIẾNG VIỆT
CF Collaborative Filtering Kỹ thuật lọc cộng tác
CRS Collaborative Recommendation
Hệ thống gợi ý dựa trên lọc
CS System cộng tác
DF Cosine Similarity
MAE Demographic Filtering Độ trùng lặp Cosine
MF Mean Absolute Error
RBM Matrix Factorization Lọc dựa trên nhân khẩu học
Restrictive Boltzmann Machine
Chỉ số hồi quy
RMSE Root Mean Square Error
Kỹ thuật phân rã ma trận
UML Unified Modeling Language
Kỹ thuật Máy Boltzman Hạn
chế
Căn bậc hai của mức trung bình
của các sai số bình phương
Ngơn ngữ mơ hình hóa thống
nhất
KÝ HIỆU DANH MỤC KÝ HIỆU TOÁN HỌC
∂ Ý NGHĨA
λ
β Đạo hàm riêng
Hệ số chính tắc hóa
Tốc độ học(learn rating)
DANH MỤC HÌNH VẼ
Hình 2-1 Hệ thống gợi ý của ứng dụng Amazon .......................................................2
Hình 2-2 Hệ thống gợi ý của ứng dụng Netflix .........................................................3
Hình 2-3 Ma trận biểu diễn dữ liệu trong RS (user-item rating matrix)....................4
Hình 2-4 Minh họa cho hệ thống gợi ý dựa theo lọc cộng tác ..................................5
Hình 2-5 Minh họa cho Hệ thống gợi ý dựa theo nội dung.......................................6
Hình 2-6 Minh họa cho Hệ thống gợi ý dựa trên cơ sở tri thức ................................7
Hình 2-7 Ma trận mơ tả rating giữa các user và item ................................................9
Hình 2-8 Ma trận ratings giữa các user và item.......................................................17
Hình 2-9 Minh họa kỹ thuật phân rã ma trận...........................................................23
Hình 2-10 Minh họa cho thuật tốn ALS.................................................................25
Hình 2-11 Trang chủ Pycharm.................................................................................31
Hình 2-12 Tạo project mới trong Pycharm..............................................................32
Hình 3-1 Giao diện trang web movielens.org..........................................................33
Hình 3-2 Giao diện trang web download bộ dữ liệu EachMovie ............................34
Hình 3-3 Giao diện web TMDB ..............................................................................34
Hình 3-4 TMDB API endpoint ................................................................................35
Hình 3-5 Mơ tả q trình tạo cơ sở dữ liệu bằng kĩ thuật scrap ..............................36
Hình 3-6 Mơ tả q trình thu thập tên phim ............................................................37
Hình 3-7 Mơ tả q trình thu thập đánh giá và số lượt đánh giá .............................37
Hình 3-8 Mơ tả q trình thu thập thể loại phim .....................................................38
Hình 3-9 Sơ đồ khối quá trình scraping data từ web ...............................................39
Hình 3-10 Kết quả được ghi vào file Excel .............................................................40
Hình 4-1 Thơng số MAE đối với bộ dữ liệu Movielens..........................................43
Hình 4-2 Thơng số RMSE đối với bộ dữ liệu Movielens........................................43
Hình 4-3 Thơng số MAE đối với bộ dữ liệu EachMovie ........................................44
Hình 4-4 Thơng số RMSE đối với bộ dữ liệu EachMovie ......................................44
Hình 4-5 Architecture of system..............................................................................46
Hình 4-6 Mơ hình dự đốn phim .............................................................................47
Hình 4-7 Sơ dồ khối quá trình Demographic Filtering............................................49
Hình 4-8 Top 10 phim có số điểm cao nhất .............................................................50
Hình 4-9 Thống kê độ phổ biến của các bộ phim đạt cao nhất ...............................51
viii