Tải bản đầy đủ (.pdf) (125 trang)

Áp dụng THUẬT TOÁN GỢI Ý VÀO XÂY DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.65 MB, 125 trang )

ĐẠI HỌC BÁCH KHOA HÀ NỘI

TRƯỜNG ĐIỆN – ĐIỆN TỬ

ĐỒ ÁN

TỐT NGHIỆP ĐẠI HỌC

Đề tài:

ÁP DỤNG THUẬT TOÁN GỢI Ý VÀO XÂY
DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM

Sinh viên thực hiện: PHẠM VIỆT HOÀNG
Mã số sinh viên: 20182547
Lớp: ĐIỆN TỬ 02 – K63
TS. NGUYỄN XUÂN DŨNG
Giảng viên hướng dẫn: PGS.TS. TRẦN QUANG VINH

Hà Nội, 03-2023


ĐẠI HỌC BÁCH KHOA HÀ NỘI

TRƯỜNG ĐIỆN – ĐIỆN TỬ

ĐỒ ÁN

TỐT NGHIỆP ĐẠI HỌC

Đề tài:



ÁP DỤNG THUẬT TOÁN GỢI Ý VÀO XÂY
DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM

Sinh viên thực hiện: PHẠM VIỆT HOÀNG
Giảng viên hướng dẫn: Lớp Điện tử 02 – K63
Cán bộ phản biện: TS. NGUYỄN XUÂN DŨNG
PGS.TS. TRẦN QUANG VINH

Hà Nội, 03-2023


ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ

ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP

(DÀNH CHO CÁN BỘ HƯỚNG DẪN)

Tên đề tài: Áp dụng thuật toán gợi ý vào xây dựng ứng dụng đề xuất phim

Họ tên SV: Phạm Việt Hoàng MSSV: 20182547

Cán bộ hướng dẫn: TS. Nguyễn Xuân Dũng , PGS. TS. Trần Quang Vinh

STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí

1 Thái độ làm Nghiêm túc, tích cực và chủ động trong quá trình làm ĐATN
việc


(2,5 điểm) Hoàn thành đầy đủ và đúng tiến độ các nội dung được GVHD giao

Trình bày đúng mẫu quy định, bố cục các chương logic và hợp lý:

Bảng biểu, hình ảnh rõ ràng, có tiêu đề, được đánh số thứ tự và được

Kỹ năng viết giải thích hay đề cập đến trong đồ án, có căn lề, dấu cách sau dấu
2 quyển ĐATN chấm, dấu phẩy, có mở đầu chương và kết luận chương, có liệt kê tài

(2 điểm) liệu tham khảo và có trích dẫn, v.v.
Kỹ năng diễn đạt, phân tích, giải thích, lập luận: Cấu trúc câu rõ ràng,

văn phong khoa học, lập luận logic và có cơ sở, thuật ngữ chuyên

ngành phù hợp, v.v.

Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn

đề và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ

quy trình nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên

cứu/ giải quyết vấn đề, kết quả đạt được, đánh giá và kết luận.

Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được

3 kết quả đạt phân tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ
được phỏng/ phần mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả


(5 điểm) trước đó có liên quan.

Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng

thời cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện

trong tương lai. Hàm lượng khoa học/ độ phức tạp cao, có tính

mới/tính sáng tạo trong nội dung và kết quả đồ án.

Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH

giải 3 cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc

Điểm thành tế từ giải 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)
Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH
4 tích
(1 điểm) nhưng không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong
cuộc thi khoa học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng

dụng có tính hồn thiện cao, yêu cầu khối lượng thực hiện lớn. (0,5

điểm)

Điểm tổng các tiêu chí:

Điểm hướng dẫn:

Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm hướng dẫn làm tròn thành 10


Nhận xét khác của cán bộ hướng dẫn
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................

Ngày: … / … / 20…
Cán bộ hướng dẫn
(Ký và ghi rõ họ tên)

ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ

ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP

(DÀNH CHO CÁN BỘ PHẢN BIỆN)

Tên đề tài: Áp dụng thuật toán gợi ý vào xây dựng ứng dụng đề xuất phim

Họ tên SV: Phạm Việt Hoàng MSSV: 20182547

Cán bộ phản biện: …………………………………………………………………………

STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí

Đồ án trình bày đúng mẫu quy định, bố cục các chương logic và hợp lý:

Bảng biểu, hình ảnh rõ ràng, có tiêu đề, được đánh số thứ tự và được giải


Trình bày thích hay đề cập đến trong đồ án, có căn lề, dấu cách sau dấu chấm, dấu
1 quyển ĐATN phẩy, có mở đầu chương và kết luận chương, có liệt kê tài liệu tham khảo và có trích dẫn, v.v.

(4 điểm) Kỹ năng diễn đạt, phân tích, giải thích, lập luận: cấu trúc câu rõ ràng, văn

phong khoa học, lập luận logic và có cơ sở, thuật ngữ chuyên ngành phù

hợp, v.v.

Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn đề

và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ quy trình

nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên cứu/ giải

quyết vấn đề, kết quả đạt được, đánh giá và kết luận.

Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được phân

2 kết quả đạt tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ phỏng/ phần

được mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả trước đó có liên

(5,5 điểm) quan.

Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng thời

cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện trong tương


lai. Hàm lượng khoa học/ độ phức tạp cao, có tính mới/ tính sáng tạo trong

nội dung và kết quả đồ án.

Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH giải 3

cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc tế từ giải

Điểm thành 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)

3 tích Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH nhưng

(1 điểm) không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong cuộc thi khoa

học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng dụng có tính hồn

thiện cao, yêu cầu khối lượng thực hiện lớn. (0,5 điểm)

Điểm tơng các tiêu chí:

Điểm phản biện:

Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm phản biện làm tròn thành 10

Nhận xét khác của cán bộ phản biện
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................


Ngày: … / … / 20…
Cán bộ phản biện
(Ký và ghi rõ họ tên)

ĐẠI HỌC BÁCH KHOA HÀ NỘI
TRƯỜNG ĐIỆN – ĐIỆN TỬ

ĐÁNH GIÁ ĐỒ ÁN TỐT NGHIỆP

(DÀNH CHO CÁN BỘ THÀNH VIÊN HỘI ĐỒNG)

Hội đồng số: ……………………………………………………………………………………

Họ tên SV: PHẠM VIỆT HOÀNG MSSV: 20182547

Cán bộ thành viên HĐ: …………………………………………………………………………

STT Tiêu chí Hướng dẫn đánh giá tiêu chí Điểm
(Điểm tối đa) tiêu chí

Chất lượng Sử dụng các minh họa hỗ trợ: Hình ảnh, biểu đồ rõ nét và phù hợp, dễ
1 slides/Bản hiểu

vẽ kỹ thuật Không quá nhiều từ, biết sử dụng từ khoá; bố cục logic, có đánh số

(1,5 điểm) trang

Kỹ năng Tự tin, làm chủ nội dung trình bày, đúng thời gian quy định
2 thuyết trình


(1,5 điểm) Dễ hiểu, dễ theo dõi, lô-gic, lôi cuốn.

Nêu rõ tính cấp thiết, ý nghĩa khoa học và thực tiễn của đề tài, các vấn
đề và các giả thuyết, phạm vi ứng dụng của đề tài. Thực hiện đầy đủ
quy trình nghiên cứu: Đặt vấn đề, mục tiêu đề ra, phương pháp nghiên
cứu/ giải quyết vấn đề, kết quả đạt được, đánh giá và kết luận.

Nội dung và Nội dung và kết quả được trình bày một cách logic và hợp lý, được phân

3 kết quả đạt tích và đánh giá thỏa đáng. Biện luận phân tích kết quả mơ phỏng/ phần
được mềm/ thực nghiệm, so sánh kết quả đạt được với kết quả trước đó có

(4 điểm) liên quan.

Chỉ rõ phù hợp giữa kết quả đạt được và mục tiêu ban đầu đề ra đồng
thời cung cấp lập luận để đề xuất hướng giải quyết có thể thực hiện
trong tương lai. Hàm lượng khoa học/ độ phức tạp cao, có tính mới/ tính
sáng tạo trong nội dung và kết quả đồ án.

Trả lời câu Trả lời ngắn gọn, chính xác, đi thẳng vào vấn đề của câu hỏi.

4 hỏi Nắm vững kiến thức cơ bản liên quan đến lĩnh vực nghiên cứu/ công

(2,5 điểm) việc của đồ án.

Có bài báo KH được đăng hoặc chấp nhận đăng/ đạt giải SV NCKH

giải 3 cấp Trường trở lên/ Các giải thưởng khoa học trong nước, quốc


Điểm thành tế từ giải 3 trở lên/ Có đăng ký bằng phát minh sáng chế. (1 điểm)

5 tích Được báo cáo tại hội đồng cấp Trường trong hội nghị SV NCKH nhưng

(1 điểm) không đạt giải từ giải 3 trở lên/ Đạt giải khuyến khích trong cuộc thi

khoa học trong nước, quốc tế/ Kết quả đồ án là sản phẩm ứng dụng có

tính hồn thiện cao, u cầu khối lượng thực hiện lớn. (0,5 điểm)

Điểm tổng các tiêu chí:

Điểm bảo vệ:

Điểm từng tiêu chí cho lẻ đến 0,5. Nếu Điểm tổng các tiêu chí > 10 thì Điểm phản biện làm tròn thành 10

Nhận xét khác của cán bộ thành viên hội đồng
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................
.....................................................................................................................................

Ngày: … / … / 20…
Cán bộ thành viên hội đồng

(Ký và ghi rõ họ tên)

LỜI NÓI ĐẦU


Cuộc sống của con người ngày càng được hỗ trợ nhiều mặt bằng các giải pháp công
nghệ mới cùng với các hệ thống thông minh phụ trợ. Chất lượng cuộc sống của con
người ngày càng được cải thiện kéo theo nhu cầu về các hoạt động giải trí ngày càng
tăng. Có ngày càng nhiều phim được ra mắt làm cho người dùng đứng trước rất nhiều
sự lựa chọn.

Từ nhu cầu thực tế, nhằm đem tới cho người dùng những lựa chọn bộ phim phù hợp
nhất cho bản thân đề tài Áp dụng thuật toán đề xuất vào xây dựng ứng dụng đề xuất
phim để giải quyết vấn đề này.

Qua đây, em cũng xin chân thành cảm ơn thầy TS. NGUYỄN XUÂN DŨNG và
PGS.TS. TRẦN QUANG VINH đã trực tiếp định hướng đồ án và tận tình hướng dẫn
trong suốt thời gian thực tập ở trên lab. Em cũng xin chân thành cảm ơn các thành viên
trong phòng nghiên cứu SANSLAB – Smart Applications and Network System
Laboratory đã tận tình hỗ trợ, giúp đỡ em trong việc giải quyết những vấn đề gặp phải
trong quá trình làm đồ án. Trong quá trình làm đồ án, do kiến thức của em còn nhiều
hạn chế, hiểu biết chưa rộng nên đồ án khơng tránh khỏi thiếu sót. Em rất mong nhận
được sự chỉ bảo và nhận xét quý báu của các thầy cô.

Em xin chân thành cảm ơn!

Hà Nội, ngày 05 tháng 03 năm 2023.
Sinh viên

Phạm Việt Hoàng


LỜI CAM ĐOAN

Tôi tên là Phạm Việt Hoàng, là sinh viên K63 trường Điện – Điện tử có mã số sinh

viên 20182547, người hướng dẫn là TS. NGUYỄN XUÂN DŨNG và PGS.TS.TRẦN
QUANG VINH đều tuân thủ các quy định về sở hữu trí tuệ, các tài liệu tham khảo được
liệt kê rõ ràng. Tơi xin chịu hồn tồn trách nhiệm trước những nội dung được viết trong
đồ án này.

Hà Nội, ngày 05 tháng 03 năm 2023.
Sinh viên

Phạm Việt Hoàng

i


MỤC LỤC

LỜI NÓI ĐẦU......................................................................................................................i
DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT ................................................................vi
DANH MỤC KÝ HIỆU TOÁN HỌC .............................................................................vii
DANH MỤC HÌNH VẼ...................................................................................................viii
DANH MỤC BẢNG BIỂU................................................................................................. x
TĨM TẮT ĐỒ ÁN.............................................................................................................xi
ABSTRACT .....................................................................................................................xiii
PHẦN MỞ ĐẦU ............................................................................................................... xv

1.1 Lý do chọn đề tài ..................................................................................................... xv
1.2 Mục đích nghiên cứu.............................................................................................. xv
1.3 Nhiệm vụ nghiên cứu ............................................................................................ xvi
1.4 Phương pháp nghiên cứu...................................................................................... xvi
1.5 Kết quả đã đạt được ............................................................................................... xvi
1.6 Kết luận .................................................................................................................. xvi

CHƯƠNG 2. TỔNG QUAN ĐỀ TÀI ................................................................................ 1
2.1 Giới thiệu về hệ thống gợi ý......................................................................................1
2.2 Các thành phần của một hệ thống gợi ý .................................................................. 3
2.3 Tìm hiểu một số phương pháp gợi ý ........................................................................ 5

2.3.1 Hệ thống gợi ý dựa theo lọc cộng tác ................................................................ 5
2.3.2 Hệ thống gợi ý dựa theo nội dung......................................................................6
2.3.3 Hệ thống gợi ý dựa trên cơ sở tri thức ............................................................... 6
2.3.4 So sánh các phương pháp gợi ý ......................................................................... 7
2.4 Phân loại các phương pháp lọc cộng tác.................................................................8
2.4.1 Phương pháp Lọc cộng tác dựa theo người dùng (User-Based CF) .................. 8
2.4.2 Phương pháp Lọc cộng tác dựa theo hạng mục (Item-Based CF) ................... 16
2.5 Các thuật toán được sử dụng trong Lọc cộng tác ................................................. 23
2.5.1 Kỹ thuật Phân rã ma trận (Matrix factorization - MF).....................................23
2.5.2 Kỹ thuật Máy Boltzmann Hạn chế (RBM) ...................................................... 25
2.6 Các thuật tốn có thể sử dụng trong hệ thống đề xuất phim................................26
2.6.1 Pearson Correlation degree .............................................................................. 26
2.6.2 CosineSimilarity .............................................................................................. 27

iii

2.6.3 Spearman rank correlation coefficient............................................................. 27
2.6.4 Log-likelihood similarity................................................................................. 27
2.6.5 Mahattan distance ............................................................................................ 28
2.6.6 TanimotoCoefficient ........................................................................................ 28

2.7 Các công cụ được sử sụng trong đề tài ................................................................. 28
2.7.1 Ngơn ngữ lập trình python và mơi trường lập trình ........................................ 28
2.7.2 Cài đặt môi trường sử dụng Python................................................................. 31


2.8 Kết luận chương ..................................................................................................... 32

CHƯƠNG 3. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU VỀ PHIM ĐƯỢC SỬ DỤNG.... 33

3.1 Bộ dữ liệu dùng để đánh giá giải thuật lọc cộng tác ............................................ 33
3.1.1 Bộ dữ liệu MovieLens 100k ............................................................................ 33
3.1.2 Bộ dữ liệu EachMovie..................................................................................... 33

3.2 Thu Thập cơ sở dữ liệu dùng cho hệ thống gợi ý ................................................. 34
3.2.1 Thu thập dữ liệu từ TMDB .............................................................................. 34
3.2.2 Kỹ thuật scrap data từ TMDB ......................................................................... 36
3.2.3 Phân loại dữ liệu và các thuộc tính.................................................................. 40

3.3 Kết luận chương ..................................................................................................... 41

CHƯƠNG 4. TÌM KIẾM THUẬT TỐN PHÙ HỢP VÀ ÁP DỤNG CHO FILM
RECOMMENDATION SYSTEM ........................................................................................ 42

4.1 Đánh giá và lựa chọn giải thuật phù hợp ............................................................. 42
4.1.1 Quá trình train các bộ dữ liệu .......................................................................... 42
4.1.2 Đánh giá kết quả và lựa chọn giải thuật phù hợp ............................................ 42

4.2 Architecture và Similarity Score ............................................................................ 46
4.2.1 Architecture ..................................................................................................... 46
4.2.2 Similarity Score ............................................................................................... 46
4.2.3 Cosine Similarity ............................................................................................. 46

4.3 Thuật toán được sử dụng trong hệ thống ............................................................. 47

4.4 Áp dụng các thuật toán vào film recomendation system ...................................... 47

4.4.1 Load dữ liệu từ dataset .................................................................................... 47
4.4.2 Demographic Filtering..................................................................................... 48
4.4.3 Cosine Similarity ............................................................................................. 51
4.4.4 Thuật toán gợi ý phim dựa theo Collaborative Filtering ................................. 57

CHƯƠNG 5. XÂY DỰNG ỨNG DỤNG ĐỀ XUẤT PHIM ......................................... 59

5.1 Use case và Diagram .............................................................................................. 59
5.1.1 Use Case của web ............................................................................................ 59
5.1.2 UML diagram .................................................................................................. 60

5.2 Xây dựng web xem phim trực tuyến Moonflix...................................................... 60
5.2.1 Chức năng tạo tài khoản và đăng nhập............................................................ 60
5.2.2 Chức năng cập nhật thông tin .......................................................................... 62
5.2.3 Chức năng hiển thị phim và TV series thịnh hành và top rate ........................ 64

5.2.4 Chức năng xem thông tin phim........................................................................65
5.2.5 Chức năng viết bình luận, đánh giá..................................................................66
5.2.6 Chức năng tạo list các bộ phim yêu thích ........................................................ 67
5.2.7 Chức năng gợi ý các bộ phim liên quan...........................................................68
5.2.8 Chức năng tìm kiếm phim dựa theo tiêu đề ..................................................... 69
5.3 Kết luận chương...................................................................................................... 70
CHƯƠNG 6. KẾT QUẢ THỰC NGHIỆM....................................................................71
6.1 Kết quả khi thực hiện thuật toán gợi ý .................................................................. 71
6.1.1 Kết quả khi thực hiện Demographic Filtering ................................................. 71
6.1.2 Kết quả khi sử dụng cosin similarity ............................................................... 74
6.1.3 Kết quả gợi ý sử dụng Collaborative Filtering................................................. 80
6.1.4 Đánh giá sai số ................................................................................................. 82
6.2 Đánh giá kết quả.....................................................................................................84
6.3 Kết luận chương...................................................................................................... 84

KẾT LUẬN ....................................................................................................................... 85
Kết luận chung .............................................................................................................. 85
Hướng phát triển .......................................................................................................... 85
Lời cảm ơn .................................................................................................................... 85
TÀI LIỆU THAM KHẢO................................................................................................87
PHỤ LỤC .......................................................................................................................... 89

v

DANH MỤC KÝ HIỆU VÀ CHỮ VIẾT TẮT

KÍ HIỆU TIẾNG ANH TIẾNG VIỆT

CF Collaborative Filtering Kỹ thuật lọc cộng tác
CRS Collaborative Recommendation
Hệ thống gợi ý dựa trên lọc
CS System cộng tác
DF Cosine Similarity
MAE Demographic Filtering Độ trùng lặp Cosine
MF Mean Absolute Error
RBM Matrix Factorization Lọc dựa trên nhân khẩu học
Restrictive Boltzmann Machine
Chỉ số hồi quy
RMSE Root Mean Square Error
Kỹ thuật phân rã ma trận
UML Unified Modeling Language
Kỹ thuật Máy Boltzman Hạn
chế

Căn bậc hai của mức trung bình

của các sai số bình phương

Ngơn ngữ mơ hình hóa thống
nhất

KÝ HIỆU DANH MỤC KÝ HIỆU TOÁN HỌC

∂ Ý NGHĨA
λ
β Đạo hàm riêng
Hệ số chính tắc hóa
Tốc độ học(learn rating)

DANH MỤC HÌNH VẼ

Hình 2-1 Hệ thống gợi ý của ứng dụng Amazon .......................................................2
Hình 2-2 Hệ thống gợi ý của ứng dụng Netflix .........................................................3
Hình 2-3 Ma trận biểu diễn dữ liệu trong RS (user-item rating matrix)....................4
Hình 2-4 Minh họa cho hệ thống gợi ý dựa theo lọc cộng tác ..................................5
Hình 2-5 Minh họa cho Hệ thống gợi ý dựa theo nội dung.......................................6
Hình 2-6 Minh họa cho Hệ thống gợi ý dựa trên cơ sở tri thức ................................7
Hình 2-7 Ma trận mơ tả rating giữa các user và item ................................................9
Hình 2-8 Ma trận ratings giữa các user và item.......................................................17
Hình 2-9 Minh họa kỹ thuật phân rã ma trận...........................................................23
Hình 2-10 Minh họa cho thuật tốn ALS.................................................................25
Hình 2-11 Trang chủ Pycharm.................................................................................31
Hình 2-12 Tạo project mới trong Pycharm..............................................................32
Hình 3-1 Giao diện trang web movielens.org..........................................................33
Hình 3-2 Giao diện trang web download bộ dữ liệu EachMovie ............................34
Hình 3-3 Giao diện web TMDB ..............................................................................34

Hình 3-4 TMDB API endpoint ................................................................................35
Hình 3-5 Mơ tả q trình tạo cơ sở dữ liệu bằng kĩ thuật scrap ..............................36
Hình 3-6 Mơ tả q trình thu thập tên phim ............................................................37
Hình 3-7 Mơ tả q trình thu thập đánh giá và số lượt đánh giá .............................37
Hình 3-8 Mơ tả q trình thu thập thể loại phim .....................................................38
Hình 3-9 Sơ đồ khối quá trình scraping data từ web ...............................................39
Hình 3-10 Kết quả được ghi vào file Excel .............................................................40
Hình 4-1 Thơng số MAE đối với bộ dữ liệu Movielens..........................................43
Hình 4-2 Thơng số RMSE đối với bộ dữ liệu Movielens........................................43
Hình 4-3 Thơng số MAE đối với bộ dữ liệu EachMovie ........................................44
Hình 4-4 Thơng số RMSE đối với bộ dữ liệu EachMovie ......................................44
Hình 4-5 Architecture of system..............................................................................46
Hình 4-6 Mơ hình dự đốn phim .............................................................................47
Hình 4-7 Sơ dồ khối quá trình Demographic Filtering............................................49
Hình 4-8 Top 10 phim có số điểm cao nhất .............................................................50
Hình 4-9 Thống kê độ phổ biến của các bộ phim đạt cao nhất ...............................51

viii


×