i
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
-----------------------------------
TRẦN TẤN LỘC
DỰ ĐỐN TUỔI VÀ GIỚI TÍNH BẰNG PHƯƠNG
PHÁP HỌC SÂU
ĐỀ ÁN TỐT NGHIỆP THẠC SĨ KỸ THUẬT
(Theo định hướng ứng dụng)
THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
ii
HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG
--------------------------------------
TRẦN TẤN LỘC
DỰ ĐỐN TUỔI VÀ GIỚI TÍNH BẰNG
PHƯƠNG PHÁP HỌC SÂU
Chun ngành: Hệ thống thông tin
Mã số:
8.48.01.04
ĐỀ ÁN TỐT NGHIỆP THẠC SỸ KỸ THUẬT
(Theo định hướng ứng dụng)
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. LÊ HỒNG THÁI
THÀNH PHỐ HỒ CHÍ MINH – NĂM 2023
i
LỜI CAM ĐOAN
Tôi xin cam đoan đề án thạc sĩ cơng nghệ thơng tin “Dự đốn tuổi và giới tính
bằng phương pháp học sâu” là do tôi nghiên cứu, tổng hợp và thực hiện.
Tất cả các nội dung, các số liệu, kết quả nêu trong đề án tốt nghiệp này là trung
thực và chưa từng được ai công bố trong bất kỳ cơng trình nào khác. Tơi hồn tồn
chịu trách nhiệm cho mọi hành vi sao chép trái phép hoặc vi phạm quy chế đào tạo.
Tp. Hồ Chí Minh, ngày 16 tháng 08 năm 2023
Học viên thực hiện đề án
Trần Tấn Lộc
ii
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành và sâu sắc đến PGS.TS Lê Hoàng Thái,
người thầy đã tận tâm và nhiệt tình trong việc hướng dẫn và động viên tơi suốt q
trình thực hiện đề án. Nhờ sự hỗ trợ của người thầy, tôi đã được định hướng và hồn
thành các mục tiêu mà tơi đã đề ra.
Tôi xin gửi lời tri ân chân thành đến các Thầy, Cơ đã đồng hành và tận tình
giảng dạy cho tơi suốt thời gian học tập trong chương trình Thạc sĩ Hệ thống thông tin
tại khoa Đào tạo Sau đại học, Học viện Cơng nghệ Bưu chính Viễn thơng cơ sở tại
thành phố Hồ Chí Minh.
Tơi muốn bày tỏ lịng biết ơn đến ban Giám Đốc Trung tâm Công nghệ
Thông tin – Viễn thông Tây Ninh đã tạo điều kiện thuận lợi cho học tập của tôi.
Tôi biết ơn đến tất cả bạn bè đã động viên, hỗ trợ và đóng góp những ý kiến
quý báu cho đề án này. Đóng góp của các bạn đã giúp tơi hồn thiện nghiên cứu này.
Đề án đã hoàn thành và đạt được một số kết quả nhất định, tuy vậy tôi thừa
nhận rằng cịn tồn tại những hạn chế và thiếu sót. Vì vậy, tơi chân thành mong nhận
được sự thơng cảm và sự đóng góp q báu từ q thầy cơ và các bạn để tơi có thể cải
thiện và nâng cao chất lượng của nghiên cứu này.
Một lần nữa tôi xin chân thành cảm ơn!
Tp. Hồ Chí Minh, ngày 16 tháng 08 năm 2023
Học viên thực hiện đề án
Trần Tấn Lộc
iii
MỤC LỤC
LỜI CAM ĐOAN ........................................................................................................... i
LỜI CẢM ƠN ................................................................................................................ ii
MỤC LỤC ..................................................................................................................... iii
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT ............................................... vi
DANH SÁCH BẢNG .................................................................................................. vii
DANH SÁCH HÌNH VẼ ............................................................................................ viii
MỞ ĐẦU ........................................................................................................................ 1
CHƯƠNG 1 - TỔNG QUAN ..................................................................................... 3
1.1 Lý do chọn đề án ................................................................................................. 3
1.2 Tổng quan vấn đề nghiên cứu ............................................................................ 4
1.3 Mục tiêu nghiên cứu............................................................................................ 6
1.4 Đối tượng và phạm vi nghiên cứu ...................................................................... 7
1.5 Phương pháp nghiên cứu.................................................................................... 9
1.6 Ý nghĩa khoa học và thực tiễn của đề án ........................................................ 10
CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT ....................................................................... 11
2.1. Giới thiệu về học sâu và thị giác máy tính ..................................................... 11
2.1.1. Học sâu......................................................................................................... 11
2.1.1.1. Các thành phần của mơ hình học sâu .................................................... 12
2.1.1.2. So với máy học, mơ hình học sâu mang lại những lợi ích sau ............. 13
2.1.2. Thị giác máy tính .......................................................................................... 15
iv
2.2. Kiến trúc mạng nơ ron tích chập .................................................................... 15
2.2.1. Tổng quan về kiến trúc mạng tích chập ....................................................... 15
2.2.2. Các đặc trưng chung của mạng CNN .......................................................... 17
2.2.3. Các mạng CNN tiêu biểu ............................................................................. 19
CHƯƠNG 3 - PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG ................................... 27
3.1. Hướng tiếp cận ................................................................................................. 27
3.2. Dữ liệu huấn luyện ........................................................................................... 27
3.2.1. Giới thiệu về tập dữ liệu............................................................................... 27
3.2.2. Các bước xây dựng từ tập dữ liệu Adience Dataset .................................... 29
3.3. Tiền xử lý dữ liệu .............................................................................................. 31
3.3.1. Loại bỏ đặc trưng không cần thiết ............................................................... 31
3.3.2. Chỉnh kích thước ảnh sang kích thước phù hợp .......................................... 32
3.4. Mơ hình được sử dụng ..................................................................................... 32
3.4.1. Tổng quan mơ hình....................................................................................... 32
3.4.2. Định nghĩa .................................................................................................... 35
3.4.3.Chuẩn bị dữ liệu tập huấn ............................................................................. 38
3.4.4. Kiến trúc ....................................................................................................... 40
3.4.5. Huấn luyện mơ hình ..................................................................................... 43
3.4.5.1 Khởi tạo mơ hình.................................................................................... 43
3.4.5.2 Các phương thức tiền xử lý ảnh ............................................................. 45
3.4.5.3 Các bước tiến hành huấn luyện mơ hình ................................................ 48
v
CHƯƠNG 4 - CÀI ĐẶT THỬ NGHIỆM VÀ ĐÁNH GIÁ................................... 52
4.1. Cài đặt môi trường ........................................................................................... 52
4.2. Phương pháp đánh giá ..................................................................................... 52
4.3. Phân tích đánh giá hệ thống đề xuất .............................................................. 53
4.3.1. Xây dựng mô đun đánh giá .......................................................................... 53
4.3.2. Kiểm tra đánh giá hệ thống trên bộ dữ liệu công khai ................................ 57
4.3.2.1. Bộ dữ liệu công khai Adience ............................................................... 57
4.3.2.2. Kết quả đánh giá trên bộ dữ liệu công khai Adience ............................ 57
4.3.3. Kiểm tra đánh giá hệ thống trên bộ dữ liệu đã xây dựng ............................ 59
4.3.3.1. Bộ dữ liệu đã xây dựng ......................................................................... 59
4.3.3.2. Kết quả đánh giá trên bộ dữ liệu đã xây dựng ...................................... 59
4.4. Cài đặt triển khai thử nghiệm. ........................................................................ 60
KẾT LUẬN .................................................................................................................. 64
DANH MỤC TÀI LIỆU THAM KHẢO ................................................................... 66
vi
DANH MỤC CÁC THUẬT NGỮ, CHỮ VIẾT TẮT
VIẾT TẮT
TIẾNG ANH
TIẾNG VIỆT
CNN
Convolutional Neural Network
Mạng Nơ ron tích chập
CV
Curriculum Vitae
Hồ sơ cá nhân
AI
Artificial Intelligence
Trí tuệ nhân tạo
DL
Deep Learning
Học sâu
ML
Mechine Learning
Học máy
Conv
Convolutional layer
Lớp tích chập
ReLU
Rectified Linear Unit
Hàm kích hoạt trong mạng nơ
ron nhân tạo
vii
DANH SÁCH BẢNG
Bảng 3.1: Danh mục nhãn .............................................................................................. 30
Bảng 3.3: Thông tin các nhãn tương ứng với các bức ảnh ............................................ 31
viii
DANH SÁCH HÌNH VẼ
Hình 2.1: Mơ hình học sâu ............................................................................................. 12
Hình 2.2: Hình ảnh tỷ lệ xám chỉ có một kênh .............................................................. 17
Hình 2.3: Mạng Alexnet, một kiến trúc điển hình của CNN ......................................... 17
Hình 2.4: Kiến trúc LeNet .............................................................................................. 19
Hình 2.5: Kiến trúc AlexNet .......................................................................................... 19
Hình 2.6: Hàm ReLU ..................................................................................................... 21
Hình 2.7: Phương pháp dropout ..................................................................................... 21
Hình 2.8: Kiến trúc VGG-16 .......................................................................................... 22
Hình 2.9: Kiến trúc GoogleNet ...................................................................................... 23
Hình 2.10: Kiến trúc GoogleNet - Inception version 3 .................................................. 25
Hình 3.1: Hình ảnh trong tập dữ liệu Adience ............................................................... 28
Hình 3.2: Thư mục chứa các ảnh được giải nén ............................................................ 29
Hình 3.3: Mạng Alexnet ................................................................................................. 33
Hình 3.4: Ví dụ thí nghiệm sử dụng ReLU .................................................................... 35
Hình 3.5: Tổ chức thư mục ............................................................................................ 36
Hình 3.6: Mơ hình gồm 5 block ..................................................................................... 40
Hình 3.7: Kết quả huấn luyện độ tuổi dạng biểu đồ ...................................................... 49
Hình 3.8: Kết quả huấn luyện độ tuổi ............................................................................ 50
Hình 3.9: Kết quả huấn luyện giới tính dạng biểu đồ .................................................... 51
Hình 3.10: Kết quả huấn luyện giới tính ........................................................................ 51
ix
Hình 4.1: Giao diện tải ảnh lên hệ thống đánh giá ......................................................... 54
Hình 4.2: Giao diện khi đã tải hình ................................................................................ 54
Hình 4.3: Kết quả dự đốn giới tính nam độ tuổi 12 ..................................................... 55
Hình 4.4: Kết quả dự đốn giới tính nam độ tuổi 45 ..................................................... 55
Hình 4.5: Kết quả dự đốn giới tính nữ độ tuổi 40 ........................................................ 56
Hình 4.6: Kết quả dự đốn giới tính nữ độ tuổi 18 ........................................................ 56
Hình 4.7: Kết quả dự đốn giới tính nam độ tuổi 28 ..................................................... 57
Hình 4.8: Kết quả kiểm chứng mơ hình với dự đốn giới tính với dữ liệu cơng khai ... 58
Hình 4.9: Kết quả kiểm chứng mơ hình với dự đốn tuổi với dữ liệu cơng khai .......... 58
Hình 4.10: Kết quả kiểm chứng mơ hình dự đốn giới tính với dữ liệu đã xây dựng ... 59
Hình 4.11: Kết quả kiểm chứng mơ hình với dự đoán tuổi với dữ liệu đã xây dựng .... 60
Hình 4.12: Giao diện hệ thống ....................................................................................... 60
Hình 4.13: Giao diện nhập thơng tin ứng viên ............................................................... 61
Hình 4.14: Giao diện chọn ảnh ứng viên ....................................................................... 61
Hình 4.15: Giao diện khi đã nhập xong thơng tin .......................................................... 62
Hình 4.16: Giao diện kết quả nghi vấn dưới độ tuổi lao động ....................................... 62
Hình 4.17: Giao diện kết quả trong độ tuổi lao động ..................................................... 63
Hình 4.18: Giao diện kết quả nghi vấn quá độ tuổi lao động ........................................ 63
1
MỞ ĐẦU
Sự phát triển kinh tế - xã hội phụ thuộc vào nhiều yếu tố khác nhau, nhưng tập
trung chủ yếu vào nguồn nhân lực. Dù có máy móc, thiết bị, nhưng chúng trở nên vô
dụng nếu thiếu sự can thiệp của con người. Nguồn nhân lực đóng vai trị trung tâm và
quan trọng nhất trong phát triển kinh tế-xã hội của đất nước, đặc biệt trong giai đoạn
đẩy mạnh cơng nghiệp hóa, hiện đại hóa và hội nhập kinh tế quốc tế.
Tuyển dụng tốt sẽ tạo đội ngũ nhân lực phù hợp với cơng việc và vị trí, từ đó
nâng cao hiệu quả cơng việc và chất lượng nguồn nhân lực của doanh nghiệp. Đồng
thời giúp tiết kiệm được chi phí đào tạo nhân lực, tránh tình trạng ứng viên khai gian
dối độ tuổi lao động gây ra vi phạm luật lao động hiện hành dẫn tới phải liên tục tuyển
dụng nhân sự mới, doanh nghiệp lại phải tốn chi phí và thời gian cho cơng tác tuyển
dụng lại nhân sự.
Tuyển dụng, là một trong những lĩnh vực quan trọng của xã hội đang dần được
cải tiến và nâng cao hiệu quả bằng các công nghệ mới. Ngày nay có nhiều hệ thống hỗ
trợ trong cơng tác tuyển dụng nhân sự phổ biến ở nước ta như: Base E-hiring, Talent
Solution, Zoho Recruit, Greenhouse, Workable…Nhưng đa phần các hệ thống này chỉ
tập trung vào quản lý ứng viên, đăng tin tuyển dụng, lập báo cáo.
Bằng cách áp dụng các kỹ thuật của trí tuệ nhân tạo kết hợp với mạng CNN đề
án đã áp dụng các giải pháp này để hướng đến xây dựng hệ thống hỗ trợ công tác tuyển
dụng thơng qua dự đốn độ tuổi và giới tính từ đó đưa ra nhận định ứng viên có phù
hợp theo độ tuổi lao động hiện hành [3] giúp nhà tuyển dụng tránh được sự khai man
của các ứng viên. Kết quả của q trình này đó là đề án đã xây dựng được một ứng
dụng hỗ trợ công tác tuyển dụng. Kết quả trả về bao gồm kết quả chính xác và các kết
quả liên quan. Ứng dụng đã được cài đặt, thử nghiệm tại phòng nhân sự VNPT Tây
Ninh giúp cho quá trình tuyển dụng trở nên hiệu quả hơn.
2
Kết quả của đề án được trình bày trong các phần như mở bài, mục lục, kết luận
và kiến nghị, danh mục hình vẽ, danh mục bảng biểu, tài liệu tham khảo, phụ lục, và
phần chính của đề án bao gồm 4 chương như sau:
Chương 1 Đề án giới thiệu các thơng tin về nghiên cứu liên quan, phân
tích và đánh giá thực trạng, trình bày mục tiêu và giới hạn của đề án,
cung cấp ý nghĩa lý luận và thực tiễn, trình bày phương pháp nghiên cứu,
hướng tiếp cận giải quyết vấn đề, và mô tả nội dung thực hiện của đề án.
Chương 2 Trình bày cơ sở lý thuyết liên quan đến vấn đề học sâu và thị
giác máy tính, bao gồm các lý thuyết về mơ hình mạng nơ ron tích chập
(CNN) cùng với các phương pháp xây dựng mơ hình dữ liệu.
Chương 3 Trình bày tổng quan về bài tốn dự đốn độ tuổi và giới tính
bằng phương pháp học sâu. Giới thiệu về hệ thống và một số phương
pháp tiếp cận.
Chương 4 Cài đặt thử nghiệm và đánh giá. Thực hiện mơ hình mạng nơ
ron tích chập CNN, xây dựng ứng dụng hỗ trợ tuyển dụng. Tiến hành
thực nghiệm, so sánh và đánh giá kết quả.
3
CHƯƠNG 1 - TỔNG QUAN
1.1 Lý do chọn đề án
Lĩnh vực quản lý nhân sự được coi là một trong những lĩnh vực quan trọng nhất
đối với mọi doanh nghiệp. Một trong những nhiệm vụ quan trọng nhất của nhà quản lý
nhân sự là tuyển dụng và chọn lọc những ứng viên sao cho phù hợp với các công việc
cụ thể. Để đảm bảo tính hiệu quả của q trình tuyển dụng, nhà quản lý nhân sự cần
phải đưa ra những quyết định đúng đắn và nhanh chóng dựa trên những thơng tin chính
xác và đầy đủ về ứng viên.
Với sự vận động, phát triển mạnh mẽ của lĩnh vực tuyển dụng ở Việt Nam, việc
sử dụng phương pháp học sâu để dự đốn độ tuổi và giới tính của ứng viên đang trở
thành xu hướng mới nhằm giúp cho q trình tuyển dụng trở nên hiệu quả và chính xác
hơn bao giờ hết. Bằng cách áp dụng các kỹ thuật của trí tuệ nhân tạo giúp dự đốn độ
tuổi và giới tính với độ chính xác cao trong việc xác định các ứng viên phù hợp nhất
với yêu cầu, tính chất của cơng việc, tránh tình trạng khai man khi dự tuyển.
Hình ảnh khn mặt mang rất nhiều thơng tin quan trọng như: tuổi tác, giới tính,
trạng thái cảm xúc, dân tộc…Trong đó, việc xác định tuổi tác và giới tính là hết sức
quan trọng, như trong giao tiếp, cần sử dụng những từ ngữ phù hợp với giới tính của
người nghe ví dụ trong tiếng Việt có: anh/chị, cơ/chú…[2] Ngồi ra nó cịn được áp
dụng vào nhiều lĩnh vực khác nhau như vào lĩnh vực tuyển dụng ta vừa đề cập ở trên.
Do đó, việc xác định tuổi và giới tính dựa trên khn mặt là một bài tốn hết sức quan
trọng, có ý nghĩa thực tế to lớn.
Có nhiều nghiên cứu, giải pháp đã đề xuất cho bài tốn dự đốn tuổi và giới tính
trong những năm trước đây. Hầu hết dựa vào phương pháp truyền thống, trích xuất đặc
trưng bằng tay sau đó đưa vào bài toán phân lớp. Các nghiên cứu gần đây đã cho thấy
4
kết quả khá tốt, tuy nhiên, trong vấn đề nhận diện thời gian thực, các mơ hình này vẫn
chưa đạt hiệu quả cao do thiết kế quá phức tạp [2].
Hiện nay với sự phát triển của mạng học sâu, thì bài tốn dự đốn tuổi và giới
tính cho những kết quả vượt bậc trong các bài tốn điển hình [2] và thực hiện end-toend ít cần sự trích xuất đặc trưng bằng tay. Một mơ hình mới đã được đề xuất bởi Alex
và nhóm nghiên cứu của họ [4]. Mơ hình này sử dụng mạng CNN và đã đạt thành công
đáng kinh ngạc khi giành chiến thắng trong cuộc thi ImageNet năm 2012. Cuộc thi này
được coi là sự kiện quy mô lớn nhất trên thế giới trong lĩnh vực nhận diện đối tượng
trong ảnh.
Từ thực tiễn trên, tôi thực hiện một nghiên cứu, ứng dụng phương pháp học sâu
trong dự đốn độ tuổi và giới tính. Nghiên cứu của tơi đã tập trung vào việc xây dựng
một mơ hình dự đốn tuổi và giới tính từ những hình ảnh trên chiếc CV của các ứng cử
viên từ đó hệ thống phân tích và dự đốn một cách nhanh chóng và chính xác để đáp
ứng các nhu cầu hiện hữu thơng qua phương pháp “dự đốn tuổi và giới tính bằng
phương pháp học sâu” đó là lý do tơi chọn thực hiện đề án này.
1.2 Tổng quan vấn đề nghiên cứu
Tổng quan
Với nhu cầu tuyển dụng ngày càng tăng, đặc biệt là trong các doanh nghiệp lớn,
việc xác định độ tuổi và giới tính của ứng viên là điều rất quan trọng, tránh được các
rủi ro cần thiết như khai man độ tuổi lao động, hỗ trợ nhà tuyển dụng lọc các ứng viên
nhanh chóng. Tuy nhiên, q trình này thường đòi hỏi sự nhận định và khả năng đánh
giá của nhà tuyển dụng, và có thể dẫn đến sai sót. Vì vậy, việc áp dụng phương pháp
học sâu vào việc dự đốn tuổi và giới tính của ứng viên và đưa ra đánh giá có thể giúp
cho q trình tuyển dụng trở nên chính xác và hiệu quả hơn.
5
Mục tiêu của nghiên cứu này là xây dựng một mơ hình học sâu để dự đốn tuổi
và giới tính của ứng viên trong quá trình tuyển dụng. Bằng cách sử dụng các thuật toán
học sâu như mạng nơ ron tích chập (CNN) nghiên cứu này mong muốn đem lại kết quả
chính xác và đáng tin cậy.
Hiện nay có nhiều giải pháp liên quan đến nghiên cứu của đề án, nhiều nghiên
cứu trên thế giới và Việt Nam đã quan tâm đến vấn đề nhận dạng độ tuổi và giới tính
con người đã được nghiên cứu từ rất lâu, hầu như chúng chỉ nghiên cứu tách rời nhau.
Việc xây dựng hệ thống dự đốn tuổi và giới tính trong bối cảnh Việt Nam có ý
nghĩa quan trọng từ cả mặt lý thuyết và thực tiễn.
Các cơng trình nghiên cứu liên quan
-
Năm 2012, Alex Krizhevsky, Ilya Sutskever và Geoffrey Hinton với cơng
trình nghiên cứu “Phân loại ImageNet bằng mạng nơ ron tích chập sâu” [4]
được coi là một cơng trình đầy tầm quan trọng trong lĩnh vực Deep learning.
Các tác giả đề xuất một kiến trúc mạng nơ ron sâu được gọi là AlexNet, đạt
được thành công đột phá đáng kể trong cuộc thi “ImageNet Large Scale
Visual Recognition Challenge” năm 2012. Kiến trúc AlexNet đạt được tỷ lệ
lỗi là 15,3%, vượt qua phương pháp tốt nhất thứ hai một khoảng cách hơn
10%. Các đóng góp của bài báo bao gồm việc phát triển kiến trúc AlexNet,
sử dụng một số kỹ thuật đổi mới như hàm kích hoạt ReLU, chuẩn hóa đáp
ứng cục bộ, chế độ giảm thiểu và tăng lượng dữ liệu để cải thiện hiệu suất
mạng, mở đường cho việc áp dụng rộng rãi deep learning trong các ứng
dụng thị giác máy tính.
-
Năm 2016, Linnan Zhu cùng các cộng sự đã cơng bố cơng trình nghiên cứu
“Học một mạng tích chập sâu nhẹ cho nhận dạng đồng thời tuổi và giới tính”
[5] đề xuất một mơ hình đa nhiệm vụ giải quyết cả hai bài toán cùng một lúc.
Bài báo đề cập đến vấn đề nhận dạng đồng thời tuổi và giới tính của một
6
người từ một hình ảnh đã cho. Các tác giả đề xuất một kiến trúc mạng tích
chập sâu nhẹ được thiết kế để đạt độ chính xác cao trong khi giảm thiểu độ
phức tạp tính tốn. Các tác giả đánh giá mạng được đề xuất trên hai bộ dữ
liệu công khai: bộ dữ liệu Adience và bộ dữ liệu FG-NET. Kết quả cho thấy
rằng mạng được đề xuất vượt qua các phương pháp tiên tiến hiện có về độ
chính xác và hiệu suất tính tốn.
1.3 Mục tiêu nghiên cứu
Mục tiêu tổng quát
Nghiên cứu này nhằm mục đích áp dụng phương pháp học sâu của mạng nơ ron
tích chập CNN để dự đốn tuổi và giới tính.
Từ các kết quả tìm hiểu về cơ sở lý thuyết, thực hiện phát triển thành ứng dụng
hỗ trợ công tác tuyển dụng với các chức năng hỗ trợ cho các đối tượng là nhà tuyển
dụng. Hệ thống cần phải đáp ứng được các yêu cầu về hỗ trợ như: Xác định được giới
tính ứng viên, xác định độ tuổi lao động của ứng viên và đưa ra kết luận dự đoán cho
từng ứng viên. Đóng góp vào việc cải thiện q trình tuyển dụng, trở nên nhanh chóng
và chính xác hơn.
Mục tiêu cụ thể
Đề án này tập trung nghiên cứu các lý thuyết cơ bản liên quan đến xử lý ảnh,
nhận dạng và dự đoán.
Nghiên cứu các lý thuyết liên quan bài toán xác độ tuổi và giới tính các khn
mặt trong ảnh để giải quyết các lớp vấn đề liên quan, bao gồm:
-
Tổng quan về phương pháp học sâu và ứng dụng của nó trong việc dự đốn
tuổi và giới tính.
7
Tìm hiểu và phân tích các khái niệm và thành phần cơ bản của phương
pháp học sâu.
Tham khảo các nghiên cứu liên quan đến phương pháp học sâu trong việc
dự đốn tuổi và giới tính.
Xác định cách thức áp dụng mạng nơ ron tích chập vào việc dự đốn tuổi
và giới tính trong lĩnh vực tuyển dụng.
Xây dựng mơ hình dự đốn tuổi và giới tính sử dụng phương pháp học sâu.
Thu thập dữ liệu từ bộ dữ liệu công khai Adience Dataset.
Tiền xử lý dữ liệu: lựa chọn, chuyển đổi, chuẩn hóa tập huấn luyện.
Thiết kế và triển khai mơ hình mạng nơ ron tích chập để dự đốn tuổi và
giới tính.
Đánh giá hiệu suất của mơ hình bằng các chỉ số như độ chính xác, xác
suất.
Đánh giá hiệu quả của phương pháp CNN trong việc dự đoán tuổi và giới
-
tính trong lĩnh vực tuyển dụng.
Đánh giá khả năng áp dụng thực tế của phương pháp CNN trong quá
trình tuyển dụng và quy mô mở rộng.
Đề xuất những cải tiến và phát triển tiếp theo cho phương pháp CNN
trong việc dự đốn tuổi và giới tính trong lĩnh vực tuyển dụng.
1.4 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
-
Các phương pháp và các kỹ thuật của học sâu, thị giác máy tính.
-
Các phương pháp xử lý hình ảnh.
8
-
Các phương pháp nhận dạng tuổi và giới tính.
-
Phân tích thiết kế và xây dựng chức năng của ứng dụng của hệ thống hỗ trợ
tuyển dụng.
Phạm vi nghiên cứu
-
Mơ hình kiến trúc mạng nơ ron tích chập (CNN).
-
Phương pháp nhận dạng giới tính:
Giới tính nam.
Giới tính nữ.
Để nhận dạng giới tính thơng qua bức ảnh, có thể sử dụng các đặc trưng sau
-
đây để đạt được hiệu suất tốt hơn như sau:
Kích thước khn mặt: Ví dụ khng mặt giới tính nam sẽ thường to hơn
so với giới tính nữ.
Đặc trưng khn mặt: Một số đặc trưng có thể trích xuất từ khuôn mặt
như đặc điểm của mắt, mũi, miệng, vùng trán.... Điều này có thể cung
cấp thơng tin quan trọng để phân biệt giữa các đặc điểm giới tính. Ví dụ
miệng của giới tính nam thường sẽ to hơn so với nữ.
Các đặc điểm hình học: Các đặc điểm hình học như hình dáng khn mặt
(hình vng hoặc trịn), tỷ lệ giữa các phần của khn mặt có thể có ý
nghĩa trong việc nhận dạng giới tính.
Kiểu tóc: Kiểu tóc thường khác biệt giữa nam và nữ. Thơng qua đặc
trưng như độ dài, kiểu tóc.
Chi tiết vùng mắt: vùng mắt có thể cung cấp nhiều thơng tin về giới tính.
9
Phương pháp xác định đối tượng trong các nhóm độ tuổi được chia cố định:
Từ 0 tuổi đến 14 tuổi.
Từ 15 tuổi đến 45 tuổi.
Lớn hơn 65 tuổi.
Có thể sử dụng các đặc trưng sau đây để đạt được hiệu suất tốt hơn đối với
-
nhận dạng độ tuổi như sau:
Nếp nhăn và đặc điểm khuôn mặt: Những nếp nhăn, vết chân chim và các
đặc điểm khn mặt khác có thể chứa thông tin về độ tuổi của người.
Sắc tố da và tóc: Sự thay đổi của màu da và tóc thường đi kèm với tuổi
tác
Nám và tàn nhang: Những dấu hiệu của tuổi tác như nám, tàn nhang.
Kiểu tóc và màu tóc: Kiểu tóc và màu tóc cũng có thể thay đổi theo độ
tuổi. Chẳng hạn, sự xuất hiện của sợi tóc bạc thường đi kèm với tuổi tác
cao hơn.
Biểu cảm khn mặt: Những biểu cảm khn mặt cũng có thể thay đổi
theo độ tuổi.
Kích thước mắt, miệng: Kích thước của các phần trên khn mặt cũng có
thể thay đổi theo độ tuổi.
1.5 Phương pháp nghiên cứu
Đề án kết hợp việc sử dụng phương pháp nghiên cứu lý thuyết và xây dựng ứng
dụng thực nghiệm.
-
Nghiên cứu lý thuyết:
Tìm hiểu về học sâu, tìm hiểu về thị giác máy tính, trí tuệ nhân tạo.
10
-
Tìm hiểu kiến trúc mạng nơ ron tích chập.
Nghiên cứu thực nghiệm:
Thực hiện dự đốn tuổi và giới tính bằng mạng mạng nơ ron tích chập.
Thực nghiệm xây dựng hệ thống hỗ trợ cơng tác tuyển dụng từ hình ảnh
ứng viên cung cấp cho nhà tuyển dụng.
1.6 Ý nghĩa khoa học và thực tiễn của đề án
Ý nghĩa khoa học
Áp dụng công nghệ mới trong lĩnh vực tuyển dụng nhân sự. Phát triển ứng dụng
để góp phần từng bước phổ biến và làm phát triển công nghệ này.
Ý nghĩa thực tiễn
Áp dụng các kỹ thuật xử lý ảnh và sử dụng mơ hình mạng nơ ron tích chập
(CNN), ứng dụng này đóng góp quan trọng cho việc nghiên cứu, tìm hiểu, sử dụng và
khai thác tài liệu liên quan đến đề án. Đồng thời, nó cũng hỗ trợ q trình tuyển dụng
nhân sự một cách nhanh chóng, hiệu quả và chính xác.
11
CHƯƠNG 2 - CƠ SỞ LÝ THUYẾT
2.1. Giới thiệu về học sâu và thị giác máy tính
2.1.1. Học sâu
Học sâu (Deep learning) là một phương pháp tiên tiến trong lĩnh vực trí tuệ nhân
tạo, nhằm giúp máy tính học và xử lý dữ liệu theo mơ phỏng q trình tư duy trong não
bộ con người. Mơ hình học sâu có khả năng nhận diện và hiểu được nhiều mẫu phức
tạp trong hình ảnh, văn bản, âm thanh và các dữ liệu khác, từ đó đưa ra thơng tin và dự
đốn chính xác. Các phương pháp học sâu cũng đóng vai trị quan trọng trong việc tự
động hóa các tác vụ mà trước đây yêu cầu sự can thiệp và trí tuệ của con người.
Các thuật toán học sâu là các mạng nơ ron được mơ hình hóa theo bộ não con
người. Ví dụ, bộ não con người có hàng triệu nơ ron kết nối với nhau, hoạt động cùng
nhau để tìm hiểu và xử lý thơng tin. Tương tự, các mạng nơ ron học sâu, hay còn gọi là
mạng nơ ron nhân tạo, được hình thành từ nhiều lớp nơ ron nhân tạo hoạt động cùng
nhau bên trong máy tính.
Các nơ ron nhân tạo là các mô đun phần mềm được gọi là nút, sử dụng các phép
toán để xử lý dữ liệu. Các mạng nơ ron nhân tạo là các thuật toán học sâu sử dụng các
nút này để giải quyết các vấn đề phức tạp.
12
Hình 2.1: Mơ hình học sâu
2.1.1.1. Các thành phần của mơ hình học sâu
Một mạng nơ ron chun sâu có các thành phần sau:
Lớp đầu vào (Input Layer)
-
Một mạng nơ ron nhân tạo sẽ bao gồm một số nút dùng để nhập dữ liệu đầu
vào. Các nút này tạo nên lớp đầu vào của hệ thống.
Lớp ẩn (Hidden Layer)
-
Lớp đầu vào trong mạng nơ ron xử lý và truyền dữ liệu đến các lớp sâu hơn.
Các lớp ẩn này thực hiện xử lý thông tin ở các cấp độ khác nhau, thích ứng
với hành vi của chúng khi nhận thơng tin mới. Mạng học sâu có thể có hàng
trăm lớp ẩn, cho phép phân tích vấn đề từ nhiều góc độ khác nhau.
13
Ví dụ, trong trường hợp phân loại hình ảnh của một lồi vật chưa được xác
-
định, cần so sánh hình ảnh đó với các lồi vật đã biết. Để thực hiện điều này,
quan sát các đặc điểm như hình dáng của cặp mắt, đơi tai, kích thước, số
lượng chi và hình mẫu lơng của lồi vật. Mục tiêu là xác định các hình mẫu
này để phân loại đúng lồi vật đó như sau:
Lồi vật có móng guốc nên nó có thể là lợn rừng hoặc hươu đỏ.
Một lồi vật có đặc điểm là có mắt mèo có thể là một loài mèo hoang dã
chưa được xác định.
-
Trong mạng nơ ron học sâu, các lớp ẩn hoạt động theo cùng một cách tiếp
cận. Khi một thuật toán học sâu đang cố gắng phân loại một hình ảnh động
vật, mỗi lớp ẩn của thuật toán sẽ xử lý một đặc điểm riêng biệt của con vật
và cố gắng phân loại nó một cách chính xác.
Lớp đầu ra (Output Layer)
-
Lớp đầu ra bao gồm các nút xuất dữ liệu. Các mơ hình học sâu có thể đưa ra
đáp án “có” hoặc “khơng” bằng cách sử dụng hai nút trong lớp đầu ra. Nếu
mô hình cần đưa ra nhiều đáp án hơn, thì số lượng nút trong lớp đầu ra sẽ
tăng tương ứng.
2.1.1.2. So với máy học, mơ hình học sâu mang lại những lợi ích sau
Xử lý hiệu quả dữ liệu phi cấu trúc
-
Phân tích dữ liệu phi cấu trúc là một thách thức đối với các phương pháp
máy học, do tập dữ liệu huấn luyện có thể thay đổi đáng kể. Trong khi đó,
các mơ hình học sâu có khả năng hiểu được dữ liệu phi cấu trúc và đưa ra
nhận xét tổng qt mà khơng cần trích xuất đặc trưng thủ cơng. Ví dụ, một
mạng nơ ron có thể nhận ra rằng hai câu đầu vào khác nhau về cú pháp
nhưng mang cùng ý nghĩa:
14
Có thể chỉ cho tơi cách thanh tốn khơng?
Tơi có thể chuyển tiền bằng cách nào?
Khám phá những mối quan hệ và mẫu ẩn
-
Ứng dụng của học sâu cho phép phân tích sâu hơn một lượng lớn dữ liệu và
khám phá ra thơng tin chun sâu mới mà có thể chưa được đào tạo trước đó.
Ví dụ, giả sử sử dụng một mơ hình học sâu để phân tích giao dịch mua hàng
của người tiêu dùng. Mơ hình này chỉ được huấn luyện trên dữ liệu của
những mặt hàng đã được mua. Tuy nhiên, mạng nơ ron nhân tạo có khả
năng đề xuất các mặt hàng mới mà người tiêu dùng chưa từng mua, bằng
cách so sánh các mẫu mua hàng của người dùng với dữ liệu từ nhiều khách
hàng tương tự khác.
Học khơng giám sát
-
Các mơ hình học sâu có khả năng học hỏi và cải thiện theo thời gian dựa
trên hành vi của người dùng mà không yêu cầu tập dữ liệu được dán nhãn có
sự biến động cao. Ví dụ, một mạng nơ ron tự động có thể điều chỉnh và đề
xuất từ ngữ dựa trên phân tích hành vi đánh máy. Giả sử mơ hình được huấn
luyện bằng tiếng Anh và có khả năng kiểm tra ngữ pháp tiếng Anh. Tuy
nhiên, nếu người dùng thường xuyên gõ các từ không phải tiếng Anh như
“danke”, mạng nơ ron sẽ tự động học và điều chỉnh để nhận biết và sử dụng
những từ này.
Xử lý dữ liệu dễ biến động
-
Các tập dữ liệu dễ biến động có tính biến động cao. Mạng nơ ron học sâu
cũng có khả năng phân loại và sắp xếp dữ liệu.