Tải bản đầy đủ (.pdf) (26 trang)

Nhận dạng khuôn mặt bằng điện thoại thông minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.84 MB, 26 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<small>Luận văn được hồn thành tại:</small>

<small>Người hướng dẫn khoa học: TS. PHAM VĂN CƯỜNG</small>

<small>Phản biện Ï:...--- 2222 22222222111 27112271110211112.1E.ceeriei</small>

<small>Phản biện 2: ...---522222+2222112222211127111112271111 2.2111. ceerrke.</small>

<small>Luận văn sẽ được bảo vệ trước Hội đông châm luận văn thạc sĩ tại</small>

<small>Học viện Cơng nghệ Bưu chính Viễn thơng</small>

<small>Vào lúc: ... giờ</small>

<small>Có thê tìm hiệu luận văn tại:</small>

<small>- Thư viện của Học viện Cơng nghệ Bưu chính Viễn thơng</small>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

MỞ ĐẦU

Ngày nay với các tiễn bộ của khoa học kỹ thuật thì mọi cơng việc hầu như đều có thé tiến hành trên máy tính một cách tự động hóa hồn tồn hoặc một phan. Một trong những sự thay đối lớn đó là

<small>cách thức chúng ta thu nhận và xử lý dữ liệu. Các công cụ nhập liệu</small>

như bàn phím hay máy scan dần bị thay thế băng các thiết bị tiện lợi

<small>hơn như màn hình cảm ứng, camera...</small>

Hơn thế nữa, các máy tính để bàn khơng cịn là cơng cụ duy nhất có thê hỗ trợ cho con người. Chúng ta bước sang thế kỷ 21 với sự phát triển mạnh mẽ của các thiết bị di động, giải trí cầm tay hay smartphone. Với kích thước ngày càng nhỏ gọn và hiệu suất làm việc thì khơng ngừng được cải tiến, các cơng cụ mini này hứa hẹn sẽ

là một phần không thê thiếu trong xã hội hiện đại. Do đó, phát triển các ứng dụng trên các thiết bi này cũng là một xu thé tất yếu.

<small>Công nghệ nhận dạng là một trong các công nghệ đang được áp</small>

dụng cho các thiết bị di động hiện nay. Hầu hết các điện thoại hiện nay có mật khâu để giải quyết vấn đề bảo mật. Tuy nhiên, sử dụng

<small>phương pháp nhận dạng khuôn mặt là an toàn hơn và linh hoạt:</small>

phương pháp này cung cấp thông tin đặc biệt dé truy cập và người sử dụng không cần phải ghi nhớ mật khâu và tránh trường hợp mật khâu bị đánh cắp hay quên mật khẩu. Vi vậy tôi đã quyết định chon đề tài “Nhận dạng khuôn mặt bằng điện thoại thông minh” cho luận

<small>văn này..</small>

Ngoài phần mở đầu, kết luận và danh mục tài liệu tham khảo, luận văn được kết cầu thành 3 chương:

Chương 1: Tổng quan về nhận dạng khn mặt: sẽ tập trung trình bày về bài tốn nhận dạng khuôn mặt, các nghiên cứu trước đây

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

về cách tiếp cận giải quyết bài toán nhận dạng khuôn mặt. Một số van đề ảnh hưởng đến chất lượng nhận dạng khuôn mặt cũng sé được thảo luận trong chương này. Ngoai ra, phạm vi và một số giả định cho nghiên cứu cũng sẽ được trình bày trong phần cuối chương.

<small>Chương 2: Phương pháp nhận dạng khuôn mặt</small>

Trong chương này, sẽ đề xuất một phương pháp nhận dạng khuôn mặt phù hợp với khả năng tính tốn hạn chế của các thiết bị như điện thoại thông minh hay các thiết bị cầm tay. Trong đó, giải pháp được đề xuất sẽ được tiến thành theo ba bước: (1) Tiền xử lý,

(2) Trích chọn các đặc trưng, và (3) Đề xuất thuật toán nhận

<small>Chương 3: Thử nghiệm và đánh giá</small>

Nội dung chương này dé cập về q trình tiến hành thực nghiệm, phân tích và đánh giá các đề xuất được nêu ra trong Chương 2. Đồng thời, chương này cũng trình bày những kết quả thử nghiệm thu được. Cuối cùng, kết chương là những thảo luận, kiến nghị và hướng phát triển cho nghiên cứu

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

Chương 1: TONG QUAN VE NHAN DẠNG KHN MAT

<small>1.1. Bai tốn nhận dang khn mặt</small>

1.1.1. Tính cấp thiết của đề tài

<small>Từ khi máy tính điện tử ra đời, đặc biệt là khi kha năng xử ly</small>

tính tốn vượt trội của nó được ứng dụng vào các hệ thống trợ giúp con người, con người không ngừng mong muốn có thể tạo ra những cỗ máy có khả năng xử lý và quan sát phân tích hình ảnh giống với hệ thống thị giác con người.

Một loạt các thành tựu trong lĩnh vực này có thé kế đến như rô-bốt giống người của Softbank, trong đó có khả năng tương tác với người và thực hiện việc đối thoại với các biểu cảm phù hợp thơng qua việc phân tích biểu hiện khn mặt và giọng nói. Hệ thống hỗ

<small>trợ lái xe tự động trong các cuộc thi giải DAPRA.</small>

<small>Là một trong các ứng dụng thành cơng và có tính thực tiễn cao</small>

<small>của lĩnh vực phân tích và xử lý hình ảnh, nhận dạng khn mặt</small>

người là lĩnh vực nhận được rất nhiều quan tâm. Chăng hạn việc nhận dạng khuôn mặt cho phép tăng tính “giống người” của các hệ thống tương tác người-máy (các thiết bị trợ giúp, rô-bốt. Việc nhận

<small>dạng nhanh và chính xác giúp cho việc quản lý an ninh, xác định tội</small>

phạm tốt hơn. Với đặc trưng riêng của mặt người, việc nhận dạng cũng có thể coi là việc xác định đặc tính sinh trắc học (biometrics)

<small>cho phép dam bảo an ninh, an tồn thơng tin cá nhân (bảo mật truynhập, mật mã tài khoản ngân hàng, ...).</small>

Với mục đích đưa những tiễn bộ cơng nghệ vào phục vụ cho cuộc song, tôi xin chọn dé tài nghiên cứu “Nhận dạng khn mặt bang

<small>điện thoại thơng mình.</small>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

1.1.2. Tổng quan hệ thông nhận dạng khuôn mặt

Một hệ thống nhận dạng khn mặt tổng qt có sơ đồ khối như hình 1. Ảnh thu nhận được, có thể là ảnh tĩnh hoặc các khung ảnh của một dòng dữ liệu video, trước hết được thực hiện quá trình tiền xử lý nhằm tăng chất lượng dữ liệu ảnh. Việc tiền xử lý tăng cường chất lượng ảnh có thể chỉ đơn giản là lọc nhiễu bằng các bộ lọc. Nhưng cũng có thể là một tổ hợp các phép xử lý nhằm mục đích

“chuẩn hóa” ảnh sao cho những thông tin cần thiết của ảnh được tăng cường trong khi những thông tin không cần thiết hoặc gây nhiễu

sẽ được giảm bớt hoặc loại bỏ. Sau đó, nhiệm vụ quan trọng tiếp theo của hệ thống là thực hiện phát hiện và định vị khn mặt (nếu

<small>có) trong dữ liệu ảnh. Trong một ảnh hay một khung ảnh, thường có</small>

mặt rất nhiều các đối tượng. Vì thế, để giảm nhỏ khối lượng tính tốn trong q trình nhận dạng cũng như để tăng khả năng nhận dạng chính xác của hệ thống, đầu vào của q trình nhận dạng chỉ nên là các dữ liệu tương ứng với vùng khn mặt xuất hiện hoặc có khả năng xuất hiện với xác suất lớn trong ảnh. Kết quả của khối phát

<small>hiện và định vị khuôn mặt là vị trí và vùng mở rộng của khn mặt.</small>

Trong một số trường hợp, kết quả của khối này có thé là những phân vùng khuôn mặt đã được phát hiện và định vi. ĐỀ việc phát hiện va

<small>định vị có tính chính xác cao thì q trình phát hiện và định vị khn</small>

mặt cũng có thé phải sử dung một SỐ phương pháp trích chọn đặc trưng, chăng hạn như trích chọn các đường, các điểm chuẩn, các đặc trưng khác trên khuôn mặt như mắt, mũi, lỗ mũi, miệng, lông mày,

<small>...V,.V. Trong trường hop dữ liệu vào là dòng video va với các Ứngdụng thời gian thực thì sau khi phát hiện và định vị được khuôn mặt</small>

ở một khung hình, hệ thống phải thực hiện nhiệm vụ bám theo sự thay đổi vị trí và hướng của khn mặt.

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<small>Sau khi một khuôn mặt hoặc một nhóm khn mặt đã được địnhvi cùng với các đặc trưng của nó được trích chọn, nó được đưa vào</small>

khối nhận dạng khuôn mặt. Khối nhận dạng khuôn mặt sử dụng các đặc trưng đã trích xuất được để xác định xem khn mặt đó là ai dựa

<small>trên việc so sánh với cơ sở dữ liệu đã có.</small>

<small>Ảnh/ Video đầu vào</small>

<small>Hình 1.1: So đồ tổng quát của một hệ thống nhận dạng khn mat</small>

1.1.3. Bài tốn nhận dạng khn mặt bằng điện thoại thơng minh Về cơ bản, bài tốn nhận dạng khuôn mặt bằng điện thoại thông minh không khác biệt nhiều so với bài tốn nhận dạng khn mặt thơng thường với hệ thống được trình bay trong hình 1.1.

Hệ thống nhận dạng khn mặt bằng điện thoại thơng minh được

<small>minh họa trong hình 1.2.</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<small>Hình 1. 2: Sơ đồ tổng quát hệ thống nhận dạng khuôn mặt bằng</small>

<small>điện thoại thông minh</small>

Ý tưởng của đề tài là phát triển ứng dụng nhận dạng khuôn mặt trên điện thoại thông minh chạy hệ điều hành Android. Ảnh được thu nhận băng camera của điện thoại. Ảnh sau đó được thực hiện tiền xử

lý và phát hiện khuôn mặt. Kết quả khuôn mặt phát hiện được sẽ

<small>được trích chọn đặc trưng. Dựa trên cơ sở dữ liệu, ứng dụng sẽ thực</small>

hiện việc trả về kết quả nhận dạng.

<small>1.2. Các nghiên cứu trước đây</small>

<small>1.3. Mục tiêu, phương pháp và phạm vi nghiên cứu</small>

Việc nhận dạng khn mặt có thể được tiếp cận theo các cách khác nhau tùy thuộc vào dữ liệu đầu vào và đáp ứng của hệ thống

<small>nhận dạng : Nhận dạng dựa trên ảnh tĩnh hoặc dãy ảnh/video; Hệ</small>

thống nhận dạng thời gian thực hoặc hệ thống nhận dạng thơng

<small>thường, ..</small>

Mặc dù các thuật tốn nhận dạng khuôn mặt được phát triển đạt được chất lượng rất cao khi hoạt động trong điều kiện được kiểm soát, hầu hết các thuật toán này cho kết quả khơng tốt khi có sự thay

<small>đơi dẫn đến sự thay đơi biểu hiện của khn mặt. Nói một cách khác,</small>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

đa số các thuật toán nhận dạng khuôn mặt nhạy cảm với các yếu tố như: Sự thay đổi chiếu sáng, Sự thay đổi biểu hiện cảm xúc, Sự thay

đơi góc chụp của Camera, Sự thay đôi tư thế đầu, ...

Để giảm sự ảnh hưởng của các yếu tô thay đổi đến chất lượng của hệ thống nhận dạng khn mặt, cần thiết phải có các phương pháp thực hiện tiền xử lý phù hop. Chang hạn dé giảm sự ảnh hưởng của sự thay đôi chiếu sảng, trước khi thực hiện nhận dạng các ảnh có thé được tiền xử lý bằng bù sự thay đổi chiếu sáng.

Mặt khác, hầu hết các thuật toán nhận dạng thường mặc định được phát triển trên nền tảng máy tính cá nhân, ở đó khả năng tính tốn đủ mạnh cũng như tài nguyên (bộ nhớ, ...) có thể đáp ứng tốt với khối lượng tính tốn lớn của các thuật toán. Mặc dù các thiết bị

cầm tay hiện nay được đầu tư phát triển nhanh chóng, với tốc đỗ chip lõi tăng đáng kể. Tuy nhiên so với sự phát triển về khả năng xử lý tính tốn của máy tính cá nhân thì vẫn cịn cần phải có một khoảng thời gian dài. Do đó, việc áp dụng trực tiếp các thuật toán này cho các thiết bị cầm tay có tài nguyên hữu hạn (Light-weight

devices) sẽ gặp khó khăn nếu khơng muốn nói là khơng khả thị, ít nhất là trong tương lai gần.

Từ những nhận định trên, đề tài được đặt ra với mục tiêu tìm hiểu, nghiên cứu triển khai một phương pháp nhận dạng khuôn mặt

<small>sử dụng điện thoại thông minh.</small>

Đề tài sẽ tập trung vào nghiên cứu bài toán nhận dạng mặt người trong điều kiện có sự thay đổi về chiếu sáng và được thực hiện trên

các thiết bị có tài nguyên hạn chế nhu điện thoại di động.

Phương pháp nghiên cứu của đề tài bao gồm cả phần nghiên cứu lý thuyết và triển khai thực nghiệm. Trước hết, đề tài tập trung tìm

<small>hiệu bài tốn nhận dạng khn mặt người, nghiên cứu các phương</small>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small>pháp nhận dang khn mặt người, từ đó lựa chon một phương pháp</small>

nhận dạng khuôn mặt người phù hợp cho cài đặt trên các thiết bị di động. Sau đó, dựa trên tập dữ liệu lựa chọn, đề tài sẽ thực hiện việc phân tích và đánh giá phương pháp đề xuất. Với những kết quả đánh

giá, đề tài sẽ đề xuất những hướng phát triển hoàn thiện trong các nghiên cứu kế tiếp.

1.4. Một số giả định

Trong đề tài này, VIỆC tiến hành nghiên cứu được thực hiện dựa trên một số giả định sau với tập dữ liệu huấn luyện:

- Di liệu ảnh huấn luyện gồm các ảnh nhìn thăng

<small>- Các anh có hướng trùng với hướng khn mặt thông thường</small>

được quan sát (thăng, đứng)

- Su chiếu sáng của ảnh và nền ảnh được kiểm soát theo yêu cầu

- Độ lớn của tập dit liệu là hữu han, trong đó mỗi đối tượng chỉ

có một ảnh mẫu duy nhất

<small>- Các ảnh là ảnh tĩnh</small>

Ngồi ra, do q trình huấn luyện là một quá trình tốn thời gian nên dữ liệu được sử dụng va huấn luyện với mơ hình trên máy tính. Kết quả huấn luyện sẽ được xuất ra file kết quả với định dạng *.xml.

Phần nhận dạng sẽ sử dụng file kết quả này dé thực hiện việc nhận

1.5. Kết luận chương

Chương này đã tập trung trình bày về bài tốn nhận dạng khn mặt, các nghiên cứu trước đây về cách tiếp cận giải quyết bài tốn nhận dạng khn mặt, một số van dé ảnh hưởng đến chất lượng nhận

<small>dạng khuôn mặt cũng sẽ được thảo luận trong chương này. Ngoài ra,</small>

phạm vi và một số giả định cho nghiên cứu cũng đã được trình bày trong phần cuối chương.

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

Chương 2: PHƯƠNG PHÁP NHAN DẠNG KHN MAT

2.1. Mở đầu

Bài tốn nhận dạng đối tượng ảnh nói chung, nhận dạng khn mặt người nói riêng là một bài tốn rất phức tạp. Nếu nhìn tổng thể

<small>tồn bộ q trình thì đây là một bài tốn hồn chỉnh của xử lý ảnh</small>

bao gồm từ những bước đầu tiên là thu nhận ảnh, tiền xử lý nâng cao

chất lượng ảnh, cho đến hiểu ảnh. Mỗi một khâu trong q trình đều

có một vai trị nhất định và có ảnh hưởng khơng nhỏ đến chất lượng

chung của tồn hệ thống, trong đó với bai tốn nhận dạng khn mặt

<small>người là tính chính xác của việc nhận dạng.</small>

Trong phạm vi luận văn này, giả thiết là dữ liệu ảnh số đã có sẵn (có thé đã được lưu trữ trong hệ thống hoặc có thé dễ dang thu nhận với sự hỗ trợ của hệ thống camera số). Vì vậy, trong phần này,

chúng tơi sẽ chỉ tập trung vào xem xét từ quá trình tiền xử lý cho đến

<small>q trình nhận dạng ảnh khn mặt.</small>

2.2. Tiền xử lý

Tiền xử lý ảnh thường được hiểu là quá trình tăng cường chất lượng ảnh, chuẩn hóa ảnh nhằm tạo điều kiện thuận lợi va tăng độ

<small>chính xác của việc trích chọn thơng tin anh.</small>

<small>2.2.1. Lọc nhiễu</small>

Dưới góc độ kỹ thuật, bất ké hệ thống nao, dù lý tưởng đến đâu cũng chịu tác động bởi yếu tố ngẫu nhiêu gọi là nhiễu. Ảnh số cũng không phải là ngoại lệ. Nhiễu trong ảnh số được hiểu là sự biến thiên đột ngột (ngẫu nhiên) của giá trị mức xám (màu) của một điểm ảnh

<small>so với những điêm ảnh xung quanh.</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

2.2.2. Tăng cường tính sắc nét của ảnh

Mục tiêu của phép làm tăng cường tính sắc nét của ảnh là tăng cường tính tương phản cục bộ của ảnh. Kết quả của phép xử lý sẽ làm các biên của đối tượng ảnh rõ nét hơn. Từ đó, cho phép thực

hiện việc phân tách đối tượng, trích chọn đặc trưng đối tượng dễ

<small>dàng và chính xác hơn.</small>

<small>2.2.3. Phát hiện biên ảnh</small>

Phát hiện biên ảnh là thao tác bước đầu chuẩn bị tiến tới trích chọn đặc trưng va hiểu ảnh. Mặc dù chưa có định nghĩa chính chính thức về biên ảnh, nhưng có một khái niệm được chấp nhận rộng rãi đó là biên anh là một tập hợp điểm liên kết có sự thay đổi đột ngột về giá trị mức xám. Tập các điểm ảnh biên tạo thành biên ảnh hay

còn gọi là đường bao của đối tượng ảnh.

<small>2.2.4. Phân vùng ảnh</small>

Phân vùng ảnh là bước tiếp theo sau phát hiện biên. Tuy nhiên trong thực tế thường được thực hiện đồng thời với quá trình phát hiện biên. Phát hiện biên và phân vùng ảnh là hai cách tiếp cận đối

<small>ngẫu trong phân tích ảnh.</small>

Mục tiêu của phân vùng ảnh là thực hiện việc chia ảnh đầu vảo thành các vùng cau thành hoặc các đối tượng. Mức độ chi tiết của việc phân vùng phụ thuộc vảo bài toán cần giải quyết. Nói một cách cụ thé, q trình phân vùng ảnh sẽ kết thúc khi các đối tượng hoặc

<small>vùng quan tâm trong ảnh được phân chia và được phát hiện.</small>

<small>2.3. Trích chọn đặc trưng</small>

Dựa trên các kết quả đạt được của quá trình phân vùng đối tượng ảnh, các đối tượng ảnh được tiếp tục đưa vào phân đoạn xử lý dé tìm các đặc trưng. Đặc trưng đối tượng có thể xem là những tham số biểu diễn hoặc tập những tham số biểu diễn cho phép mô tả tốt đối

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

tượng và phan nao giúp việc phân biệt giữa một đối tượng với một đối tượng khác.

<small>Việc trích chọn các đặc trưng hiệu quả sẽ cho phép việc khai</small>

thác thông tin ảnh tốt hơn, nhận dạng các đối tượng ảnh nhanh hơn,

khối lượng dữ liệu (tập dtr liệu) mô tả các đối tượng ảnh sẽ giảm di.

2.3.1. Các đặc trưng cơ bản của đối tượng ảnh

2.3.1.1. Các đặc trưng mô tả đường bao đối tượng ảnh

Dé mô tả biên (đường bao) của đối tượng ảnh chúng ta có thé sử dụng các mơ tả đơn giản như: chiều dài đường bao, đường kính

<small>đường bao, các trục chính/phụ của đường bao, hình chữ nhận cơ sởcủa đường bao, độ lệch tâm của hình dạng đường bao, độ cong củađường bao, ...</small>

Bên cạnh các mô ta don giản ké trên, đường bao đối tượng cịn có thé được mơ tả bởi chi số hình dạng. Chỉ số hình dạng được định nghĩa là vi sai mã chuỗi của biên được dịch vòng ứng với số nguyên nhỏ nhất.

<small>2.3.1.2. Các mô tả vùng ảnh</small>

Các mô tả vùng đơn giản nhất là: diện tích của vùng, chu vi của

<small>vùng, mức độ gọn của vùng, độ tròn của vùng, ...</small>

Vùng cịn có thể mơ tả băng các giá trị trung bình, trung vị, lớn nhất

<small>hoặc nhỏ của các mức xám của vùng.</small>

2.3.1.3. Mô tả bằng các thành phân chỉnh

Như đã có đề cập trong chương đầu của luận văn, mục tiêu của việc sử dụng các đặc trưng mô tả là các thành phần chính là việc sử

dụng các cơng cụ tốn của đại số tuyến tính thực hiện việc phân tích dữ liệu theo các thành phan cơ bản. Các thành phan cơ bản là những véc-to trị riêng có hướng trùng với những hướng thay đổi lớn của dữ

</div>

×