Tải bản đầy đủ (.docx) (51 trang)

QUẢN Lý d6cntt epu dai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.05 MB, 51 trang )

MỤC LỤC

1


DANH MỤC HÌNH ẢNH

2


DANH MỤC TỪ VIẾT TĂT
Từ viết

Diễn giải

tắt

Principal Component
PCA

Analysis
Linear Discriminant

LDA

Analysis

Từ viết
tắt
PDF


FLD

Diễn giải
Probabilistic Density
Function
Fisher’s Linear
Discriminant

3


LỜI MỞ ĐẦU
Hiện nay, cùng với sự phát triển của xã hội , vấn đề an ninh bảo mật đang được
yêu cầu khắt khe tại mọi quốc gia trên thế giới. Các hệ thống nhận dạng con người được
ra đời với độ tin cậy ngày càng cao. Một trong những bài toán nhận dạng con người rất
được quan tâm hiện nay là nhận dạng khuôn mặt. Ngày nay việc thu thập , xử lý thông tin
qua ảnh để nhận biết đối tượng đang được quan tâm và ứng dụng rộng rãi. Với phương
pháp này chúng ta có thể thu thập được nhiều thông tin từ đối tượng mà không cần tác
động nhiều đến đôi tượng nghiên cứu. Sự phát triển của khoa học máy tính tạo môi
trường thuận lợi cho bài toán nhận dạng khuôn mặt người từ ảnh số.
Em xin chọn đề tài “Xây dựng ứng dụng nhận dạng mặt người trong ảnh dựa trên
việc phân tích thành phần chính PCA”. Nhằm mục đích tìm hiểu, nắm bắt và làm chủ
được kỹ thuật nhận dạng mặt người phục vụ cho việc xây dựng các ứng dụng thực tế
trong tường lai.

Chương 1: Tìm hiểu tổng quan về xử lý ảnh và bài toán nhận dạng mặt người
1.1 Tổng quan về sử lý ảnh
1.1.1 Xử lý ảnh là gì ?
Xử lý ảnh là một một lĩnh vực mang tính khoa học và công nghệ . Quá trình xử lý ảnh
được xem như là quá trình thao tác ảnh đầu vào(ảnh tự nhiên được thu qua các thiết bị

thu) nhằm cho ra kết quả mong muốn . Kết quả đầu ra của một quá trình xử lý ảnh có
thể là một ảnh tốt hơn hoặc một kết luận.

Ảnh Tốt Hơn
Ảnh

Xử Lý Ảnh
Kết Luận

4


Hình 1-1 : quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng
cường độ sang hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong
không gian
Sơ đồ tổng quát của một hệ thống xử lý ảnh :

Hệ quyết
định
Thu
nhận
ảnh

Tiền
xử lý

Trích
chọn đặc
điểm


Hậu
xử lý

Đối sánh
rút ra kết
luận
Lưu trữ

Hình 1-2 : Hệ thống xử lý ảnh
1.1.2 Các hệ thống xử lý ảnh
a. Tiền xử lý
Tiền xử lý là giai đoạn đầu tiên trong xử lý ảnh số. Tuỳ thuộc vào quá trình
xử lý tiếp theo trong giai đoạn này sẽ thực hiện các công đoạn khác nhau như: nâng
cấp, khôi phục ảnh, nắn chỉnh hình học, khử nhiễu v.v..
b. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá
trình xử lý ảnh. Trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm.
c. Đối sánh, nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân
nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong

5


nhiều ngành khoa học khác nhau. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một
vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng
nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó.Hệ thống nhận
dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau đây:


• Thu nhận dữ liệu và tiền xử lý.
• Biểu diễn dữ liệu.
• Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:






Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
Phân loại thống kê.
Đối sánh cấu trúc.
Phân loại dựa trên mạng nơ-ron nhân tạo.

Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn
lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và
cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng
khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ
thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.

1.1.3 Các vấn đề cơ bản trong xử lý ảnh
1.1.3.1 Một số khái niệm cơ bản
-

Ảnh và điểm ảnh: Điểm ảnh được xem như là dấu hiệu hay cường độ sáng
tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như là 1 tập

-


hợp các điểm ảnh.
Mức xám, màu: Là số các giá trị có thể có của các điểm ảnh của ảnh

1.1.3.2 Nắn chỉnh biến dạng.
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
6


P’i
f(Pi)

Pi

Ảnh thu nhận

Ảnh mong muốn

Hình 0.1: Ảnh thu nhận và ảnh mong muốn

Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường được
xây dựng trên tập các điểm điều khiển.
1, n

Giả sử (Pi, Pi’) i =

có n các tập điều khiển
n

Tìm hàm f: Pi





i =1

f (Pi) sao cho

f ( Pi ) − Pi '

2

→ min

Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc nhất
tuyến tính. Khi đó hàm f có dạng: f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)

[

φ = ∑ ( f ( Pi) − Pi ' ) 2 = ∑ ( a1 xi + b1 yi + c1 − xi' ) + ( a 2 xi + b2 yi + c2 − yi' )
Ta có:

n

n

i =1

i =1


2

2

]

Để cho φ → min

7


 ∂φ
=0


a
1

 ∂φ
=0⇔


b
1

 ∂φ
=0


c

 1

n
n
n
 n
2
'
∑ a1 xi + ∑ b1 xi y i + ∑ c1 xi = ∑ xi xi
i =1
i =1
i =1
 i =1
n
n
n
n

2
'
∑ a1 xi y i + ∑ b1 y i + ∑ c1 y i = ∑ y i xi
i =1
i =1
i =1
 i =1
n
n
n

'

∑ a1 xi + ∑ b1 y i + nc1 = ∑ xi
i =1
i =1
 i =1

Giải hệ phương trình tuyến tính tìm được: a1, b1, c1
Tương tự tìm được : a2, b2, c2
⇒ Xác định được hàm f
1.1.3.3 Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh
- Nhiều hệ thống: là nhiễu có quy luật có thể khử bằng các phép
biến đổi
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các
phép lọc.
1.1.3.4

Chỉnh mức xám.

Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có 2
hướng tiếp cận:
-

Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen

-

trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.

8


1.1.3.5

Phân tích ảnh.
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong phân
tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối
tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh.
Có thể nêu ra một số đặc điểm của ảnh sau đây:
-

Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm

-

uốn.
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực
hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm”
(feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ nhật,

-

tam giác, cung tròn v.v..)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và
do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng
khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán
tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero
crossing) v.v.. Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận
dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng

nhớ lưu trữ giảm xuống.

1.1.3.6

Nhận dạng.
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân
nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng
trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu
(pattern) là gì? Watanabe, một trong những người đi đầu trong lĩnh vực này đã
định nghĩa: “Ngược lại với hỗn loạn (chaos), mẫu là một thực thể (entity), được
xác định một cách ang áng (vaguely defined) và có thể gán cho nó một tên gọi
nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được
9


chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói. Khi
biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
-

Phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt
(discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần
của một lớp đã xác định.

-

Phân loại không có mẫu (unsupervised classification hay clustering) trong đó các
mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó.
Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh.

Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ

yếu sau đây:
-

Thu nhận dữ liệu và tiền xử lý.

-

Biểu diễn dữ liệu.

-

Nhận dạng, ra quyết định.

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
-

Đối sánh mẫu dựa trên các đặc trưng được trích chọn.

-

Phân loại thống kê.

-

Đối sánh cấu trúc.

-

Phân loại dựa trên mạng nơ-ron nhân tạo.


Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn
lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và
cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử
dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế
các hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.
10


Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra
những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng
đó là những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên
gia đề xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
1.1.3.7 Nén ảnh.
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai cách
khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo
toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn.
Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
-

Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích

-

hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm
ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh

-


trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính
là tiếp cận theo kỹ thuật nén này.

Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự
lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc
ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal
1.1.4 Các ứng dụng của xử lý ảnh
Một số ứng dựng của xử lý ảnh :
Như đã nói ở trên, các kỹ thuật xử lý ảnh trước đây chủ yếu được sử dụng để
nâng cao chất lượng hình ảnh, chính xác hơn là tạo cảm giác về sự gia tăng chất

11


lượng ảnh quang học trong mắt người quan sát. Thời gian gần đây, phạm vi ứng dụng
xử lý ảnh mở rộng không ngừng, có thể nói hiện không có lĩnh vực khoa học nào
không sử dụng các thành tựu của công nghệ xử lý ảnh số .
Trong y học các thuật toán xử lý ảnh cho phép biến đổi hình ảnh được tạo ra từ
nguồn bức xạ X-ray hay nguồn bức xạ siêu âm thành hình ảnh quang học trên bề mặt
film x-quang hoặc trực tiếp trên bề mặt màn hình hiển thị. Hình ảnh các cơ quan
chức năng của con người sau đó có thể được xử lý tiếp để nâng cao độ tương phản,
lọc, tách các thành phần cần thiết (chụp cắt lớp) hoặc tạo ra hình ảnh trong không
gian ba chiều (siêu âm 3 chiều).
Trong lĩnh vực địa chất, hình ảnh nhận được từ vệ tinh có thể được phân tích để
xác định cấu trúc bề mặt trái đất. Kỹ thuật làm nổi đường biên (image
enhancement) và khôi phục hình ảnh (image restoration) cho phép nâng cao
chất lượng ảnh vệ tinh và tạo ra các bản đồ địa hình 3-D với độ chính xác cao.

Trong ngành khí tượng học, ảnh nhận được từ hệ thống vệ tinh theo dõi thời ti ết
cũng được xử lý, nâng cao chất lượng và ghép hình để tạo ra ảnh bề mặt trái đ ất trên
một vùng rộng lớn, qua đó có thể th ực hiện việc dự báo thời ti ết một cách chính xác
hơn.
Xử lý ảnh còn được sử dụng rộng rãi trong lĩnh vực hình sự và các hệ thống bảo
mật hoặc kiểm soát truy cập: quá trình xử lý ảnh với mục đích nhận dạng vân tay hay
khuôn mặt cho phép phát hiện nhanh các đối tương nghi vấn cũng như nâng cao hiệu
quả hệ thống bảo mật cá nhân cũng như kiểm soát ra vào. Ngoài ra, có thể kể đến
các ứng dụng quan trọng khác của kỹ thuật xử lý ảnh tĩnh cũng như ảnh động trong
đời sống như tự động nhận dạng, nhận dạng mục tiêu quân sự, máy nhìn công nghiệp
trong các hệ thống điều khiển tự động, nén ảnh tĩnh, ảnh động để lưu và truyền trong
mạng viễn thông v.v

12


1.2 Bài toán nhận dạng mặt người
1.2.1 Khái niệm
Nhận dạng mặt người là một hệ thống được thiết kế để tìm thông tin của một người
dựa vào những đặc trưng sinh học duy nhất trên khuôn mặt của người đó. Kĩ thuật
nhận dạng là kiểm tra sự phù hợp dựa trên phép so sánh một-nhiều cụ thể là tìm ra
một người là ai trong số những người đã được lưu trữ trong hệ thống dựa vào thông
tin khuôn mặt.

1.2.2 Khái quát về nhận dạng mặt người
1.2.2.1. Phân tích các đặc tính sinh trắc học của người
Đặc tính sinh trắc của người là đặc tính đo được các nét hành vi riêng của con người.
Nhận diện người được thực hiện trong quá trình kiểm tra tính đồng nhất của đặc tính
sinh trắc giữa người cần kiểm tra với đặc tính tương tự của người đã được lưu sẵn
trong CSDL. Có thể nhận diện người dựa trên các đặc điểm sinh trắc tĩnh trên người

như khuôn mặt, mắt, vân tay, bàn tay, gen…hay các đặc trưng hành vi như dáng đi,
chữ viết, giọng nói…
Dữ liệu sinh trắc lý tưởng của người cần phải có những đặc tính cơ bản như:
- Tính tổng quát: Mỗi người đều được thể hiện bởi đặc tính này.
- Tính duy nhất: Không thể tồn tại hai người có đặc tính giống nhau.
- Tính thường xuyên: Là sự độc lập của đặc tính đối với thời gian.
- Tính thu thập được: Là đặc tính được thu thập một cách tương đối đơn giản và
nhanh chóng từ mỗi cá nhân và có thể được chi tiết hóa

1.2.2.2. Hệ thống nhận dạng tổng quát
Nhiệm vụ của hệ thống nhận dạng mặt người là xử lý tự động thông tin từ các ảnh để
tìm ra độ tương tự giữa các khuôn mặt và đưa ra quyết định về tính đồng nhất giữa
chúng. Câu trúc của hệ thống nhận dạng mặt người được thể hiện như hình sau:

13


- Tiền xử lý (Pre-Processing): Chức năng này để chuẩn hóa ảnh cần tìm giúp cho
việc tìm kiếm được hiệu quả hơn. Các công việc trong bước tiền xử lý có thể là:
Chuẩn hóa kích cỡ giữa ảnh trong CSDL và ảnh cầm tìm, hiệu chỉnh độ sáng, tối
của ảnh; lọc nhiễu, chuẩn hóa về vị trí, tư thế ảnh mặt.
- Tách khuôn mặt (FD): Chức năng này làm nhiệm vụ xác định vị trí, kích cỡ của
một hoặc nhiều khuôn mặt trên ảnh chụp từ đó tách ra phần mặt. Phần ảnh mặt
đươc tách ra thường nhỏ hơn nhiều so với ảnh chụp ban đầu, nó sẽ là các khuôn
mặt cần tìm và chức năng trích chọn đặc trưng sẽ sử dụng các ảnh được tách ra
này.
- Trích chọn đặc trưng (FE): Tìm ra các đặc trưng chính của ảnh mặt, từ các đặc
trưng này hình thành các vector đặc trưng, các vector này sẽ được sử dụng để đối
sánh sự giống nhau giữa ảnh mặt cần tìm và ảnh mặt trong CSDL.
- Đối sánh (Comparison): Thực hiện việc so sánh giữa các vector đặc trưng để

chọn ra độ tương tự giữa ảnh cần tìm và ảnh trong CSDL. Ảnh chân dung mặt
người cho giấy tờ xuất nhập cảnh và đi đường thỏa mãn các yêu cầu của tiêu chuẩn
quốc tế ISO/IEC JTC 1/SC 37 N 506- Part 5: Face Image Data
Hệ thống nhận dạng mặt người cần đảm bảo các yêu cầu:
+ Độ chính xác nhận dạng có thể chấp nhận được đối với yêu cầu của bài
toán nhận dạng;
+ Tốc độ vận hành cao đối với các CSDL lớn và số lượng các yêu cầu có
thể giải quyết được;
+ Đơn giản trong việc cài đặt, lựa chọn thiết bị và vận hành. An toàn với
người sử dụng.

1.2.3 Các phương pháp nhận dạng mặt người
1.2.3.1. Phương pháp nhận dạng hiện nay có 2 loại:
• Nhận dạng dựa trên các đặc trưng của các phần tử trên khuôn mặt
(Feature based face recognition ).
• Nhận dạng dựa trên xét tổng thể khuôn mặt (Appearance based face
recognition ) .

14


Ngoài ra còn có một số loại nhận dạng sử dụng mô hình về khuôn mặt , một số
phương pháp được dùng cho loại này:

• Nhận dạng 2D: Elastic Bunch Graph, Active
• Nhận dạng 3D: 3D Morphable Model.
1.2.3.2. Nhận dạng dựa trên mối quan hệ giữa các phần tử :
Đây là phương pháp nhận dạng khuôn mặt dựa trên việc xác nhận đặc trưng hình
học của các chi tiết trên một khuôn mặt (như vị trí, diện tích, hình dạng của mắt, mũi,
miệng,..), mỗi quan hệ giữa chúng( như khoảng cách của hai mắt , khoảng cách của

hai lông mày,… ).
Ưu điểm của phương pháp này là nó gần với cách mà con người xử dụng để nhận
biết khuôn mặt. Hơn nữa với việc xác định đặc tính và các mối quan hệ, phương pháp
này có thể cho kết quả tốt trong cách trường hợp ảnh có nhiều nhiễu như bị ngiêng, bị
xoay hoặc ánh sáng thay đổi.
Nhược điểm của phương pháp này là cài đặt thuật toán phức tạp do việc xác định
các mối quan hệ giữa các đặc tính đòi hỏi các thuật toán phức tạp. Mặt khác với các
ảnh kích thức bé thì các đặc tính sẽ khó phân biệt.

1.2.3.3. Nhận dạng dựa trên xét toàn diện khuôn mặt :
Nội dung chính của hướng tiếp cận này là xem mỗi ảnh có kích thước RxC là một
vector trong không gian RxC chiều. Ta sẽ xây dựng một không gian mới có chiều nhỏ
hơn sao cho khi biểu diễn trong không gian đó các đặc điểm chính của một khuôn mặt
không bị mất đi. Trong không gian đó, các ảnh của một người sẽ được tâp chung lại
thành một nhóm gần nhau và cách xa các nhóm khác. Hai phương pháp thường được
sử dụng là PCA ( Principle Components Analysis) và LDA (Linear Discriminant
Analysis).

1.2.4 Mô hình xử lý của một hệ thống nhận dạng mặt người

15


Ảnh tĩnh

Tiền xử lý

Trích rút đặc
trưng


Nhận dạng
khuôn mặt

Hình 1-3. Hệ thống nhận dạng khuôn mặt cơ bản

1.2.4.1. Tiền xử lý
Quá trình tiền xử lý đối với khuôn mặt nhằm nâng cao chất lượng hình ảnh,
chuẩn hóa dữ liệu, kích thước ảnh. Các ảnh trong đối tượng nghiên cứu này là có chất
lượng tương đối tốt nên ta không cần dung các thuật toán nâng cao chất lượng ảnh mà

16


ta chỉ cần chuẩn hóa ảnh. Việc chuẩn hóa này khiế độ lệch giữa 2 điểm ảnh được
giảm xuống làm quá trình rút đặc trưng them chính xác.

1.2.4.2. Trích rút đặc trưng
Chuẩn hóa ma trận ảnh

Trung bình các ảnh

Ma trận ảnh so với trung bình
ảnh
Tính các higenfaces

Tập ảnh học

Khối trích chọn đặc
tính


17


Eigenfaces
Ảnh đầu vào

Vector đặc tính

Hình 1-4. Quá trình trích rút đặc trưng

Trích rút đặc trưng là kĩ thuật sử dụng thuật toán để lấy ra những thông tin mang
những đặc điểm riêng biệt của một người. Trong bài toán này ta sử dụng phương
pháp PCA để thực hiện :

• Tạo một tập S gồm m ảnh (ảnh học). Mỗi ảnh có kích thức RxC. Mỗi ảnh được
chuyển thành mọt vector N = RxC chiều.
S = {, , …, }
(1)
• Tính ảnh trung bình ᴪ: ᴪ =

1.2.4.3. Nhận dạng khuôn mặt
Những đặc trưng sau khi được trích rút sẽ được đưa vào khối nhận dạng để
phân lớp đối tượng. Trong đề tài này ta dung phương pháp phân tích thành phần
chính PCA để nhận dạng đối tượng.

1.2.5 Các ứng dụng của nhận dạng mặt người
Hiện nay các nước châu Mỹ đang ứng dụng công nghệ nhận diện mặt để đảm bảo
an ninh quốc gia thông qua việc nhận diện khuôn mặt kẻ tội phạm ngay khi chúng
xuống sân bay và loại bỏ những lá phiếu gian lận thông qua việc xác định khuôn mặt
người đi bầu cử.


18


Trên lĩnh vực điện thoại di động, ứng dụng nhận diện khuôn mặt để mở máy đã có
trong hệ điều hành Android 4.x
Hồi tháng 6/2012, mạng xã hội Facebook mua lại công ty nhận diện khuôn mặt
Face.com đã tạo ra những hy vọng nhất định cho các công ty hoạt động trong lĩnh vực
này. Trước đó, Google và Sony cũng đã ứng dụng công nghệ nhận diện khuôn mặt
trong các phần mềm của họ, tương ứng là Picasa và Picture Motion Browser.

Chương 2 : Kĩ thuật PCA trong nhận diện khuôn mặt
2.1 Phân tích thành phần chính PCA
2.1.1 Giới thiệu về PCA
Phương pháp này được phát minh năm 1901 bởi Karl Pearson[12] và hiện
nay nó được sử dụng như công cụ để phân tích dữ liệu nghiên cứu và thực hiện
các mô hình dự đoán. PCA còn bao gồm cả việc tính toán phân tích các giá trị
đặc trưng của một ma trận tuơng quan dữ liệu hay phân tính các giá trị đơn của
ma trận dữ liệu thường sau khi tính trung bình dữ liệu của mỗi thuộc tính.
PCA là phương pháp đơn giản nhất phân tích đa biến dựa trên các vector
đặc trưng. Thông thường hoạt động của nó có thể được hiểu nhằm khám phá ra
cấu trúc bên trong của dữ liệu. Nếu một tập dữ liệu đa biến được xem xét như
tập các tọa độ trong một không gian dữ liệu nhiều chiều (mỗi trục biểu diễn một
biến) thì phương pháp PCA cung cấp cho chúng ta một bức ảnh ít chiều, một
cái bóng của vật thể khi quan sát từ chính những đặc trưng cơ bản nhất của vật
thể đó.
2.1.2 Giới thiệu chung về thuật toán
PCA (Principle Components Analysis) là một thuật toán được sử dụng để tạo ra
một ảnh mới từ ảnh ban đầu. Ảnh mới này có kích thước nhỏ hơn rất nhiều so với ảnh


19


đầu vào và vẫn mang những đặc trưng cơ bản nhất của ảnh cần nhận dạng. PCA
không cần quan tâm đến việc tìm ra các đặc điểm cụ thể của thực thể cần nhận dạng
và mối quan hệ giữa các đặc điểm đó. Tất cả các chi tiết đó đều được thể hiện ở ảnh
mới được tạo ra từ PCA.
Về bản chất , PCA tìm ra một không gian mới theo hướng biến thiên mạnh nhất của
một tập hợp các vector trong không gian cho trước. trong không gian mới người ta hy
vọng rằng việc phân loại sẽ mang kết quả tốt hơn so với không gian ban đầu.

• Ưu điểm của phương pháp PCA :
 Tìm được các đặc tính tiêu biểu của đối tượng cần nhận dạng mà không
cần phải xác định các thành phần và mối quan hệ giữa các thành phần đó.

 Thuật toán có thẻ thực hiện tốt với các ảnh có độ phân giải cao, do PCA sẽ
thu gọn ảnh thành một ảnh có kích thức nhỏ hơn.
 PCA có thể kết hợp với các phương pháp khác như mạng Noron, Suport
Vector Machine … để mang lại hiệu quả nhận dạng cao hơn.
• Nhược điểm của PCA:
 PCA phân loại theo phần phân bố lớn nhất của tập vector. Tuy nhiên chiều
phân bố lớn nhất không phải lúc nào cũng mang lại hiệu quả tốt nhất cho
bài toán nhận dạng. Đây là nhược điểm cơ bản của PCA.
 PCA rất nhạy với nhiễu .

2.1.3 Nội dung của thuật toán
Không gian mới tạo bởi PCA được cấu thành từ K vector đơn vị có chiều là N.
Mỗi vector được gọi là một Eigenface
Phép biến đổi :


A=

.

W=

.

Với K<
20


.

.

Theo công thức : W = T.A
Với T là ma trận chuyển đổi, T có kích thước KxN
Gọi M là số ảnh đầu vào, mỗi ảnh được chuyển thành vector N chiều. Ta có tập hợp
đầu vào X= {}()
Trung bình của các vector đầu vào:
=

(2.1)

Sai lệch so với tâm :
(2.2)
Gọi A=[] ta có ma trận tương quan của A là :
C = = A.


(2.3)

Gọi các giái trị riêng của C là sắp xếp theo thứ tự giảm dần, tương ứng với N vector
riêng . Các vector riêng này trực giao từng đôi một. Mỗi vector riêng được gọi là một
Eigenface. Taps hợp các vector ban đầu được biểu diễn trong không gian tạo bởi N
eigenface theo mô tả :
x = … =
Chọn lấy K vector riêng U tương ứng với K giá trị riêng lớn nhất, ta có :
x = … = với K<Vector các hệ số khai triển [,] được tính theo công thức:

21


.
.

=

.

=

.

Vấn đề cần giải quyết ở đây là ma trận tương quan C=A. có kích thức . Với N =
180x200 = 36000, khối lượng tính toán sẽ rất lớn. Do đó để tính được các eigenface mà
không cần tính cả ma trận C, người ta đưa ra phương pháp tính nhanh và dựa vào vevtor
riên g của ma trận L=.A có kích thước MxM với M là số ảnh đầu vào. Ta có thể chứng

minh như sau: goi , lần lượt là vector riêng và giá trị riêng của ma trận L :
=
Nhân cả hai vế với A ta có :
A. = .A
Ta thấy A. chính là vector riêng của C= A. ứng với giá trị riêng

2.2 Kỹ thuật nhận dạng mặt người dựa trên PCA

22


2.2.1 Trích chọn đặc trưng PCA và huấn luyện

2.2.1.1 Xác định khuôn mặt người

Bước 1:

Φ =Γ−Ψ

Bước 2:
Tính

Bước 3:
Tính

Bước 4:
Nếu ed < Td (1 ngưỡng nào đó chấp nhận được):
Tức ảnh cần xác định có khoảng cách “đủ gần” với không gian khuôn
mặt. Khi đó, ta kết luận đó chính là ảnh khuôn mặt người (chứ không
phải ảnh cảnh vật !!).

----------------------------------------Có 1 tài liệu (Slides của Pradeep Buddharaju) đề cập đến việc tính
ngưỡng như sau:
3 θc = ½ maxj,k {||pj-pk||}; j,k = 1,…,m
Tức là θc bằng ½ khoảng cách lớn nhất giữa 2 khuôn mặt bất kỳ.
Ngưỡng này sẽ được dùng thay cho cả Td và Tr

23


2.2.1.1 Đặc trưng PCA

Mục tiêu của phương pháp PCA là “giảm số chiều” của 1 tập vector
sao cho vẫn đảm bảo được “tối đa thông tin quan trọng nhất” . Phương pháp
PCA sẽ giữ lại K thuộc tính “mới” từ M các thuộc tính ban đầu (K2.2.1.2 Nhận các khuôn mặt từ cơ sở dữ liệu – tập luyện
Đầu tiên chúng ta sẽ đọc cơ sở dữ liệu và nhận vào các ảnh
luyện . Các ảnh luyện ở đây đều là ảnh mặt, điều kiện quan trọng là chúng có
mặt ở tâm ảnh và có cùng kích thước với nhau.
Giả sử có M ảnh, khi đó i=1..M.

Sau đó ta tương ứng mỗi ảnh với một vector
(ảnh N×N) → (vector ×1)
2.2.1.3 Tính toán các Eigenfaces
Bước 1:
Sử dụng các ảnh khuôn mặt I1, I2, … In (tập các khuôn mặt huấn luyện) với khuôn mặt
phải chính diện & tất cả ảnh phải cùng kích thước.

24



Bước 2:

Γi
Biểu diễn mọi ảnh Ii thành vector
Ví dụ: Để đơn giản ta giả sử chỉ có 4 ảnh trong tập huấn luyện (kích thước
3x3). Ta tính toán được:

1

2

3

4

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×