TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC
BÁO CÁO CUỐI KỲ MƠN HỌC
Mơn: Xử lý ảnh số
Đề tài: Bài tốn trích chọn đặc trưng ảnh dựa trên đường biên
động (active-contour)
Các giảng viên hướng dẫn:
TS. Vương Mai Phương
TS. Nguyễn Phương Thuỳ
Nhóm sinh viên thực hiện: Nhóm 2
Họ tên
MSSV
Phạm Đức Anh
20185321
Nguyễn Nam Đàn
20173490
Vũ Tiến Đạt
20173492
Phạm Thành Đạt
20140995
Nguyễn Việt Đức
20173500
Hà Nội − 2021
Báo cáo Xử lý ảnh - Học kỳ 20211
Mục lục
1 Tổng quan
1.1 Giới thiệu về đề tài . . . . . . . . . . . . . . . . . . . . .
1.2 Phạm vi nghiên cứu . . . . . . . . . . . . . . . . . . . .
1.3 Phương pháp nghiên cứu . . . . . . . . . . . . . . . . . .
4
4
4
5
2 Nội dung bài toán
2.1 Đặt vấn đề . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Phương pháp giải quyết bài toán . . . . . . . . . . . . .
5
5
5
3 Tiền xử lý ảnh
3.1 Một số phép biến đổi ảnh . . . . . . . . .
3.1.1 Biến đổi âm bản ảnh . . . . . . . .
3.1.2 Biến đổi log . . . . . . . . . . . . .
3.1.3 Biến đổi luỹ thừa . . . . . . . . . .
3.1.4 Biến đổi giãn độ tương phản . . . .
3.1.5 Intensity-level slicing . . . . . . . .
3.1.6 Biến đổi sigmoid . . . . . . . . . .
3.1.7 Cân bằng xám . . . . . . . . . . .
3.1.8 Lọc trung bình . . . . . . . . . . .
3.1.9 Lọc trung vị . . . . . . . . . . . . .
3.1.10 Lọc Gauss . . . . . . . . . . . . . .
3.2 Một số phép biến đổi hình thái . . . . . .
3.2.1 Bào mòn . . . . . . . . . . . . . . .
3.2.2 Giãn nở . . . . . . . . . . . . . . .
3.3 Áp dụng phép biến đổi vào tiền xử lý ảnh
3.3.1 Áp dụng đối với ảnh thiếu sáng . .
3.3.2 Áp dụng với ảnh nhiễu . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
4 Tổng quan về đường biến động
4.1 Đường biên động . . . . . . . . . . . . . . . . . . . . . .
4.2 Mơ hình rắn (Snake model) . . . . . . . . . . . . . . . .
4.3 Mơ hình dịng vectơ gradient (Gradient Vector Flow Model)
4.4 Mơ hình tập mức (Level-set Approach) . . . . . . . . . .
6
6
8
8
9
9
9
9
10
10
11
12
13
13
13
14
14
18
23
24
25
25
26
5 Trích chọn đặc trưng của ảnh dựa trên đường biến động 27
5.1 Mơ hình toán học của bài toán . . . . . . . . . . . . . . 27
5.2 Mơ hình rắn . . . . . . . . . . . . . . . . . . . . . . . . . 27
1
Báo cáo Xử lý ảnh - Học kỳ 20211
.
.
.
.
.
.
.
27
28
28
30
32
32
36
6 Ứng dụng
6.1 Cài đặt chưong trình . . . . . . . . . . . . . . . . . . . .
6.2 Kết quả chạy chương trình . . . . . . . . . . . . . . . . .
6.3 Ứng dụng thực tiễn của bài toán . . . . . . . . . . . . .
37
37
43
47
7 Kết luận
7.1 Kết quả đạt được . . . . . . . . . . . . . . . . . . . . . .
7.2 Đề xuất hướng phát triển . . . . . . . . . . . . . . . . .
49
49
49
Tài liệu tham khảo
51
5.3
5.2.1 Mơ hình tối ưu . . . . .
5.2.2 Nội lực . . . . . . . . . .
5.2.3 Ngoại lực . . . . . . . .
5.2.4 Q trình lặp . . . . . .
Mơ hình tập mức . . . . . . . .
5.3.1 Mơ hình tái tạo bề mặt .
5.3.2 Phương pháp giải số . .
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Báo cáo Xử lý ảnh - Học kỳ 20211
Bảng phân công nhiệm vụ
Phạm Đức Anh
Làm mục 3.1.1, 3.1.2, 3.1.3, 3.1.4, 3.1.5, 3.1.8, 3.1.9,
3.1.10, 3.2
Nguyễn Nam Đàn Làm mục 5.2.4
Vũ Tiến Đạt
Làm mục 1, 2, 3.1.6, 3.1.7, 4, 5.1, 5.2.1, 5.2.2, 5.3, 6, 7
Phạm Thành Đạt Làm mục 5.2.3
Nguyễn Việt Đức Làm mục 6.1, 6.2, 6.3
3
Báo cáo Xử lý ảnh - Học kỳ 20211
1
1.1
Tổng quan
Giới thiệu về đề tài
Ảnh kỹ thuật số là tập hơp gồm hữu hạn các phần tử, hay còn được biết
đến là các pixel, mỗi pixel biểu diễn một giá trị số đặc trưng cho mức
xám tại một toạ độ trên hệ truc x, y.
Xử lý ảnh số là ngành học sử dụng máy tính để xử lý các bức ảnh số
thơng qua các thuật tốn nào đó. Là một bộ phận của xử lý tín hiệu số,
xử lý ảnh số cho phép áp dụng rât nhiều thuật toán như xử lý nhiễu,
méo ảnh,... Ảnh số thường được biểu diễn dưới dạng từ 2 chiều trở lên,
vì vậy xử lý ảnh số được áp dụng trên các mo hình nhiều chiều. Xử lý
ảnh số được hình thành và phát triển thơng qua sự phát triển của máy
tính điện tử, các thuật toán toán rời rạc và yêu cầu ngày một tăng cao
về xử lý ảnh trong môi trường, nông nghiệp, quân đội, cơng nghiệp, y
tế,...
Trích chọn đặc trưng ảnh là một trong số các bài toán được đặt ra và
giải quyết trong xử lý ảnh số. Đầu tiên, ta cần phải hiểu trích chọn đặc
trưng là q trình làm giảm số chiều của dữ liệu mà ở đó, dữ liệu thơ
được chuyển thành các nhóm dữ liệu dễ xử lý hơn.
Đối với trích chọn đặc trưng ảnh, đầu vào là 1 ảnh số gọi là ảnh gốc
(hay còn gọi ảnh đầu vào, ảnh thô, ảnh chưa qua xử lý), thông qua một
số thuật toán sẽ thu được đầu ra là các đặc trưng, đối tượng mà có thể
được xử lý nhằm phục vụ mục đích khác mà vẫn giữ ngun thơng tin
dữ liệu ban đầu. Chi tiết về trich chọn đặc trưng ảnh số sẽ được đề cập
ở các phần sau.
Trong thực tiễn đời sống, xử lý ảnh số có thể được ứng dụng vào rất
nhiều lĩnh vực. Những ứng dụng nổi bật nhất có thể đề cập đến là phục
hồi, làm đẹp ảnh; phát hiện vật thể trong ảnh chụp x-quang trong y tế;
thám hiểm, do thám thông qua ảnh vệ tinh; thị giác máy; giao thông;...
1.2
Phạm vi nghiên cứu
Phạm vi nghiên cứu đề tài nằm trong giới hạn về các thuật toán xử
lý ảnh số cũng như kỹ thuật xử lý ảnh số bằng phần mềm MATLAB.
Trong đó, kỹ thuật được tập trung nghiên cứu là trích chọn đặc trưng
của ảnh sử dụng đường biên động.
4
Báo cáo Xử lý ảnh - Học kỳ 20211
1.3
Phương pháp nghiên cứu
Các phương pháp nghiên cứu:
• Nghiên cứu tài liệu
• Thu thập ảnh làm dữ liệu mẫu
• Lập trình, sử dụng các cơng cụ, thư viện trên MATLAB
• So sánh, đối chiếu, đánh giá kết quả và so sánh hiệu quả của các
thuật toán
2
2.1
Nội dung bài toán
Đặt vấn đề
Dữ liệu lớn (Big data) đang là một chủ để nhận được sự quan tâm rất lớn
trong những năm gần đây. Nguồn dữ liệu dường như bất tận là nguồn
tài nguyên về thông tin to lớn mà bất cứ tổ chức hay quốc gia nào đều
muốn sở hữu.
Trong đó, dữ liệu ảnh chiếm một phần khơng hề nhỏ. Theo thống kê
tính đến năm 2008, có 10 tỉ ảnh trên Facebook, 3 tỉ ảnh trên Flicker,
6,2 tỉ ảnh trên Photobucket. Tuy nhiên, cũng từ lượng rất lớn dữ liệu
dạng ảnh này mà ta cần phải giải quyết các bài toán xử lý chúng. Một
ví dụ thực tiễn là khi người dùng muốn tìm kiếm kết quả dựa trên một
bức ảnh, ta cần phải tìm được một thuật tốn để máy tính nhận ra đối
tượng xuất hiện trên ảnh là gì để đưa ra các gợi ý phù hợp. Hoặc cũng
có thể là với một lượng lớn ảnh, ta cần tìm ra một đối tượng cụ thể nào
đó có xuất hiện trên ảnh khơng và nếu có thì nằm ở đâu. Đây là các vấn
đề đặt ra để bài tốn trích chọn đặc trưng của ảnh giải quyết. Trong đề
tài này, chúng tơi trình bày về quá trình từ một ảnh thu được các đặc
trưng (tiền xử lý và trích chọn đặc trưng). Phương pháp được lựa chọn
là sử dụng đường biên động (active contour)
2.2
Phương pháp giải quyết bài toán
Để giải quyết bài toán trên, đề tài đề xuất giải quyết bài toán theo quy
trình sau:
5
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 1: Quy trình xử lý ảnh
Để giảm số chiều cho các bước về sau (qua đó làm giảm độ phức tạp tính
tốn và đơn giản hố cơng việc), ở bước đầu tiên, ảnh sẽ được chuyển
đổi thành ảnh HSV . HSV là hệ thống màu gồm 3 kênh đại diện cho
sắc, độ bão hồ và độ sáng của màu. Trong đó, giá trị kênh độ sáng (giá
trị/value) ở các pixel cho ta một ảnh xám mà vẫn giữ các hình dạng các
đối tượng trong ảnh. Ở các bước về sau, ta sẽ xử lý trên ảnh xám này.
Các bước tiền xử lý ảnh và trích chọn đặc trưng của ảnh sẽ được đi sâu
hơn ở các phần sau.
3
3.1
Tiền xử lý ảnh
Một số phép biến đổi ảnh
Trong thực tế, đầu vào của bài tồn xử lý ảnh khơng phải lúc nào cũng
là những ảnh có chất lượng tốt. Ảnh có thể bị mờ, thừa/thiếu sáng,
nhiễu, nh,... Một ví dụ điển hình là hiệ tượng nhiễu muối tiêu như ta
có thể thấy dưới đây:
6
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 2: Ví dụ về ảnh đầu vào có chất lượng khơng tốt
Để khắc phục tình trạng này, ảnh được đưa qua các bước tiền xử lý
nhằm cải thiện chất lượng đầu vào cho các bước xử lý sau này. Để tiền
xử lý, chúng tôi đề xuất sử dụng các phép biến đổi dựa trên miền khơng
gian. Các thuật tốn này dựa trên các phép biến đổi tốn học và gồm
hai nhóm chính:
• Biến đổi dựa trên tổng thể: Giá trị màu mới của pixel phụ thuộc
vào giá trị của tất cả các pixel trên ảnh
• Biến đổi dựa trên lân cận: Giá trị màu mới của pixel chỉ phụ thuộc
vào giá trị màu của một số điểm ở gần nó (từ đây về sau, chúng
ta sẽ dùng thuật ngữ "cửa sổ"
7
Báo cáo Xử lý ảnh - Học kỳ 20211
Sau đây, chúng tơi xin phép khái qt về 6 thuật tốn xử lý dựa vào
tổng thể và 3 thuật toán dựa vào lân cận
3.1.1
Biến đổi âm bản ảnh
Ảnh âm bản là ảnh ngược lại ảnh bình thường. Ảnh âm bản có mức xám
trong dải [0, L − 1] được biểu hiện bởi hàm biến đổi âm bản, hàm này
được biến đổi dưới dạng:
s=L−1−r
(1)
Hình 3: Biểu diễn hàm biến đổi âm bản
Việc lấy âm bản của bức ảnh sẽ cho ra một phiên bản ảnh âm bản tương
tự. Kiểu xử lý này đặc biệt thích hợp cho việc tăng cường các chi tiết
sáng hoặc xám mà được bao quanh bởi vùng tối của bức ảnh, nhất là
khi vùng tối trong bức ảnh chiếm chủ yếu.
3.1.2
Biến đổi log
Phép biến đổi log có cơng thức tổng quát như sau:
s = c.log(1 + r)
8
(2)
Báo cáo Xử lý ảnh - Học kỳ 20211
Trong đó c là hằng số và r ≥ 0. Đường cong log trong Hình 3 cho thấy
biến đổi này ánh xạ dải hẹp của những giá trị mức xám thấp trong hình
ảnh đầu vào thành dải rộng hơn ở đầu ra. Chúng ta có thể sử dụng loại
chuyển đổi này để mở rộng những giá trị của điểm tối trong bức ảnh
trong khi nén những giá trị ở mức cao hơn. Điều ngược lại cũng đúng
với hàm ngược của hàm log.
3.1.3
Biến đổi luỹ thừa
Phép biến đổi lũy thừa có cơng thức cơ bản là:
s = c.rγ
(3)
Trong đó c và γ là hằng số dương. Như trong trường hợp biến đổi logarit,
các đường cong quy luật lũy thừa với các giá trị y rời rạc chuyển đổi một
dải hẹp giá trị đầu vào sang dải rộng hơn. Và ngược lại cũng đúng với
các giá trị đầu vào cao hơn. Nhưng không giống như hàm logarit, ta có
thể thấy đây là một tập hợp các đường cong chuyển đổi được lược diễn
biến thiên. Những đường cong được tạo bảo giá trị y > 1 thì cũng được
tạo ra bởi chiều ngược lại với y < 1. Cuối cùng , với c = y = 1 thì cơng
thức được biểu diễn như một đường thẳng đồng nhất.
3.1.4
Biến đổi giãn độ tương phản
Các ảnh có độ tương phản thấp có thể do cường độ ánh sáng kém hoặc
do bộ cảm ứng không tốt. Ý tưởng giãn độ tương phản là gia tăng các
khoảng cấp xám trong ảnh.
3.1.5
Intensity-level slicing
Cắt mức cường độ có nghĩa là làm nổi bật một phạm vi cường độ cụ thể
trong một hình ảnh. Nói cách khác, ta phân đoạn các vùng mức xám
nhất định từ phần cịn lại của hình ảnh.
3.1.6
Biến đổi sigmoid
Sigmoid là một hàm phi tuyến với đầu vào là các số thực và cho kết quả
nằm trong khoảng [0,1] và được xem là xác xuất trong một số bài tốn.
Cơng thức của hàm Sigmoid và đạo hàm của nó được nêu ra dưới đây:
9
Báo cáo Xử lý ảnh - Học kỳ 20211
f (x) =
f ′ (x) =
3.1.7
1
1 + e−x
∂f (x)
= f (x) ∗ (1 − f (x))
∂x
Cân bằng xám
Histogram cho ta biết tần suất xuất hiện của mỗi giá trị xám trong ảnh.
f : D −→ N
k −→ f (k) = nk
(4)
f : D −→ [0, 1]
k −→ f (k) =
(5)
Công thức chuẩn hố:
nk
n
Tuy nhiên, trong thực tế, histogram của một ảnh khơng phải lúc nào
cũng cho kết quả "đẹp" (theo nghĩa là có giá trị trong khoảng [0,1], phân
phối gần đều). Nhằm thu được một lược đồ xám phần phối đều hơn, qua
đó nhìn rõ hơn một số vùng giá trị xám trên ảnh, ta tìm ánh xạ τ khơng
giảm, đơn điệu và có hàm mật độ xác suất của s gần đều:
τ : D −→ [0, L − 1]
r −→ s = τ (r) = (L − 1)
3.1.8
r
0
pr (w)dw
(6)
Lọc trung bình
Bộ lọc trung bình là thay thế mỗi giá trị điểm ảnh trong một hình ảnh
với giá trị trung bình của giá trị các điểm ảnh lân cận, trong đó có điểm
ảnh đó. Đây là một bộ lọc tuyến tính đơn giản với tác dụng làm mịn
ảnh, khử nhiễu,..
10
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 4: Ví dụ về bộ lọc trung bình
Phép lọc trung bình hiệu quả nhất trong việc khử nhiễu Gaussian nhưng
đổi lại là sự mất các chi tiết hình ảnh cao tần. Kích thước kernel lớn hơn
sẽ có hiệu quả lọc lơn hơn nhưng làm giảm chất lượng hình ảnh nên lọc
này không hiệu quả trong việc khử nhiễu muối tiêu (salt-pepper) . Một
biến thể phổ biến khác của bộ lọc này là tạo một ngưỡng và chỉ thay
thế các giá trị điểm ảnh hiện tại với giá trị trung bình của vùng lân cận
nếu độ lớn của giá trị trung bình nằm nằm dưới ngưỡng này.
3.1.9
Lọc trung vị
Bộ lọc thường được sử dụng trong xử lý ảnh. Lọc Median vượt qua
những hạn chế của bộ lọc Mean. Bộ lọc này thay thế điểm ảnh đích
bằng giá trị trung vị của các điểm ảnh lân cận và chính điểm ảnh đó.
Bộ lọc Median sẽ tìm giá trị trung vị trong tất cả các điểm anh và thay
vào điểm ảnh trung tâm. Các bộ lọc trung vị là cấp trên bộ lọc trung
bình ở chỗ nó giữ độ nét tần số cao trong khi vẫn loại bỏ nhiễu.
Phép lọc trung vị là một kỹ thuật lọc phi tuyến (non-linear), nó khá
11
Báo cáo Xử lý ảnh - Học kỳ 20211
là hiệu quả với hai loại nhiễu: nhiễu đốm (speckle) và nhiễu muối tiêu
(salt-pepper). Kĩ thuật là một bước rất phổ biến trong xử lý ảnh số.
Hình 5: Ví dụ về bộ lọc trung vị
3.1.10
Lọc Gauss
Bộ lọc Gauss được thực hiện bằng cách nhân chập ảnh đầu vào với một
ma trận lọc Gauss sau đó cộng chúng lại để tạo thành ảnh đầu ra.Ý
tưởng chung là giá trị mỗi điểm ảnh sẽ phụ thuộc nhiều vào các điểm
ảnh ở gần hơn là các điểm ảnh ở xa. Trọng số của sự phụ thuộc được
lấy theo hàm Gauss.
Ứng dụng của bộ lọc Gaussian là làm mịn ảnh, nó khác với bộ lọc trung
bình ở chổ là: thứ nhất,mức độ làm mịn được điều khiển bởi sự lựa chọn
các tiêu chuẩn thông số độ lệch, chứ khơng phải bởi giá trị tuyệt đối của
kích thước hạt nhân,thứ 2, hàm Gaussian có một thuộc tính khá đặc
12
Báo cáo Xử lý ảnh - Học kỳ 20211
biệt, đó là biến đổi Fourier của nó là một hàm Gaussian, điều đó rất
thuận tiện cho việc phân tích miền tần số của bộ lọc.
3.2
3.2.1
Một số phép biến đổi hình thái
Bào mịn
Phép tốn bào mịn là một trong hai hoạt động cơ bản (khác phép giãn
nở) trong hình thái học có ứng dụng trong việc giảm kích thước của đối
tượng, tách rời các đối tượng gần nhau, làm mảnh và tìm xương của đối
tượng.
Ta có cơng thức như sau:
A ⊖ B = {c|(B)c ⊆ A}
(7)
Trong đó:
• A: Ma trận điểm ảnh của ảnh nhị phân.
• B: Là phần tử cấu trúc
Phép bào mòn ảnh sẽ cho ra một tập điểm ảnh c thuộc A, nếu di chuyển
phần tử cấu trúc B theo c, thì B nằm trong đối tượng A.
3.2.2
Giãn nở
Phéo tốn này có tác dụng làm cho đối tượng ban đầu trong ảnh tăng
lên về kích thước.
Ta có cơng thức như sau:
A ⊕ B = {c|c = a + b, a ∈ A, b ∈ B}
(8)
Trong đó:
• A: Ma trận điểm ảnh của ảnh nhị phân.
• B: Là phần tử cấu trúc.
Phép giãn nở (Dilation) ảnh sẽ cho ra một tập điểm ảnh c thuộc D(i),
thấy rằng đây là một phép tổng giữa A và B.
13
Báo cáo Xử lý ảnh - Học kỳ 20211
3.3
3.3.1
Áp dụng phép biến đổi vào tiền xử lý ảnh
Áp dụng đối với ảnh thiếu sáng
Một số vấn đề thường gặp của ảnh là việc ảnh thường bị nhoè, mờ, loé
hoặc thiếu sáng, nhiễu. Với tình trạng ảnh bị thừa hay thiếu sáng, tất
cả các điểm ảnh trên ảnh đều bị ảnh hưởng. Chính vì vậy, ta sử dụng
các phép biến đổi dựa trên tổng thể cho các ảnh thuộc nhóm này.
Hình 6: Ví dụ về ảnh thiếu sáng
Đưa ảnh về kênh màu HSV và tách kênh value để xử lý:
14
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 7: Kết quả bước tách thành phần value
Áp dụng một số phép biến đổi dựa trên tổng thể:
15
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 8: Kết quả các phép biến đổi xử lý ảnh thiếu sáng
Bằng cảm quan, có thể thấy các phép biến đổi luỹ thừa và cân bằng
xám giúp ta nhìn rõ nhất phần giá trị xám có giá trị thấp chiếm đa số
trong ảnh. Để có đánh giá tốt hơn ta kết hợp các ảnh xám này với kênh
hue và saturation để có cái nhìn tổng qt nhất
16
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 9: Kết hợp lại với kênh màu
Phéo biến đổi cân bằng xám cho ra giá trị tốt nhất nhờ việc đưa tần
suất xuất hiện của các giá trị xám về phân phối gần đều. Những điểm
có giá trị thấp vốn chiếm đa số trong ảnh thiếu sáng được đấy lên có giá
trị sáng cao hơn.
17
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 10: Lược đồ xám trước và sau khi cân bằng
3.3.2
Áp dụng với ảnh nhiễu
Tuy nhiên không phải trong trường hợp nào, chúng ta cũng sử dụng các
phép biến đổi dựa vào tổng thể. Với các bị nhiễu, chỉ một số pixel có giá
trị xám khơng mong muốn. Vì vậy, ta áp dụng các phép biến đổi dưa
trên lân cận.
Ta sử dụng 1 ảnh bị nhiễu salt & pepper và nhiễu speckle:
18
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 11: Ví dụ về ảnh nhiễu
19
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 12: Kết quả bước tách thành phần value
20
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 13: Kết quả các phép biến đổi xử lý ảnh nhiễu
Thực hiện tương tự với ảnh thiếu sáng, nhưng với các thuật toán lọc
dựa trên lân cận với các cửa sổ khác nhau:
21
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 14: Kết hợp lại với kênh màu
22
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 15: So sánh kết quả trước và sau khi lọc nhiễu
4
Tổng quan về đường biến động
Như đã đề cập ở phần trên, mục tiêu nghiên cứu chính của đề tài này là
giải quyết bài tốn trích chọn đặc trưng của ảnh; từ một ảnh đầu vào ta
tìm ra được các đối tượng khác nhau trên ảnh. Để giải quyết bài toán
này, đề tài hướng tới việc sử dụng phương pháp đường biên động. Đường
biên động là một phương pháp được rộng rãi áp dụng để giải quyết bài
toàn phân vùng ảnh (image segmentation). Bài tốn phân vùng ảnh có
mục tiêu là phân chia ảnh thành các vùng thông qua việc phân cụm các
pixel (các pixel cùng cụm được gộp thành 1 vùng). Có thể thấy, việc
phân vùng được ảnh cũng tương đương với việc ta trích chọn ra được
những đặc trưng của khác nhau xuất hiện trên ảnh như ví dụ dưới đây.
23
Báo cáo Xử lý ảnh - Học kỳ 20211
Hình 16: Ví dụ về phân vùng ảnh
Trong ví dụ trên, ta đã phân được ảnh thành 4 phần khác nhau. Qua
đó, ta cũng thu được 4 đối tượng trên ảnh (con hổ, cỏ, cát, nước) và vị
trí của chúng.
4.1
Đường biên động
Đường biên là đường phân chia các khu vực, đối tượng khác nhau trên
ảnh với nhau. Đường biên là tập hợp gồm vơ hạn các điểm nhưng ta
có thể thu được đường biên thông qua việc nội suy một số hữu hạn các
điểm (thuật tốn nội suy có thể khác nhau tuỳ từng trường hợp).
Mục tiêu của việc sử dụng phương pháp đường biên động là tạo ra các
đường biên kín, qua đó tạo ra các vùng khép kín, tách biệt với nhau để
phân biệt đối tượng này với đối tượng khác hoặc đối tượng với nền.
Đường biên đông là phương pháp phân vùng ảnh thơng qua việc tối thiểu
hố hàm năng lượng (energy). Hàm năng lượng (sẽ được định nghĩa ở
các phần sau) là một hàm phụ thuộc vào hình dạng của đường cong.
Xuất phát từ một đường ghép trơn (spline) ban đầu, thông qua một số
bước lặp để hàm năng lượng giảm, đường cong ban đầu tiến dần đến
đường biên mà ta mong muốn. Trong suốt quá trình này, đường ghép
trơn chịu tác dụng của ngoại lực (tác động để khiến đường ghép trơn
tiến dần về hình dạng của đường biên vật) và nội lực (cản trở sự biến
dạng).
Có nhiều mơ hình khác nhau của phương pháp đường biên động. Phần
sau đây sẽ trình bày sơ lược về một số mơ hình như mơ hình rắn và mơ
hình dịng vectơ gradient.
24