Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
MỤC LỤC
MỤC LỤC 1
LỜI NÓI ĐẦU 3
CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI 4
CHƯƠNG II: NỘI DUNG ĐỀ TÀI 5
I.LÝ THUYẾT 5
I.1 KHÁI QUÁT VỀ PHÂN VÙNG ẢNH 5
I.1.1.Một số khái niệm: 5
I.1.2. Các hướng tiếp cận phân vùng ảnh 5
I.1.3. Các công đoạn chính của phân vùng ảnh: 5
I.1.4 Một số phương pháp phân vùng ảnh 5
I.2 MỘT SỐ THUỘC TÍNH CỦA ĐIỂM ẢNH VÀ VÙNG ẢNH 6
I.2.1 Một số thuộc tính của điểm ảnh 6
I.2.2. Một số thuộc tính của vùng ảnh 6
II.3 PHÂN VÙNG ẢNH DỰA TRÊN PHƯƠNG PHÁP PHÂN LỚP. .7
II.3.1. Khái quát về phương pháp phân lớp 7
II.3.2. Phân lớp các điểm ảnh trong không gian thuộc tính một chiều7
a, Xác định ngưỡng dựa trên biểu đồ Histogram 7
B, Xác định ngưỡng dựa trên thuật toán tam giác: 11
c, Xác định ngưỡng dựa trên thuật toán ISODATA 12
I.4. PHÂN VÙNG DỰA TRÊN PHƯƠNG PHÁP CẤU TRÚC 13
I.4.1. Giới thiệu phương pháp: 13
I.4.2 Thuật toán gán nhãn thành phần liên thông 13
I.4.3 Phân vùng ảnh theo miền đồng nhất 15
Thuật toán phân vùng dựa trên sự phân chia và kết hợp các miền
kề 17
a, Nguyên tắc thuật toán 17
b, Thuật toán phân chia các miền kề dựa trên cấu trúc cây tứ
phân 17
c, Thuật toán kết hợp các miền kề 21
I.5. Phân đoạn dựa theo kết cấu bề mặt(texture) 23
I.5.1. Tiếp cận thống kê 23
I.5.2. Cách tiếp cận cấu trúc 26
I.5.3. Phân đoạn theo tính kết cấu 26
I.6. PHÂN VÙNG DỰA THEO ĐƯỜNG BIÊN 27
I.6.1. Làm mảnh biên 27
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
I.6.2. Nhị phân hóa đường biên 28
I.6.3. Miêu tả đường biên 29
Mã hóa theo tọa độ Đềcác: 30
CHƯƠNG III: ĐÁNH GIÁ KẾT QUẢ NGHIÊN CỨU VÀ KẾT LUẬN 32
ĐÁNH GIÁ: 32
KẾT LUẬN: 32
TÀI LIỆU THAM KHẢO: 33
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
LỜI NÓI ĐẦU
Xử lý ảnh là một lĩnh vực đang được quan tâm và đã trở thành môn học
chuyên ngành của sinh viên hệ kỹ sư, hệ cử nhân ngành Công Nghệ Thông Tin
cũng như một sso ngành kỹ thuật khác trong các trường Đại học kỹ thuật.
Xử lý ảnh có liên quan đến nhiều ngành khác như: hệ thống thông tin, lý
thuyết thông tin, lý thuyết thống kê, trí tuệ nhân tạo, nhận dạng…
Xử lý ảnh cũng đã tạo ra được rất nhiều ứng dụng hữu ích trong thực tế
như: bài toán nhận dạng vân tay, chữ viết, giọng nói…
Qua thời gian 15 tuần học trên lớp và khoảng 45 ngày nghiên cứu đề tài,
chúng em đã tìm hiểu được một số nội dung cơ bản trong Môn học xử lý ảnh. Tuy
nhiên do kiến thức còn hạn hẹp, kết quả chúng em nghiên cứu còn nhiều thiếu sót,
kính mong nhận được sự góp ý, nhận xét của các thầy cô trong bộ môn.
Chúng em xin chân thành cảm ơn!
Nhóm sinh viên.
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
CHƯƠNG I: GIỚI THIỆU ĐỀ TÀI
“Nghiên cứu các vấn đề về phân vùng ảnh (Image Region) trong xử lý
ảnh số”
Phân vùng ảnh là một bước then chốt trong xử lý ảnh. Giai đoạn này nhằm
phân tích ảnh thành những thành phần có cùng tính chất dựa theo biên hay các
vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là mức xám,
cùng màu hay độ nhám…
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nó là một tập hợp
các điểm có cùng hoặc gần cùng một tính chất nào đấy: mức xám, mức màu, độ
nhám… Vùng ảnh là một trong hai thuộc tính quan trọng của ảnh. Nói đến vùng
ảnh là nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh (boundary) là
biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối
đồng đều hay tính kết cấu (texture) tương đồng.
Dựa vào đặc tính vật lý của vùng ảnh, người ta có nhiều kỹ thuật phân
vùng. Nếu phân vùng dựa trên các miền liên thông, ta gọi là kỹ thuật phân vùng
dựa theo miền đồng nhất hay miền kề. Nếu muốn phân vùng dựa vào biên gọi là
phân vùng biên. Ngoài ra, còn có kỹ thuật khác như phân vùng dựa vào biên độ,
phân vùng theo kết cấu.
Mục đích của phân tích ảnh là để có một miêu tả tổng hợp về nhiều phần tử
khác nhau cấu tạo nên ảnh thô (brut Image). Vì lượng thông tin chứa trong ảnh là
rất lớn, trong khi đó đa số ứng dụng chỉ cần một số thông tin đặc trưng nào đó, do
vậy cần có một quá trình để giảm lượng thông tin khổng lồ ấy. Quá trình này bao
gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
CHƯƠNG II: NỘI DUNG ĐỀ TÀI
I.LÝ THUYẾT
I.1 KHÁI QUÁT VỀ PHÂN VÙNG ẢNH
I.1.1.Một số khái niệm:
• Vùng ảnh (Region): là tập hợp các điểm ảnh có chung các thuộc tính thuộc
về
một đối tượng nào đó.
• Phân vùng ảnh (Image Segmentation): là quá trình phân hoạch tập các điểm
ảnh
của X thành các tập con R (hay một vùng ảnh) thỏa mãn các điều kiện sau:
+ R ≠ ∅
+ R ∩ R = ∅ (i ≠ j, ∀ i,j)
+ ∪ R = X, ∀ i
R : bao gồm các pixel có chung các thuộc tính nào đó.
I.1.2. Các hướng tiếp cận phân vùng ảnh
Có 2 hướng tiếp cận phân vùng ảnh sau:
Dựa trên tính đồng đều ( độ tương tự của mức xám và các thuộc tính
chung của các điểm ảnh trong mỗi vùng.
Phân vùng ảnh dựa trên sự biến thiên của hàm độ xám hoặc mức xám
( phân vùng dựa trên tách biên).
I.1.3. Các công đoạn chính của phân vùng ảnh:
Gồm 3 công đoạn sau:
+ Tiền xử lý ảnh ( nếu có )
+ Quá trình phân vùng ảnh ( thực hiện dựa trên các thuật toán )
+ Đánh nhãn cho các vùng ảnh được phân tách và điều chỉnh nếu cần
I.1.4 Một số phương pháp phân vùng ảnh
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích
ảnh thành các thành phần có cùng tính chất nào đấy dựa vào biên hay những vùng
liên thông. Tiêu chuẩn để xác định các vùng liên thông có thê là cùng mức xám,
cùng màu,…Vùng ảnh là một thuộc tính quan trọng của ảnh. Nói đến vùng ảnh là
nói đến kết cấu bề mặt. Đường bao quanh một vùng ảnh gọi là biên ảnh.
Một số phương pháp phân vùng chính như:
- Dựa trên sự phân lớp
- Dựa trên phương pháp cấu trúc
- Dựa trên việc biểu diễn và xử lý đa phân giải
- Phân vùng ảnh dựa trên phương pháp phân tích kết cấu
I.2 MỘT SỐ THUỘC TÍNH CỦA ĐIỂM ẢNH VÀ VÙNG ẢNH
I.2.1 Một số thuộc tính của điểm ảnh
- Giả sử có một điểm ảnh X = { P } , trong đó P là pixel thứ i ( i = 1,…, M*N)
Có 2 loại ảnh sau:
+ Ảnh đơn màu : P được biểu diễn bằng giá trị mức xám ( độ xám ). Kí hiệu
A(P) hoặc X(P).
+ Ảnh đa màu ( đa phổ ) : mỗi pixel được biểu diễn bởi một vecto màu mà ta
gọi là vecto thuộc tính.
P =
- Độ tương phản giữa hai điểm ảnh
( S, S ) = | A(S) – A(S) | / ( L-1)
Trong đó L : giá trị mức xám lớn nhất của ảnh
I.2.2. Một số thuộc tính của vùng ảnh
- Độ đồng đều mức xám của một vùng ảnh R :
E(R) = ( A(P) – m )
Trong đó : card(R) là số phần tử của vùng R ( lực lượng của vùng R )
: A(P) là giá trị mức xám của một điểm ảnh
: m là giá trị trung bình được tính bằng công thức sau
m = A(P)
- Hàm vị từ của R ( Pred (R) ) : để đo độ đồng đều của mức xám, được định
nghĩa như sau:
Pred(R) =
Trong đó: θ là ngưỡng tự chọn
: nếu Pred(R) = 1 thì vùng R là vùng đồng đều
Pred(R) = 0 thì vùng R là không đồng đều
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
- Thuộc tính tần số, thuộc tính thống kê, thuộc tính cấu trúc
II.3 PHÂN VÙNG ẢNH DỰA TRÊN PHƯƠNG PHÁP PHÂN LỚP
II.3.1. Khái quát về phương pháp phân lớp
- Phương pháp phân lớp là việc phân các phần tử có chung một số thuộc tính
nào đó về các lớp theo các tiêu chuẩn về thuộc tính.
- Các phương pháp phân lớp: có hai phương pháp sau:
+ Phân lớp dựa trên các điểm ảnh trong không gian thuộc tính
+ Phân lớp dựa trên tiêu chuẩn phân lớp ( dựa trên khoảng cách nhỏ nhất
giữa các vecto thuộc tính ).
Phương pháp phân lớp các điểm ảnh trong không gian thuộc tính một chiều dựa
trên các thuộc tính biên độ
Có 2 phương pháp trong không gian thuộc tính một chiều : dựa vào giải thuật
học ISODATA và thuật toán phân chia, kết hợp miền kề.
II.3.2. Phân lớp các điểm ảnh trong không gian thuộc tính một chiều
- Khái niêm: Giả sử giá trị mức xám của điểm ảnh P là A(P). Có phương pháp
đê phân lớp các pixel như sau: điểm P ∈ C nếu T ≤A(P) < T
Trong đó T , T là giá trị ngưỡng dưới và ngưỡng trên của lớp C
Vấn đề : xác định các ngưỡng T , T giữa các lớp và kết quả của quá trình
phân lớp là mỗi lớp C sẽ cho ta một vùng anh R tương ứng.
Có 2 phương pháp để xác định ngưỡng T , T
+ Xác định ngưỡng dựa trên biểu đồ Histogram (nếu có thể )
Chọn ngưỡng dựa trên biểu đồ Histogram
+ Phương pháp xác định ngưỡng tự động dựa trên quá trình học theo thuật
toán ISODATA
Sau đây, chúng ta sẽ lần lượt tìm hiểu về tường phương pháp xác định ngưỡng ở
trên:
a, Xác định ngưỡng dựa trên biểu đồ Histogram
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Việc tìm ngưỡng biên độ rất hữu ích khi các đặc điểm của biên độ đủ để mô
tả đối tượng. Giá trị của biên độ là tiêu chuẩn đưa ra một khoảng đại diện cho các
đặc trưng riêng biệt của đối tượng. Kỹ thuật xác định ngưỡng rất hữu ích trong
việc phân vùng ảnh nhị phân như là các tài liệu in, các dòng vẽ và đồ họa, ảnh
màu, ảnh tia X…
Việc chọn ngưỡng là một bước rất quan trọng trong phương pháp này. Các
bước chọn ngưỡng như sau:
1. Xem xét Histogram của ảnh được để xác định các đỉnh và các khe. Nếu ảnh
có dạng rắn lượn (nhiều đỉnh và khe), thì các khe có thể được sử dụng để
chọn ngưỡng.
2. Chọn ngưỡng t sao cho xác định được số ŋ của toàn bộ mẫu < t
3. Điều chỉnh ngưỡng dựa trên xem xét lược đồ xám của các điểm lân cận
4. Chọn ngưỡng bởi việc lấy mẫu histogrant chỉ của những điểm mà thỏa mãn
tiêu chí để chọn. Ví dụ như, trong các ảnh có độ tương phản thấp,
histogram cùa các pixel sẽ có độ lớn Laplacian g(m,n) lớn hơn giá trị t định
trước (sao cho từ 5% đến 10% số điểm ảnh với gradient lớn nhất sẽ coi như
biên) sẽ cho phép xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh gốc.
5. Khi có một mô hình phân lớp xác suất, việc xác định ngưỡng dựa vào tiêu
chuẩn nhằm cực tiểu của sai số hoặc một số tính chất theo định luật Bayes
Ví dụ:
Chúng ta phân vùng ảnh tượng đài Washington trên hình 9.50.
Trước tiên, cường độ thấp là ngưỡng để tách các khu vực rất tối (các cây ở
trong ảnh) để loại cây ra khỏi ảnh.
Sau đó, chúng ta tìm một hình chữ nhật bao quanh tượng đài bởi việc chọn
ngưỡng các đường ngang và dọc được ký hiệu dưới dạng:
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Hình 1
h(n) = u(m,n) / 1
v(n) = u(m,n) / 1
với h(n): hình chiếu bằng
v(n): hình chiếu đứng
Đường viền sau bao quanh đối tượng nằm trong hình chữ nhật cho ta các đối
tượng đã được phân vùng.
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Quá trình nhị phân hóa cũng chính là việc phân theo ngưỡng, tức là:
Out(x,y) = 1 với In(x,y) >T
= 0 với In(x,y) <T
Với T là ngưỡng cần xác định
Trong một số trường hợp, ta cần biến đổi lược đồ xám theo công thức:
H(i) = t(e(k,1)δ (f(k,1) – i
Với e(k,1) là ảnh đầu ra của việc phát hiện biên
δ (i) là hàm Delta
t(e(k,1) tính bởi: t(e(k,1)) =
Để hiểu rõ hơn về nguyên tắc phân vùng dựa vào ngưỡng biên độ ta xét thí dụ sau:
Hình2 Lược đồ hình rắn lượn và cách chọn ngưỡng
Giả sử ảnh có lược đồ xám như hình trên ta chọn các ngưỡng như hình vẽ:
T = L, T = L. Ta có 5 ngưỡng và phân vùng thành 4 vùng, ký hiệu là C là vùng
thứ k của ảnh, k=1, 2, 3, 4. Cách phân vùng theo nguyên tắc:
P ∈ C nếu T <= A(P ) < T , k =1, 2, 3, 4
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Sau khi phân xong, nếu ảnh rõ nét thì việc phân vùng coi như kết thúc.
Trường hợp ngược lại cần điều chỉnh ngưỡng. Thuật toán ISODATA cho phép
điều chỉnh ngưỡng theo từng bước cho đến khi ta có một phân vùng như ý.
B, Xác định ngưỡng dựa trên thuật toán tam giác:
Thuật toán này do Zack đưa ra và được minh họa trong hình dưới.
Trong hình này, chúng ta có thê quan sát thấy một đường thẳng đã được xây
dựng bằng cách nối từ giá trị lớn nhất của lược đồ tại độ sáng b đến giá trị nhỏ nhất
của lược đồ sáng b . Với mỗi độ sáng b trong khoảng [ b , b ], chúng ta đi tính
khoảng cách d từ giá trị lược đồ tại b là h[b] đến đường thẳng đã có. Giá trị b ứng
với khoảng cách lớn nhất sẽ được chọn làm giá trị ngưỡng θ .
Kỹ thuật lấy ngưỡng không nhất thiết phải được áp dụng cho toàn bộ ảnh, mà có
thể áp dụng cho từng vùng ảnh một.Các giá trị ngưỡng được tính riêng biệt cho từng
vùng một và sau đó được kết hợp lại thông qua phép nội suy để hình thành nên một
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
mặt ngưỡng cho toàn bộ ảnh. Trong thuật toán mới này, kích thước của các vùng cần
được chọn một cách thích hợp sao cho có một lượng đáng kể các điểm ảnh ở trong
một vùng, nhằm phục vụ cho việc tính lược đồ và xác định ngưỡng tương ứng. Tính
hữu ích của thuật toán này, cũng như nhiều thuật toán khác, sẽ phụ thuộc vào từng
ứng dụng cụ thể.
c, Xác định ngưỡng dựa trên thuật toán ISODATA
- Bước khởi đầu: (t=0)
+ dự đoán được số vùng của ảnh: N
+ Xác định được giá trị bắt đầu của ngưỡng của lớp theo cách sau:
Chia [L , L] thành N phần bằng nhau.
L: Giá trị nhỏ nhất của mức xám của ảnh ban đầu
L: Giá trị lớn nhất của mức xám của ảnh ban đầu
Giả sử ta có Nc =4:
T (0) = L ; T (0)= L
T (0) = T (0) + ( L - L)/ N
T (0) = T (0) + ( L - L)/ N
T (0) = T (0) + ( L - L)/ N
- Các bước lặp:
+ Thực hiện phân lớp theo các T (t-1) ; j = [0, N ]
điểm ảnh P ∈ C nếu T ≤ A(P) < T
trong đó ta lặp với mọi lớp C thuộc khoảng [0, N ]
+ Tính giá trị trung bình của các điểm ảnh của các lớp ở bước lặp t:
m (t)
+ tính giá trị ngưỡng ở bước lặp t: T (t) theo công thức:
T (t) =
Nếu tồn tại T (t) = T (t-1) hoặc m(t) = m(t-1) thì thuật toán dừng lại và sang bước
cuối cùng, ngược lại thì sang bước tiếp theo.
+ Từ các bước trên ta tìm được các ngưỡng T là hằng số nên thuật toán hội
tụ. Do đó ta thực hiện các công việc sau:
• phân các điểm ảnh theo các ngưỡng T đã tìm được
• Đánh nhãn các vùng ảnh R bằng thuộc tính chung và hiển thị các vùng
(phân tách)
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
• Ta hiệu chỉnh các vùng (số vùng theo kết quả hiển thị các vùng N có
thể tăng, giảm: Nếu N thay đổi thì ta phải dự đoán lại số vùng và thực
hiện lại từ đầu.
I.4. PHÂN VÙNG DỰA TRÊN PHƯƠNG PHÁP CẤU TRÚC
I.4.1. Giới thiệu phương pháp:
Bao gồm các phương pháp sau:
- Độ đồng đều thuộc tính của các điểm ảnh
- Tính liên thông (cấu trúc vị trí) của các điểm ảnh trong một vùng.
- Bản chất: thực hiên phân vùng dựa trên cấu trúc đồ thị để giải quyết tính
liên thông.
I.4.2 Thuật toán gán nhãn thành phần liên thông
Một phương pháp đơn giản và hiệu quả của việc phân vùng ảnh nhị phân là
việc kiểm tra sự kết nối của các điểm ảnh với các điểm lân cận và gán nhãn cho
các kết nối đã được thiết lập. Hai thuật toán thực tế là như sau:
Gán nhãn các điểm ảnh: giả sử có một ảnh nhị phân được scan từ trái
sang phải và từ dưới lên trên. Điểm ảnh hiện tại là X, được gán nhãn nhận 1 trong
2 giá trị: 1 đối tượng (các bit 1) hay một hố (các bit 0) bởi việc kiểm tra sự kết nối
của nó với các điểm lân cận A, B, C và D. Ví dụ như: nếu X=1, thì nó được ấn
định cho một (hoặc một số) đối tượng mà nó kết nối. Nếu có hai hay nhiều đối
tượng được kiểm tra, thì các đối tượng này được biểu thị cho các các vùng tương
đương và được kết hợp lại. Một đối tượng mới lại được ấn định khi có một sự
chuyển từ các bit 0 sang một bit 1 riêng rẽ. Khi mà một điểm ảnh được gán nhãn,
các đặc điểm của đối tượng được cập nhật. Ở cuối quá trình scan, các đặc điểm
như trọng tâm, diện tích, chu vi được lưu lại cho mỗi vùng của các bit 1 được kết
nối.
Phân tích các kết nối chạy dài (Run-length connectivity analysis.)
Một phương pháp phụ của việc phân vùng ảnh nhị phân là phân tích các kết nối
chạy dài sau khi quét các dòng. Để minh họa cho ý tưởng này, chúng ta theo dõi
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
hình 9.52, nơi mà các điểm đen hay trắng chạy qua được biểu thị bởi a, b, c… Một
bảng phân vùng được tạo ra, nơi mà biến chạy a của dòng đầu tiên được đưa vào
cột đầu tiên. Đối tượng của biến chạy đầu tiên a được đặt tên là A. Biến chạy đầu
tiên của dòng tiếp theo, b, có màu giống với a và gối lên a. Do đó b thuộc về đối
tượng A và được đặt dưới a trong cột đầu tiên.
Vì c là của các mầu khác nhau, nó được đặt trong một cột mới cho một đối
tượng có nhãn là B. dòng chạy d là các hoạt động trong cùng mầu sắc như là a và
gối lên a. Khi cả b và d cùng gối lên a, sự phân kỳ được gọi là đã xẩy ra và một cột
mới của đối tượng A được tạo ra, nơi mà d chiếm chỗ. Một cờ phân kỳ(sai số) ID1
được đặt trong cột này để cho biết rằng đối tượng b đã gây ra sai số. Hơn nữa cờ
ID2 của B được đặt thành A để chỉ rằng B đã gây ra sai số trong A. Tương tự như
vậy, sự hội tụ xảy ra khi hai đối tượng hay nhiều hơn các dòng chạy các bit 0 hoặc
hoặc các bit 1 trong một dòng được đưa ra được gối lên 1 dòng có màu giống với
màu của dòng trước đó. Như vậy, hội tụ xẩy ra trong việc chạy u, cái mà đặt cờ
hội tụ IC1 vào C trong cột 4 đặt cờ IC2 vào B trong cột 6. Tương tự như vậy w đặt
cờ hội tụ IC2 đến A trong cột 2 và cột 5 là nhãn thuộc đối tượng A.
Theo cách này, tất cả các đối tượng với đường bao khép kín được phân
vùng trong một single pass. Bảng phân vùng đưa ra dữ liệu liên quan đên từng đối
tượng. Cờ hội tụ và phân kỳ cũng cho ta biết cấu trúc thứ bậc của đối tượng. Vì B
hội tụ cũng như phân kỳ ở A và C có mối quan hệ tương tự với B. Đối tượng A, B,
và C được phân cấp thành 1, 2, và 3 tương ứng.
Ví dụ:
Một tầm nhìn hệ thống dựa trên việc phân tích các kết nối chạy dài được
đưa ra trong hình. Đối tượng đầu vào là các ảnh và các dữ liệu số hóa để đưa ra
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
một ảnh nhị phân. Hình 9.53 đại diên cho dữ liệu chạy dài của chiếc khóa, sự phân
vùng của nó thành mặt nghiêng ngoài cùng và 3 lỗ.
Hình 9.53.
Với mỗi đối tượng, các tính năng như số lượng lỗ, diện tích lỗ, giới hạn
hình chữ nhật, trung tâm của khối, định hướng, chiều dài trục lớn và trục nhỏ của
hình elip là được tính toán. Một hệ thống được đào tạo với các tính năng như vậy,
sau đó có thể xác định đưa ra từ một đối tượng đào tạo từ vốn từ của đối tượng.
I.4.3 Phân vùng ảnh theo miền đồng nhất
Kĩ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan
trọng nào đó của miền. Việc lựa chọn các tính chất của miền sẽ xác định tiêu
chuẩn phân vùng. Ở đây cũng cần phải xác định rõ tính đồng nhất của một miền
của ảnh vì đó là điểm chủ yếu xác định tính hiệu quả của việc phân vùng. Các tiêu
chuẩn hay được dùng là sự thuần nhất về mức xám, màu sắc đối với ảnh màu, kết
cấu sợi và chuyển động.
Thí dụ, với ảnh hàng không, việc phân vùng theo màu cho phép phân biệt
thảm thực vật: Cánh đồng màu xanh hay vàng, rừng xanh thẫm, đường màu xám,
mái nhà màu đỏ, v v
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Đối với ảnh chuyển động, người ta tiến hành trừ 2 ảnh quan sát được tại hai
thời điểm khác nhau. Trong trường hợp này, phần ảnh không thay đổi sẽ nhận giá
trị không, những phần thay đổi sẽ nhận giá trị dương hay âm tương ứng với thay
đổi hay dịch chuyển. Như vậy việc trừ ảnh thực ra là một xấp xi của đạo hàm theo
thời gian của ảnh. Thực vậy, giả sử I(t) và I(t+ r) là 2 ảnh quan sát ở thời điểm t và
t+r. Nếu thời gian quan sát r là nhỏ, ta sẽ nhận được xấp xỉ của đạo hàm một cách
trực tiếp:
=
Với cánh tính này, ta có thể biết được vận tốc dịch chuyển của ảnh.
Cũng nhờ kỹ thuật trừ ảnh ta có thể xác định sự xuất hiện của những đối
tượng mới ( tín hiệu dương ) hay sự biến mất của các đối tượng trong ảnh trước
( tín hiệu âm ).
Tính kết cấu ( Texture ) là đặc tính rất quan trong trong phân vùng ảnh. Nhờ
nó, ta có thể phân biệt thảm cỏ với một mặt nhuộm màu lá cây. Tính kết cấu đặc
trưng cho kiểu dạng xuất hiện lặp trên bề mặt nào đó cảu đối tượng. Có 2 kiểu lặp:
lặp có tính chu kỳ và lặp ngẫu nhiên. Lặp ngẫu nhiên thường gặp trong tự nhiên
như cát, thảm cỏ…, còn lặp có tính chu kỳ là lặp nhân tạo. Thí dụ như ảnh tạo bởi
kỹ thuật phân ngưỡng bằng ma trận Dithering trong chương 2 cho ảnh có kết cấu
sợi.
Người ta có thể dùng logic vị từ để làm tiêu chuẩn đánh giá việc phân vùng
ảnh. Giả sử ảnh X phải phân thành n vùng khác nhau, kí hiệu: Z , Z ,…,Z và logic
vị từ có dạng P(Z).
Việc phân vùng ảnh như vậy phải thỏa mãn các tính chất sau:
X= Z với i = 1, 2,…,n
Z ∩ Z = ∅
P( Z ) = true với i=1,2,…,n
Và P( Z ∪ Z ) = false
Kết quả của việc phân vùng ảnh phụ thuộc vào dạng của vị từ P và các đặc
tính biểu diễn bởi vecto đặc tính. Thường vị từ P có dạng P(Z,X,t) với X là véctơ
đặc tính; t là ngưỡng. Trường hợp đơn giản nhất, vecto đặc tính chỉ chứa giá trị
mức xám I(k,l) của ảnh và ngưỡng chỉ đơn thuần là giá trị T
P(Z) : I(k,l)<T
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Với ảnh màu, vecto đặc tính X có thể là thành phần 3 màu R,G,B và I
(k.l), I (k,l), I(k,l) là các thành phần tương ứng. Lúc đó luật phân ngưỡng có dạng:
P(Z,X,t): I (k,l) < T và I(k,l) < T và I(k,l) < T
Có 3 cách tiếp cận chủ yếu trong phân vùng ảnh theo miền đồng nhất và độc
lập với tiêu chuẩn chọn lựa tính đồng nhất:
• Phương pháp phân tách – cây tứ phân ( split – quad trees ).
• Phương pháp hợp ( merge).
• Phương pháp tách - hợp (split – merge).
Mức độ hiệu quả của các phương pháp là phụ thuộc vào việc chọn tiêu chuẩn
đánh giá độ thuần nhất. Trên thực tế người ta hay sử dụng trung bình số học m
và độ lệch chuẩn σ cho vùng Z có n điểm:
m = I(k,l)
σ =
với n là số điểm của vùng i.
Hai vùng Z và Z có thể hợp nhất nếu: | m - m | < kσ , vùng Z được coi là
thuần nhất nếu σ < T ( T là ngưỡng ).
Thuật toán phân vùng dựa trên sự phân chia và kết hợp các miền kề
a, Nguyên tắc thuật toán
Quá trình phân vùng ảnh gômg 2 giai đoạn liên tiếp nhau:
+ Giai đoan 1: chia ảnh thành các miền kề dựa trên cấu trúc cây tứ phân cho
đến khi đạt được độ đồng đều gọi là thuật toán phân chia lọc.
+ Giai đoạn 2: giai đoạn kết hợp, ta thực hiện kết hợp các miền kề nhau dựa
trên đồ thị các miền kề và chỉ tiêu về sai số để tạo thành vùng ảnh (thuật toán kết
hợp lặp).
b, Thuật toán phân chia các miền kề dựa trên cấu trúc cây tứ phân
Chỉ tiêu:
Để tìm các miền ảnh có độ đồng đều, ta thực hiện phân chia liên tiếp cho
đến khi tất cả các miền R có hàm Pred(R) = 1,
Ngược lại nếu tồn tại một vùng R nào đó có Pred(R) = 0 (chưa đồng đều)thì
tiếp tục phân chia.
Nguyên tắc phân chia:
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Về nguyên tắc, phương pháp này kiểm tra tính hợp thức của tiêu chuẩn một
cách tổng thể trên miền lớn của ảnh. Nếu tiêu chuẩn được thỏa, việc phân đoạn coi
như kết thúc.
Trong trường hợp ngươc lại, nếu 1 vùng ảnh R nào có Pred(R )=0, ta chia
miền đang xét thành 4 miền nhỏ hơn. Với mỗi nhỏ, ta áp dụng một cách đệ quy
phương pháp trên cho đến khi tất cả các miền đều thỏa, tức là Pred(R )= 1.
Thuật toán này tạo nên một cây mà mỗi nút cha có 4 nút con ở mọi mức trừ
mức ngoài cùng. Vì thế cây này có tên là cây tứ phân. Cây này cho ta hình ảnh rõ
nét về cấu trúc phân cấp của các vùng tương ứng với tiêu chuẩn.
Một vùng thỏa chuẩn sẽ tạo lên một nút lá, nếu không nó sẽ tạo lên một nút
trong và có 4 nút con tương ứng với việc chia làm 4 vùng. Ta cứ tiếp tục như vậy
cho đến khi phân xong. Các nút của cây biểu diễn số vùng đã phân.
Tiêu chuẩn phân vùng ở đây là màu sắc. Nếu mọi điểm của vùng đều là màu
trắng thì sẽ tạo lên nút lá trắng và tương tự như vậy với nút lá đen. Nút màu ghi
vùng không thuần nhất và phải tiếp tục chia.
Nội dung chi tiết của giải thuật phân chia dựa trên cây tứ phân:
+ Khởi đầu: Chuẩn bị cho quá trình lặp
Điều kiện: giả sử ta có ảnh ban đầu: kích thước vuông, N. N = e . 2 và ảnh
đầu vào chưa phân vùng R có Pred(R )=0 chưa đồng đều.
tính E(R ) = [ A(P ) – m(R)]
chọn ngưỡng phân chia θ < E (R) nhưng θ không khác quá xa
so với R
+ Tính Pred (R ) = 1 nếu E (R) ≤ θ
= 0 nếu E (R) > θ
Ví dụ:
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 2
1 1 1 1 1 2 2 2
1 1 1 1 2 2 2 2
1 1 1 1 1 2 2 2
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
1 1 1 1 1 2 2 2
2 2 2 2 2 2 2 2
2 2 2 2 2 2 2 2
m (R ) = A(P ) ≈ 1,5
E( R ) = [ A(P ) – m (R )] với i = 1
= ( (1 – 1,5) + (2 – 1.5) ) = 0.25
Chọn θ < E(R ) => θ = 0.2
Tính Pred (R ) = 0 =>
Các bước lặp t = 1, 2, … chia ảnh thành 4 phần bằng nhau dựa trên cấu trúc
cây tứ phân và tính hàm vị từ Pred cho 4 miền vừa chia của R
Quá trình tính toán:
R
E (R), θ = 0.2
Pred (R)
R 0 < 0.2 1
R 0,25> 0,2 0
R 0,25>0,2 0
R 0,13>0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
R 0< 0,2 1
Khi tất cả các Pred = 1 thì dừng chia chuyển sang bước cuối: => Cây tứ phân
R
R R R R
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
R R R R R R R R
+ Biểu diễn ảnh sau khi8 chia thông qua giá trị trung bình của từng miền đã chia
trước tiên phải tính được giá trị Trung Bình của từng miền đã chia:
m = 1,0
m = 1,0 m = 1,3
m = 1,8 m = 2,0
m = 1,0 m = 1,0
m = 1,9
m = 2,0 m = 2,0
+ Tính giá trị sai số bình phương của ảnh sau quá trình chia theo công thức sau:
E (L) = ( A(P ) –m )
L= số miền vừa phân chia
Sai số của quá trình phân chia được chọn làm cơ sở để chọn ngưỡng
trong giai đoạn kết hợp các miền kề tiếp theo ( θ kết hợp)
Nguyên tắc chọn θ kết hợp : θ > E (L) nhưng không khác quá xa
E (L)
=>Áp dụng vào ví dụ trên:
E (L) = [3.(1-1,3) + (2- 1,3) + (1 – 1,8) + 3(2- 1,8) + 2(1-1,9) +
+ 14(2- 1,9) ]/10
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
E (L) = 0,328
chọn θ= 0,4
c, Thuật toán kết hợp các miền kề
Nguyên tắc: dựa trên khái niệm đồ thị các đỉnh kề G(V, E) trong đó:
V: tập các nút tương ứng với các đỉnh kề
E: tập các cung
Hai vùng R, R được nối với nhau bởi 1 cung trong đó mang giá trị độ đo sự không
đồng đều giữa 2 miền.
E(R, R ) = ( A(P) – m (R∪R))
Trong đó: m (R∪R): giá trị trung bình các điểm ảnh thuộc miền (R∪R)
Áp dụng vào ví dụ trên:
E ( R, R )
m ( R, R ) = 1, 5
*) Chỉ tiêu kết hợp: 2 miền kề R, R sẽ được kết hợp thành miền R nếu giá trị
cung của nó nhỏ nhất tức là E (R, R ) min
Quá trình kết hợp được dựa trên sự kiểm tra về sai số bình phương của ảnh E(L)
Nội dung chi tiết của giải thuật kết hợp các miền kề:
• Bước 1: Xác định được đồ thị các miền kề của ảnh sau khi chia G(V, E) và
ngưỡng θ (đã chọn)
VD: trên đồ thị có các miền kề sau:
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
• Bước 2: kết hợp các miền kề R, R tương ứng với các cung có giá trị nhỏ
nhất sau mỗi lần kết hợp, ta phải vẽ lại đồ thị các miền kề G(V,E) và tính
lại sai số E (L)
• Bước 3: hiển thị kết quả phân vùng dựa trên đồ thị các miền kề sau khi lọc
tách các vùng và hiệu chỉnh nếu cần.
Trong ví dụ trên, sau khi kết hợp các miền kề đồ thị gồm 2 nút:
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Lưu ý: ta phải chọn θ sao cho ảnh được phân vùng chính xác không phải điều
chỉnh θ . Trong trường hợp nếu phải điều chỉnh thì phải thực hiện lại thuật toán
kết hợp các miền kề.
I.5. Phân đoạn dựa theo kết cấu bề mặt(texture)
Như đã giới thiệu, kết cấu quan sát kết cấu quan sát thấy trong các mẫu trên
bề mặt các đối tượng như gỗ, hạt cát, quần áo, v.v. Kết cấu là thuật ngữ phản ánh
sự lập lại của các phần tử sợi(texel) cơ bản. Sự lặp lại này có thể ngẫu nhiên hay
có tính chu kỳ hoặc gần như chu kỳ. Một texel chứa rất nhiều điểm ảnh. Trong
phân tích ảnh, kết cấu được phân làm 2 loại chính: loại thống kê và loại cấu trúc.
I.5.1. Tiếp cận thống kê
Tính kết cấu ngẫu nhiên rất phù hợp với các đặc trưng thống kê. Vì vậy,
người ta có thể dùng các đặc trưng ngẫu nhiên để đo nó như: Hàm tự tương
quan(AutoCorrelation Function-ACF), các biến đổi mật độ gờ, ma trận tương
tranh, v.v.
Theo cách tiếp cận bằng hàm tự tương quan, độ thô của kết cấu sợi tỉ lệ với
độ rộng của ACF, được biểu diễn bởi khoảng cách x , y :
sao cho ( x , 0) = r(0, y ) = 1.
Người ta cũng dùng cách đo nhánh của ACF nhờ hàm khởi tạo moment:
M(k,l) = (m- µ) (n- µ)r(m,n)
Với : µ= mr(m,n) và
µ= nr(m,n)
Các đặc trưng của kết cấu sợi như độ thô, độ mịn hay hướng có thể ước
lượng nhờ các biến đổi ảnh bằng kỹ thuật lọc tuyến tính (đã nêu trong chương 4).
Một mô hình đơn giản trong trường ngẫu nhiên cho việc phân tích tính kết cấu
được mô tả trong hình 6.16.
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
Hình 6.16. Phân tích kết cấu sợi bằng dải tương quan.
Trong mô hình này, trường kết cấu sợi trước tiên được giải chập bởi bộ
lọc lấy từ đầu ra của ACF. Như vậy, nếu r(m, n) là ACF thì:
U(m, n)⊗ a(m, n) = ε (m, n)
là một trường ngẫu nhiên không tương quan.
Lưu ý rằng bộ lọc là không duy nhất, có thể là nhân quả, bán nhân quả
hay không nhân quả. Các ACF hay dung như M(0, 2), M(2, 0), M(1, 1), M(2, 2).
Các đặc trưng của lược đồ bậc 1 của ε (m, n) chẳng hạn như trung bình m1 độ
phân tán cũng hay được sử dụng.
Ngoài các đặc trưng trên, có thể đưa thêm một số khái niệm và định
nghĩa các đại lượng dựa trên đó như: lược đồ hiệu mức xám(Histogram grey level
difference). Ma trận xuất hiện mức xám (grey level occurence matrices).
Lược đồ hiệu mức xám dùng để mô tả các thông tin mang tính không
gian và được định nghĩa như sau:
Cho d = (d1, d2) là véctơ dịch chuyển giữa 2 điểm ảnh và g(d) là hiệu
mức xám với khoảng cách d:
g(d) = |f(k,l) – f(k+d,l+d )
Với f(k, l) hàm cho giá trị mức xám tại tọa độ (k, l). Gọi h(g, d) là lược đồ của
hiệu mức xám với khoảng cách d. Như vậy, với mỗi khoảng cách d ta có 1 lược đồ
riêng.
Với mỗi điểm ảnh có kết cấu thô lược đồ h(g, d) có khuynh hướng tập
trung xung quanh g= 0 với khoảng cách d nhỏ. Trái lại, với một miền ảnh có kết
cấu mịn, h(g, d) sẽ phân nhánh dù với véctơ dịch chuyển d là khá nhỏ. Dựa trên
lược đồ này, người ta định nghĩa lại một số đại lượng:
Đề tài số 5: phân vùng ảnh trong xử lý ảnh số
- Trung bình: µ = g h (g , d)
- Phương sai: σ = ( g k - µ) h ( g , d)
- Độ tương phản: c = g h (g , d)
Phương sai đo độ tản mát của hiệu mức xám tại một khoảng cách d nào
đấy.Kết cấu tất định thường có khuynh hướng có phương sai σ tương đối nhỏ. Độ
tương phản cd chính là mômen của lược đồ hg(g, d) xung quanh g=0 và đo độ
tương phản của hiệu mức xám.
Người ta cũng sử dụng entropy để đo độ đồng nhất của lược đồ hg:
H = - h (g , d)ln (h (g , d))
Ưu điểm cơ bản của lược đồ hiệu mức xám là tính toán đơn giản. Ngoài
ra còn có khả năng cho ta tổ chức kết cấu không gian.
Ma trận xuất hiện liên hiệp mức xám: gọi P(k, l , d) là xác suất liên hiệp
của 2 điểm ảnh fk và fl với các mức xám k, l tương ứng cách nhau một khoảng d.
Xác suất này dễ dàng tính được nhờ việc tính số lần xuất hiện nk, l của điểm ảnh
(fk, fl) có mức xám k và l với khoảng cách d. Gọi n là tổng số cặp liên hiệp mức
xám cd được tính như sau: c = (c )
Và c= P(k,l,d) =
Ma trận xuất hiện liên hiệp mức xám Cd là ma trận vuông N*N phần tử (N
là số mức xám của ảnh). Ma trận này chứa đựng các thông tin rất hữu ích về tổ
chức kết cấu không gian. Nếu cấu tương đối thô thì các phần tử của ma trận tập
trung xung quanh đường chéo chính. Ngược lại nếu kết cấu bề mặt mịn giá trị các
phần tử của cd sẽ phân rải tương đối rõ:
Dựa trên khái niệm này người ta định nghĩa về một số độ đo:
- Xác xuất cực đại: P = max C
- Entropy: H d = - C ln(C)
Dễ dàng thấy entropy cực đại khi xác suất liên hiệp P(k, l, d) có phân
phối đều.
- Mô men hiệu bậc m: I = | k- 1| C
Id cực tiểu khi các phần tử của ma trận C tập trung trên đường chéo chính
vì khoảng cách | k- 1| là rất nhỏ. Id nhỏ có nghĩa là kết cấu khá thô. Người ta cũng
còn đưa vào một số độ đo khác như hàm tự tương quan, phổ năng lượng.