Chương 3:
CƠ SỞ TOÁN
Võ Quang Hoàng Khang
TPHCM - 2016
1.
Hàm ảnh - Image function
2.
Tích chập - Convolution
3.
Biến đổi Cosine rời rạc
4.
Biến đổi Fourier
5.
Biến đổi Wavelet
2
Mô tả được hàm ảnh, tích chập
Mô tả được phép biến đổi Cosine rời rạc
Mô tả được biến đổi Fourier.
Mô tả được biến đổi Wavelet.
3
Input image
Enhancement
technique
Miền không gian
Xử lý trực tiếp trên pixel
Input image
Miền tần số
Xử lý trên biến đổi Cosine - Fourier
4
Ảnh số có thể được định nghĩa là hàm hai biến: f(x,y),
với x và y là các tọa độ nguyên, giá trị của f tại cặp tọa
độ (x,y) được gọi là cường độ sáng hoặc mức xám của
ảnh tại điểm đó.
Giá trị của f(x,y) và miền xác định của x và y rời rạc và
hữu hạn
R = {( x, y),1 £ x £ x m ,1 £ y £ y n}
Liên tục: Tích chập của 2 hàm f(x) và h(x) được định
nghĩa bởi:
g ( x ) f ( x ) h( x )
f (m)h( x m)dm
Rời rạc:
g (n) f (n) h(n) k f (k )h(n k )
6
Liên tục: Tích chập của 2 hàm f(x) và h(x) hai chiều
được định nghĩa bởi:
g ( x, y ) f ( x, y ) h ( x, y )
f (m, n)h( x m, y n)dmdn
Rời rạc
g (m, n)
f (m, n) h(m, n)
f ( k , l ) h( m k , n l )
l k
7
Kích thước kernel mxn, ảnh kích thước MxN, tích
chập được định nghĩa bởi
g ( x, y )
a
b
f ( x k , y l ) h( k , l )
l a k b
a (m 1) / 2
b (n 1) / 2
Thông thường, nhân chập có dạng vuông (m=n),
với m và n là số lẻ.
Chú ý: tâm của nhân chập thường ở giữa cửa sổ
chập.
Tại một vị trí bất kỳ, pixel đích sẽ bằng tổng các
tích giữa pixel nguồn với các phần tử tương ứng
trong nhân
8
Tích chập giữa f(M1xN1) và nhân h(M2xN2) có thể tạo
ra các ma trận có kích thước như sau, tùy thuộc vào
kiểu chập.
Giữ nguyên kích thước: M1xN1 (same convolution)
Tăng kích thước : (M1+M2-1)x(N1+N2-1) (full
convolution)
Giảm kích thước: (M1-M2+1)x(N1-N2+1) (valid
convolution)
9
Giữ nguyên kích thước
10
Tăng kích thước
Tâm ma trận chập
nằm ngoài ảnh
Giảm kích thước
Ma trận chập nằm
gọn trong ảnh
11
for(int y = 0; y < height; ++y)
{
for(int x = 0; x < width; ++x)
{
sum = 0;
for(int i = 0; i < kHeight-1; i++) {
for(int j = 0; j < kWidth-1; j++) {
if((y+(i-kMiddleHeight)) < 0 || (y+(i-kMiddleHeight)) >= height
|| (x+(j-kMiddleWidth)) < 0 || (x+(j-kMiddleWidth)) >= width) {
result = 0;
}
else {
result = input[y+(i-kMiddleHeight), x+(j-kMiddleWidth)] * kernel[I, j];
}
sum += result;
}
}
result[y, x] = sum;
}
}
12
Input image
Enhancement
technique
Miền không gian
Xử lý trực tiếp trên pixel
Input image
Miền tần số
Xử lý trên biến đổi Cosine - Fourier
13
y
v
x
u
Là một công cụ toán học xử lý các tín hiệu như ảnh
hay video.
Chuyển đổi các tín hiệu từ miền không gian sang
miền tần số và biến đổi ngược lại từ miền tần số
quay trở lại miền không gian
Không ảnh hưởng đến chất lượng ảnh.
15
16
17
Biến đổi thuận: chuyển sự biểu diễn từ không gian
thực sang không gian tần số
f(x)
Fourier
Transform
F(w)
Biến đổi ngược: chuyển đổi sự biểu diễn của đối
tượng từ không gian Fourrier sang không gian thực.
F(w)
Inverse Fourier
Transform
f(x)
The one-dimensional Fourier transform and its inverse
The two-dimensional Fourier transform and its inverse
Biến đổi Fourier – ví dụ
original
image
x-blurred
image
Fourier
transform
Fourier
transform
Biến đổi Fourier – ví dụ
original
image
Fourier
transform
Code matlab:
f = imread(‘lena.jpg’);
subplot(1,2,1), imshow(f);
f = double(f);
F = fft2(f);
Fc = fftshift(F);
S = log(1+abs(Fc));
subplot(1,2,2),imshow(S,[]);
reconstructed
“inverse FT”
image
original
image
Fourier
transform
truncated
Fourier
transform
Lowpass filter
reconstructed
“inverse FT”
image
original
image
Fourier
transform
truncated
Fourier
transform
Highpass filter