Tải bản đầy đủ (.pdf) (77 trang)

Thuật toán phát hiện ảnh giả mạo dạng cắt dán dựa trên các phép biến đổi ma trận

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.68 MB, 77 trang )

..

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

NGUYỄN HỒNG HẠNH

THUẬT TỐN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2014
Số hóa bởi Trung tâm Học liệu

/>

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

NGUYỄN HỒNG HẠNH

THUẬT TỐN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


HƢỚNG DẪN KHOA HỌC: PGS.TS PHẠM VĂN ẤT

THÁI NGUYÊN - 2014

Số hóa bởi Trung tâm Học liệu

/>

i

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ khoa học máy tính: “Thuật tốn phát
hiện ảnh giả mạo dạng cắt - dán dựa trên các phép biến đổi ma trận” là kết quả
của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc.
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, đƣợc
trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các cơng trình
nghiên cứu đã đƣợc công bố, các website, …
Các phƣơng pháp nêu trong luận văn đƣợc rút ra từ những cơ sở lý luận
và quá trình nghiên cứu tìm hiểu của tác giả.

Thái Nguyên, tháng năm 2014
Tác giả

Nguyễn Hồng Hạnh

Số hóa bởi Trung tâm Học liệu

/>

ii


LỜI CẢM ƠN
Lời đầu tiên tôi xin gửi lời cảm ơn thầy PGS. TS. Phạm Văn Ất đã tận
tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, đặc biệt là định hướng
nghiên cứu và tận tình hướng dẫn cho tơi trong suốt q trình làm luận văn.
Nếu khơng có sự giúp đỡ tận tình của thầy, tơi khó có thể hồn
thành luận văn này.
Bên cạnh đó tơi cũng xin chân thành cảm ơn các thầy cô T r ư ờ n g
Đ ạ i h ọ c Công nghệ Thông tin & T r u y ề n t h ơ n g đã tận tình giảng dạy,
chỉ bảo và cung cấp cho tôi những kiến thức cần thiết trong suốt thời gian
học và cũng xin gởi lời cám ơn chân thành đến những người thân, bạn bè
và đồng nghiệp đã giúp đỡ và động viên tôi trong suốt thời gian học tập
cũng như trong thời gian thực hiện luận văn.
Chân thành cảm ơn !

Thái Nguyên, tháng năm 2014
Tác giả

Nguyễn Hồng Hạnh

Số hóa bởi Trung tâm Học liệu

/>

iii

MỤC LỤC
LỜI CAM ĐOAN ............................................................................................. i
LỜI CẢM ƠN ...................................................................................................................ii
MỤC LỤC ......................................................................................................................... iii

DANH MỤC HÌNH VẼ ..................................................................................................iv
MỞ ĐẦU .............................................................................................................................1
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT HIỆN
ẢNH GIẢ MẠO .................................................................................................................3
1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH...............................................................................3
1.1.1. Xử lý ảnh là gì?..........................................................................................................3
1.1.2. Các khái niệm cơ bản trong xử lý ảnh.....................................................................9
1.1.3. Các vấn đề cơ bản trong xử lý ảnh ..........................................................................9
1.1.4. Một số định dạng ảnh phổ biến ..............................................................................12
1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO ...........................................................17
1.2.1. Ảnh giả mạo .............................................................................................................17
1.2.2. Các loại ảnh giả mạo cơ bản ..................................................................................17
1.2.3. Các cách tiếp cận trong phát hiện ảnh giả mạo ....................................................21
CHƢƠNG 2: THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT DÁN ....................................................................................................................................24
2.1. THUẬT TỐN ĐỐI SÁNH CHÍNH XÁC (EXACT MATCH) PHÁT HIỆN
ẢNH GIẢ MẠO DẠNG CẮT - DÁN ............................................................................24
2.1.1. Ý tƣởng.....................................................................................................................24
2.1.2. Thuật tốn................................................................................................................25
2.1.3. Phân tích thuật tốn .................................................................................................26
2.1.4. Ví dụ minh họa ........................................................................................................26
2.2. THUẬT TỐN ĐỐI SÁNH BỀN VỮNG (ROBUST MATCH) PHÁT HIỆN
ẢNH GIẢ MẠO DẠNG CẮT - DÁN DỰA TRÊN PHÉP BIẾN ĐỔI COSIN RỜI
RẠC (DCT - Discrete cosine transform) .........................................................................35
Số hóa bởi Trung tâm Học liệu

/>

2.2.1. Ý tƣởng.....................................................................................................................38
2.2.2. Thuật tốn.................................................................................................................39
2.2.3. Phân tích thuật tốn ................................................................................................44

2.3. THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT - DÁN DỰA
TRÊN PHÉP BIẾN ĐỔI DWT (Discrete Wavelet Transform) ...................................45
2.3.1. Ý tƣởng.....................................................................................................................48
2.3.2. Thuật tốn.................................................................................................................49
2.3.3. Phân tích thuật tốn .................................................................................................54
2.4. SO SÁNH CÁC PHƢƠNG PHÁP PHÁT HIÊN ẢNH GIẢ MẠO DẠNG CẮT
- DÁN..................................................................................................................................55
CHƢƠNG 3: PHẦN MỀM THỬ NGHIỆM .............................................................56
3.1. PHÂN TÍCH YÊU CẦU BÀI TOÁN .....................................................................56
3.2. TẠO ẢNH GIẢ MẠO...............................................................................................56
3.3. SƠ ĐỒ CHUNG CỦA THUẬT TỐN ĐỐI SÁNH CHÍNH XÁC - (exact
match)..................................................................................................................................57
3.4. SƠ ĐỒ CHUNG CỦA THUẬT TOÁN ĐỐI SÁNH BỀN VỮNG - (robust
match)..................................................................................................................................58
3.5. LỰA CHỌN CÔNG CỤ ...........................................................................................59
3.6. MÔI TRƢỜNG CÀI ĐẶT VÀ XÂY DỰNG CÁC HÀM ...................................60
3.7. KẾT QUẢ THỰC NGHIỆM....................................................................................60
3.7.1. Phần mềm đối sánh bền vững dựa trên phép biến đổi DCT ...............................61
3.7.2. Phần mềm đối sánh bền vững dựa trên phép biến đổi DWT ..............................64
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ..................................................................67
1. KẾT LUẬN....................................................................................................................67
2. KIẾN NGHỊ ...................................................................................................................68
TÀI LIỆU THAM KHẢO .............................................................................................69

Số hóa bởi Trung tâm Học liệu

/>

iv


DANH MỤC HÌNH VẼ
Hình 1.1. Các giai đoạn trong xử lý ảnh ............................................................................4
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh ..............................................8
Hình 1.3. Quá trình nén JPEG cơ .....................................................................................16
Hình 1.4. Minh họa về việc giả mạo ảnh ......................................................................17
Hình 1.5. Minh họa cho loại ảnh giả mạo tăng cƣờng ảnh ...........................................18
Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng ..................................................................20
Hình 1.7 thể hiện một dạng khác thƣờng thấy của giả mạo ảnh, đó là việc bổ sung
thêm đối tƣợng. .................................................................................................................21
Hình 1.8. Sơ đồ phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu ......................................22
Hình 1.9. Sự khác biệt của các hƣớng nguồn sáng khác nhau. ................................23
Hình 2.1. Đánh số thứ tự các phần tử của ma trận hệ số DCT theo đƣờng zigzag .....41
Hình 2.2. Vectơ dịch chuyển của vùng cắt - dán ............................................................44
Hình 2.3. Áp dụng phép biến đổi DWT theo hàng và cột .............................................48
Hình 2.4. Áp dụng phép biến đổi DWT theo hai mức ...................................................48
Hình 2.5. Vectơ dịch chuyển của vùng cắt - dán ............................................................54
Hình 3.1 Kết quả thực nghiệm 1 phát hiện ảnh giả mạo dạng cắt - dán .......................61
Hình 3.2. Kết quả thực nghiệm 2 phát hiện ảnh giả mạo dạng cắt - dán ......................62
Hình 3.3. Kết quả thực nghiệm 3 phát hiện ảnh giả mạo dạng cắt - dán ......................63
Hình 3.4. Kết quả thực nghiệm 4 phát hiện ảnh giả mạo dạng cắt - dán ......................64
Hình 3.5. Kết quả thực nghiệm 5 phát hiện ảnh giả mạo dạng cắt – dán, ảnh giả nén
JPEG với hệ số Q=60 ........................................................................................................65
Hình 3.6. Kết quả thực nghiệm 6 phát hiện ảnh giả mạo dạng cắt - dán nhiễu 1% ....66
Hình 3.7. Kết quả thực nghiệm 7 phát hiện ảnh giả mạo dạng cắt – dán nhiễu 1% làm
mờ 1px nén JPEG Q=60 ...................................................................................................66

Số hóa bởi Trung tâm Học liệu

/>


1

MỞ ĐẦU

Ngày nay, ảnh số là phƣơng tiện truyền thông đƣợc sử dụng rộng rãi,
đóng vai trị quan trọng trong đời sống con ngƣời, có tác động đến xã hội, tham
gia vào các quá trình pháp lý và kinh tế nhƣ: làm bằng chứng trong điều tra, xử
án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy ảnh kĩ
thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến ảnh số có
thể dễ dàng đƣợc chỉnh sửa mà không cần đến các kiến thức chuyên gia và việc
chỉnh sửa hầu nhƣ không để lại dấu vết mà mắt thƣờng có thể nhận biết đƣợc.
Kết quả là khi những hình ảnh đƣợc chỉnh sửa sử dụng cho mục đích xấu nó có
thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc phát hiện ảnh giả mạo là
vấn đề đặt ra ngày càng cấp bách và càng trở lên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận
bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay số tài liệu về lĩnh vực này
vẫn chƣa nhiều. Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ
thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào các bức
ảnh trƣớc khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện
cho việc phát hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này,
các thiết bị máy ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản
quyền ngay trong q trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết đƣợc
nguồn gốc của bức ảnh, biết đƣợc đó có phải là ảnh gốc hay khơng? Cách tiếp
cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin bản
quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải
đƣợc chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số đƣợc
trang bị đặc biệt. Ngồi ra, một giải pháp khác khơng cần dùng đến các thông tin
nhúng vào từ trƣớc là các phƣơng pháp thụ động phát hiện ảnh giả mạo.
Trong các loại giả mạo thì ảnh giả mạo dạng cắt - dán tƣơng đối phổ biến và
dễ dàng thực hiện, nên chúng đã và đang đƣợc nhiều nhà nghiên cứu quan tâm.

Số hóa bởi Trung tâm Học liệu

/>

2

Nhận thức đƣợc ý nghĩa khoa học và tính thực tiễn của vấn đề này nên em
đã chọn đề tài “Thuật toán phát hiện ảnh giả mạo dạng cắt - dán dựa trên các
phép biến đổi ma trận” cho luận văn tốt nghiệp của mình.
* Nội dung chính của luận văn gồm:
- Phần mở đầu.
Chương 1: Tổng quan về xử lý ảnh và bài toán phát hiện ảnh giả mạo.
Chƣơng này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến nhƣ định dạng Bitmap, định
dạng JPEG, đồng thời trình bày bài tốn phát hiện ảnh giả mạo.
Chương 2: Thuật toán phát hiện ảnh giả mạo dạng cắt - dán
Chƣơng này trình bày một số phép biến đổi ma trận, giới thiệu tổng quan
về ảnh giả mạo dạng cắt - dán và phát hiện ảnh giả mạo. Bên cạnh đó trình bày
một số thuật toán phát hiện ảnh giả mạo nhƣ: Thuật toán đối sánh chính xác,
thuật tốn đối sánh bền vững và thuật toán phát hiện ảnh giả mạo dạng cắt - dán
dựa trên các phép biến đổi DWT.
Chương 3: Phần mềm thử nghiệm
Tiến hành xây dựng chƣơng trình thực nghiệm để phát hiện ảnh kỹ
thuật số giả mạo dạng cắt - dán.
Kết luận
Do thời gian và trình độ cịn hạn chế nên luận văn khó tránh khỏi những
thiếu sót, kính mong nhận đƣợc sự đóng góp, chỉ bảo của các thầy giáo, cơ
giáo và các bạn.

Số hóa bởi Trung tâm Học liệu


/>

3

CHƢƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT HIỆN ẢNH
GIẢ MẠO
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến như định dạng Bitmap, định
dạng JPEG đồng thời trình bày bài toán phát hiện ảnh giả mạo.

1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tƣơng đối mới mẻ so với nhiều ngành khoa học
khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất
hiện những máy tính chun dụng. Để có thể hình dung cấu hình một hệ thống
xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào
tạo, trƣớc hết chúng ta sẽ xem xét các bƣớc cần thiết trong xử lý ảnh.
Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu
CCIR), nhƣng cũng có thể là tín hiệu số hóa (loại-Change Coupled Device).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay
ảnh, tranh đƣợc quét trên scanner. Tiếp theo là q trình số hóa để biến đổi tín
hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa, trƣớc khi
chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại.
Q trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trƣớc hết là công
việc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác
nhau: Có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu
ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khơi phục lại ảnh để làm


Số hóa bởi Trung tâm Học liệu

/>

4

nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng
thái gốc - trạng thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện
các đặc tính nhƣ biên, phân vùng ảnh, trích chọn các đặc tính,v.v…
Cuối cùng, tùy theo mục đích của ngƣời xử dụng, sẽ là giai đoạn nhận
dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong q trình xử
lý ảnh đƣợc mơ tả qua hình 1.1.
Thu nhận
(Camera, Scanner,
Sensor…)

Tiền xử lý
(Nắn chỉnh, xóa,
nhiễu…)

Trích chọn đặc
trƣng

Lƣu trữ
Hậu xử lý
(Chính xác hóa, rút
gọn,…)

Kết Luận

Hệ quyết định

Hình 1.1. Các giai đoạn trong xử lý ảnh
1.1.1.1. Thu nhận ảnh
Đây là bƣớc đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hố những tín hiệu liên tục đƣợc sinh ra
bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu,
máy quét ảnh, ... Trong trƣờng hợp bộ thu ảnh cung cấp chƣa phải là dạng
số hoá ta cịn phải chuyển đổi hay số hố ảnh.
Q trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận
dạng số hố của ảnh. Các thơng số quan trọng ở bƣớc này là độ phân giải,
chất lƣợng màu, dung lƣợng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.
Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh
hƣởng rất nhiều đến cơng đoạn kế tiếp.
Số hóa bởi Trung tâm Học liệu

/>

5

1.1.1.2. Tiền xử lý
Ở bƣớc này, ảnh sẽ đƣợc cải thiện về độ tƣơng phản, khử nhiễu, khử
bóng, khử độ lệch, v.v với mục đích làm cho chất lƣợng ảnh trở nên tốt hơn
nữa, chuẩn bị cho các bƣớc xử lý phức tạp hơn về sau trong quá trình xử lý
ảnh. Quá trình này thƣờng đƣợc thực hiện bởi các bộ lọc.
+ Khử nhiễu: Nhiễu đƣợc chia thành hai loại: nhiễu hệ thống và nhiễu
ngẫu nhiên. Đặc trƣng của nhiễu hệ thống là tính tuần hồn. Do vậy, có thể
khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh
điểm. Đối với nhiễu ngẫu nhiên, trƣờng hợp đơn giản là các vết bẩn tƣơng
ứng với các điểm sáng hay tối, có thể khử bằng phƣơng pháp nội suy, lọc

trung vị và trung bình.
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính khơng đồng
đều của thiết bị thu nhận hoặc độ tƣơng phản giữa các vùng ảnh.
+ Chỉnh tán xạ: Ảnh thu nhận đƣợc từ các thiết bị quang học hay điện
tử có thể bị mờ, nhoè. Phƣơng pháp biến đổi Fourier dựa trên tích chập của
ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này.
1.1.1.3. Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác
nhau hay còn gọi là các đối tƣợng để biểu diễn phân tích, nhận dạng ảnh. Ví
dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thƣ cho mục đích phân
loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ,
các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều
vào cơng đoạn này.
Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều

Số hóa bởi Trung tâm Học liệu

/>

6

phần tử khác nhau cấu tạo lên ảnh thơ. Vì lƣợng thông tin chứa trong ảnh rất
lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trƣng nào
đó, do vậy cần có một quá trình để giảm lƣợng thơng tin khổng lồ đó. Q
trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
1.1.1.4. Hệ quyết định
Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tối, dung
lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu.

Trong nhiều khâu xử lý và phân tích ảnh ngồi việc đơn giản hóa các
phƣơng pháp tốn học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt
chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các
bƣớc xử lý đó, nhiều khâu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con
ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy.
1.1.1.5. Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt
ra những yêu cầu về tốc độ tính tốn.
Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trƣng
cần thiết thƣờng là nhiều, không thể do chuyên gia đề xuất, mà phải đƣợc
trích chọn dựa trên các thủ tục phân tích dữ liệu.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tƣợng ảnh chính xác, với tốc độ tính tốn cao và dung lƣợng nhớ lƣu trữ
giảm xuống.
Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận
dạng trong q trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh
sau đây:
- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v
Số hóa bởi Trung tâm Học liệu

/>

7

- Đặc điểm biến đổi: các đặc điểm loại này đƣợc trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng đƣợc gọi là “mặt nạ đặc
điểm” (feature mask) thƣờng là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn v.v..).

- Đặc điểm biên và đƣờng biên: Đặc trƣng cho đƣờng biên của đối
tƣợng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến đƣợc
dùng khi nhận dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích chọn nhờ
toán tử Gradient, toán tử la bàn, toán tử Laplace, tốn tử “chéo khơng”
(zero crossing) ...
1.1.1.6. Nhận dạng
Đây là bƣớc cuối cùng trong quá trình xử lý ảnh.
Nhận dạng ảnh là quá trình xác định nội dung ảnh. Quá trình này
thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã đƣợc lọc (hoặc lƣu)
từ trƣớc.
Nhận dạng ảnh có thể đƣợc nhìn nhận một cách đơn giản là việc gán
nhãn cho các đối tƣợng trong ảnh. Ví dụ nhƣ khi nhận dạng chữ viết, các đối
tƣợng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ
đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tƣơng ứng cho các mẫu
chữ thu đƣợc trong ảnh. Giải thích là cơng đoạn gán nghĩa cho một tập các
đối tƣợng đã đƣợc nhận biết.
Chúng ta cũng có thể thấy rằng, khơng phải bất kỳ một ứng dụng xử lý
ảnh nào cũng bắt buộc phải tuân theo tất cả các bƣớc xử lý đã nêu ở trên, ví
dụ nhƣ các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bƣớc tiền xử lý.
Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng
và giải thích thƣờng chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán
tự động, đƣợc dùng để rút trích ra những thơng tin quan trọng từ ảnh, ví dụ

Số hóa bởi Trung tâm Học liệu

/>

8

nhƣ các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v…

Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối
thiểu nhƣ hình sau:
Màn hình
Đồ họa

Camera

Bộ xử lý tƣơng tự

Bộ nhớ ảnh

Màn hình đồ họa

Bộ xử lý
ảnh số

Bàn phím

Máy in

Bộ nhớ
ngồi

Màn hình

Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera nhƣ là
con mắt của hệ thống: có hai loại camera ống loại CCIR và camera CCD. Loại
camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng.
Loại CCD gồm các photo điốt và làm tƣơng ứng một cƣờng độ sáng tại một

điểm ảnh với một phần tử ảnh (pixel). Nhƣ vậy, ảnh là tập hợp các điểm ảnh. Số
pixel tạo nên một ảnh gọi là độ phân giải
Bộ xử lý tƣơng tự thực hiện các chức năng sau:
- Chọn camera thích hợp nếu hệ thống có nhiều camera.
- Chọn màn hình hiển thị tín hiệu.
- Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
- Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn
đƣờng bao, nhị phân hóa ảnh.
Số hóa bởi Trung tâm Học liệu

/>

9

Máy chủ đóng vai trị điều khiển các thành phần ở trên.
Bộ nhớ ngoài: Dữ liệu ảnh cũng nhƣ các dữ liệu khác, để có thể
chuyển giao cho các quá trình khác, nó cần đƣợc lƣu trữ.
1.1.2. Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cƣờng độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tƣợng trong khơng gian. Điểm ảnh là một hàm nhiều
biến P(x1, x2,..., xn) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thƣờng đƣợc biểu diễn dƣới
dạng ma trận các điểm ảnh.
Mức xám: là kết quả sự mã hóa tƣơng ứng của mỗi cƣờng độ sáng của
một điểm ảnh với một giá trị số - kết quả của q trình lƣợng hóa. Cách mã hóa
kinh điển thƣờng dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số
điểm ảnh của I có mức xám g.
1.1.3. Các vấn đề cơ bản trong xử lý ảnh

1.1.3.1. Biểu diễn ảnh
Ảnh đƣợc thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh
đƣợc lƣu trữ trên máy tính. Q trình lƣu trữ gồm 2 mục đích: tiết kiệm bộ nhớ
và giảm thời gian xử lý.
Ảnh đƣợc lƣu trữ trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị, in
ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thƣớc do đó nếu sử dụng
càng nhiều điểm ảnh thì càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết của
ảnh, ngƣời ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải phụ
thuộc vào nhu cầu sử dụng và đặc trƣng của từng loại ảnh cụ thể. Chẳng hạn, ảnh

Số hóa bởi Trung tâm Học liệu

/>

10

dùng trong văn bản thƣờng thể hiện dƣới dạng đen trắng có độ phân giải 300
DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh đƣợc biểu diễn theo 2 mơ hình cơ bản là RASTER
và VECTOR.
Mơ hình RASTER:
Theo mơ hình này, ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Tùy
theo yêu cầu thực tế mà mỗi điểm ảnh đƣợc biểu diễn bằng một hoặc nhiều bit.
Ngày nay thiết bị phần cứng phát triển nhƣng chủ yếu là theo định hƣớng
Raster cho cả thiết bị đầu vào cũng nhƣ đầu ra. Ví dụ: máy in, máy quét, v.v…
Một trong những nghiên cứu chủ yếu trong mơ hình raster là kỹ thuật nén
ảnh, chia ra hai khuynh hƣớng đó là nén bảo tồn và nén khơng bảo tồn thơng tin.
Nén bảo tồn thơng tin là có khả năng phục hồi hồn tồn dữ liệu ban đầu.
Nén khơng bảo tồn thơng tin là có khả năng phục hồi dữ liệu ban đầu nhƣng với
sai số chấp nhận đƣợc. Trên cơ sở đó ngƣời ta xây dựng đƣợc nhiều khuôn dạng

ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v…
Mơ hình VECTOR:
Ảnh lƣu trữ trên máy tính ngồi u cầu về giảm khơng gian lƣu trữ, thời
gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong sự lựa
chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu
diễn Vector tỏ ra ƣu việt hơn.
Trong mơ hình Vector, ảnh đƣợc biểu diễn bởi các điểm ảnh và các đƣờng
thể hiện hƣớng của một điểm. Ảnh dạng vector đƣợc thu nhận từ các thiết bị nhƣ
sensor, digitalier, v.v….

Số hóa bởi Trung tâm Học liệu

/>

11

Ngày nay, các thiết bị phần cứng phát triển mạnh theo hƣớng Raster cho
cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mơ hình
Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.3.2. Nắn chỉnh biến dạng
Ảnh thu đƣợc sau quá trình thu nhận thƣờng bị biến dạng do những thiết
bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (pi, p‟i), ( i= 1,
…, n).
2

n

Cần tìm hàm: : Pi


(Pi) sao cho:

f ( pi )

pi

min

i 1

1.1.3.3. Khử nhiễu
Trong quá trình thu nhận ảnh khơng thể tránh khỏi bị nhiễu. Có 2 loại
nhiễu cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, nhƣ vết xƣớc hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu
này thƣờng khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thơng
thƣờng sử dụng các phép lọc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời ta
muốn đặc tả nó. Q trình nhận dạng thƣờng đi sau q trình trích chọn các đặc
tính chủ u của đối tƣợng. Có 2 kiểu đối tƣợng:
- Mơ tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)

Số hóa bởi Trung tâm Học liệu

/>


12

Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa q trình
đọc tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thơng tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v.v...) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan.
1.1.4. Một số định dạng ảnh phổ biến
1.1.4.1. Định dạng ảnh Bitmap
Ảnh Bitmap là định dạng ảnh do Microsoft đề xuất, có phần mở rộng là
BMP. Trong đồ họa máy vi tính, BMP cịn đƣợc biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh khá phổ biến.
Các

tập

tin đồ

họa lƣu

dƣới

dạng

BMP


thƣờng



đi

là .BMP hoặc .DIB (Device Independent Bitmap).
Số bit trên mỗi điểm ảnh (bit per pixel), thƣờng đƣợc ký hiệu bởi n. Một
ảnh BMP n-bit có 2n màu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng
rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh
256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24-bit có
chất lƣợng hình ảnh trung thực nhất.
Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng nhƣ file ảnh nói
chung) là:
Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Số hóa bởi Trung tâm Học liệu

/>

13

Loại ảnh này đƣợc truyền tải, sử dụng rộng rãi trên máy tính và các thiết
bị điện tử khác. Ảnh Bitmap đƣợc chia thành ba dạng: Ảnh đen trắng, ảnh đa
mức xám và ảnh màu.
Ảnh đen trắng: là ảnh mà mỗi điểm ảnh chỉ thể hiện một trong hai trạng
thái 0 và 1 để biểu diễn trạng thái điểm ảnh đen hay trắng.
Ảnh đa mức xám: là ảnh mà mỗi điểm ảnh đƣợc biểu diễn bởi một giá trị
và đó là cƣờng độ sáng của điểm ảnh.

Ảnh màu: Mỗi điểm ảnh đƣợc đại diện bởi ba giá trị màu RGB, ứng
với mỗi đại lƣợng R,G, B ta sẽ đƣợc một giá trị màu tƣơng ứng. Số lƣợng
màu thực của ảnh có thể lên tới 2563 màu khác nhau. Nhƣng số màu thực của
một ảnh nào đó có thể là khá nhỏ. Để tiết kiệm bộ nhớ, với các ảnh có số
lƣợng màu nhỏ hơn 256 thì màu của các điểm ảnh đƣợc lƣu trữ dƣới dạng
bảng màu (PALLETE). Với các ảnh có số màu lớn thì màu của điểm ảnh
khơng tổ chức dƣới dạng bảng màu, khi đó giá trị của các điểm ảnh chính là
giá trị của các thành phần màu R, G, B.
Với ảnh có số lƣợng màu lớn, tuỳ theo chất lƣợng ảnh mà quyết định số
bit để biểu diễn cho mỗi màu thƣờng là 24 bit, hoặc 32 bit. Với ảnh 24 bit, mỗi
thành phần màu đƣợc biểu diễn bởi một byte (8 bit).

Một file ảnh BMP gồm ba phần:
* BitmapHeader
* Palette màu
* BitmapData

Số hóa bởi Trung tâm Học liệu

BitmapHeader (54 byte)
Bảng màu (có thể có hoặc không)
Thông tin ảnh (Bitmap Data)

/>

14

Cấu trúc cụ thể của ảnh BMP như sau:
** Cấu trúc và nội dung của bitmap File Header (bắt đầu từ byte 0 của tệp)
Byte


Data

Giá trị

Độ tin cậy

1

Kiểu tệp

„B‟



2

Kiểu tệp

„M‟



3-6

Size of the file

Unsigned long

Khơng


7-10

Reserved

Zero

11-14

Byte offset to bitmap data

Số TT (tính từ 0) byte



đầu của BMP data
** Cấu trúc và nội dung của bitmap Info (bắt đầu từ byte 14 của tệp)
Byte

Data

Giá trị

Độ tin cậy
qua test

1-4

Number of byte in Bitmap Info 40


5-8

Width of bitmap

In pixel



9-12

Height of bitmap

In pixel



13-14

Number of color planes

1

15-16

Number of bits per pixels

1,4,8 hoặc 24




17-20

Type of compression

21-24

Size image

In bytes

Khơng

25-28

Horizontal resolution

29-32

Vertical resolution

33-36

Number of color

Ảnh 24 bít - 0



In color Pallete


Ảnh 8 bít - nếu 0 thì
256 màu

37-40

Number of colors importal

Số hóa bởi Trung tâm Học liệu

/>

15

** Cấu trúc và nội dung của Color Pallete (bắt đầu từ byte 54 của tệp)
(Chỉ có ảnh nhỏ hơn hoặc bằng 8 bít màu mới có bảng màu)
Byte

Data

Giá trị

Entry – Chỉ số màu

1

Blue color value

0-255

0


2

Green color value

0-255

0

3

Red color value

0-255

0

4

Reserved

0

0

5

Blue color value

0-255


1

6

Green color value

0-255

1

7

Red color value

0-255

1

8

Reserved

0

1

9

….


** Cấu trúc và nội dung của Bitmap Data (bắt đầu từ tg byte Offset to Bitmap Data)
+) Với ảnh 8 bít màu:
Mỗi byte chứa chỉ số màu (tính từ 0) của một điểm ảnh. Các điểm ảnh
đƣợc lƣu trữ trên file theo từng hàng từ dƣới lên trên. Các điểm ảnh mỗi hàng
đƣợc chứa từ trái sang phải
+) Với ảnh 24 bít màu:
Mỗi nhóm 3 byte biểu diễn màu của một điểm ảnh (byte 1 – Red, byte 2 –
Green, byte 3 - Blue). Thứ tự lƣu trữ các điểm ảnh trong file cũng đƣợc mô tả
nhƣ trong bảng Bitmap Header
1.1.4.2. Định dạng ảnh JPEG (Joint Photographic Experts Group)
Chuẩn JPEG là kết quả của sự hợp tác giữa Liên hiệp viễn thông quốc tế
(International Telecommunication Union (ITU)), Tổ chức tiêu chuẩn quốc tế
(International Organization for Standardization (ISO)), Ủy ban điện quốc tế
Số hóa bởi Trung tâm Học liệu

/>

16

(International Electrotechnical Commission (IEC)). Tên chính thức của nó là
“ISO/IEC 10918-1 Digital compression and coding of continuous-tone still
image" hoặc "ITU-T Recommendation T.81".
Với lƣợc đồ nén JPEG cơ sở (JPEG baseline), một ảnh RGB đầu tiên
đƣợc chuyển đổi sang không gian luminance/chrominace (YCbCr). Mỗi kênh
sau đó đƣợc chia thành các khối pixel 8*8. Các giá trị này tiếp tục đƣợc chuyển
đổi từ số ngun khơng dấu [0,255] thành số ngun có dấu [-128,127]. Tiếp
theo mỗi khối đƣợc chuyển đổi sang không gian tần số sử dụng phép biến đổi
cosin rời rạc 2 chiều (2-D Discrete Cosine Transform - DCT). Gọi mỗi hệ số
DCT là C, C tiếp tục đƣợc lƣợng tử hóa bởi giá trị q:



round(C / q)

Ở đây giá trị lƣợng tử hóa q phụ thuộc vào tần số và kênh. Giá trị q càng
lớn thì tỷ lệ nén càng cao và chất lƣợng ảnh sau khi bị nén càng thấp. Sau khi
lƣợng tử hóa nhiều hệ số DCT sẽ trở thành 0 (đặc biệt đối với vùng tần số cao).
Cuối cùng các hệ số này đƣợc nén bằng phƣơng pháp Runlengh và Huffman.
Q trình nén ảnh JPEG đƣợc mơ tả nhƣ trong sơ đồ sau:
Huffman
Table

AC
Ảnh B.
(R,G,B)

Color
components
(Y, Cb, Cr)

Perform

DCT

Zig-zag
reordering

Huffman
coding
JPEG

bit-stream

Quantizer

DC

Difference
Encoding

Quantization
Table

Huffman
coding
Huffman
Table

Hình 1.3. Quá trình nén JPEG cơ
Tƣơng tự, để giải nén ảnh JPEG thực hiện các bƣớc ngƣợc lại với quá
trình nèn ảnh JPEG nhƣ trên.

Số hóa bởi Trung tâm Học liệu

/>

17

1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
1.2.1. Ảnh giả mạo
Ảnh giả mạo đƣợc xem là ảnh khơng có thật, việc có đƣợc ảnh là do sự

ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận ảnh.
Sức mạnh của các chƣơng trình xử lý ảnh số nhƣ PhotoShop, Corel Draw,
v.v...giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ
dàng. Một trong những ví dụ cho việc gải mạo này là hình 1.4. Hình này đƣợc
tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Clinton và
Saddam Hussein đƣợc cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng
và ánh sáng cũng đƣợc tạo ra làm cho bức ảnh nhìn có vẻ hồn tồn nhƣ thật.

Hình 1.4. Minh họa về việc giả mạo ảnh
1.2.2. Các loại ảnh giả mạo cơ bản
Ảnh giả mạo thƣờng chia làm hai loại chính. Ảnh giả nhƣng thật, tức là
hiện trƣờng đƣợc dựng thật và việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả
đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1.4 hoặc đƣợc cắt dán

Số hóa bởi Trung tâm Học liệu

/>

18

để thêm vào hay che đi các chi tiết trên ảnh.
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứ
hai. Trong dạng ảnh giả mạo thứ hai có thể chia làm 3 loại chính: Ghép ảnh, tăng
cƣờng ảnh, cắt - dán vùng trên ảnh và tơi tập trung chủ yếu tìm hiểu về ảnh giả
mạo dạng cắt - dán và các kỹ thuật phát hiện ảnh giả mạo dạng cắt - dán.

1.2.2.1. Tăng cường ảnh

(a)


(b)

(c)

(d)

Hình 1.5. Minh họa cho loại ảnh giả mạo tăng cƣờng ảnh: (a) ảnh gốc, (b) ảnh
đƣợc thay đổi màu sắc, (c) ảnh tăng độ tƣơng phản, (d) ảnh đƣợc làm mờ nền.
Hình 1.5 gồm một ảnh gốc (hình 1.5(a)), và 3 ví dụ cho loại giả mạo tăng

Số hóa bởi Trung tâm Học liệu

/>

×