1
CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
2-D
2- Dimension
3-D
AC
CCD
Covariance Matrix
DC
DCT
DPI
EM
Image Enhancement
PCA
3- Dimension
Alternating Current
Change Coupled Divice
Ma trận đồng biến
Direct Current
Discrete Cosin Transform
Dot per inch
Expectation/Maximization algorithm
Tăng cƣờng ảnh
Principal Component Analysis
2
DANH MỤC CÁC HÌNH
Hình 1.1. Các giai đoạn chính trong xử lý ảnh.................................................................................................. 6
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh ................................................................. 6
Hình 1.3. Minh họa về việc giả mạo ảnh ...............................................................................................................10
Hình 1.4. Minh họa cho loại giả mạo ghép ảnh ............................................................................................11
Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh ..........................................................................12
Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng...........................................................................................................13
Hình 1.7. Ảnh bổ sung đối tƣợng ....................................................................................................................................14
Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu ..................................................15
Hình 2.1. Minh họa các loại nguồn sáng ...............................................................................................................21
Hình 2.2. Kết quả áp dụng thuật tốn so khớp bền vững cho hình 1.7b .........................29
Hình 2.3. Kết quả của thuật tốn phát hiện dựa trên PCA ...............................................................33
Hình 2.4. Lấy mẫu lại một tín hiệu với tỷ lệ 4/3 ..........................................................................................35
Hình 2.5. Kết quả thực hiện thuật tốn EM cho các tín hiệu ở hình 2.4 ........................40
Hình 2.6. Ví dụ về lấy mẫu lại ảnh ...............................................................................................................................42
Hình 2.7. Kết quả của thuật toán EM áp dụng để ƣớc lƣợng xác suất ..............................43
Hình 2.8. Ví dụ cho thuật tốn phát hiện việc lấy mẫu lại ...............................................................44
Hình 2.9. Minh họa biểu đồ xác suất nhân tạo ...............................................................................................47
Hình 2.10. Độ chính xác của thuật tốn phát hiện với các tham số lấy mẫu lại
khác nhau.......................................................................................................................................................................................................49
Hình 3.1. Ảnh giả đƣợc tạo ra bằng việc copy một vùng khói và dán vào ảnh
nhiều lần.........................................................................................................................................................................................................50
Hình 3.2. Ảnh bổ sung đối tƣợng ....................................................................................................................................51
Hình 3.3. Ảnh giả đƣợc tạo ra từ 2 ảnh ở hình 3.4 ....................................................................................52
Hình 3.4. Hai ảnh gốc để tạo ra ảnh giả ở hình 3.3 ...................................................................................52
Hình 3.5. Kết quả của thuật toán ƣớc lƣợng hƣớng nguồn sáng cho 2 đối tƣợng
trong ảnh.........................................................................................................................................................................................................53
Hình 3.6. Giao diện chƣơng trình ...................................................................................................................................55
Hình 3.7. (a) ảnh gốc; (b) ảnh giả mạo; (c) Kết quả thực hiện thuật tốn ....................56
Hình 3.8. Kết quả của thuật tốn phát hiện với các kích thƣớc khối khác nhau ...57
Hình 3.9. Kết quả của thuật toán phát hiện ảnh giả mạo ở hình 3.2b ................................57
3
MỞ ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của ngành Khoa học máy tính cũng
nhƣ sự bùng nổ của lĩnh vực Công nghệ thông tin đã đẩy nhanh sự phát triển của
nhiều lĩnh vực nhƣ quân sự, y học, giáo dục, kinh tế, giải trí v.v... Sự phát triển
của phần cứng cả về phƣơng diện thu nhận, hiển thị, cùng với tốc độ xử lý đã mở
ra nhiều hƣớng mới cho sự phát triển phần mềm, đặc biệt là Công nghệ xử lý ảnh
đã ra đời và phát triển nhanh. Sức mạnh của các phần mềm soạn thảo và xử lý
ảnh nhƣ Photoshop đã giúp cho việc tạo ra ảnh giả mạo ngày càng dễ dàng hơn.
Các chƣơng trình xử lý ảnh này có thể thêm vào hoặc bỏ đi các đặc trƣng của
ảnh mà ít để lại các dấu hiệu về sự giả mạo v.v... Ngƣời ta tạo ra các ảnh giả mạo
thƣờng nhằm vào các mục đích nhƣ vu cáo, tạo ra các tin giật gân, đánh lừa đối
thủ, làm sai lệch chứng cứ phạm tội v.v... Do vậy, việc phát hiện ra ảnh giả mạo
là vấn đề phải đặt ra ngày càng cấp bách và càng trở nên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận
bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay rất ít tài liệu có giá trị về lĩnh
vực này. Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ thuật về
tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào bức ảnh trƣớc khi
phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện cho việc phát
hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này, các thiết bị máy
ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản quyền ngay trong
q trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết đƣợc nguồn gốc của
bức ảnh. Nhờ đó mà có thể biết đƣợc đó có phải là ảnh gốc hay không? Cách
tiếp cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin
bản quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải
đƣợc chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số
đƣợc trang bị đặc biệt.
Trên đây đã điểm qua tầm quan trọng của vấn đề phát hiện ảnh giả mạo và
điều đó cho ta thấy rõ tính cần thiết cũng nhƣ tính thời sự đồng thời là ý nghĩa
khoa học và thực tiễn của vấn đề. Nhận thức đƣợc điều này, tôi đã chọn đề tài:
“Phát hiện ảnh giả mạo” cho luận văn của mình.
4
Bố cục của luận văn bao gồm phần mở đầu, phần kết luận và ba chƣơng nội
dung đƣợc tổ chức nhƣ sau:
Chƣơng 1: Tổng quan về xử lý ảnh và giả mạo ảnh
Chƣơng này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện
ảnh giả mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng các cách tiếp cận chính
để phát hiện ảnh giả mạo.
Chƣơng 2: Một số phƣơng pháp phát hiện ảnh giả mạo
Chƣơng này trình bày một số kỹ thuật phát hiện ảnh giả mạo nhƣ: Kỹ thuật
phát hiện dựa vào phân tích nguồn sáng, kỹ thuật phát hiện dựa vào việc tìm ra
dấu vết của việc lấy mẫu lại và các kỹ thuật phát hiện dựa vào việc tìm ra các
vùng lặp trong ảnh.
Chƣơng 3: Ứng dụng
Trình bày các ứng dụng của các kỹ thuật phát hiện ảnh giả mạo và sử dụng
Visual C++ cài đặt kỹ thuật phát hiện các vùng lặp trong ảnh để phát hiện loại
ảnh giả mạo sinh bởi thao tác copy và dịch chuyển vùng trên ảnh.
5
Chƣơng 1 –
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ GIẢ MẠO ẢNH
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ bản
trong xử lý ảnh, đồng thời trình bày tổng quan về ảnh giả mạo và phát hiện ảnh giả
mạo, cụ thể là các dạng ảnh giả mạo cơ bản cùng với các cách tiếp cận chính để
phát hiện ảnh giả mạo.
1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tƣơng đối mới mẻ so với nhiều ngành khoa học
khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất hiện
những máy tính chun dụng. Để có thể hình dung cấu hình một hệ thống xử lý ảnh
chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trƣớc hết
chúng ta sẽ xem xét các bƣớc cần thiết trong xử lý ảnh.
Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu
CCIR), nhƣng cũng có thể là tín hiệu số hóa (loại CCD-Change Coupled
Device).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
tranh đƣợc quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín hiệu
liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa, trƣớc khi
chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại.
Q trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trƣớc hết là công
việc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác
nhau: có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu,
ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khôi phục lại ảnh để làm
nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng
thái gốc – trạng thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện
các đặc tính nhƣ biên, phân vùng ảnh, trích chọn các đặc tính, v.v...
6
Cuối cùng, tùy theo mục đích của ngƣời sử dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính trong q trình xử lý ảnh
đƣợc mơ tả qua hình 1.1[1].
Thu nhận
(Camera, scanner,
sensor, ...)
Tiền xử lý
(Nắn chỉnh, xóa
nhiễu, ...)
Trích chọn
đặc trƣng
Lƣu trữ
Hậu xử lý
(Chính xác hóa, rút
gọn, ...)
Kết luận
Hệ quyết định
Hình 1.1. Các giai đoạn chính trong xử lý ảnh
Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối thiểu
nhƣ hình sau:
Màn hình
đồ họa
Camera
Bộ nhớ
Bộ xử lý
tƣơng tự
Bộ nhớ ảnh
Máy chủ
Bộ xử lý
ảnh số
ngồi
Màn hình
Bàn phím
Máy in
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
7
Đối với một hệ thống xử lý ảnh thu nhận qua camera - camera nhƣ là con mắt
của hệ thống. Có 2 loại camera: camera ống loại CCIR và camera CCD. Loại
camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625
dòng. Loại CCD gồm các photo điốt và làm tƣơng ứng một cƣờng độ sáng tại
một điểm ảnh với một phần tử ảnh (pixel). Nhƣ vậy, ảnh là tập hợp các điểm
ảnh. Số pixel tạo nên một ảnh gọi là độ phân giải.
Bộ xử lý tƣơng tự thực hiện các chức năng sau:
Chọn camera thích hợp nếu hệ thống có nhiều camera.
Chọn màn hình hiển thị tín hiệu.
Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn đƣờng
bao, nhị phân hóa ảnh.
Máy chủ đóng vai trị điều khiển các thành phần miêu tả ở trên.
Bộ nhớ ngoài: Dữ liệu ảnh cũng nhƣ các dữ liệu khác, để có thể chuyển giao
cho các q trình khác, nó cần đƣợc lƣu trữ.
Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cƣờng độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tƣợng trong không gian. Điểm ảnh là một hàm nhiều
biến P(x1, x2, ..., xn) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thƣờng đƣợc biểu diễn dƣới dạng
ma trận các điểm ảnh.
Mức xám: là kết quả của sự mã hóa tƣơng ứng một cƣờng độ sáng của một
điểm ảnh với một giá trị số - kết quả của q trình lƣợng hóa. Cách mã hóa kinh
điển thƣờng dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: Biều đồ tần suất của một mức xám g của ảnh I là số điểm
ảnh của I có mức xám g.
8
1.1.2 Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1 Biểu diễn ảnh
Ảnh đƣợc thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh đƣợc
lƣu trữ trên máy tính. Q trình lƣu trữ gồm 2 mục đích: tiết kiệm bộ nhớ và
giảm thời gian xử lý.
Ảnh đƣợc lƣu trữ trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị, in ấn
và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thƣớc do đó nếu sử dụng
càng nhiều điểm ảnh thì ảnh càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết
của ảnh, ngƣời ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải
phụ thuộc vào nhu cầu sử dụng và đặc trƣng của từng loại ảnh cụ thể. Chẳng
hạn, ảnh dùng trong văn bản thƣờng thể hiện dƣới dạng đen trắng có độ phân
giải 300 DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh đƣợc biểu diễn theo 2 mơ hình cơ bản là RASTER
và VECTOR.
Mơ hình RASTER:
Theo mơ hình này, ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh.
Tùy theo yêu cầu thực tế mà mỗi điểm ảnh đƣợc biểu diễn bằng một hoặc
nhiều bít.
Ngày nay thiết bị phần cứng phát triển nhƣng chủ yếu là theo định hƣớng
Raster cho cả thiết bị đầu vào cũng nhƣ đầu ra. Ví dụ: máy in, máy quét v.v...
Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nén
ảnh, chia ra 2 khuynh hƣớng là nén bảo tồn và nén khơng bảo tồn thơng tin.
Nén bảo tồn thơng tin là có khả năng phục hồi hồn tồn dữ liệu ban đầu. Nén
khơng bảo tồn thơng tin là có khả năng phục hồi dữ liệu ban đầu nhƣng với sai
số chấp nhận đƣợc. Trên cơ sở đó ngƣời ta đã xây dựng đƣợc nhiều khuôn dạng
ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v...
Mô hình VECTOR:
Ảnh lƣu trữ trên máy tính ngồi u cầu về giảm không gian lƣu trữ, thời
gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong lựa
chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu
diễn Vector tỏ ra ƣu việt hơn.
9
Trong mơ hình Vector, ảnh đƣợc biểu diễn bởi các điểm ảnh và các đƣờng
thể hiện hƣớng của một điểm. Ảnh dạng Vector đƣợc thu nhận từ các thiết bị
nhƣ sensor, digitalier, v.v...
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hƣớng Raster cho cả
đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mơ hình Vector
là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.2.2 Nắn chỉnh biến dạng
Ảnh thu đƣợc sau quá trình thu nhận thƣờng bị biến dạng do những thiết bị
quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển
( Pi , Pi ' ) (i 1,..., n).
Cần tìm hàm: f : Pi f (Pi ) sao cho:
n
i 1
2
f ( Pi ) Pi ' min
1.1.2.3 Khử nhiễu
Trong q trình thu nhận ảnh khơng thể tránh khỏi bị nhiễu. Có 2 loại nhiễu
cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, nhƣ vết xƣớc hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu này
thƣờng khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thơng thƣờng
sử dụng các phép lọc.
1.1.2.4 Nhận dạng ảnh
Nhận dạng ảnh là q trình liên quan đến các mơ tả đối tƣợng mà ngƣời ta
muốn đặc tả nó. Q trình nhận dạng thƣờng đi sau q trình trích chọn các đặc
tính chủ yếu của đối tƣợng. Có hai kiểu mơ tả đối tƣợng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
10
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa q trình đọc
tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu
chữ, v.v...) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan.
1.2 Ảnh giả mạo và phát hiện ảnh giả mạo
1.2.1 Ảnh giả mạo
Ảnh giả mạo đƣợc xem là ảnh khơng có thật, việc có đƣợc ảnh là do sự
ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận ảnh.
Sức mạnh của các chƣơng trình xử lý ảnh số nhƣ PhotoShop, Corel Draw,
v.v... giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ
dàng. Một trong những ví dụ cho việc giả mạo này là hình 1.3. Hình này đƣợc
tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Clinton và
Saddam Hussein đƣợc cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng
và ánh sáng cũng đƣợc tạo ra làm cho bức ảnh nhìn có vẻ hồn tồn nhƣ thật.
Hình 1.3. Minh họa về việc giả mạo ảnh
11
1.2.2 Các loại ảnh giả mạo cơ bản
Ảnh giả mạo thƣờng chia làm hai loại chính [2]. Ảnh giả nhƣng thật, tức là
hiện trƣờng đƣợc dựng thật và việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả
đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1.3 hoặc đƣợc cắt
dán để thêm vào hay che đi các chi tiết trên ảnh.
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứ
hai. Trong dạng ảnh giả mạo thứ hai có thể chia ra làm 3 loại chính: Ghép ảnh,
tăng cƣờng ảnh và copy/di chuyển vùng trên ảnh.
1.2.2.1 Ghép ảnh
Ghép ảnh là dạng giả mạo ảnh số phổ biến nhất, trong đó hai hay nhiều ảnh
số đƣợc ghép lại với nhau để tạo ra một ảnh số hoàn chỉnh. Một ví dụ cho ghép
ảnh là hình 1.4a. Ảnh này đƣợc ghép từ 2 ảnh có cùng tỷ lệ. Rõ ràng nếu chỉ ra
đây là ảnh thật hay ảnh giả mạo thì cũng có nghĩa là chứng minh đƣợc mối quan
hệ giữa họ.
(a) Ghép ảnh từ các ảnh riêng rẽ
(b) Ghép ảnh từ các ảnh thay đổi tỷ lệ
Hình 1.4. Minh họa cho loại giả mạo ghép ảnh
Một ví dụ khác của dạng giả mạo loại này là hình 1.4b. Hình này là ảnh
ghép từ hai ảnh có sự thay đổi tỷ lệ. Nếu không chứng minh đƣợc ảnh này là giả
thì sẽ phải có cách nhìn khác về sự tiến hóa của lồi ngƣời?
Độ tin cậy của sự giả mạo loại này phụ thuộc vào mức độ phù hợp giữa các
thành phần trong ảnh về mặt kích thƣớc, tƣ thế, màu sắc, chất lƣợng và ánh sáng.
Nếu có một cặp ảnh tƣơng thích tốt, đƣợc thực hiện bởi một chuyên gia giàu kinh
nghiệm thì việc giả mạo hồn tồn nhƣ thật.
12
1.2.2.2 Tăng cƣờng ảnh
(a)
(c)
(b)
(d)
Hình 1.5. Minh họa cho loại giả mạo tăng cƣờng ảnh: (a) ảnh gốc, (b) ảnh đƣợc thay đổi
màu sắc, (c) ảnh tăng độ tƣơng phản, (d) ảnh đƣợc làm mờ nền
Hình 1.5 gồm một ảnh gốc (hình 1.5a), và 3 ví dụ cho loại giả mạo tăng
cƣờng ảnh: (1) Xe mô tô màu xanh đƣợc chuyển thành màu lục lam và xe tải
màu đỏ trong nền đƣợc chuyển thành màu vàng (hình 1.5b); (2) Tăng độ tƣơng
phản của toàn cảnh làm cho ảnh này giống nhƣ đƣợc chụp vào một ngày trời
nắng (hình 1.5c); (3) Các xe ôtô đỗ trong ảnh này bị làm mờ khiến cho chiều sâu
13
của khung cảnh trở nên hẹp hơn (hình 1.5d) v.v... Không giống nhƣ ghép ảnh,
trong Photoshop loại thao tác này thƣờng sử dụng ít click chuột hơn.
Mặc dù loại giả mạo này khơng thể thay đổi cơ bản hình dạng hay ý nghĩa
của ảnh gốc nhƣ loại ghép ảnh, nhƣng nó vẫn có tác động khéo léo lên cách hiểu
ảnh. Ví dụ, có thể sửa đổi thời tiết và thời gian trong ngày hay có thể làm mờ đi
vài chi tiết để thổi phồng các chi tiết khác trong ảnh, v.v...
1.2.2.3 Copy và dịch chuyển vùng trên ảnh
a) Ảnh gốc
b) Ảnh đã che phủ đối tƣợng
c) Ảnh gốc
d) Ảnh bỏ đi đối tƣợng
Hình 1.6. Ảnh che phủ và bỏ đi đối tƣợng
14
a) Ảnh gốc
b) Ảnh bổ sung đối tƣợng
Hình 1.7. Ảnh bổ sung đối tƣợng
Một dạng khác thƣờng thấy nữa của ảnh giả mạo loại hai là việc sao
chép/dịch chuyển các phần của ảnh gốc. Thể hiện của loại này có thể là việc bớt
đi các đối tƣợng trong ảnh, và cũng đƣợc xem nhƣ là che phủ đối tƣợng hoặc
xóa đi đối tƣợng. Hình 1.6a là ảnh gốc với 2 chiếc ơ tơ, một xe con và một xe tải.
Hình 1.6b là hình 1.6a giả tạo với việc che phủ chiếc xe tải bằng một cành cây
cũng lấy từ trong chính ảnh đó. Trong khi hình 1.6c là ảnh gốc với chiếc trực
thăng nhỏ cịn hình 1.6d chính là ảnh gốc 1.6c đã đƣợc bỏ đi đối tƣợng chiếc
trực thăng. Trong cả hai trƣờng hợp giả mạo này đều đƣợc thực hiện từ một ảnh
nên độ tƣơng đồng về ánh sáng và bóng là nhƣ nhau. Do đó, bằng mắt thƣờng rất
khó xác định.
Hình 1.7 thể hiện một dạng khác thƣờng thấy của giả mạo sinh ra bởi thao
tác copy và dịch chuyển vùng trên ảnh là việc bổ sung thêm đối tƣợng. Hình 1.7a
là ảnh gốc chỉ có một chiếc máy bay trực thăng, nhƣng hình 1.7b đã đƣợc bổ
sung thêm thành 3 chiếc trực thăng ở các vị trí khác nhau. Các trực thăng này
chính là đƣợc copy từ trực thăng gốc nên góc độ và hƣớng là giống nhau, do đó
khó cho việc xác định.
1.2.3 Các cách tiếp cận chính trong phát hiện ảnh giả mạo
1.2.3.1 Dựa vào hình dạng
Việc phân tích để xác định tính giả mạo có thể dựa vào hình dạng vì việc
cắt dán và ghép ảnh thƣờng đƣợc thực hiện dựa theo các đƣờng biên, nơi có sự
thay đổi khơng liên tục của cƣờng độ sáng của các điểm ảnh.
15
1.2.3.2 Dựa vào phân tích nguồn sáng
Việc ghép các ảnh khác nhau hoặc bổ sung thêm đối tƣợng không phải thực
hiện thao tác copy có thể đƣợc thực hiện bằng việc phân tích nguồn sáng đối với
từng đối tƣợng, các đối tƣợng đƣợc ghép thƣờng có hƣớng của nguồn sáng
khơng cùng với các đối tƣợng trong ảnh gốc.
1.2.3.3 Dựa vào biến đổi màu sắc
Ảnh gốc thu nhận thƣờng đƣợc thực hiện bởi một thiết bị. Do tính chất biến
đổi của ống kính bao gồm góc độ chụp, độ mở v.v... nên ảnh thu đƣợc thƣờng bị
biến dạng theo các tính chất đặc trƣng của các nhà sản xuất. Phần ảnh đƣợc ghép
vào hay bổ sung thƣờng khơng có sự biến đổi tƣơng đồng về độ sáng.
1.2.3.4 Dựa vào cơ sở dữ liệu
Hình 1.8. Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu
Việc giả mạo ảnh thƣờng dựa vào các ảnh đã có, tức là các ảnh đã đƣợc
xuất bản bởi một nơi nào đó nhƣ: báo chí, trang Web, tạp chí v.v... Các ảnh này
16
đã đƣợc lƣu trữ nên khi xuất hiện một ảnh nghi là giả mạo ngƣời ta có thể tìm
ảnh này với các phần trong nguồn ảnh nằm trong cơ sở dữ liệu ảnh. Trong
trƣờng hợp tốt nhất là các ảnh trong cơ sở dữ liệu đều đã đƣợc ẩn giấu một thơng
tin về bản quyền nào đó. Hình 1.8 là sơ đồ tổng quát cho một hệ thống phát hiện
giả mạo thuộc loại này.
Cách tiếp cận này cũng thƣờng đƣợc áp dụng với trƣờng hợp xóa bớt hoặc
bổ sung thêm đối tƣợng từ chính ảnh gốc. Trƣờng hợp mà việc phân tích nguồn
sáng hay sự biến đổi về màu sắc khơng có tác dụng. Cơ sở dữ liệu trong trƣờng
hợp này có thể xem là các phần có thể của ảnh gốc.
17
Chƣơng 2 –
MỘT SỐ PHƢƠNG PHÁP PHÁT HIỆN ẢNH GIẢ MẠO
Chương này trình bày một số kỹ thuật phát hiện ảnh giả mạo như: Kỹ thuật
phát hiện dựa vào phân tích các mâu thuẫn trong hướng chiếu sáng, kỹ thuật
phát hiện dựa vào việc tìm ra dấu vết của việc lấy mẫu lại và các kỹ thuật phát
hiện ra sự giả mạo dựa vào việc tìm ra các vùng lặp trong ảnh.
2.1 Phát hiện dựa vào phân tích nguồn sáng
Khi tạo ra một ảnh giả mạo bằng việc ghép các đối tƣợng từ các ảnh khác
nhau thƣờng khó tƣơng thích về các điều kiện ánh sáng. Hầu nhƣ các đối tƣợng
đƣợc ghép vào có hƣớng nguồn sáng khơng cùng với các đối tƣợng trong ảnh
gốc. Do vậy, các khác nhau về hƣớng nguồn sáng này có thể là một gợi ý tốt để
ta phát hiện ảnh giả mạo.
Từ gợi ý đó ngƣời ta đã tìm ra một cách phát hiện ảnh giả mạo dựa vào mâu
thuẫn trong nguồn sáng. Chúng ta biết rằng mỗi đối tƣợng trong ảnh đều đƣợc
chiếu sáng bởi các nguồn sáng và nếu một ảnh không phải là ảnh giả mạo thì các
đối tƣợng trong ảnh đó phải đƣợc chiếu sáng cùng nguồn sáng tại cùng thời gian.
Còn nếu một ảnh là ảnh giả đƣợc tạo thành bằng việc ghép các đối tƣợng từ các
bức ảnh khác nhau thì nguồn sáng của chúng thƣờng khác nhau. Do đó từ các
đối tƣợng này ta tìm hƣớng chiếu của nguồn sáng đến từng đối tƣợng và đem so
sánh với nhau, nếu chênh lệch nhiều thì kết luận đó là ảnh giả mạo.
Trong phần này, trƣớc hết tơi trình bày sơ lƣợc về các loại nguồn sáng,
sau đó trình bày một số phƣơng pháp ƣớc lƣợng hƣớng các nguồn sáng để dựa
vào đó ta có thể phát hiện ra ảnh giả mạo.
2.1.1 Các loại nguồn sáng
Nguồn sáng có thể chia thành hai loại là nguồn sáng đơn (một nguồn sáng) và
đa nguồn sáng (nhiều nguồn sáng). Nếu các đối tƣợng của một ảnh đƣợc chiếu sáng
bởi duy nhất một nguồn sáng thì ta gọi ảnh đó đƣợc chiếu sáng bởi nguồn sáng đơn,
18
ngƣợc lại nếu có nhiều nguồn sáng chiếu đến các đối tƣợng của ảnh thì ta gọi ảnh
đó đƣợc chiếu sáng bởi nhiều nguồn sáng.
Nguồn sáng đơn đƣợc chia làm 2 loại: nguồn sáng xa (xa vô hạn) và nguồn
sáng cục bộ (nguồn sáng ở gần). Nguồn sáng đƣợc coi là nguồn sáng xa nếu
khoảng cách từ nguồn sáng đến đối tƣợng là rất lớn so với kích thƣớc của đối
tƣợng (lớn tới mức có thể coi đối tƣợng nhƣ một chất điểm). Ngƣợc lại thì gọi là
nguồn sáng gần. Trên thực tế chỉ có các nguồn sáng tự nhiên (mặt trời, mặt
trăng, v.v...) đƣợc xem là nguồn sáng xa.
Đối với trƣờng hợp nguồn sáng ở xa vô hạn, việc ƣớc lƣợng hƣớng chiếu
sáng là đơn giản nhất. Do khoảng cách từ đối tƣợng đến nguồn sáng là quá lớn
nên có thể xem hƣớng chiếu sáng từ nguồn sáng đến mọi điểm trên đối tƣợng
đều trùng nhau. Và vì vậy với mỗi đối tƣợng ta chỉ cần tìm ra một hƣớng chiếu
sáng. Trƣờng hợp nguồn sáng cục bộ thì khó hơn nhiều. Vì nguồn sáng ở gần đối
tƣợng nên hƣớng chiếu sáng từ nguồn sáng đến các điểm trên đối tƣợng sẽ khác
nhau và đồng quy tại một điểm. Điểm đó chính là vị trí của nguồn sáng.
Ánh sáng có một đặc tính tuyệt vời là cộng tuyến. Do vậy, trong trƣờng
hợp nhiều nguồn sáng, hƣớng nguồn sáng đƣợc xác định bằng cách cộng các
hƣớng nguồn sáng thành phần và xem nhƣ chỉ có một nguồn sáng (ảo) chiếu
vào đối tƣợng.
2.1.2 Các phƣơng pháp ƣớc lƣợng hƣớng nguồn sáng
Thuật toán ƣớc lƣợng hƣớng nguồn sáng không thể áp dụng chung cho
mọi loại nguồn sáng mà mỗi loại có một cách ƣớc lƣợng riêng. Trong phần
này, tơi trình bày các phƣơng pháp ƣớc lƣợng hƣớng chiếu sáng của nguồn
sáng xa, nguồn sáng cục bộ và nhiều nguồn sáng để sử dụng cho việc phát hiện
ảnh giả mạo [11].
2.1.2.1 Nguồn sáng xa (3-D)
Các cách tiếp cận chuẩn cho việc ƣớc lƣợng hƣớng nguồn sáng bắt đầu
bằng một số giả định đơn giản sau:
(1) Bề mặt đối tƣợng là bề mặt Lambertian (bề mặt phản chiếu ánh sáng
bằng nhau theo mọi hƣớng);
(2) Bề mặt đối tƣợng có hệ số phản chiếu khơng thay đổi;
19
(3) Bề mặt đối tƣợng đƣợc chiếu sáng bằng một nguồn sáng điểm vơ cùng xa;
(4) Góc giữa pháp tuyến bề mặt và hƣớng ánh sáng nằm trong khoảng 0 0
đến 900.
Với các giả định này, cƣờng độ ảnh đƣợc biểu diễn nhƣ sau:
I ( x, y) R( N ( x, y).L) A
(2.1)
Trong đó R là giá trị hệ số phản chiếu cố định của bề mặt, L là véctơ 3
chiều chỉ hƣớng chiếu của nguồn sáng, N ( x, y) là véctơ 3 chiều chỉ pháp tuyến
của bề mặt tại điểm (x,y), và A là hệ số phản chiếu của mơi trƣờng, hình 2.1(a).
Nếu chúng ta chỉ quan tâm đến hƣớng của nguồn sáng thì hệ số phản chiếu, R,
có thể xem là hằng số. Từ ảnh ta có thể tính đƣợc I(x,y) và N ( x, y) còn L và A
là các ẩn mà chúng ta phải tìm.
Với ít nhất 4 điểm có hệ số phản chiếu giống nhau, R, và các pháp tuyến
của bề mặt cụ thể, N , hƣớng nguồn sáng và hệ số ánh sáng nền A có thể đƣợc
tính bằng phƣơng pháp ƣớc lƣợng bình phƣơng tối thiểu chuẩn. Trƣớc hết xét
hàm sai số có dạng nhƣ sau:
L I (x , y )
x 1 1
L I (x , y )
E ( L, A) M y 2 2
L ...
z I (x , y )
A
p p
2
2
(2.2)
M v b
Trong đó Lx, Ly, và Lz là các thành phần của hƣớng nguồn sáng L , và
N x ( x1 , y1 ) N y ( x1 , y1 ) N z ( x1 , y1 ) 1
N x ( x2 , y2 ) N y ( x2 , y2 ) N z ( x2 , y2 ) 1
M
N x ( x p , y p ) N y ( x p , y p ) N z ( x p , y p ) 1
(2.3)
Với Nx(xi,yi), Ny(xi,yi), Nz(xi,yi) là các thành phần của pháp tuyến bề mặt N
tại tọa độ (xi, yi). Hàm lỗi trên đƣợc cực tiểu bằng việc lấy đạo hàm hàm sai số
trên theo v và thiết lập kết quả bằng khơng, ta có:
20
v (M T M )1M T b
(2.4)
2.1.2.2 Nguồn sáng xa (2-D)
Phần này trình bày một giải pháp thơng minh hơn để ƣớc lƣợng 2 thành
phần của hƣớng nguồn sáng (Lx và Ly) từ một ảnh đơn [12]. Cách tiếp cận này
cung cấp ít thơng tin về hƣớng nguồn sáng, làm cho vấn đề dễ kiểm soát hơn.
Tại các điểm trên đƣờng biên khuất, thành phần z của pháp tuyến bề mặt bằng 0,
tức Nz=0. Do vậy, ta chỉ ƣớc lƣợng 2 thành phần Lx, Ly của hƣớng nguồn sáng,
bỏ qua thành phần Lz. Khi đó, hàm lỗi (2.2) có dạng:
I (x , y )
L 1 1
x I (x , y )
E ( L, A) M L 2 2
y
A
I ( x , y )
p p
2
2
(2.5)
= M v b
Trong đó,
N (x , y ) N (x , y ) 1
y 1 1
x 1 1
N (x , y ) N (x , y ) 1
M x 2 2 y 2 2
N ( x , y ) N ( x , y ) 1
y p p
x p p
(2.6)
Nhƣ phần trƣớc, hàm lỗi này đƣợc cực tiểu hóa sử dụng bình phƣơng tối
thiểu chuẩn và cho kết quả giống nhƣ (2.4), nhƣng ma trận M có dạng nhƣ (2.6).
Trong trƣờng hợp này, giải pháp yêu cầu biết các pháp tuyến bề mặt 2-D từ ít
nhất 3 điểm (p ≥ 3) trên một bề mặt có cùng hệ số phản chiếu.
Cƣờng độ I(xi, yi) tại một điểm (xi, yi) trên đƣờng biên khuất không thể đo
trực tiếp từ ảnh. Tuy nhiên, thay vào đó ta sẽ lấy cƣờng độ sáng tại các điểm ở
gần đƣờng biên khuất.
Để tính véctơ pháp tuyến tại (x,y) trên biên khuất ta lấy hai điểm A, B trên
biên khuất gần với (x,y) nhất, từ đó tính véctơ pháp tuyến của AB và có thể lấy
đó là véctơ pháp tuyến N ( x, y) .
21
Làm giảm giả định hệ số phản chiếu cố định
Trong phần trên ta giả sử hệ số phản chiếu trên toàn bộ bề mặt của đối
tƣợng là giống nhau. Ta sẽ làm giảm giả định này bằng việc giả sử rằng hệ số
phản chiếu trên mỗi phần của bề mặt là cố định. Việc này đòi hỏi chúng ta đánh
i
giá các hƣớng nguồn sáng riêng biệt, L , cho mỗi phần dọc theo bề mặt. Trong
trƣờng hợp nguồn sáng xa, hƣớng của các véctơ này sẽ không thay đổi, nhƣng
độ lớn của chúng thì có thể khác nhau do nó phụ thuộc vào R.
Hình 2.1. Minh họa các loại nguồn sáng (a) nguồn sáng xa (3-D); (b) nguồn sáng xa (2-D); và
(c) nguồn sáng cục bộ (2-D).
Xét một bề mặt đƣợc chia thành n phần, và giả sử mỗi phần có p điểm. Khi
đó, hàm sai số là:
I ( x11 , y11 )
1
Lx
1
Ly
1
1
I (xp , y p )
1 n
E ( L ,..., L , A) M n
1
L
x I ( x1n , y1n )
Lny
A I ( xn , y n )
p
p
2
= M v b
Trong đó, ma trận M nhƣ sau:
2
(2.7)
22
N x ( x11 , y11 ) N y ( x11 , y11 )
0
0
N ( x1 , y1 ) N ( x1 , y1 )
0
0
y
p
p
x p p
M
0
0
N x ( x1n , y1n ) N y ( x1n , y1n )
0
0
N x ( x np , y np ) N y ( x np , y np )
1
1
1
1
(2.8)
Nhƣ phần trƣớc, hàm sai số trên đƣợc cực tiểu hóa sử dụng phƣơng pháp
bình phƣơng tối thiểu và cho kết quả nhƣ (2.4). Trong trƣờng hợp này, giải pháp
1
n
cho ra n ƣớc lƣợng về các hƣớng ánh sáng 2-D, L ,..., L , và một hệ số ánh sáng
nền A.
Mặc dù các ƣớc lƣợng cục bộ này cho phép chúng ta giảm nhẹ giả định hệ
số phản xạ bất biến, nhƣng có khả năng cho kết quả ít ổn định hơn. Lƣu ý rằng
đối với nguồn sáng điểm xa, hƣớng của n véctơ này phải giống nhau, chúng chỉ
khác nhau về độ lớn. Với giả định thêm vào rằng sự khác nhau giữa hai hệ số
phản chiếu của hai phần gần nhau là rất nhỏ, chúng ta có thêm một hàm sai số
dạng toàn phƣơng khác:
1
n
n
i i 1
E2 ( L ,..., L ) L L
2
(2.9)
i 2
Phần sai số thêm vào này cản trở các ƣớc lƣợng lân cận khác xa với ƣớc
lƣợng khác. Hàm sai số trong trƣờng hợp này sẽ là sự kết hợp của (2.7) và (2.9)
thông qua một trọng số nhƣ sau:
1
n
1
n
1
n
E( L ,..., L , A) E1 ( L ,..., L , A) E2 ( L ,..., L )
(2.10)
Hàm sai số trên vẫn có thể đƣợc cực tiểu hóa sử dụng phƣơng pháp bình
phƣơng tối thiểu. Hàm lỗi E2(.) đƣợc viết lại dƣới dạng sau:
2
E2 (v) Cv ,
Trong đó, ma trận C kích thƣớc 2n-1 x 2n+1 có dạng:
(2.11)
23
-1
0
C
0
0
và
0 1 0 ... 0 0
-1 0 1 ... 0 0
0 0 0 ... -1 0
0 0 0 ... 0 -1
0 0 0
0 0 0
1 0 0
0 1 0
(2.12)
v (L1x L1y L2x L2y ... Lnx Lny A)T .
Lúc này, hàm sai số (2.10) có dạng:
2
2
E(v) M v b Cv
(2.13)
Lấy đạo hàm hàm sai số trên ta đƣợc kết quả nhƣ sau:
E (v) 2M M v 2M b 2CT Cv
2(M T M CT C )v 2M T b.
'
T
T
(2.14)
Thiết lập kết quả bằng 0 ta tính đƣợc:
v (M T M CT C) M T b,
(2.15)
Trong đó, dấu + là ký hiệu của giả nghịch đảo.
Cuối cùng véctơ chỉ hƣớng chiếu của nguồn sáng đƣợc lấy bằng trung bình
1
n
cộng của n véctơ đã ƣớc lƣợng đƣợc L ,..., L .
2.1.2.3 Nguồn sáng cục bộ (2-D)
Trong hai phần trên ta xét nguồn sáng L là nguồn sáng xa, tức là L không
phụ thuộc vào tọa độ điểm ảnh. Với một nguồn sáng ở gần, điều này khơng cịn
hợp lý, tức là hƣớng chiếu sáng phụ thuộc vào các điểm ảnh, hình 2.1(c). Mơ
hình cho một nguồn sáng xa, phƣơng trình (2.1), có thể đƣợc viết lại để thích
hợp với nguồn sáng cục bộ nhƣ sau:
I ( x, y) R( N ( x, y).L( x, y)) A
(2.16)
Lúc này hƣớng của nguồn sáng là một hàm các tọa độ ảnh.
Chúng ta bắt đầu bằng việc thừa nhận hƣớng chiếu của nguồn sáng lên mỗi
phần của bề mặt cục bộ là không đổi và đƣợc ƣớc lƣợng sử dụng phƣơng trình
(2.7). Trong phần trƣớc, phƣơng trình (2.9) khuyến khích các ƣớc lƣợng lân cận
24
bằng nhau. Trong trƣờng hợp nguồn sáng cục bộ, chúng ta mong muốn hƣớng
của các véctơ ƣớc lƣợng đƣợc sẽ hội tụ đến một điểm đơn ở gần. Một công thức
tƣơng tự nhƣ (2.9) đƣợc đƣa ra để thực hiện điều này:
1
n
i 2
n
E2 ( L ,..., L ) Ci L
i 1
,
(2.17)
Trong đó, ma trận Ci đƣợc xác định nhƣ sau:
Xét các ƣớc lƣợng hƣớng chiếu sáng của nguồn sáng cục bộ trên một cặp
đối tƣợng (hoặc một cặp đƣờng biên trên một đối tƣợng hay một cặp các phần
cục bộ của một đƣờng biên) đƣợc ƣớc lƣợng bằng việc cực tiểu hóa hàm lỗi bình
phƣơng nhƣ phƣơng trình (2.7). Ký hiệu các ƣớc lƣợng này là L1 và L 2 , và ký
hiệu c1 và c 2 là điểm ảnh trung tâm dọc theo mỗi đƣờng biên của mỗi đối
tƣợng. Giả sử rằng các ƣớc lƣợng này không song song với nhau, khi đó điểm
giao nhau của chúng đƣợc xác định bằng phƣơng trình:
c1 1 L1 c2 2 L2
(2.18)
Với 1 và 2 là các giá trị vô hƣớng. Điểm giao nhau này là vị trí nguồn
sáng cục bộ và nằm trên véctơ L c1 1 L1 .
Bây giờ, xét tập hợp các ƣớc lƣợng riêng lẻ dọc theo mỗi phần của một
1
n
đƣờng biên khuất, L ,..., L . Với nguồn sáng cục bộ đơn, mỗi ƣớc lƣợng sẽ có
hƣớng là L ci , trong đó ci là điểm ảnh trung tâm của phần thứ i. Vì vậy, số
i
hạng chính quy hóa phạt mỗi ƣớc lƣợng L tƣơng ứng với độ lệch của nó so với
hƣớng này. Cụ thể, hình phạt tƣơng ứng với độ chênh lệch giữa ƣớc lƣợng ban
i
đầu L và phép chiếu của ƣớc lƣợng này lên L ci :
i
T i
R i L i ( i L )
T i
( I i i ) L
(2.19)
i
Ci L ,
Trong đó, I là ma trận đơn vị và
i
L ci
L ci
(2.20)