ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM THỊ CÚC
PHÁT HIỆN ẢNH GIẢ MẠO
DỰA TRÊN MẪU NHIỄU CẢM BIẾN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Hà Nội - Năm 2014
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
PHẠM THỊ CÚC
PHÁT HIỆN ẢNH GIẢ MẠO
DỰA TRÊN MẪU NHIỄU CẢM BIẾN
Ngành
: Công nghệ thông tin
Chuyên ngành : Hệ thống thông tin
Mã số
: 60480104
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS. ĐỖ NĂNG TOÀN
Hà Nội - Năm 2014
1
LỜI CẢM ƠN
Trước tiên, tôi xin gửi lời cảm ơn Thầy PGS.TS. Đỗ Năng Toàn là người
đã định hướng nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình
làm luận văn. Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn
thành luận văn này.
Đồng thời tôi cũng xin chân thành cảm ơn các thầy cô Khoa Công nghệ
thông tin – Trường Đại học Công nghệ đã tận tình giảng dạy và cung cấp cho
tôi những kiến thức cần thiết trong suốt thời gian học tập tại trường.
Cuối cùng xin gửi lời cảm ơn chân thành đến gia đình, cơ quan, bạn bè và
đồng nghiệp đã tạo điều kiện, giúp đỡ và động viên tôi trong suốt thời gian học
tập cũng như trong thời gian nghiên cứu luận văn.
Tuy có nhiều cố gắng nhưng do thời gian và kiến thức của bản thân còn
nhiều hạn chế nên trong luận văn không tránh khỏi những thiếu sót. Kính mong
nhận được sự góp ý của thầy cô và các bạn để luận văn được hoàn thiện hơn.
Tôi xin chân thành cảm ơn !
Phạm Thị Cúc
2
LỜI CAM ĐOAN
Tôi xin cam đoan: Bản luận văn tốt nghiệp này là kết quả nghiên cứu
thực sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, cài đặt
thực nghiệm chương trình. Kết quả của luận văn là cả một quá trình nghiên
cứu nghiêm túc các kiến thức được học ở trường và dưới sự hướng dẫn khoa
học của PGS.TS Đỗ Năng Toàn.
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được trích
dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình nghiên
cứu đã được công bố, các website,…. Dữ liệu để thực nghiệm có nguồn gốc rõ
ràng và không mang tính chất thương mại.
Học viên
Phạm Thị Cúc
3
MỤC LỤC
LỜI CẢM ƠN ...................................................................................................................................................1
LỜI CAM ĐOAN.............................................................................................................................................2
DANH MỤC CÁC HÌNH .............................................................................................................................5
DANH MỤC CÁC TỪ VIẾT TẮT............................................................................................................6
LỜI NÓI ĐẦU...................................................................................................................................................7
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO ............................................9
1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh ........................................................ 9
1.1.1. Một số khái niệm cơ bản .......................................................................................... 9
1.1.2. Một số vấn đề cơ bản trong xử lý ảnh .................................................................... 10
1.1.3. Các giai đoạn trong xử lý ảnh ................................................................................. 15
1.1.3.1. Thu nhận ảnh ................................................................................................... 15
1.1.3.2. Tiền xử lý......................................................................................................... 15
1.1.3.3. Phân đoạn ảnh .................................................................................................. 16
1.1.3.4. Biểu diễn và mô tả ........................................................................................... 17
1.1.3.5. Cơ sở trí thức ................................................................................................... 17
1.1.3.6. Nhận dạng và nội suy ảnh................................................................................ 18
1.1.3.7. Trích chọn đặc trưng........................................................................................ 18
1.2. Ảnh giả mạo và các dạng giả mạo ảnh cơ bản .............................................................. 20
1.2.1. Ảnh giả mạo ........................................................................................................... 20
1.2.2. Các loại ảnh giả mạo cơ bản ................................................................................... 22
1.2.2.1. Ghép ảnh .......................................................................................................... 22
1.2.2.2. Tăng cường ảnh ............................................................................................... 22
1.2.2.3. Sao chép và dịch chuyển vùng trên ảnh .......................................................... 23
CHƢƠNG 2: CÁC KỸ THUẬT PHÁT HIỆN ẢNH SỐ GIẢ MẠO.........................................25
2.1. Dựa trên đặc trưng điểm ảnh (Pixel Based)................................................................... 25
2.1.1. Nhân bản (Cloning) ................................................................................................ 25
2.1.2. Lấy mẫu lại (Re-sampling) ..................................................................................... 26
2.1.3. Ghép (Splicing) ...................................................................................................... 26
2.2. Dựa trên định dạng ảnh (Format Based) ....................................................................... 27
2.2.1. Lượng tử hóa JPEG (JPEG quantization) ............................................................... 27
2.2.2. Phần đầu ảnh JPEG (JPEG Header) ...................................................................... 28
2.2.3. Nén kép (Double JPEG) ......................................................................................... 30
2.2.4. Hiệu ứng khối JPEG (JPEG Blocking)................................................................... 30
2.3. Dựa trên đặc điểm máy ảnh (Máy ảnh-Based) .............................................................. 31
2.3.1. Quang sai màu (Chromatic Aberration) ................................................................. 31
2.3.2. Mảng lọc màu (Color Filter Array) ........................................................................ 33
2.3.3. Đáp ứng của máy ảnh (Máy ảnh Response) .......................................................... 33
2.3.4. Mẫu nhiễu cảm biến (Sensor Pattern Noise) .......................................................... 34
2.4. Một số phương pháp trực quan khác ............................................................................. 34
2.4. 1. Nguồn sáng ............................................................................................................ 35
2.4.2. Hướng mắt nhìn và vị trí ........................................................................................ 36
2.4.3. Hình học ................................................................................................................. 36
4
CHƢƠNG 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA VÀO MẪU NHIỄU CẢM BIẾN .........37
3.1. Giới thiệu ....................................................................................................................... 37
3.2. Mẫu nhiễu và các phương thức biểu diễn ...................................................................... 38
3.2.1. Xử lý tín hiệu trong máy ảnh kỹ thuật số ............................................................... 38
3.2.2. Mẫu nhiễu cảm biến ............................................................................................... 39
3.2.3. Dò tìm mẫu nhiễu ................................................................................................... 41
3.3. Thuật toán phát hiện ảnh giả mạo dựa vào mẫu nhiễu cảm biến ................................... 43
3.3.1. Tạo các mẫu tham chiếu của máy ảnh .................................................................... 43
3.3.2. Thuật toán nhận dạng ảnh giả ................................................................................. 45
3.4. Chương trình thực nghiệm ............................................................................................. 47
3.4.1. Bài toán ................................................................................................................... 47
3.4.2. Công cụ và dữ liệu thử nghiệm .............................................................................. 47
3.4.3. Kết quả thử nghiệm ............................................................................................... 48
KẾT LUẬN ......................................................................................................................................................52
TÀI LIỆU THAM KHẢO ..........................................................................................................................53
5
DANH MỤC CÁC HÌNH
Hình 1.1. Quá trình xử lý ảnh ................................................................................................... 10
Hình 1.2. Biểu diễn ảnh bằng hàm f ( X , Y ) ............................................................................ 10
Hình 1.3. Ảnh thu nhận và ảnh mong muốn ............................................................................. 12
Hình 1.4. Các bước cơ bản trong xử lý ảnh số ......................................................................... 15
Hình 1.5. Các thành phần cơ bản của một hệ xử lý ảnh ........................................................... 19
Hình 1.6. Minh họa về việc giả mạo ảnh .................................................................................. 20
Hình 1.7. Ảnh giả của John Kerry và Jane Fonda được cắt ghép từ hai ảnh riêng lẻ............... 21
Hình 1.8. Ghép ảnh từ hai ảnh riêng rẽ .................................................................................... 22
Hình 1.9. Ví dụ về tăng cường ảnh ........................................................................................... 23
Hình 1.10. Ảnh che phủ và bỏ đi đối tượng ............................................................................ 24
Hình 1.11. Ảnh bổ sung đối tượng .......................................................................................... 24
Hình 2.1. Mô phỏng sử dụng quang sai để phát hiện ảnh giả .................................................. 32
Hình 2.2. Mô phỏng hướng nguồn sáng tới bề mặt một quả cầu ............................................. 35
Hình 2.3. Mô phỏng việc phân tích nguồn sáng để phát hiện ảnh giả ...................................... 35
Hình 3.1. Quy trình xử lý tín hiệu của máy ảnh kỹ thuật số..................................................... 38
Hình 3.2. Mô hình mẫu nhiễu ................................................................................................... 39
Hình 3.3. Minh họa vùng R được chọn và mẫu nhiễu tham chiếu tương ứng của nó.............. 42
Hình 3.4. Hình ảnh minh họa chọn các vùng Qi và mẫu tham chiếu ................................. 42
Hình 3.5. Mô hình tạo mẫu tham chiếu của máy ảnh ............................................................... 44
Hình 3.6. Sơ đồ bài toán phát hiện ảnh giả mạo ....................................................................... 47
Hình 3.7. Ảnh giả mạo bằng cách cắt ghép và lấy mẫu lại. ..................................................... 49
Hình 3.8. Các hình gốc dùng để tạo ảnh giả ............................................................................. 49
Hình 3.9. Minh họa kết quả chương trình với ảnh giả mạo định dạng TIFF............................ 50
Hình 3.10. Minh họa kết quả chương trình với ảnh giả mạo dạng nén JPEG .......................... 50
Hình 3.11.Minh họa kết quả chương trình với ảnh giả cắt/ghép từ hai ảnh được chụp bởi cùng
loại máy ảnh. ............................................................................................................................ 51
6
DANH MỤC CÁC TỪ VIẾT TẮT
Viết tắt
Đầy đủ - mô tả
BAM
Blocking Artifact Matrix - Ma trận các khối dấu hiệu
CFA
Color Filter Array - Mảng lọc màu sắc
DCT
Discrete Cosine Transform - Dãy biến đổi cosine rời rạc
ELA
Error Level Analysis - Phân tích mức độ lỗi
EM
Expectation Maximization - Thuật toán kỳ vọng cực đại
EXIF
Exchange able Image Tệp format -Tiêu chuẩn xác định định dạng ảnh
FPN
Fixed Pattern Noise - Mẫu nhiễu có cấu trúc
JPEG
Joint Photographic Experts Group - Là một phương pháp nén ảnh
hiệu quả
MAP
Maximum A Posteriori Estimation - Ước lượng hậu cực đại
PCA
Principal Component Analysis - Phân tích thành phần chính
PNG
Portable Network Graphics-Là một định dạng của ảnh
PNU
Pixel Non-Uniformity - Điểm ảnh không đồng nhất
PRNU
TIFF
Photo-response non-uniformity noise - Ảnh hưởng không đồng nhất
của nhiễu tới điểm ảnh
Tag Image File Format –Là một định dạng của ảnh
7
LỜI NÓI ĐẦU
Ngày nay, ảnh số là phương tiện truyền thông được sử dụng phổ biến và
rộng rãi, nó chứa đựng nhiều thông tin, cũng là cách để biểu diễn thế giới xung
quanh ta một cách dễ dàng và cô đọng.
Một câu hỏi đặt ra là ảnh này có độ tin cậy bao nhiêu? Rõ ràng, thông tin
hình ảnh có tác động quan trọng đến xã hội chúng ta, chúng đóng vai trò cốt yếu
trong đời sống con người.
Việc xác thực ảnh là bài toán quan trọng trong nhiều lĩnh vực xã hội, chẳng
hạn trong phòng xử án, tính thật của một bức ảnh đóng vai trò cốt yếu vì nó
chính là một bằng chứng. Mặt khác, hằng ngày các bài báo hay tạp chí đều chứa
nhiều hình ảnh, trong vật lý và y học thì có nhiều quyết định đều phải dựa vào
các ảnh số,…
Hơn nữa, hiện nay do sự tiến bộ của các máy tính hiệu năng cao, giá thành
thấp, giao diện người máy thân thiện hơn, cũng như các phần mềm điều khiển và
thao tác trên ảnh số là khá mạnh và đơn giản. Sức mạnh của các chương trình xử
lý ảnh số như PhotoShop giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh
khác nhau trở nên dễ dàng.
Điều đó, đồng nghĩa với việc phát hiện ảnh giả mạo là bài toán khó khăn và
ngày càng trở nên cấp thiết hơn.
Từ yêu cầu thực tế đó, tôi lựa chọn đề tài “Phát hiện ảnh giả mạo dựa trên
mẫu nhiễu cảm biến” nhằm nghiên cứu kỹ thuật phát hiện ảnh kỹ thuật số giả
mạo dựa trên cơ sở dò tìm các mẫu nhiễu tạo ra bởi máy ảnh.
Bố cục của luận văn được trình bày như sau:
Phần mở đầu
Chƣơng 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề cập
đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh. Khái quát một
số phương pháp giả mạo ảnh số thường gặp, để từ đó giúp người đọc có cái
nhìn tổng quan về lĩnh vực ảnh số giả mạo.
Chƣơng 2: Các kỹ thuật phát hiện ảnh số giả mạo: Chương này trình
bày các kỹ thuật phát hiện ảnh giả mạo đã được các nhóm nghiên cứu và giới
thiệu.
Chƣơng 3: Phát hiện ảnh giả mạo dựa trên mẫu nhiễu cảm biến:
Chương này nghiên cứu về mẫu nhiễu cảm biến của máy ảnh, từ đó đưa ra
8
phương pháp phát hiện ảnh giả mạo dựa vào mẫu nhiễu cảm biến bao gồm ý tưởng,
thuật toán và chương trình thử nghiệm.
Phần kết luận
53
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Phạm Việt Bình, Đỗ Năng Toàn (2007), Giáo trình xử lý ảnh, Khoa Công
nghệ thông tin - Đại học Thái Nguyên.
2. Đỗ Năng Toàn, Hà Xuân Trường (2008), “Tiếp cận phát hiện ảnh giả mạo
dựa trên mẫu nhiễu cảm biến”. Kỷ yếu Hội Thảo Quốc gia về “Các vấn đề chọn
lọc của CNTT”, Đại Lải 14-15/09/2007, tr566-577.
3. Nguyễn Thị Hồng Xiêm (2008), Tìm hiểu một số phương pháp dò tìm,
phát hiện sự giả mạo trong ảnh số, Đề tài khoa học, Trường Đại học Sư phạm
Hà Nội.
Tiếng Anh
4. Hany Farid (2009), “A survey of image forgery detection”, IEEE Signal
Processing Magazine, vol. 2, no. 26, pp. 16–25, Mar.
5. Jan Lukáš, Jessica Fridrich, and Miroslav Goljan: “Digital camera
Identification from Sensor Pattern Noise”, submitted to IEEE Transactions on
Information Forensics and Security,2005.
6. Jan Lukáš, Jessica Fridrich, and Miroslav Goljan.: “Detecting Digital
Image Forgeries Using Sensor Pattern Noise”. Department of Electrical and
Computer Engineering SUNY Binghamton, Binghamton, NY 13902-6000.
7. Jessica Fridrich, David Soukal, and Jan Lukáš: “Detection of Copy-Move
Forgery in Digital Images”, Proc. Digital ForensicResearch Workshop,
Cleveland, OH, August 2003.
8. Johnson M.K. and Farid H.: “Exposing Digital Forgeries by Detecting
Inconsistencies in Lighting”, Proc. ACM Multimedia and Security Workshop,
New York, pp. 1–9, 2005.
9. Ng T.-T. and Chang S.-H.: “Blind Detection of Digital Photomontages
using Higher Order Statistics”, ADVENT. Technical Report #201-2004-1,
Columbia University, June 2004.
10. Popescu A.C. and Farid H.: “Exposing Digital Forgeries by Detecting
Traces of Resampling”, IEEE Transactions on Signal Processing, vol. 53(2),
pp. 758–767, 2005.
54
11. Popescu A.C. and Farid H.: “Exposing Digital Forgeries in Color Filter
Array Interpolated Images”, IEEE Transactions on Signal Processing, vol.
53(10), pp. 3948–3959, 2005.
12. Popescu A.C. and Farid, H.: “Exposing Digital Forgeries by Detecting
Duplicated Image Regions”, Technical Report, TR2004-515, Dartmouth
College, Computer Science 2004.