Tải bản đầy đủ (.pdf) (92 trang)

Nâng cao chất lượng giấu tin trên ảnh số JPEG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.77 MB, 92 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

ĐÀO MINH TUẤN

NÂNG CAO CHẤT LƯỢNG GIẤU TIN TRÊN ẢNH SỐ JPEG
Chuyên ngành : Công nghệ thông tin

LUẬN VĂN THẠC SĨ KỸ THUẬT
CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS.

NGUYỄN HẢI THANH

Hà Nội 10 - 2014


LỜI CAM ĐOAN
Trước khi đi vào nội dung bản luận văn thạc sĩ của mình, tôi xin cam đoan
luận văn này do chính tôi viết, dựa trên những kiến thức, hiểu biết của bản thân, sự
chỉ dẫn của thầy hướng dẫn và những thông tin mà tôi tìm hiểu, tham khảo được
qua các tài liệu liên quan. Các kết quả được viết chung với các tác giả khác đều
được sự đồng ý của đồng tác giả trước khi đưa vào luận văn. Các kết quả nêu trong
luận văn là trung thực và chưa từng được ai công bố trong các công trình nào khác.

Học viên
Đào Minh Tuấn

Học viên: Đào Minh Tuấn



Trang 2


LỜI CẢM ƠN
Tôi rất mừng vì sau một thời gian cố gắng tập trung nghiên cứu thì
luận văn thạc sĩ của tôi đã hoàn thành. Kết quả đạt được ngoài sự nỗ lực của
bản thân, còn có sự hỗ trợ và giúp đỡ của các thầy cô, gia đình và bạn bè.
Tôi xin gửi lời cảm ơn chân thành đến các thầy cô của Viện Toán Ứng dụng và Tin học, Viện Công nghệ thông tin và Truyền thông - Trường
Đại học Bách khoa Hà Nội, Vụ Khoa học Công nghệ và Môi trường – Bộ
Giáo dục và Đào tạo, đã tạo điều kiện và truyền đạt cho tôi những kiến thức
vô cùng hữu ích.
Đặc biệt, Tôi xin bày tỏ lòng biết ơn sâu sắc đến PGS.TS Phan Trung
Huy. Ngay cả khi lâm bệnh hiểm nghèo, nằm trên giường bệnh, Thầy vẫn tận
tình truyền đạt những kiến thức quý báu và tài liệu cần thiết để tôi thực hiện
luận văn. Thầy đã ra đi, nhưng trái tim đầy nhiệt huyết với các thế hệ học trò,
tấm lòng đức độ của Thầy, chúng tôi mãi mãi không quên và sẽ phát huy
những kiến thức, tâm nguyện mà Thầy đã truyền đạt.
Tôi xin cảm ơn TS. Nguyễn Hải Thanh. Khi tôi đang hoang mang với
đề tài luận văn dang dở của mình, Thầy đã nhận và hết mình hướng dẫn tôi
hoàn thành. Ngoài ra, Thầy cũng động viên và giúp đỡ tôi rất nhiều trong
những lần gặp khó khăn trong quá trình làm luận văn.
Tôi xin gửi lời cảm ơn chân thành đến các thầy phản biện và các thầy
trong hội đồng đã trao đổi và góp nhiều chỉ dẫn quý báu, giúp cho luận văn
được trình bày tốt hơn.
Cuối cùng tôi xin gửi lời cảm ơn đến gia đình, người thân và bạn bè
đã làm chỗ dựa vững chắc, động viên giúp đỡ rất nhiều về tinh thần, thời gian
để tôi có thể hoàn thành luận văn này.

Học viên: Đào Minh Tuấn


Trang 3


MỤC LỤC

LỜI CAM ĐOAN .......................................................................................... 2
LỜI CẢM ƠN ................................................................................................ 3
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ...................................................... 7
DANH MỤC CÁC BẢNG SỐ LIỆU ............................................................. 8
DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT...................................... 9
MỞ ĐẦU ..................................................................................................... 10
1) Lý do chọn đề tài .................................................................................. 10
2) Lịch sử nghiên cứu................................................................................ 11
3) Mục đích nghiên cứu............................................................................. 12
4) Nội dung nghiên cứu............................................................................. 14
5) Các đóng góp mới của đề tài ................................................................. 15
6) Phương pháp nghiên cứu....................................................................... 15
CHƯƠNG 1. TỔNG QUAN VỀ GIẤU TIN, CÁC KỸ THUẬT GIẤU TIN
VÀ THÁM TIN TRONG ẢNH SỐ JPEG.................................................... 17
1.1. Khái niệm và phân loại....................................................................... 17
1.2. Giấu tin trong ảnh số .......................................................................... 18
1.3. Ứng dụng cơ bản của giấu tin ............................................................. 20
1.4. Các định dạng ảnh số cơ bản .............................................................. 21
1.4.1. Định dạng ảnh Bitmap.................................................................. 21
1.4.2. Định dạng ảnh nén JPEG.............................................................. 22
1.5. Các yếu tố ảnh hưởng đến quá trình giấu tin:...................................... 25
1.5.1. Sự thay đổi trên đối tượng chứa là tối thiểu:................................. 25
1.5.2. Tính bền vững:.............................................................................. 26
1.5.3. Số lượng dữ liệu nhúng: ............................................................... 26

1.5.4. Tính ẩn (Sự vô hình): ................................................................... 27
1.5.5. Tính bảo mật ................................................................................ 28
1.5.6. Độ phức tạp tính toán................................................................... 28
Học viên: Đào Minh Tuấn

Trang 4


1.6. Giấu tin trên ảnh nhị phân .................................................................. 28
1.6.1. Phương pháp Wu-Lee trên ảnh nhị phân....................................... 28
1.6.2. Phương pháp CPT trên ảnh nhị phân ............................................ 30
1.7. Đánh giá chất lượng ảnh sau khi giấu tin ............................................ 33
1.8. Các phương pháp phát hiện ảnh có giấu tin ........................................ 34
1.8.1. Phân tích trực quan (Visual Attack).............................................. 35
1.8.2. Phân tích định dạng ảnh................................................................ 38
1.8.3. Phân tích thống kê ........................................................................ 38
1.9. Các lược đồ giấu tin trong ảnh JPEG và các phương pháp phát hiện .. 41
1.9.1. Lược đồ giấu tin Jsteg .................................................................. 41
1.9.2. Lược đồ giấu tin JPHide ............................................................... 45
1.9.3. Lược đồ giấu tin OutGuess........................................................... 47
1.9.4. Lược đồ giấu tin F5 ...................................................................... 48
1.10. Nguồn dữ liệu ảnh thực nghiệm........................................................ 51
1.11. Kết luận............................................................................................ 51
CHƯƠNG 2. GIẤU TIN TRONG ẢNH SỐ JPEG SỬ DỤNG PHƯƠNG
PHÁP MÔĐUN ........................................................................................... 52
2.1. Một số khái niệm................................................................................ 52
2.2. Giấu tin sử dụng phương pháp Môđun ............................................... 55
2.2.1. Giấu tin theo phương pháp môđun sử dụng tập 1 – cơ sở ............. 56
2.2.2. Giấu tin theo phương pháp môđun sử dụng tập 2 – cơ sở ............. 57
2.2.3. Sơ đồ giấu tin sử dụng phương pháp môđun trên vành Z2............. 57

2.3. Thực nghiệm về khả năng phát hiện giấu tin của Stegdetect............... 59
2.3.1. Thuật toán giấu tin JSTEG -thưa .................................................. 60
2.3.2. Khả năng phát hiện ảnh có giấu tin của Stegdetect ....................... 60
2.4. Tỉ lệ thay đổi lý tưởng ........................................................................ 63
2.5. Phương pháp đề xuất .......................................................................... 63
2.5.1. Thuật toán nhúng B1 .................................................................... 64
Học viên: Đào Minh Tuấn

Trang 5


2.5.2. Thuật toán trích xuất B2 ............................................................... 65
2.6. Giấu tin theo thứ tự các block của ảnh JPEG ...................................... 65
2.6.1. Giai đoạn giấu tin ......................................................................... 65
2.6.2. Giai đoạn trích xuất tin ................................................................. 65
2.7. Kết luận.............................................................................................. 66
CHƯƠNG 3. CHƯƠNG TRÌNH THỬ NGHIỆM........................................ 67
3.1. Môi trường thử nghiệm ...................................................................... 67
3.2. Kết quả thử nghiệm ............................................................................ 67
3.2.1. Khả năng chống lại công cụ kiểm tra............................................ 67
3.2.2. Chất lượng ảnh sau khi giấu ......................................................... 70
3.2.3. Tỉ lệ giấu tin ................................................................................. 73
3.2.4. So sánh với Thuật toán F5 ............................................................ 74
3.3. Hiệu năng của lược đồ Module(2,18,7) .............................................. 76
3.4. Kết hợp mã hóa với giấu tin ............................................................... 76
3.4.1. Mã đối xứng và phi đối xứng........................................................ 76
3.4.2. Thám mã (Cryptanalyis)............................................................... 77
3.4.3. Phương pháp mã hóa dùng ngôn ngữ nhập nhằng......................... 78
3.4.4. Hệ mã hóa sử dụng ngôn ngữ đa trị nhập nhằng ........................... 78
3.4.5. Lược đồ kết hợp mã hóa và giấu tin.............................................. 81

3.5. Kết luận.............................................................................................. 82
KẾT LUẬN.................................................................................................. 84
TÀI LIỆU THAM KHẢO ............................................................................ 86
DANH MỤC CÔNG TRÌNH CỦA TÁC GIẢ ............................................. 87
PHỤ LỤC .................................................................................................... 88
GIỚI THIỆU VỀ PHẦN MỀM GIẤU TIN THEO LƯỢC ĐỒ
MODULE(2,18,7) KẾT HỢP VỚI HỆ MÃ ĐA TRỊ NHẬP NHẰNG MAS 88

Học viên: Đào Minh Tuấn

Trang 6


DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ
TT Tên hình ảnh, đồ thị, bảng số liệu

Trang

1

Hình 1.1: Phân loại các kỹ thuật giấu tin

17

2

Hình 1.2: Sơ đồ quá trình giấu tin trong ảnh

19


3

Hình 1.3: Sơ đồ quá trình tách tin trong ảnh

19

4

Hình 1.4: Quá trình nén ảnh JPEG

22

5

Hình 1.5: Ảnh RGB

22

6

Hình 1.6: Matrix zig-zag

25

7

Hình 1.7: Quá trình giải nén ảnh JPEG

25


8

Hình 1.8: Biểu đồ liên hệ giữa số lượng dữ liệu nhúng và tính bền
vững

27

9

Hình 1.9: Lược đồ chung cho quá trình thám tin

34

10

Hình 1.10: Nhúng thông tin ẩn gây ra biến đổi lược đồ hệ số DCT

39

11

Hình 1.11: Xác suất nhúng được tính cho các vùng trên ảnh.

40

12

Hình 1.12: Sơ đồ lật bít LSB trên các hệ số DCT của thuật toán JSteg

42


13

Hình 1.13: Original

43

14

Hình 1.14: Graph Original

44

15

Hình 1.15: Stego 50%

44

16

Hình 1.16: Stego 100%

45

17

Hình 1.17: Ảnh hưởng của nhúng bằng F5 tới histogram của hệ số
DCT


50

18

Hình 1.18: Ảnh hưởng của 2 lần nén tới histogram của hệ số DCT

51

19

Hình 2.1: Tỉ lệ phát hiện có giấu tin với tham số Quantizer Quality=20

61

20

Hình 2.2: Tỉ lệ phát hiện có giấu tin với tham số Quantizer Quality=40

61

Học viên: Đào Minh Tuấn

Trang 7


21

Hình 2.3: Tỉ lệ phát hiện có giấu tin với tham số Quantizer Quality=60

62


22

Hình 2.4: Tỉ lệ phát hiện có giấu tin với tham số Quantizer Quality=80

62

23

Hình 2.5: Thứ tự ma trận S trong block

64

24

Hình 3.1: So sánh chất lượng ảnh sau giấu của các thuật toán

71

25

Hình 3.2: So sánh tỉ lệ giấu tin của các thuật toán

73

26

Hình 3.3: So sánh tổng thời gian mã hóa của MAS với DES và AES

79


27

Hình 3.4: So sánh tổng thời gian giải mã của MAS với DES và AES

79

28

Hình 3.5: Quan hệ giữa kích thước dữ lệu vào và dữ liều ra của MAS,
DES và AES

80

29

Hình 3.6: Lược đồ kết hợp mã hóa và giấu tin

81

30

Hình 3.7: Lược đồ giấu tin MAS_Module(2,18,7).

82

DANH MỤC CÁC BẢNG SỐ LIỆU
TT Tên hình ảnh, đồ thị, bảng số liệu

Trang


1

Bảng 1.1: Visual Attack ảnh có hình khối đơn giản

36

2

Bảng 1.2: Visual Attack ảnh phức tạp

37

3

Bảng 1.3: Sự liên quan giữa mật độ thay đổi và tỉ lệ nhúng

49

4

Bảng 3.1: Tỉ lệ phát hiện ảnh có giấu tin của stegdetect

68

5

Bảng 3.2: So sánh chất lượng ảnh sau giấu PSNR

70


6

Bảng 3.3: So sánh chất lượng ảnh sau giấu của lược đồ module
(2,18,7)

72

7

Bảng 3.4: So sánh tỉ lệ giấu của Module(2,28,7) với Jsteg 1/9

74

8

Bảng 3.5: So sánh thuật toán F5 và Module(2,18,7)

75

Học viên: Đào Minh Tuấn

Trang 8


DANH MỤC KÝ HIỆU VÀ CÁC CHỮ VIẾT TẮT
STT Ký hiệu/chữ viết tắt

Ý nghĩa


1

|A|

Lực lượng của tập A

2

x

Giá trị phần nguyên dưới của x

3

CPT

Chen-Pan-Tseng

4

GIF

Graphics Interchange Format

5

JPEG

Joint Photographic Experts Group


6

LSB

Least significant bit (bit ít quan trọng nhất)

7

PSNR

Peak signal-to-noise ratio (tỷ lệ tín hiệu trên
nhiễu)

8

JFIF

JPEG File Interchange Format - Định dạng trao
đổi tệp JPEG

9

MAS

Multi-valued and Ambiguous Scheme

Học viên: Đào Minh Tuấn

Trang 9



MỞ ĐẦU
1) Lý do chọn đề tài
Công nghệ thông tin và truyền thông phát triển mạnh mẽ đã đem lại sự thay
đổi rất lớn trong đời sống con người trên toàn thế giới. Máy móc, thiết bị công nghệ
ngày càng đa dạng và hiện đại đem lại nhiều tiện ích cho người sử dụng. Đi kèm với
đó vấn đề bảo mật thông tin, chứng thực, vấn nạn bản quyền, truy cập trái
phép,…ngày càng khó kiểm soát.
Ngoài ra, trong một môi trường số hóa với những công nghệ số bùng nổ
như hiện nay, thì vấn đề giấu tin – thám tin trở thành một công cụ hữu ích cho một
số tổ chức trong việc trao đổi thông tin trong cộng đồng. Và thực tế là hiện nay, vấn
đề giấu tin – thám tin đã được quan tâm nghiên cứu, được triển khai ứng dụng rộng
rãi trong các cơ quan quân sự, ngoại giao, an ninh và giáo dục…
Kỹ thuật giấu tin được biết đến bởi hai lĩnh vực chủ yếu là Giấu tin mật
(Steganography) và Thủy vân (Watermaking). Thủy vân được sử dụng chủ yếu
trong lĩnh vực bảo vệ bản quyền sản phẩm số bằng cách đưa thông tin bản quyền
vào sản phẩm. Giấu tin mật là kỹ thuật giấu thông tin mật vào các dữ liệu truyền
thông (ảnh, văn bản, audio, video,…) để chuyển tải đến người nhận. Trong quá
trình truyền tải, ngoài người gửi và người nhận ra sẽ không ai biết đến sự tồn tại của
thông tin mật.
Môi trường giấu tin có thể là bất kỳ đối tượng dữ liệu đa phương tiện nào
nhưng phổ biến nhất là ảnh số. Độ an toàn của một thông tin được giấu trong những
phương tiện mang tin được đánh giá bằng khả năng phát hiện ra thông tin có được
giấu trong các phương tiện mang tin hay không. Chính vì vậy kỹ thuật phát hiện
giấu tin (thám tin) cũng được phát triển song song với kỹ thuật giấu tin nhằm để có
thể đánh giá độ an toàn của một hệ thống giấu tin, và cũng là công cụ cho phép
pháp hiện những nội dung mật được ẩn giấu nhằm phục vụ cho các mục đích khác
nhau. Đa số các kỹ thuật thám tin đều tập trung tìm ra sự sai khác một thuộc tính
nào đó trên ảnh chứa thông điệp giấu so với ảnh gốc như: sự phân bố các bít LSB
Học viên: Đào Minh Tuấn


Trang 10


của các điểm ảnh trên các vùng của ảnh bitmap hoặc tần số xuất hiện của các hệ số
DCT trên ảnh JPEG,... Để giấu được thông tin trong ảnh đa phần các kỹ thuật đều
phải thay đổi thông tin trên ảnh gốc, mật độ thay đổi càng lớn dẫn đến khả năng bị
thám tin càng cao.
Để nâng cao khả năng bảo mật cho thông điệp mật đem giấu, người ta đã sử
dụng mã hóa thông điệp mật trước khi giấu. Khi đó nếu kỹ thuật giấu tin bị phát
hiện thì kẻ tấn công phải giải được mã mới biết được nội dung thông điệp mật.
Càng ngày thì các kỹ thuật giấu tin và thám tin càng tinh xảo, đòi hỏi nhà
nghiên cứu không ngừng tìm ra các phương pháp giấu tin và phát hiện ra thông tin
giấu phù hợp, bắt kịp với xu hướng phát triển của kỹ thuật giấu thông tin. Đặc biệt,
ảnh số có định dạng JPEG được sử dụng rộng rãi nhất trên mạng Internet hiện nay
và đang là định dạng ảnh thu hút được sự quan tâm nghiên cứu phát triển của các
nhà khoa học. Hiện nay, trên định dạng ảnh số JPEG có các kỹ thuật giấu tin phổ
biến như Jpeg-Jsteg, Jphide, outguest và F5. Nhưng các kỹ thuật này đều có thể bị
tấn công phát hiện có giấu tin và thậm chí trích xuất được cả nội dung mật được
giấu. Nguyên nhân ảnh stego sử dụng các lược đồ trên có thể bị phát hiện có giấu
tin là do mật độ thay đổi hay chính là tỉ lệ lật bít LSB của các hệ số DCT đạt đến
một ngưỡng nhất định trên một vùng ảnh đủ lớn. Vì vậy, nhu cầu tìm kiếm các kỹ
thuật giấu tin mới trên ảnh số JPEG có độ an toàn cao hơn các kỹ thuật trên là rất
cấp thiết.
Bằng sự đam mê tìm hiểu về lĩnh vực giấu tin và bảo mật thông tin. Xuất
phát từ những nhu cầu và hiểu biết của mình, tôi đã chọn đề tài “Nâng cao chất
lượng giấu tin trên ảnh số JPEG” cho luận văn thạc sĩ này.

2) Lịch sử nghiên cứu
Trong hướng nghiên cứu về steganography thì việc nghiên cứu các thuật

toán giấu tin trong ảnh nén có định dạng JPEG luôn có sự thách thức cao và được
nhiều tổ chức và cá nhân quan tâm nghiên cứu. Nguyên nhân là do JPEG là định
dạng ảnh rất phổ biến hiện nay.
Học viên: Đào Minh Tuấn

Trang 11


Trên thế giới có một số công trình nghiên cứu thành công trong định dạng
ảnh này. Năm 1997 Derek Upham đã công bố lược đồ giấu tin Jsteg, đây là một
trong những thuật toán đầu tiên giấu tin trên miền tần số. Jsteg giấu thông tin theo
phương pháp LSB một cách tuần tự. Thuật toán này không bảo mật. Bất cứ ai biết
về phương pháp LSB cũng có thể trích rút được thông điệp ẩn bởi công cụ này.
JPHide là một công cụ được phát triển bởi Allan Latham năm 1999. Thuật
toán này nhúng ngẫu nhiên trên các bít LSB của các hệ số DCT. Hệ thống OutGuess
được phát triển bởi Niels Provos (1998), giấu ngẫu nhiên vào các bit LSB của các
hệ số DCT và có tính năng bảo toàn tính chất thống kê, nên không bị tấn công xác
suất. Nhưng các nhà nghiên cứu Niels Provos và Honeyman, đã tìm ra phương pháp
tấn công năm chúng năm 2001. Hệ thống giấu tin của Andreas Westfelds - F5 được
công bố năm 2001, đã thể hiện được những yêu điểm về khả năng bảo mật. F5 giấu
thông tin theo khối và trải đều thông tin giấu trên toàn bộ ảnh stego. Nhưng hệ
thống này đã bị tấn công bởi các nhà nghiên cứu Jessica Fridrich, Miroslav Goljan,
Dorin Hogea trong công bố của mình năm 2006.
Trong nước, đã có một vài nhóm nghiên cứu các phương pháp giấu tin áp
dụng cho định dạng ảnh JPEG. Nhưng tôi chưa thấy kết quả nào về giấu tin mật
được công bố.

3) Mục đích nghiên cứu
Luận văn đi vào tìm hiểu, nghiên cứu một số kỹ thuật giấu tin và phương
pháp thám tin, nhằm nghiên cứu tìm ra phương pháp nâng cao chất lượng giấu tin

trên ảnh JPEG. Để phát triển phương pháp giấu tin an toàn và nâng cao khả
năng giấu tin trên ảnh số JPEG, chúng tôi đã đề ra các mục tiêu nghiên cứu sau:
Mục tiêu thứ nhất của luận văn là nghiên cứu tìm ra tỉ lệ lật bít hay mật độ
thay đổi an toàn, chống lại các phương pháp phát hiện giấu tin trên ảnh có định
dạng JPEG. Chúng tôi sẽ tìm hiểu các kỹ thuật giấu tin và thám tin trên định dạng
ảnh này, tiến hành thực nghiệm và phân tích kết quả đưa ra tỉ lệ trên.

Học viên: Đào Minh Tuấn

Trang 12


Mục tiêu thứ hai của luận văn là đề ra một lược đồ giấu tin mới cho ảnh số
JPEG trên cơ sở của Z2 -Môđun để nâng cao tỷ lệ giấu tin trong khi tỉ lệ lật bít ở
mức độ an toàn cho phép .
Mật mã có thể làm cho nội dung của thông điệp bị che dấu, không thể đọc
được dưới dạng bản rõ nên vẫn có thể nhận ra được là có một nội dung đang bị che
dấu, giấu tin là che dấu sự tồn tại, hiện hữu của dữ liệu, thông điệp mật. Ưu điểm
của hướng tiếp cận giấu tin so với mã hoá là khi tiếp cận môi trường giấu tin đối
phương khó xác định được là có thông tin giấu ở trong đó hay không. Giấu tin có
thể kết hợp với khả năng của mã hóa để phục vụ cho mục đích che dấu dữ liệu với
khả năng bảo mật và an toàn cao hơn.
Mục tiêu thứ ba của luận văn về khía cạnh kết hợp mật mã với giấu tin: Tìm
hiểu các hệ mật mã và mô hình mã hóa kết hợp với giấu tin. Tiếp đó đề xuất sử
dụng một hệ mật mã có khả năng bảo mật cao và một lược đồ giấu tin an toàn cho
mô hình mã hóa kết hợp với giấu tin.
Đối tượng nghiên cứu: định dạng ảnh JPEG, các lý thuyết về giấu tin, thám
tin, mã hóa,…
Phạm vi nghiên cứu:
-


Nghiên cứu cấu trúc ảnh số JPEG, các phép biến đổi giữa miền không gian
và miền tần số.

-

Nghiên cứu các thuật toán, phương pháp giấu tin và thám tin trên ảnh nhị
phân và ảnh số JPEG.

-

Nghiên cứu lý thuyết mô đun, các phương pháp giấu tin theo cách tiếp cận
mô đun.

-

Nghiên cứu về các hệ mật mã, mô hình kết hợp mã hóa trong giấu tin.

Học viên: Đào Minh Tuấn

Trang 13


4) Nội dung nghiên cứu
Nội dung nghiên cứu của luận văn gồm phần mở đầu, 3 chương, tài liệu
tham khảo và kết luận:
 Chương 1:
Giới thiệu tổng quan về giấu tin, giấu tin trong ảnh và một số định dạng ảnh
phổ biến, các yếu tố ảnh hưởng đến giấu tin, một số phương pháp giấu tin trên ảnh
nhị phân. Tiếp theo trình bày công thức đánh giá chất lượng ảnh sau giấu tin, các

phương pháp cơ bản để phát hiện ảnh có giấu tin. Sau đó chúng tôi trình bày một số
kỹ thuật giấu tin và thám tin trên ảnh số JPEG.
 Chương 2:
Trình bày giấu tin theo phương pháp môđun, thực nghiệm đánh giá khả
năng phát hiện giấu tin khi mật độ giấu thay đổi, của công cụ thám tin stegdetect.
Từ đó, chúng tôi đưa ra tỉ lệ thay đổi an toàn chống phát hiện trên ảnh số JPEG. Sau
cùng, chúng tôi đề xuất một lược đồ giấu tin an toàn trong ảnh số JPEG trên cơ sở
của Z2 module.
 Chương 3:
Trong chương này chúng tôi đưa ra kết quả thử nghiệm của lược đồ giấu tin
module(2,18,7) đã được đề xuất trong chương 2. Chúng tôi đã kiểm tra thực nghiệm
và đánh giá so sánh lược đồ này với các lược đồ sử dụng thuật toán Jsteg thưa và
thuật toán F5. Lược đồ module(2,18,7) dựa trên tỉ lệ thay đổi an toàn đã được đề
xuất ở chương 2, cho kết quả tốt cả về chất lượng ảnh và tỉ lệ thông tin nhúng trong
ảnh sau giấu tin. Tiếp đó đề xuất sử dụng một hệ mật mã có khả năng bảo mật cao
và một lược đồ giấu tin an toàn để xây dựng hệ thống giấu tin theo mô hình mã hóa
kết hợp với giấu tin.

Học viên: Đào Minh Tuấn

Trang 14


5) Các đóng góp mới của đề tài
- Xây dựng được một lược đồ giấu tin Module(2,18,7) dựa trên cơ sở của Z2–
module để thực hiện giấu tin trên ảnh số JPEG. Trên ảnh số JPEG chưa có lược
đồ nào tiếp theo phương pháp này.
- Lược đồ này có những ưu điểm vượt trội sau đây:
+ Thứ nhất: Độ an toàn của thông tin giấu rất cao, lược đồ trên giấu tin đảm
bảo tỉ lệ thay đổi bit LSB trên các hệ số DCT dưới 13%. Tỉ lệ này an toàn

chống lại các kỹ thuật phát hiện ảnh có giấu tin, đã được kiểm chứng bằng
thực nghiệm.
+ Thứ hai: Tỉ lệ giấu tin khoảng 5%, cao hơn so với các lược đồ giấu tin
khác trên cùng mật độ thay đổi.
- Ngoài ra để tăng cường bảo mật cho lược đồ trên khi cài đặt, chúng tôi đề xuất
xây dựng hệ thống giấu tin trên ảnh số JPEG, MAS_Module(2,18,7). Hệ thống
này kết hợp lược đồ giấu tin Module(2,18,7) với lược đồ mã hóa MAS và đã
được cài đặt thành công.

6) Phương pháp nghiên cứu
Chúng tôi đã kết hợp phương pháp nghiên cứu lý thuyết với nghiên cứu
thực nghiệm.
Trong nghiên cứu lý thuyết, Từ lý thuyết về cấu trúc ảnh JPEG, lý thuyết về
mô đun và mã hóa, chúng tôi đã phân tích, tổng hợp để xây dựng lược đồ giấu tin
theo cách tiếp cận mô đun. Sau đó tìm hiểu mô hình mã hóa kết hợp với giấu tin để
xây dựng ứng dụng thực tiễn.
Trong thực nghiệm: Để đánh giá được ưu nhược điểm của lược đồ trên
chúng tôi đã tiến nhiều thực nghiệm khác nhau:
a) Thực nghiệm về khả năng phát hiện của công cụ thám tin Stegdetect:
- Mỗi lần giấu tin trên 1000 ảnh khác nhau

Học viên: Đào Minh Tuấn

Trang 15


- Thay đổi tỉ lệ lật bít LSB trên các hệ số DCT trong mỗi lần giấu.
- Cho công cụ thám tin Stegdetect kiểm tra giấu tin trong mỗi trường hợp thay đổi
trên.
- Thu thập số liệu kết quả phát hiện, để phân tích và đánh giá.

b) Thực nghiệm về khả năng phát hiện của Stegdetect đối với ảnh giấu tin theo
lược đồ Module(2,18,7):
- Xây dựng phần mềm giấu tin sử dụng lược đồ Module(2,18,7).
- Thực hiện giấu tin trong thư viện 1000 ảnh theo phần mềm trên (giấu hết khả năng
có thể giấu của từng ảnh)
- Cho công cụ thám tin Stegdetect kiểm tra giấu tin trong 1000 ảnh đã giấu tin.
- Thu thập số liệu kết quả phát hiện, để phân tích và đánh giá.
c) Thực nghiệm về khả năng phát hiện của Stegdetect đối với ảnh giấu tin theo
lược đồ Jsteg thưa 1/9:
- Xây dựng phần mềm giấu tin sử dụng lược đồ Jsteg thưa 1/9.
- Thực hiện giấu tin trong thư viện 1000 ảnh theo phần mềm trên (giấu hết khả năng
có thể giấu của từng ảnh)
- Cho công cụ thám tin Stegdetect kiểm tra giấu tin trong 1000 ảnh đã giấu tin.
- Thu thập số liệu kết quả phát hiện, để phân tích và đánh giá.
d) Thực nghiệm khả năng giấu tin của lược đồ Module(2,18,7) và Jsteg thưa1/9
- Cho phần mềm Jsteg thưa 1/9 giấu tin trong 1000 ảnh (giấu hết khả năng có thể
giấu của từng ảnh)
- Cho phần mềm Module(2,18,7) giấu tin trong 1000 ảnh (giấu hết khả năng có thể
giấu của từng ảnh)
- Thu thập số liệu kết quả về khả năng giấu trên từng ảnh, độ đo PSNR, để phân tích
và đánh giá.

Học viên: Đào Minh Tuấn

Trang 16


CHƯƠNG 1. TỔNG QUAN VỀ GIẤU TIN, CÁC KỸ THUẬT
GIẤU TIN VÀ THÁM TIN TRONG ẢNH SỐ JPEG
1.1. Khái niệm và phân loại

- Giấu thông tin gọi tắt là Giấu tin, tiếng Hy Lạp là “Steganography”, tiếng
Anh là “Cover Writing” – là kỹ thuật giấu (nhúng) một lượng thông tin nào đó vào
trong một đối tượng dữ liệu khác, nhằm 2 mục đích: bảo vệ cho đối tượng mang tin
giấu và bảo mật cho dữ liệu được đem giấu.
- Hai mục đích của giấu tin dẫn đến 2 kỹ thuật chủ yếu của giấu tin: Giấu
tin mật và Thủy vân số. Có nhiều cách phân loại khác nhau dựa trên những tiêu chí
khác nhau. Theo Fabien A.P.Pentitcolas đề xuất năm 1999 thì có thể chia lĩnh vực
giấu tin thành hai hướng lớn: Giấu tin mật và Thủy vân số.
Thủy vân được sử dụng chủ yếu trong lĩnh vực bảo vệ bản quyền sản phẩm
số bằng cách đưa thông tin bản quyền vào sản phẩm. Giấu tin mật là kỹ thuật giấu
thông tin mật vào các dữ liệu truyền thông (ảnh, văn bản, audio, video, …) để
chuyển tải đến người nhận mà trong quá trình truyền tải không biết đến sự tồn tại
của thông tin mật.

Dưới đây là sơ đồ phân loại các kỹ thuật giấu tin:
Giấu thông tin
Information hiding

Giấu tin mật
Steganography

Thủy vân số
Watermarking

Thủy vân bền vững
Robust Copyright Watermarking

Thủy vân ẩn
Imperceptible watermarking


Thủy vân dễ vỡ
Fragile Watermarking

Thủy vân hiện
Visible watermarking

Hình 1.1: Phân loại các kỹ thuật giấu tin
Học viên: Đào Minh Tuấn

Trang 17


1.2. Giấu tin trong ảnh số
Giấu tin mật trong ảnh số (image steganography) là kỹ thuật lợi dụng một
số thông tin dư thừa của dữ liệu ảnh gốc để giấu (nhúng) thông tin vào đó. Kỹ thuật
này phải đảm bảo chỉ người gửi và nhận biết thông tin đã giấu, còn những người
khác không thể cảm nhận được sự tồn tại của thông tin đã giấu trong ảnh. Giấu tin
trong ảnh gồm hai giai đoạn: Nhúng thông tin vào ảnh gốc và trích xuất thông tin đã
nhúng. Để tăng cường độ an toàn cho thông tin đem giấu, thường trước khi giấu
thông tin có thể được mã hóa bằng kỹ thuật mật mã nào đó. Trong quá trình tách
thông tin, dữ liệu gốc có thể tham gia hoặc không, các kỹ thuật giấu tin tốt thường
không cần dữ liệu gốc để tách thông tin đã giấu.
Các thành phần chính của một hệ giấu tin trong ảnh bao gồm:
 Bản tin mật (Secret Message): có thể là văn bản hoặc tệp ảnh hay bất kỳ
một tệp nhị phân nào, vì quá trình xử lý chúng ta đều chuyển chúng thành
chuỗi các bit.
 Ảnh phủ (hay ảnh gốc) (Cover image): là ảnh được dùng để làm môi
trường nhúng tin mật.
 Khoá bí mật K (Key): khoá bí mật tham gia vào quá trình giấu tin để
tăng tính bảo mật

 Bộ nhúng thông tin (Embedding Algorithm): Những chương trình, thuật
toán nhúng tin.
 Ảnh mang (Stego image): là ảnh sau khi đã nhúng tin mật vào đó
 Kiểm định (Control) : Kiểm tra thông tin sau khi được giải mã.
Dưới đây là sơ đồ tổng quát quá trình giấu tin và tách tin trong ảnh:

Học viên: Đào Minh Tuấn

Trang 18


Hình 1.2: Sơ đồ quá trình giấu tin trong ảnh

Hình 1.3: Sơ đồ quá trình tách tin trong ảnh
Có thể chia các kỹ thuật giấu tin theo hai hướng tiếp cận chính:
Hướng thứ nhất dựa trên miền không gian ảnh tức là tiến hành nhúng các
thông tin mật vào ảnh bằng cách thay đổi các giá trị điểm ảnh sao cho không ảnh
hưởng nhiều đến chất lượng ảnh và đảm bảo tính bí mật của thông tin nhúng trước
những tấn công có thể có đối với bức ảnh đã giấu tin mật. Điển hình cho cách tiếp
cận này là phương pháp giấu tin vào bit ít quan trọng nhất (LSB-Least Significant
Bit).
Hướng thứ hai là sử dụng các phương pháp khác thông qua các kỹ thuật
biến đổi. Các kỹ thuật biến đổi này làm nhiệm vụ chuyển miền không gian ảnh sang
các miền khác, như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các
miền mới với các biến số mới. Sau đó, ta tìm cách giấu tin mật vào ảnh bằng cách
thay đổi các hệ số biến đổi trong những miền thích hợp để đảm bảo chất lượng ảnh
và tính bí mật của thông tin giấu. Các phép biến đổi được sử dụng phổ biến là DCT,
DFT (Discrete Fourier Transform) và DWT.

Học viên: Đào Minh Tuấn


Trang 19


Kỹ thuật giấu tin sử dụng phép biến đổi DCT thường chia ảnh gốc thành
các khối, thực hiện phép biến đổi DCT với từng khối ảnh gốc để được miền tần số
thấp, miền tần số giữa và miền tần số cao. Sau đó các kỹ thuật giấu biến đổi các hệ
số trong các miền tần số này để nhúng thông tin cần giấu.

1.3. Ứng dụng cơ bản của giấu tin
- Ứng dụng của thủy vân số

 Bảo vệ bản quyền tác giả
Một thông tin nào đó mang ý nghĩa quyền sở hữu gọi là thủy vân sẽ được
nhúng vào trong sản phẩm. Thủy vân đó chỉ một mình người chủ sở hữu hợp pháp
sản phẩm đó có và được dùng làm chứng minh cho bản quyền sản phẩm.

 Xác thực thông tin hay phát hiện xuyên tạc thông tin
Một thông tin sẽ được giấu trong phương tiện chứa, sau đó sử dụng để nhận
biết xem phương tiện gốc đó có bị thay đổi không. Thủy vân nên được ẩn để tránh
sự tò mò của kẻ thù, hơn nữa việc làm giả thủy vân hợp lệ hay xuyên tạc thông tin
nguồn cũng được xem xét.

 Giấu vân tay và dán nhãn
Thủy vân trong ứng dụng này được dùng để nhận diện người gửi hay người
nhận của một thông tin nào đó.

 Kiểm soát sao chép
Ứng dụng này dùng kiểm soát sao chép đối với các thông tin; các thiết bị
phát hiện ra thủy vân thường được gắn sẵn vào trong hệ thông đọc ghi.

- Ứng dụng của giấu tin mật
Thông tin được giấu trong trường hợp này càng nhiều càng tốt, việc tách tin
để nhận được tin giấu cũng không cần phương tiện chứa ban đầu. Các yêu cầu mạnh
về tính bền vững không cần thiết lắm, thay vào đó là thông tin giấu phải đảm bảo
tính bí mật và giảm thời gian lưu thông trên đường truyền.
Học viên: Đào Minh Tuấn

Trang 20


1.4. Các định dạng ảnh số cơ bản
Hiện nay có rất nhiều định dạng ảnh khác nhau như GIF, Bitmap, PNG,
JPEG, … Trong khuôn khổ của luận văn này, chúng tôi sẽ trình bày hai định dạng
phổ biến là ảnh bitmap và ảnh JPEG. Hai định dạng ảnh này rất phổ biến trên
Internet hiện nay. Ảnh nhị phân (ảnh đen trắng) cũng có định dạng ảnh bipmap với
số lượng bit trên mỗi điểm ảnh bằng 1. Đây là định dạng ảnh thu hút được rất nhiều
nhà khoa học trong việc nghiên cứu phát triển các thuật toán giấu tin. Nguyên nhân
là do giấu tin trong ảnh nhị phân rất dễ bị phát hiện và các thuật toán giấu tin trong
ảnh nhị phân có thể mở rộng cho các định dạng ảnh khác, ví dụ điển hình là phương
pháp LSB (được đề xuất vào khoảng đầu những năm 2000). JPEG là định dạng ảnh
nén. Việc hiểu rõ cấu trúc ảnh JPEG, quá trình biến đổi từ miền không gian sang
miền tần số và ngược lại, cho phép ta dễ dàng cài đặt, thử nghiệm để đưa ra các kết
quả của đề tài.

1.4.1. Định dạng ảnh Bitmap
Bitmap là một định dạng tập tin hình ảnh khá phổ biến. Các tập tin đồ họa
lưu dưới dạng BMP thường có đuôi là .BMP hoặc .DIB.
Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng như file ảnh nói
chung) là:



Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n. Một ảnh
BMP n-bit có 2n màu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng
rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh
256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24-bit có
chất lượng hình ảnh trung thực nhất.



Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).



Chiều rộng của ảnh (width), cho bởi điểm ảnh.

Cấu trúc tập tin ảnh BMP bao gồm 4 phần:


Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap.

Học viên: Đào Minh Tuấn

Trang 21




Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển thị ảnh.




Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ được sử
dụng trong ảnh.



Bitmap Data: lưu dữ liệu ảnh.
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không

được nén bằng bất kỳ thuật toán nào. Khi lưu ảnh, các điểm ảnh được ghi trực tiếp
vào tập tin. Một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá
trị n của ảnh. Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn,
gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG).

1.4.2. Định dạng ảnh nén JPEG
Jpeg (Joint Photographics Experts Group) là một định dạng ảnh nén, được
đưa ra vào năm 1992. Việc nén trong ảnh jpeg là nén có mất thông tin, tuy nhiên
việc mất thông tin này không làm giảm nhiều chất lượng của hình ảnh. Ảnh jpeg có
tỷ lệ nén khá tốt và chất lượng ảnh cũng khá cao. Quá trình nén và giải nén của jpeg
được mô tả như dưới đây:
Quá trình nén:

Hình 1.4: Quá trình nén ảnh JPEG
Ví dụ cho ảnh sau

Hình 1.5: Ảnh RGB
Học viên: Đào Minh Tuấn

Trang 22



Giá trị màu RGB của khối 8x8 pixel đầu tiên là
R

G

B

33

42

48

51

52

50

50

53

27

37

43


46

47

48

48

51

31

41

47

50

51

51

51

54

36

45


50

52

52

51

52

53

30

40

45

47

47

49

50

51

34


44

49

51

51

52

53

54

40

48

53

53

53

53

56

52


33

43

48

48

48

51

54

50

40

49

54

54

54

56

59


55

44

51

55

55

55

56

59

52

37

46

50

50

50

54


57

50

44

52

56

56

56

59

62

55

46

52

55

56

57


54

51

51

39

47

50

51

52

51

48

48

47

54

57

58


59

58

55

55

48

53

55

56

57

54

51

52

41

48

50


51

52

51

48

49

49

55

57

58

59

58

55

56

51

56


57

57

58

55

52

52

44

51

52

52

53

52

49

49

52


58

59

59

60

59

56

56

55

59

59

59

60

56

54

54


48

54

54

54

55

53

51

51

56

61

61

61

62

60

58


58

Đầu tiên, các giá trị RGB của ảnh bitmap được chuyển đổi sang dạng
YCbCr theo công thức:
Y = INT( 0.299 * R + 0.587 * G + 0.114 * B -128)
Cb = INT(-0.1687 * R - 0.3313 * G + 0.5 * B)
Cr =INT( 0.5 * R - 0.4187 * G - 0.0813 * B)
Thành phần Y là thành phần nhậy cảm nhất đến thị giác của mắt người. Hai
thành phần Cb và Cr ít nhậy cảm với mắt người hơn.
Sau đó, ảnh được chia thành các khối 8x8. Mỗi khối này có thể coi là một
ma trận 8x8 của các giá trị Y, Cr và Cb.
Y
-99 -90 -84 -81 -80 -80 -80 -77
-96 -87 -82 -80 -80 -79 -78 -77
-93 -83 -78 -78 -78 -76 -73 -77
-89 -80 -76 -76 -76 -73 -70 -77
-86 -79 -76 -75 -74 -76 -79 -79
-84 -78 -76 -75 -74 -76 -79 -78
-81 -75 -74 -74 -73 -75 -78 -78
-77 -72 -72 -72 -71 -74 -76 -76

Cb
0
0
2
2
2
2
2
2


1
1
2
2
2
2
2
2

1
1
2
2
2
2
2
2

1
1
2
2
2
2
2
2

Cr
1

1
2
2
2
2
2
2

1
1
2
2
2
2
2
2

1
1
2
2
2
2
2
2

1
1
2
2

2
2
2
2

2
2
2
2
2
2
2
2

2
2
2
2
1
1
1
1

2
2
2
2
1
1
1

1

2
2
2
2
1
1
1
1

2
2
2
2
1
1
1
1

0
0
0
0
0
0
0
0

0

0
0
0
0
0
0
0

0
0
0
0
0
0
0
0

Tiếp theo, thực hiện phép biến đổi Cosine cho mỗi khối này, phép biến đổi
này được gọi là biến đổi DCT (Discrete Cosine Transform).

Trong đó:

u là thứ tự theo chiều ngang của miền tần số 0≤u≤8
v là thứ tự theo chiều dọc của miền tần số 0≤v ≤8

Học viên: Đào Minh Tuấn

Trang 23



Ngược lại, C(u) = 1 với u ≠ 0.
f(x,y) là giá trị điểm ảnh tại (x,y)
Sau bước biến đổi này, từ mỗi khối 8x8 ta thu được các khối 8x8 các hệ số DCT.
Tiếp theo tiến hành lượng tử hóa cho mỗi khối này với ma trận lượng tử hóa có kích
thước 8x8.

Ta thu được các khối 8x8 các hệ số DCT đã được lượng tử hóa.
DCT của Y
-105 -6 -4 -3 -4 -1 -1 0
0
-2 -1 -1 0 0 0 0
0
0 0 0 0 0 0 0
0
0 0 0 0 0 0 0
0
0 0 0 0 0 0 0
0
0 0 0 0 0 0 0
0
0 0 0 0 0 0 0
0
0 0 0 0 0 0 0

2
0
0
0
0
0

0
0

0
0
0
0
0
0
0
0

DCT của Cb
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0

0
0
0
0
0
0
0
0


0
0
0
0
0
0
0
0

1
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0

DCT của Cr
1 0 0 0

0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0
0 0 0 0

0
0
0
0
0
0
0
0

0
0
0
0
0
0
0
0

Kết quả sau khi lượng tử hóa cho ta một khối có rất nhiều giá trị 0. Điều
này làm cho việc nén dữ liệu của ảnh có tỷ lệ cao. Quá trình lượng tử hóa này cũng
chính là quá trình làm mất mát thông tin của điểm ảnh do việc làm tròn thành các
giá trị nguyên. Giá trị ở vị trí (1,1) trong khối được gọi là hệ số DC, 63 giá trị còn

lại được gọi là các hệ số AC. Việc nhúng các bit thông tin vào ảnh jpeg chính là
việc nhúng nó vào các hệ số DC, AC này. Mỗi khối 8x8 này được chuyển đổi thành
một mảng 64 phần tử theo một quá trình Zig-Zag. Matrix zig-zag được mô tả như
sau đây:

Học viên: Đào Minh Tuấn

Trang 24


Hình 1.6: Matrix zig-zag
Cuối cùng, các mảng 64 phần tử này được nén lại với thuật toán nén
Huffman và được lưu vào trong file ảnh với định dạng jpeg.
Quá trình khôi phục được thực hiện ngược lại như sơ đồ dưới đây:

Hình 1.7: Quá trình giải nén ảnh JPEG

1.5. Các yếu tố ảnh hưởng đến quá trình giấu tin:
Các kỹ thuật giấu tin nói chung đều phải đáp ứng một số các yếu tố, các yếu
tố này thay đổi tùy theo từng ứng dụng cụ thể. Sau đây là các yếu tố chung cho các
kỹ thuật giấu tin.

1.5.1. Sự thay đổi trên đối tượng chứa là tối thiểu:
Mục đích của giấu tin là nhúng thông tin vào đối tượng chứa nhằm các mục
đích riêng cho từng ứng dụng. Tuy nhiên, giấu tin không thể làm thay đổi giá trị sử
dụng của đối tượng chứa vì:
Nếu ứng dụng của giấu tin là bảo vệ quyền sở hữu trí tuệ thì đối tượng
chứa – tác phẩm của tác giả không thể bị suy biến vì như thế thì tác phẩm đó mất
đi giá trị và không cần bảo vệ bản quyền nữa.


Học viên: Đào Minh Tuấn

Trang 25


×