Tải bản đầy đủ (.pdf) (96 trang)

Đánh dấu ẩn bảo vệ bản quyền số trên miền hệ số đã biến đổi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1 MB, 96 trang )

Bộ giáo dục và đào tạo
Trường Đại học Bách Khoa Hµ Néi
-----------------------------------------------

ĐÁNH DẤU ẤN BẢO VỆ BẢN QUYỀN SỐ TRÊN MIN H S
BIN I
Lấ ANH C

Luận Văn Thạc Sĩ Khoa Häc
CHUN NGÀNH: CƠNG NGHỆ THƠNG TIN

Hµ Néi - 2005


Bộ giáo dục và đào tạo
Trường Đại học Bách Khoa Hµ Néi
-----------------------------------------------

ĐÁNH DẤU ẤN BẢO VỆ BẢN QUYỀN SỐ TRÊN MIN H S
BIN I
Lấ ANH C

Luận Văn Thạc Sĩ Khoa Häc
CHUYÊN NGÀNH: CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN
TS. NGUYỄN LINH GIANG

Hµ Néi - 2005



Luân văn thạc sĩ

2

LI CAM OAN
Tụi xin cam oan bn luận văn này là kết quả nghiên cứu của bản thân
tôi dưới sự hướng dẫn của Ts.Nguyễn Linh Giang. Nếu có gì sai phạm tơi xin
hồn tồn chịu trách nhiệm.
Người lm cam oan

Lờ Anh c

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

3

MC LC
LI NểI U ...................................................................................................................... 5
TNG QUAN LUÂN VĂN ................................................................................................. 7
MỘT SỐ THUẬT NGỮ ...................................................................................................... 9
NỘI DUNG CHÍNH CỦA LUẬN VĂN ........................................................................... 12
CHƯƠNG I. TỔNG QUAN VỀ HỆ THỐNG ĐÁNH DẤU ẨN.................................... 13

I. Khái niệm:............................................................................................... 13
II. Hệ thống nhúng thông tin trên dữ liệu đa phương tiện .......................... 13
1. Sơ đồ hệ thống.................................................................................... 13
2. Các đặc trưng và tính chất:.................................................................. 18

3. Các yêu cầu đối với quá trình đánh dấu thơng tin .............................. 20
III. Phân loại và ứng dụng các kỹ thuật đánh dấu ẩn .................................. 21
1. Phân loại kỹ thuật đánh dấu ẩn ........................................................... 21
2. Ứng dụng các kỹ thuật đánh dấu ẩn ................................................... 24
IV. Các phương thức tấn công đối tượng đánh dấu ẩn ............................... 25
1. Giới thiệu các kiểu tấn công................................................................ 26
2. Các kiểu tấn công đơn giản ................................................................. 26
3. Các kiểu tấn công Dị tìm – Vơ hiệu hóa ............................................ 27
4. Tấn cơng tạo sự nhập nhằng, khóa chết hay loại bỏ dấu ẩn............... 27
CHƯƠNG II. MỘT SỐ KỸ THUẬT ĐÁNH DẤU ẨN BẢO VỆ BẢN QUYỀN SỐ
TRÊN MIỀN KHÔNG GIAN VÀ MIỀN HỆ SỐ BIẾN ĐỔI........................................ 28

I. Đánh dấu ẩn dựa trên miền không gian ................................................... 28
1. Giải thuật thay thế bit có trọng số thấp nhất ....................................... 28
2. Giải thuật dựa trên tính tương quan trong miền khơng gian ............... 31
3. Kỹ thuật đánh dấu ẩn CDMA ............................................................. 33
II. Đánh dấu ẩn dựa trên miền hệ số biến đổi ............................................. 34
1. Giải thuật đánh dấu thơng tin dựa trên q trình điều chế biên độ biến
đổi Fourier rời rạc (DFT Amplitude Modulation) .................................. 34
2. Giải thuật đánh dấu thông tin trên miền các hệ số biến đổi Cosin rời
rạc ............................................................................................................ 36

Lª Anh §øc – Líp CNTT2003


Luân văn thạc sĩ

4

2. ỏnh du n s dng la chọn vị trí khối và ràng buộc miền biến đổi

Cosince rời rạc. ....................................................................................... 51
3. Nhúng dấu ẩn mức xám sử dụng biến đổi Cosince rời rạc ................. 63
4. Đánh dấu ẩn video sử dụng các hệ số biến đổi DCT .......................... 71
III. Kỹ thuật kiểm định đánh dấu ẩn ........................................................... 75
CHƯƠNG III. THỬ NGHIỆM CHƯƠNG TRÌNH ĐÁNH DẤU ẨN DỰA TRÊN KỸ
THUẬT MIỀN HỆ SỐ BIẾN ĐỔI ................................................................................... 76

I. Bài toán: ................................................................................................... 76
II. Thực hiện ................................................................................................ 77
III. Sơ đồ một số modul trong chương trình ............................................... 81
1. Sơ đồ mơ đun đánh dấu ẩn trên miền không gian............................... 81
2. Sơ đồ mô đun đánh dấu ẩn trên miền hệ số biến đổi. ......................... 82
3. Sơ đồ mô đun tách dấu ẩn. .................................................................. 83
IV. Kết quả thực hiện .................................................................................. 84
1. Thực hiện q trình nhúng thơng tin có dạng Text ............................. 85
2. Tách thông tin dấu ẩn dạng text .......................................................... 86
3. Nhúng thông tin dấu ẩn dạng ảnh ....................................................... 87
4. Quá trình tách thơng tin dạng ảnh ....................................................... 88
5. Đánh giá .............................................................................................. 90
HƯỚNG PHÁT TRIỂN CỦA LUẬN VĂN..................................................................... 91
KẾT LUẬN ......................................................................................................................... 92
TI LIU THAM KHO ................................................................................................. 94

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

5


LI NểI U

Ngy nay, s phỏt trin như vũ bão của thông tin kỹ thuật số đã đem lại
những thay đổi sâu sắc trong xã hội và trong cuộc sống của chúng ta. Bên
cạnh những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra những
thách thức và cơ hội mới. Sự ra đời những phần mềm có tính năng rất mạnh,
các thiết bị mới như máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in,
máy ghi âm kỹ thuật số v.v… đã thúc đẩy khả năng sáng tạo, xử lý và thưởng
thức các dữ liệu đa phương tiện (multimedia data). Mạng Internet toàn cầu đã
tạo ra những cơ cấu ảo – nơi diễn ra các q trình trao đổi thơng tin trong mọi
lĩnh vực chính trị, qn sự, quốc phịng, kinh tế, thương mại…Bên cạnh đó,
trong mơi trường mở và tiện nghi như thế xuất hiện những vấn nạn, tiêu cực
đang rất cần các giải pháp hữu hiệu nhằm đảm bảo an tồn thơng tin, chống
lại các nạn ăn cắp bản quyền, xuyên tạc thông tin, truy nhập thông tin trái
phép, sử dụng bất hợp pháp các sản phẩm số (file tài liệu, chương trình, âm
thanh, hình ảnh và Video,...) ngày càng gia tăng, và việc quản lý các sản
phẩm số khơng được đảm bảo, do các đặc tính của các file số có thể sao chép
qua lại giữa các máy tính với nhau bằng nhiều phương pháp. Kết quả là hiện
nay tình trạng vi phạm bản quyền số đang xảy ra hàng ngày, hàng giờ trên
khắp thế giới. Nhằm bảo vệ các sản phẩm số không bị sử dụng trái phép, song
song với việc kêu gọi ý thức tự giác thực thi luật bản quyền thì các cơng ty
cơng nghệ lớn trên thế giới đã và đang thực hiện các giải pháp kỹ thuật kiểm
soát bản quyền số. Kỹ thuật đánh dấu ẩn dữ liệu đa phương tiện là một lĩnh
vực còn khá mới ở Viêt Nam, dường như mọi người mới chỉ biết ứng dụng nó
từ các chương trình v cỏc th vin cú sn

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ


6

gii quyt vn bo v quyền sở hữu với các sản phẩm dữ liệu số
trong luận văn đưa ra một số kỹ thuật bảo vệ bản quyền dựa trên phương pháp
miền không gian và miền hệ số đã được biến đổi giúp cho quá trình bảo vệ
bản quyền số được đảm bảo hơn.
Do thời gian tìm hiều và nghiên cứu về bản quyền số cịn hạn chế nên
trong luận văn cịn có những thiếu sót. Em rất mong được sự đánh giá và góp
ý bổ sung của các thầy giáo, cô giáo và các bạn để luận văn được hoàn chỉnh
hơn.
Em xin chân thành cảm ơn Thầy giáo TS. Nguyễn Linh Giang đã tận
tình hướng dẫn em trong quá trình thực hiện luận văn này. Em xin chân thành
cảm ơn các thầy cô giáo trong khoa CNTT và các bạn cùng lớp đã tham gia
góp ý trong q trình hồn thiện lận văn.
Hà nội, tháng 11 nm 2005
Hc viờn thc hin

Lờ Anh c

Lê Anh Đức – Líp CNTT2003


Luân văn thạc sĩ

7

TNG QUAN LUN VN

T nhu cu thc tế là bảo vệ quyền sở hữu đối với các dữ liệu đa

phương tiện, có nhiều phương pháp khác nhau để đạt được mục đích này. Bài
tốn đặt ra cho chúng ta là đưa ra một phương pháp xác nhận quyền sở hữu
của tác giả đối với các thông tin đa phương tiện.
Các phương pháp được thực hiện bởi quá trình trao đổi, xác thực sử
dụng các dữ liệu được đánh dấu ẩn. Qúa trình đánh dấu ẩn trên dữ liệu thực
hiện việc nhúng một thơng tin nào đó mang ý nghĩa quyền sở hữu của tác giả
vào trong sản phẩm của tác giả và được dùng làm thông tin xác nhận quyền sở
hữu sản phẩm. Quá trình đánh dấu ẩn này phải đảm bảo là không ảnh hưởng
lớn đến sản phẩm của tác giả, nó phải tồn tại bền vững cùng sản phẩm và
muốn gỡ bỏ dấu thông tin mà khơng được phép của chủ sở hữu thì khó thực
hiện được, ngoại trừ việc phá huỷ sản phẩm. Sản phẩm đã được đánh dấu, sau
đó được sử dụng cho quá trình trao đổi theo các giao thức cụ thể đảm bảo
được các yêu cầu đặt ra về xác thực quyền sử dụng và bảo vệ quyền sở hữu.
Để đạt được mục đích nêu ra trong đề tài, em đã tìm hiểu các vấn đề lý
thuyết liên quan đến hệ thống đánh dấu ẩn, các giải thuật đánh dấu ẩn trên dữ
liệu đa phương tiện, các giao thức trao đổi thơng tin trong q trình đánh dấu
ẩn và các cơ chế xác thực người sử dụng cũng như người sở hữu đối với các
dữ liệu đa phương tiện.
Các giải thuật đánh dấu ẩn, trong luận văn em đã tìm hiểu và nghiên
cứu một số giải thuật thực hiện quá trình đánh dấu ẩn trên miền không gian và
trên miền các hệ số biến đổi đối với dữ liệu số giúp bảo vệ quyền sở hữu,
chống sao chép bất hợp pháp (Bảo vệ bản quyền tác giả), nhận thức thơng tin

Lª Anh §øc – Líp CNTT2003


Luân văn thạc sĩ

8


hay phỏt hin xuyờn tc thụng tin và có khả năng theo dõi q trình sử dụng,
truyền thông...
Các giao thức trao đổi thông tin giữa người sở hữu và người sử dụng
trong đánh dấu ẩn như:
Giao thức trao đổi thơng tin trong q trình phát sinh dấu ẩn để thực
hiện quá trình ẩn với sự tham gia của người sử dụng, trung tâm chứng
thực
Giao thức chèn dấu ẩn thực hiện quá trình chèn dấu ẩn đã được tạo ra.
Giao thức này có sự tham gia của hai bên là người sử dụng và người sở
hữu.
Giao thức xác định vi phạm khi người sở hữu phát hiện có sự vi phạm
bản quyền đối với tác phẩm của mình. Giao thức này chỉ có sự tham gia
của người sở hữu.
Giao thức giải quyết khi có sự vi phạm xảy ra để đảm bảo xác định
đúng người đã vi phạm. Giao thức này có sự tham gia của đầy đủ ba
bên là người sử dụng, người sở hữu và trung tâm chứng thực.
Các giao thức này đóng vài trị quan trọng bởi vì nó làm đảm bảo sự an
tồn, xác thực đối với các dữ liệu được đánh dấu ẩn trong q trình trao đổi.
Trong phần mơ phỏng giải thuật, sử dụng cơng cụ lập trình là Ngơn
ngữ lập trình Visual C++ và sử dụng các thư viện của hệ điều hành Windows.
Do ngôn ngữ Visual C++ cung cấp nhiều cơng cụ lập trình và khả năng xử lý
bộ nhớ tốt đối với các ứng dụng xử lý dữ liệu lớn, ngơn ngữ cung cấp các tính
năng giúp lập trình giao din d s dng v gn gi

Lê Anh Đức – Líp CNTT2003


Luân văn thạc sĩ

9


MT S THUT NG
- Host signal (Phng tiện chứa): là phương tiện gốc được dùng để
nhúng thông tin. Trong giấu thơng tin trong ảnh thì nó mang tên ảnh chứa,
cịn trong audio là audio chứa .v.v. Đơi khi ta cũng gọi phương tiện chứa là
môi trường.
- Embeded data (Thông tin giấu): là lượng thông tin được nhúng vào
trong phương tiện chứa. Trong giấu tin mật steganograpy thông tin giấu được
gọi là thơng điệp giấu (message), cịn trong kỹ thuật đánh dấu ẩn số thì thơng
tin giấu được gọi là dấu ẩn (watermark).
- Cryptographic Service Provider: Mô đun cung cấp dịch vụ mã

- Spatial Domain : Miền không gian
- Frequency domain : Miền tần số
- DCT-Discrete Cosine Transform : Biến đổi Cosin rời rạc
- DFT-Discrete Fourier Transform : Biến đổi Fourier rời rạc
- IPR-intellectual property rights : Quyền sở hữu trí tuệ
- Watermark Embedder : Bộ nhúng dấu ẩn
- Watermark Detector : Bộ tách dấu ẩn
- Imperceptibility : Tính khơng thể cảm nhận được
- Robustness : Tính bền vững
- Inseparability : Tính khơng phân chia
- Security: Bảo mật
- Copyright Protection : Bảo vệ bản quyền
- Copy Protection : Bảo vệ, chống sao chép bất hợp pháp
- Tracking: Dò vết dữ liệu theo dõi q trình truyền thơng
- Tamper Proofing : Chống giả mạo
- Broadcast Monitoring : Giám sát truyn thụng

Lê Anh Đức Lớp CNTT2003



Luân văn thạc sĩ

10

- Concealed Communication : Truyn tin bớ mật
- Space : Dấu cách
- Syntax: Cú pháp
- Wavelet Transform : Biến đổi sóng con
- Block-wise: (biến đổi) theo khối
- LSB-Least Significant Bit: Thuật tốn sử dụng bit có trọng số thấp
nhất
- Correlation :Độ tương quan
- Amplitude Modulation : Điều chế biên độ
- Human Visible System : Hệ thống thị giác của con người
- Human audible system : Hệ thống thính giác của con người
- JPEG-Joint Photographic Expert Group : Chuẩn quốc tế về nén
ảnh tĩnh
- MPEG-Moving Picture Expert Group : Chuẩn mã hố và nén tín
hiệu video-audio
- Reduce: Giản lược
- Encrypt: Mã hoá, nghĩa hẹp, sử dụng phương pháp biến đổi thơng
tin bằng các thuật tốn mã hố để đảm bảo tính bí mật cho thơng tin
- Encode: Mã hố, nghĩa rộng, thơng tin sau khi được biến đổi nhờ mã
hoá cùng các biến đổi tương tự như lấy hàm băm, chữ ký ... được trừu
tượng hố thành thơng điệp chuẩn.
- Key container : Hộp khoá
- Block Transformation : Biến đổi khối
- Shape-adaptive DCT: Biến đổi cosin rời rạc tương ứng với hình

dạng
- Permutation: Sự hốn vị
- Pseudorandom : Gi ngu nhiờn

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

11

- Original Image: nh gc
- Middle frequency : Tần số trung bình
- GOP-Group of picture : Cấu trúc nhóm ảnh
- Low bit coding : Mã hố bit thấp
- Phase coding : Mã hoá pha
- Hash object : Đối tượng dùng để tham chiếu đến dữ liệu băm
- Picture element : im nh

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

12

NI DUNG CHNH CA LUN VN
Chng I. Tổng quan về hệ thống đánh dấu ẩn.
- Đưa ra khái niệm và sơ đồ hệ thống đánh dấu ẩn
- Các đặc trưng và tính chất cơ bản của hệ thống.

- Phân loại các kỹ thuật và ứng dụng của các kỹ thuật đánh dấu
ẩn
Chương II. Một số kỹ thật đánh dấu ẩn bảo vệ bản quyền số trên miền khơng
gian và miền hệ số biến đổi
- Dựa trên tính tương quan của miền không gian
- Thay thế các bit có trọng số thấp.
- Dựa trên q trình điều biến biên độ biến đổi Fourier rời rạc
- Dựa trên miền hệ số biến đổi Cosince rời rạc
- Sử dụng lựa chọn vị trí khối và ràng buộc miền biến đổi
Cosince rời rạc.
- Nhúng dấu ẩn trong mức xám sử dụng biến đổi Cosince rời
rạc
Chương III. Xây dựng chương trình mơ phỏng nhúng dấu ẩn dựa trên miền
không gian và miền các hệ số biến đổi.
 Bài toán:
- Đầu vào là một ảnh màu hoặc đen trắng, sử dụng các kỹ thuật đánh dấu
ẩn thông tin trên miền không gian và miền các hệ số ảnh đã được biến đổi để
nhúng thông tin cần dấu vào ảnh.
- Sử dụng các phép biến đổi hình học thơng dụng như: giãn ảnh tương
phản, chuyển đổi Ellip.
- Sau khi sử dụng các phép biến đổi làm thay đổi hình dạng ảnh, dung kỹ
thuật dị tìm thơng tin ẩn và đưa ra thơng tin ẩn ú.

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

13


CHNG I. TNG QUAN V H THNG ĐÁNH DẤU ẨN
I. Khái niệm:
Hệ thống đánh dấu ẩn là kỹ thuật đưa vào nội dung của thông tin đa
phương tiện một dữ liệu số khác (thông tin ẩn) dùng để xác nhận quyền sở
hữu hay xác thực đối với sản phẩm này. Việc đưa dấu ẩn vào nội dung của
thông tin đa phương tiện được thực hiện bằng một giải thuật thích hợp. Thơng
thường giải thuật để chèn dấu ẩn vào thông tin đa phương tiện dựa vào giới
hạn ở khả năng cảm nhận của người.
Ý tưởng cơ bản của quá trình nhúng dấu ẩn là thêm một dấu thông tin
vào dữ liệu gốc cần được đánh dấu thoả mãn điều kiện tín hiệu đánh dấu phải
kín đáo, để cho người sử dụng không thấy được sự khác biệt giữa thông tin
chứa chứa dấu ẩn và thông tin ban đầu cũng như không dễ dàng nhận thấy
được sự hiện diện của dấu ẩn. Đồng thời, phải có tính bảo mật trong một dữ
liệu được đánh dấu nhưng sau đó có thể giải mã từng phần hoặc tồn bộ từ dữ
liệu này nếu khoá bảo mật được sử dụng cho q trình khơi phục dấu ẩn.
II. Hệ thống nhúng thơng tin trên dữ liệu đa phương tiện
1. Sơ đồ hệ thống
Sơ đồ tổng quan môi trường hệ thống nhúng thông tin n trờn d liu
a phng tin:

Lê Anh Đức Líp CNTT2003


Luân văn thạc sĩ

14

D liu nộn
hay cha nộn
D liu ó

watermark
Kờnh truyền
thông

Bộ nhúng
Watermark

Hàm nhúng

Các dạng tấn
công và nhiễu
trên đường

Bộ xác
định

Thông tin
Nhúng

Thông tin
đã xác định

Tùy chọn
Thơng tin
ẩn

Khóa

Thơng số
người dùng


Dữ liệu
ngun thủy

Hình 1.1: Sơ đồ hệ thống đánh dấu ẩn
Hệ thống đánh dấu thông tin trên dữ liệu đa phương tiện về cơ bản gồm
hai phần, thứ nhất là bộ phận nhúng thông tin-Watermark Embedder, thứ hai
là bộ phận giải mã thông tin Watermark Detector. Bộ phận nhúng thông tin
Watermark Embedder sử dụng để nhúng thông tin ẩn vào nội dung dữ liệu đa
phương tiên-Multimedia Content. Còn bộ phận giải mã Watermark Detector
được sử dụng để xác định sự hiện diện của tín hiệu thơng tin ẩn-Watermark
Signal.
Thực thể khố-Watermark Key được sử dụng trong suốt q trình
nhúng tín hiệu và tách tín hiệu ẩn. Khố Watermark Key có sự tương ứng 1-1
với tín hiệu Watermark Signal. Khoá này được giữ mật và chỉ có người được
uỷ quyền mới có thể biết được và có thể xác định được sự hiện diện của dấu
watermark khi sử dụng khố.
Ngồi ra q trình truyền thơng tin đa phương tiện trên mơi trường
mạng có thể bị nhiễu và các dạng thức tấn cơng, vì vậy kỹ thuật đánh dấu ẩn
cũng cần quan tâm đến hai khía cạnh ny. Tuy nhiờn hai b phõn chớnh cn

Lê Anh Đức – Líp CNTT2003


Luân văn thạc sĩ

15

c quan tõm y l, b phõn thực hiện quá trình đánh dấu ẩn và bộ phân
thực hiện quá trình tách dấu ẩn, chúng thể hiện ở hai sơ đồ sau đây:

Thông tin ẩn
Dữ liệu
ban đầu

Hệ thống đánh
dấu thơng tin

Dữ liệu được
đánh dấu ẩn

Khố mật/khố
cơng khai

Mơ hình đánh dấu ẩn nói chung

Thơng tin ẩn
hoặc ảnh gốc
Dữ liệu có
nhúng dấu ẩn

Hệ thống khơi phục
dấu thơng tin

Dấu thơng tin hoặc
các độ đo khác

Khố mật/khố
cơng khai
Hệ thống giải mã dấu ẩn nói chung
Hình 1.2: Hệ thống nhúng và tách dấu ẩn nói chung.

Dưa trên hai mơ hình trên, chúng ta quan tâm đến ba bước trong quá
trình thiết kế một phng thc ỏnh du n:

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

16

Bc 1: Quỏ trỡnh thit k tớn hiệu W được thêm vào dữ liệu gốc,
thơng thường tín hiệu thơng tin W phụ thuộc vào một khố K và thông tin ẩn
I:
W = f 0 (I , K )

Dấu thơng tin W cũng có thể phụ thuộc vào dữ liệu gốc X khi nó được
nhúng:
W = f 0 (I , K , X )

Bước 2: Thiết kế phương thức đánh dấu ẩn để kết hợp dấu thông tin W
với dữ liệu gốc X để thu được dữ liệu được đánh dấu Y:
Y = f1 (X ,W )

Bước 3: Thiết kế q trình giải mã dấu thơng tin tương ứng để phục hồi
thông tin được đánh dấu trong một tín hiệu hỗn hợp bằng việc sử dụng khố
và có sự hỗ trợ của dữ liệu gốc:


I = g(X , Y , K )


hoặc khơng có sự hỗ trợ của dữ liệu gốc:


I = g (Y , K )

Hai bước đấu là q trình thiết kế dấu thơng tin và q trình nhúng dấu
thơng tin thường được kết hợp làm một. Dữ liệu gốc phụ thuộc vào loại ứng
dụng, có thể là dữ liệu nén hoặc không nén, hầu hết các phương pháp đưa ra
đều làm việc trên dữ liệu khơng nén. Dấu thơng tin có thể là một số hiệu, một
đoạn văn bản hay một ảnh. Khoá ở đây được sử dụng để tăng cường tính bảo
mật cho dữ liu s.

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

17

S k thut h thng nhỳng thông tin ẩn trong tập tin đa phương
tiện:
Tập tin đa
phương tiện
gốc

101010..

Văn
bản
Tập tin đa

phương tiện
được nhúng

Dữ liệu ẩn

Văn
bản

Nhúng

“Hello World”

Nén

Chạy tập tin đa
phương tiện
101010..

Xử lý

Tách

“Hello World”

Hình 1.3: Sơ đồ kỹ thuật
Theo sơ đồ kỹ thuật này, cấu trúc của dữ liệu bao gồm tập tin chứa dữ
liệu ẩn gọi là tập tin mang, dữ liệu ẩn được nhúng trực tiếp vào tập tin mang.
Việc xem hoặc nghe tập tin mang theo cách thông thường không thể phát hiện
ra được dữ liệu ẩn. Do vậy cần có cơng cụ phần cứng đặc biệt hoặc phần mềm
để thực hiện việc nhúng và phát hiện dữ liệu ẩn.

Theo sơ đồ này, về nguyên lý nhúng dữ liệu ẩn thì hiện nay có nhiều kỹ
thuật nhúng dữ liệu ẩn. Về cơ bản thì các kỹ thuật này đều thực hiện việc ghi
chèn thông tin yêu cầu vào dữ liệu hình hoặc âm thanh theo cách thức không
làm hư hỏng dữ liệu gốc. Sự biến đổi của dữ liệu hầu như khơng thể nhận biết
được. Có ba cách thức chính để giấu thơng tin vào tập tin a phng tin:

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

18

- Cỏch u tiờn l chốn thng thông tin vào tập tin đa phương tiện
mang.
- Cách thứ hai địi hỏi thực hiện một số phân tích để tìm ra mức độ biến
đổi màu sắc để đặt thơng tin ẩn vào vùng khó phát hiện nhất.
- Cách thứ ba là chèn thông tin ẩn một cách ngẫu nhiên vào tập tin
mang.
2. Các đặc trưng và tính chất:
Sau đây là các tính chất của q trình đánh dấu ẩn. Các tính chất này
cũng giúp chúng ta đánh giá chất lượng của giải thuật:
Tính phổ dụng: Phương pháp đánh dấu ẩn cần được ứng dụng cho
nhiều loại dữ liệu số.
Tính vơ hình (Imperceptibility): Khi đưa dấu ẩn vào chứa bên trong
thơng tin đa phương tiện, thì ta phải đưa theo giải thuật thích hợp để người
dùng khơng nhận thấy sự thay đổi đó. Dấu ẩn phải khơng ảnh hưởng nhiều
đến chất lượng của thông tin đa phương tiện. Thông thường các bit ít cảm
nhận được bởi con người sẽ được ưu tiên dùng để chứa dấu ẩn. Để đạt được
độ bền vững cao, một điều mong muốn là cường độ của dấu ẩn được nhúng

càng cao càng tốt. Vì vậy trong q trình thiết kế các phương pháp đánh dấu
thơng tin ln ln có sự cân nhắc giữa tính chất khơng thể cảm nhận được và
tính bền vững của dấu ẩn. Để đảm bảo tính chất khơng thể cảm nhận của các
thao tác gây ra bởi q trình nhúng thơng tin, một tiêu chuẩn sắp xếp được sử
dụng đối với các phương pháp đánh dấu ẩn. Vấn đề này có thể tường minh
hoặc khơng, dữ liệu gốc có thể biến đổi hoặc cố định. Bởi vì địi hỏi về tính
khơng thể cảm nhận được, các mẫu(có thể là các điểm ảnh hoặc các hệ số
biến đổi) được sử dụng cho q trình nhúng dấu thơng tin chỉ có thể được
biến đổi ít đến giá trị trung bình của chúng.

Lª Anh §øc – Líp CNTT2003


Luân văn thạc sĩ

19

Tớnh bn vng (Robustness): Tựy vo tng loại ứng dụng mà ta có
thể xem tính bền vững này bằng nhiều quan điểm khác nhau, nếu như đối với
các ứng dụng dùng để bảo vệ quyền sở hữu thì dấu ẩn cần phải bền vững qua
một số các hành động cập nhật nội dung thông tin. Với ứng dụng để chống
làm giả hoặc chống lại sự thay đổi trên thơng tin địi hỏi dấu ẩn phải huỷ bỏ
khi có các tác vụ này xảy ra. Để đảm bảo tính bền vững mặc dù chỉ biến đổi
ít, thơng tin đánh dấu phải luôn luôn phân tán một cách dư thừa trên nhiều
mẫu của dữ liệu gốc, vì vậy chúng ta đưa ra khai niệm độ bền vững giao
thoa(“holographic” robustness), có nghĩa là dấu ẩn ln ln có thể được
phục hồi từ một phần nhỏ của dữ liệu được đánh dấu, nhưng q trình phục
hồi dấu thơng tin có thể bền vững hơn nếu như có nhiều dữ liệu gốc có sẵn
cho q trình phục hồi.
Tính khơng phân chia (Inseparability): Sau khi thơng tin đa phương

tiện chứa dấu ẩn thì u cầu là phải rất khó hoặc khơng thể phân chia thành 2
thành phần riêng biệt lúc đầu.
Bảo mật (Security): Sau khi đã đưa dấu ẩn vào thông tin đa phương
tiện, thì yêu cầu là chỉ cho phép những người sử dụng có quyền mới chỉnh sửa
và phát hiện được dấu ẩn điều này được thực hiện nhờ vào khoá trong giải
thuật nhúng dấu ẩn vào thông tin và giải thuật phát hiện ra dấu ẩn trong thông
tin đa phương tiện.
Chẳng hạn như với nhiều mơ hình, các tín hiệu ngẫu nhiên được nhúng
vào dữ liệu như các dấu ẩn. Trong trường hợp này, q trình mơ tả và bộ sinh
số hiệu ngẫu nhiên đầu tiên phải sử dụng khoá. Có hai mức bảo mật, trong
mức đầu tiên thì người sử dụng không được uỷ quyền không thể đọc, giải mã
dấu ẩn và anh ta cũng khơng thể dị ra nếu một tập tin dữ liệu chứa dấu. Mức
thứ hai cho phép người dùng khơng được uỷ quyền dị ra c nu thụng tin

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

20

c ỏnh du. Tuy nhiờn thụng tin được nhúng khơng thể đọc được nếu
khơng có khố. Một số mơ hình có thể nhúng nhiều dấu ẩn, một dấu ẩn được
mã hố dùng khố cơng khai, một dấu ẩn dùng khố mật.
Nói cách khác, một mơ hình được đưa ra có thể kết hợp một hoặc nhiều
khố cơng khai với một khoá mật và kết hợp nhúng một dấu thông tin công
khai và một dấu thông tin mật tốt hơn là nhiều dấu ẩn. Trong quá trình thiết
kế cho một hệ thống bảo vệ bản quyền hoàn chỉnh, các vấn đề như q trình
phát sinh khố mật, q trình phân tán, q trình quản lý(có thể bởi một
thành phần thứ ba) và các khía cạnh tích hợp khác phải được quan tâm.

Khơng mập mờ: Q trình khơi phục dấu ẩn nên rõ ràng, dữ liệu số
sau khi khôi phục phải giống với dữ liệu ban đầu.
3. Các yêu cầu đối với q trình đánh dấu thơng tin
Các u cầu cơ bản được áp dụng cho quá trình đánh dấu trên mọi loại
thông tin:
 Dấu ẩn sẽ mang càng nhiều thơng tin càng tốt, điều này có nghĩa là
tỉ lệ dữ liệu trên dấu thông tin nên giữ ở mức cao.
 Xác suất lỗi thấp.
 Dấu thơng tin nói chung nên được giữ mật và nên chỉ được truy cập
bởi các thành phần được uỷ quyền. Yêu cầu này được hiểu là q
trình bảo mật cho dấu thơng tin và có thể được đảm bảo bởi việc sử
dụng hệ khóa mật mã.
 Dấu ẩn phải ln ln cố hữu trong dữ liệu gốc bất chấp điều gì xảy
ra với dữ liệu gốc, bao gồm tất cả các quá trình xử lý tín hiệu có thể
xảy ra, tất cả các hình thức tấn cơng bởi các thành phần khơng được
uỷ quyền. u cầu này muốn nói đến tính bền vững ca d liu. Nú

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

21

l mt yờu cu v s dng khố cho q trình bảo vệ bản quyền
hoặc các ứng dụng truy cập có điều kiện.
 Một dấu thơng tin được khuyến nghị là không thể loại bỏ và không
thể cảm nhận được bằng giác quan bình thường.
Phụ thuộc vào các loại phương tiện được đánh dấu và vào các ứng dụng
mà các yêu cầu cơ bản có thể được bổ sung thêm các yêu cầu khác:

 Quá trình phục hồi dấu thơng có thể được sử dụng hay khơng dữ
liệu gốc, các dữ liệu không được đánh dấu thông tin
 Phụ thuộc vào ứng dụng, quá trình nhúng dấu thơng tin có thể u
cầu thời gian thực hay là không, chẳng hạn như đánh dấu thông tin
áp dụng cho video. Q trình nhúng thơng tin theo thời gian thực
theo các lý do phức tạp yêu cầu các phương pháp nhúng thông tin
trên các vùng thông tin nén.
 Dựa vào ứng dụng, các dấu ẩn có thể mang các thơng tin cá nhân
hay không. Với các ứng dung khác, chỉ một số các dấu thông tin
được định nghĩa trước được nhúng và với q trình mã hố điều đó
có thể đủ cho quá trình kiểm tra sự tồn tại của các dấu ẩn được định
nghĩa trước(quá trình kiểm tra theo giả thuyết).
III. Phân loại và ứng dụng các kỹ thuật đánh dấu ẩn
1. Phân loại kỹ thuật đánh dấu ẩn
Kỹ thuật đánh dấu ẩn có thể phân loại thành một số các loại khác nhau
dựa trên các tham số khác nhau. Dưới đây là danh sách các loại đánh dấu
thông tin khác nhau:
* Phân loại theo khả năng cảm nhân của con người
- Dấu ẩn có thể nghe thấy, nhìn thy c

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

22

- Du n khụng th nghe thy, nhìn thấy được
o Đánh dấu thơng tin yếu: là loại đánh dấu ẩn mà thông tin ẩn
rất dễ dàng bị phá huỷ bởi q trình biến đổi thơng thường

o Đánh dấu thơng tin bền vững: là loại hình đánh dấu thông tin
mà thông tin rất bền vững trước các biến đổi thông thường
* Phân loại theo thông tin cần được đánh dấu bản quyền
- Đánh dấu thông tin trên dữ liệu dạng văn bản
- Đánh dấu thông tin trên dữ liệu dạng ảnh
- Đánh dấu thông tin trên dữ liệu dạng video
- Đánh dấu thông tin trên dữ liệu dạng audio
* Phân loại dựa theo miền thực hiên quá trình đánh dấu
- Đánh dấu thông tin trên miền không gian
- Đánh dấu thông tin trên miền tần số
* Phân loại dựa trên ứng dụng
- Đánh dấu thông tin dựa trên dữ liệu bên nguồn
- Đánh dấu thông tin dựa trên d liu bờn nhn

Lê Anh Đức Lớp CNTT2003


Luân văn thạc sĩ

23

ỏnh du n

Theo min
lm vic
Min khụng
gian

Vn bn


Theo loại tài
liệu

Dựa trên
nguồn

Miền tần số

Ảnh

Audio

Video

Khơng cảm
nhận được

Có thể cảm
nhận được

Bền
vững

Giữ mật

Cơng
khai

Yếu


Có thể khơi
phục được

Khơng thể phơi
phục được

Hình1.4: Sơ đồ phân loi ỏnh du n

Lê Anh Đức Lớp CNTT2003

Theo loi
ng dụng

Theo khả năng
cảm nhận

Dựa trên
đích


Luân văn thạc sĩ

24

2. ng dng cỏc k thut ỏnh dấu ẩn
Kỹ thuật đánh dấu ẩn dữ liêu ẩn khác với các kỹ thuật mã hóa dữ liệu.
Thơng tin multimedia có những dữ liệu ẩn khơng bị "khóa", mỗi thơng tin
được bảo vệ tự thực hiện việc bảo mật chứ không cần đến hệ thống bảo mật
đầu cuối - thường là loại đắt tiền. Cơ chế bảo mật này linh động và có chi phí
thấp; có thể kết hợp với các kỹ thuật mã hóa khác để tăng độ an tồn. Kỹ

thuật nhúng dữ liêu ẩn có nhiều ứng dụng: bảo vệ bản quyền, kiểm sốt sao
chép, truyền tải thơng tin ... Hiện nay đã có một số ứng dụng thương mại của
kỹ thuật này, như cơ chế xác thực dùng trong máy ảnh số nhằm cấm thay đổi
ảnh chụp, cơ chế kiểm soát sao chép đĩa DVD, cơ chế bảo vệ bản quyền nhạc
số và sẽ có nhiều ứng dụng khác nữa trong tương lai.
Dữ liệu ẩn có thể phân thành hai loại: loại cơng khai và loại bí mật.
Loại dữ liệu ẩn cơng khai có thể được sử dụng để xác định nguồn gốc, quyền
sử dụng của thông tin. Đây là dạng mà các công ty phim ảnh, âm nhạc đang
dùng. Loại dữ liệu ẩn bí mật có ưu điểm hơn so với loại dữ liệu ẩn công khai
vì sự hiện hữu của nó khó phát hiện và vì vậy khả năng bị tấn cơng ít hơn.
Loại này có thể được dùng để kiểm tra sự thay đổi dữ liệu hay dùng để truyền
tải thơng điểm bí mật mà chỉ những ai biết được khố mới có thể đọc được,
đây có thể xem là dạng thơng tin trong thơng tin. Dựa vào hai loại này, trên
thực tế có các dạng ứng dụng chủ yếu sau đây:
Bảo vệ quyền sở hữu (Copyright Protection): Dấu ẩn có thể được
dùng để bảo vệ quyền sở hữu đối với các sản phẩm đa phương tiện. Nội dung
của các thông tin đa phương tiện này sẽ chứa thêm các thông tin về người sở
hữu. Khi các thông tin này được sử dụng bất hợp pháp thì ta có thể dùng bộ
phận tách dấu n phỏt hin.

Lê Anh Đức Lớp CNTT2003


×