Tải bản đầy đủ (.doc) (89 trang)

Nghiên cứu kỹ thuật xử lý ảnh ứng dụng phát hiện khối u trong gan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.36 MB, 89 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN
THÔNG

LÊ THỊ HÀ PHƯƠNG

NGHIÊN CỨU KỸ THUẬT XỬ LÝ ẢNH
ỨNG DỤNG PHÁT HIỆN KHỐI U TRONG GAN

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2019
Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN
THÔNG

LÊ THỊ HÀ PHƯƠNG

NGHIÊN CỨU KỸ THUẬT XỬ LÝ ẢNH
ỨNG DỤNG PHÁT HIỆN KHỐI U TRONG GAN
Ngành: Khoa học máy tính
Mã số: 8 480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS. ĐỖ NĂNG TOÀN



THÁI NGUYÊN - 2019
Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




i

LỜI CAM ĐOAN
Tôi xin cam đoan các số liệu và kết quả nghiên cứu của luận văn là
trung thực và không trùng lặp với đề tài khác.
Tôi cũng xin cam đoan mọi sự giúp đỡ cho việc thực hiện luận văn này
đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn
gốc.
Thái Nguyên, ngày tháng năm 2019
Học viên thực hiện

Lê Thị Hà Phương

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




ii

LỜI CẢM ƠN
Trong suốt thời gian học tập và nghiên cứu tại lớp cao học K16A
trườngĐại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên

chuyên ngành Khoa học máy tính, tôi đã nhận được rất nhiều sự bảo ban, quan
tâm, định hướng, nhiệt tình của các thầy cô trong trường. Các thầy cô giáo
quản lý sau đại học đã luôn giúp đỡ tạo điều kiện giúp tôi có thể học tập cũng
như nghiên cứu một cách tốt trong suốt thời gian học tập tại trường. Nhân dịp
này, tôi xin bày tỏ lời cảm ơn chân thành tới tập thể các thầy cô trong trường
Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên.
Tôi xin chân thành cảm ơn sâu sắc tới Thầy PGS.TS Đỗ Năng Toànđã
tận tình hướng dẫn và tạo điều kiện cho tôi hoàn thành tốt luận văn tốt
nghiệp này.
Quá trình thực hiện đề tài không tránh khỏi những thiếu sót, rất mong
tiếp tục nhận được sự đóng góp ý kiến của các thầy cô đối với đề tài nghiên
cứu của tôi để đề tài được hoàn thiện hơn.
Tôi xin trân trọng cảm ơn!

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




3

MỤC LỤC
LỜI CAM ĐOAN .................................................................................... i
LỜI CẢM ƠN .........................................................................................ii
MỤC LỤC..............................................................................................iii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT ..................... v
DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN ................. vi
MỞ ĐẦU ................................................................................................ 1
Chương 1.KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT
HIỆNKHỐI U TRONG GAN .............................................................. 3

1.1. Khái quát về xử lý ảnh ..................................................................... 3
1.1.1. Các khái niệm cơ bản .................................................................... 3
1.1.2. Các bước xử lý ảnhsố.................................................................... 5
1.2. Bài toán phát hiện bất thường trong gan ........................................
15
1.2.1. Giới thiệu về xử lý ảnh y tế......................................................... 15
1.2.2. Các chuẩn ảnh y tế và truyền thông ảnh y tế .............................. 16
1.2.3. Phát hiện bất thường trong gan dựa vào ảnh y tế........................ 19
Chương 2.MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN KHỐI U
TRONG GAN ...................................................................................... 20
2.1. Phát hiện khối u dựa vào phát hiện biên ........................................ 20
2.1.1. Giới thiệu..................................................................................... 20
2.1.2. Kỹ thuật phát hiện biên Gradient ................................................ 21
2.1.3. Kỹ thuật phát hiện biên Laplace ................................................. 24
2.1.4. Phương pháp canny ..................................................................... 27
2.2. Phát hiện khối u dựa vào đặc trưng bất biến tỷ lệ - SIFT ..............
28
2.2.1. Phát hiện cực trị không gian tỷ lệ (Scale-space Extrema
Detection)30
2.2.2. Định vị chính xác điểm khóa (Keypoint localization) ................
34
Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




4

2.2.3. Gán hướng cho các điểm khóa (Oriented Assignment).............. 37
2.2.4. Bộ mô tả ảnh cục bộ (Keypoint Description) ............................. 38


Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




5

Chương 3.CHƯƠNG TRÌNH THỬ NGHIỆM ................................. 42
3.1. Phân tích yêu cầu bài toán.............................................................. 42
3.1.1. Khối u trong cơ thể người ........................................................... 42
3.1.2. Khối u, nang trong gan người và các đặc điểm của nó ............... 43
3.1.3. Cách giải quyết bài toán
3.1.4. Yêu cầu thực nghiệm, ứng dụng ................................................. 47
3.3. Một số kết quả chương trình .......................................................... 50
KẾT LUẬN........................................................................................... 52
TÀI LIỆU THAM KHẢO .................................................................. 54

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




6

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT
TÊN

TÊN


1

VIẾT TẮT
Pixel

TIẾNG ANH
Picture Element

2

CGA

Color Graphic Adapter

3

RLC

Run Length Coding

4

MPEG

5

DICOM

6


PACS

7

SIFT

TT

ĐỊNH NGHĨA
Điểm ảnh
Chế độ đồ họa màu
Phương pháp mã hóa
loạt dài

Chuẩn nén video và
Moving Picture Experts
audio theo ISO/IEC
Group
Digital ImagingandCommunic Chuẩn hình ảnh số và
ations in Medicine
Picture archiving and
communication system
Scale Invariant
Feature Transform

truyền thông trong y tế
Hệ thống lưu trữ và
truyền hình ảnh
Biến đổi đặc trưng bất
biến tỷ lệ


Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




7

DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN
Hình 1.1.

Quá trình xử lý ảnh ............................................................... 3

Hình 1.2.

Các bước cơ bản trong một hệ thống xử lý ảnh .................... 5

Hình 1.3.

Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các
khối........................................................................................ 5

Hình 1.4.

Ảnh gốc và ảnh sau khi nắn chỉnh ........................................ 6

Hình 1.5.

Dãn độ tương phản ................................................................ 8


Hình 1.6.

Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thông qua
DIB ...................................................................................... 14

Hình 1.7.

Sự chuyển đổi giữa các mô hình biểu diễn ảnh .................. 14

Hình 1.8.

Minh họa đối tượng thông tin và dịch vụ của DICOM....... 17

Hình 2.1.

Bộ lọc Laplace of Gauss ..................................................... 25

Hình 2.2.

Mô hình tính của phương pháp Canny................................ 27

Hình 2.3.

Xây dựng một thể hiện không gian tỷ lệ............................. 31

Hình 2.4.

Các giá trị cực đại và cực tiểu của các ảnh DoG ................ 32

Hình 2.5.


Các giai đoạn lựa chọn các điểm khóa................................ 35

Hình 2.6.

Bộ mô tả điểm khóa ............................................................ 39

Hình 3.1.

U máu gan ........................................................................... 43

Hình 3.2.

Tăng sản thể nốt khu trú...................................................... 44

Hình 3.3.

U tuyến gan ......................................................................... 45

Hình 3.4.

Nang gan ............................................................................. 45

Hình 3.5.

Gan đa nang......................................................................... 46

Hình 3.6.

Mô hình chức năng nhận dạng đối tượng……………………….47


Hình 3.7.

Ảnh chụp CT lá gan ............................................................ 49

Hình 3.8.

Ảnh sau khi xử lý ................................................................. 50

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




vii

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




1

MỞ ĐẦU
Mỗi năm có hơn 8 triệu người chết vì ung thư, có khoảng 14 triệu ca
ung thư mới được chuẩn đoán trên thế giới. Theo tổ chức y tế thế giới
(WHO) nếu không có biện pháp kịp thời thì con số này sẽ tăng lên. Việc
phòng ngừa đúng cách và sống lành mạnh là một trong những cách làm
giảm một phần ba nguy cơ bị mắc căn bệnh này, bên cạnh đó việc thường
xuyên kiểm tra sức khỏe và xét nghiệm sàng lọc sớm cũng làm giảm nguy

cơ bị mắc bệnh ung thư. Ở Việt Nam, trong bản đồ ung thư thế giới, tỷ lệ
mắc ung thư được xếp vào nhóm nước cao thứ 3, với gần 200 ca mắc trên
100 nghìn người. Tại các nước phát triển,chương trình sàng lọc phát hiện
sớm ung thư đạt kết quả tốt, đã góp phần chữa khỏi hơn 50% bệnh nhân ung
thư thì ở nước ta đa số người bị ung thư khi được chẩn đoán đã ở giai đoạn
muộn, tỉ lệ chữa khỏi bệnh còn rất thấp. Cơ hội chữa khỏi bệnh ung thư
chính là làm sao phát hiện sớm ung thư.
Vì vậy, việc cảnh báo ung thư sớm là vô cùng quan trọng để hỗ trợ bác
sỹ trong quá trình chuẩn đoán và điều trị cho bệnh nhân. Với mục tiêu là
phát hiện vùng ảnh có khả năng là khối u, tôi lựa chọn đề tài “Nghiên cứu
kỹ thuật xử lý ảnh ứng dụng phát hiện khối u trong gan” nhằm nghiên
cứu các kỹ thuật xử lý ảnh, qua đó ứng dụng giải quyết bài toán phát hiện
khối u trong gan.
Nội dung luận văn bao gồm phần mở đầu, phần kết luận và ba chương
với bố cục nội dung như sau:
Chương 1. Khái quát về xử lý ảnh và bài toán phát hiện khối u
trong

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN




2

gan
Chương này trình bày khái quát về xử lý ảnh, ảnh y tế và bài toán phát
hiện bất thường trong gan.

Số hóa bởi Trung tâm Học liệu và Công nghệ thông tin – ĐHTN





Chương 2. Một số phương pháp phát hiện khối u trong gan
Chương này hệ thống hóa một số kỹ thuật phát hiện biên như kỹ thuật
Gradient, kỹ thuật Laplace, kỹ thuậtCanny và kỹ thuật SIFT dùng cho việc
phát hiện vùng khác biệt hay bất thường trong ảnh lá gan.
Chương 3. Chương trình thử nghiệm
Phần mềm đầu vào là ảnh lá gan, trích xuất từ ảnh chụp cắt lớp hay ảnh
cộng hưởng tử, đầu ra ảnh có các vùng khoanh tương ứng với các khối u trong
ảnh.


Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN
KHỐI U TRONG GAN
1.1.Khái quát về xử lý ảnh
1.1.1.Các khái niệm cơ bản
1.1.1.1. Xử lý ảnh
Xử lý ảnh [1,2,3]là một trong những cách tiếp cận phân tích, tổng hợp
hình ảnh theo ý tưởng và mục đích của người sử dụng. Tuy xử lý ảnh là một
trong những ngành khoa học còn tương đối mới so với nhiều ngành khoa học
khác, nhưng tốc độ phát triển rất nhanh, được rất nhiều các viện nghiên cứu,
ứng dụng.
Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý
ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp
dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong
tương tác người -máy.
Mục đích của xử lý ảnh là nâng cao chất lượng hình ảnh phục vụ cho

con người và xử lý dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó
đưa ra những quyết định cần thiết.

Hình 1.1. Quá trình xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh, vệ
tinh dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh…


1.1.1.2. Điểm ảnh
Điểm ảnh (Pixel) làmột phần tử nhỏ nhất của một hình ảnh số tại toạ độ
(x, y) với độ xám hoặc màu nhất định. Để mắt người cảm nhận sự liên tục về
không gian và mức xám (hoặc màu) của ảnh số gần như ảnh thật thì kích
thước và khoảng cách giữa các điểm ảnh đó được chọn sao cho thích hợp.
1.1.1.3. Ảnh
Là một tập hợp các điểm ảnh được biểu diễn thông qua một mảng hai
chiều I(n,p): n dòng và p cột, với ảnh này thì số lượng điểm ảnh sẽ là n×p. Ta
kí hiệu I(x,y) để chỉ giá trị mức xám của điểm ảnh tại vị trí toạ độ (x,y).
1.1.1.4. Mức xám củaảnh
a) Định nghĩa: Mức xám (grey level) của điểm ảnh là kết quả sự mã
hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số tại
điểm đó.
b) Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức
256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8 bit) để
biểu diễn mức xám: Mức xám dùng một byte biểu diễn: 28=256 mức, tức là từ
giá trị 0 đến255).
c)Ảnh đen trắng: là ảnh chỉ có hai màu đen và trắng với mức xám ở các
điểm ảnh có thể khácnhau.
d) Ảnh nhị phân: ảnh chỉ có hai mứcđen trắng phân biệt tức dùng 1 bit
mô tả 21 mức khác nhau. Nói cách khác mỗi điểm ảnh của ảnh nhị phân chỉ có
thể là 0 hoặc1.

e) Ảnh màu: theo lý thuyết của Thomas là ảnh tổ hợp từ ba màu cơ bản
(Red, Blue, Green) được thu nhận trên các dải băng tần khác nhau để tạo nên
thế giới màu, người ta thường dùng ba byte để mô tả mức màu, khi đó các giá
trị màu: 28*3 = 224 ≈ 16,7triệu màu.


1.1.1.5. Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là số lượng điểm ảnh ( pixcel)trên
một hình ảnh số được hiển thị.
1.1.2.Các bước xử lý ảnhsố
Một hệ thống xử lý ảnh có sơ đồ tổng quát như sau:

Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh

Hình 1.3. Sơ đồ phân tích, xử lý ảnh và lưu đồ thông tin giữa các khối
Sau đây sẽ trình bày một số kỹ thuật xử lý ảnh cần thiết phục vụ cho
việc cài đặt chương trình thử nghiệm (theo các bước trong hình 1.2), còn các
thành phần khác sẽ được giới thiệu ở mức cơ bản.
1.1.2.1.Thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng.
Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông
dụng Raster, Vector.


Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu
nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc
được chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình:
- Cảm biến: biến đổi năng lượng quang học thành năng lượngđiện

- Tổng hợp năng lượng điện thànhảnh
1.1.2.2. Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa
vào bộ tiền xử lý (Image Processing) để nâng cao chất lượng. Chức năng
chính của bộ tiền xử lý là nắn chỉnh biến dạng, lọc nhiễu, chỉnh mức xám,
nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
a) Nắn chỉnh biến dạng
Ảnh gốc thường bị biến dạng do các thiết bị quang học và điện tử.

ẢnhgốcẢnh sau khi nắm chỉnh
Hình 1.4. Ảnh gốc và ảnh sau khi nắn chỉnh
Các nguyên nhân gây ra biến dạng ảnh do:
- Do đầu thu ảnh chất lượngkém, camera.
- Do môi trường, ánh sáng, hiện trường (scene), khí quyển, nhiễuxung.
- Do chấtlượng.
Để khắc phục người ta sử dụng các phép chiếu được xây dựng trên tập
các điểm điều khiển.
Giả sử (Pi, Pi’) với i = 1, n có n các tập điều khiển. Tìm hàm f: Pi a f (Pi)


′ 2
∑� | |�(�� ) − ��
sao cho:
|| → ���
��=1


(1.1)



Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc
nhất tuyến tính. Khi đó hàm f códạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)

(1.2)


Ta có:
∅ = ∑� (�(��
′ 2� ) −�
) =∑



��=1

2


�=
1

[( � + �
− � ′ ) + (� �
+� +
� �
1
1 �
1
2




2

�2 �� +��2 ]
(1.3)
−� ′ )2
Để cho φ → min

(1.4)
Giải hệ phương trình tuyến tính tìm được a1, b1, c1, tương tự tìm
đượca2,b2, c; từ đó ta xác định được hàmf.
b)Lọc nhiễu
Lọc nhiễu là làm cho hình ảnh có chất lượng tốt hơn. Thường ảnh thu
nhận được không được sắc nét có nhiễu nên cần phải loại bỏ nhiễu làm ảnh nét
hơn. Để tách nhiễu hay làm trơn nhiễu, người ta sử dụng các bộ lọc tuyến
tính( lọc trung bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc
đồng hình). Từ bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ
sở lý thuyết lọc là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó,
để lọc nhiễu người ta thường dùng lọc thông thấp (theo quan điểm tần số
không gian) hay lấy tổ hợp tuyến tính để san bằng (lọc trungbình).
c)Tăng độ tương phản
Ảnh số là tập hợp các điểm ảnh, mà mỗi điểm ảnh có giá trị độ sáng khác
nhau.


Ở đây,mắt người dễ nhận ra hình ảnh nhờ có độ sáng, song không phải là
quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên
hai nền khác nhau sẽ cho cảm nhận khác nhau. Vì vậy, độ tương phản biểu

diễn sự thay đổi độ sáng của đối tượng so với nền. Như vậy có thể hiểu rằng,
độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Với định
nghĩa này, nếu ảnh có độ tương phản thấp, ta có thể thay đổi tuỳ ý theo ý
muốn.
Ảnh với độ tương phản thấp có thể do độ sáng không đủ hay không
đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh.
Để điều chỉnh lại độ tương phản của ảnh, ta điều chỉnh lại biên độ trên toàn
dải hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào
(dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm
lôgarít). Khi dùng hàm tuyến tính các độ dốc α, β, γphải chọn lớn hơn một
trong miền cần dãn. Các tham số a và b (các cận) có thể chọn khi xem xét lược
đồ xám của ảnh.

Hình 1.5. Dãn độ tương phản
ảnh kết quả trùng với ảnh
dãn độ tương phản
co độ tương phản
Chú ý, nếu dãn độ tương phản bằng hàm tuyến tính ta có
Hàm mũ hay dùng trong dãn độ tương phản có dạng:
f = (X[m,n])p(1.5)
d)Chỉnh mức xám


Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông
thường có hai hướng tiếp cận:


- Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có hai mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng: In ảnh màu ra máy in đentrắng.

- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn choảnh.
1.1.2.3.Phân vùng ảnh
Phân vùng ảnh là khâu quan trọng trong quá trình xử lý ảnh. Giai đoạn
này nhằm phân tích hình ảnh thành các vùng riêng biệt vàđồng nhất theo một
tiêu chí nào đó dựa theo biên hay các vùng liên thông. Tiêu chuẩn để xác định
các vùng liên thông có thể là cùng mức xám, cùng màu hay cùng độ nhám...
Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật lý của
vùng.
Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh. Nó là một tập
hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức
màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng
ảnh là nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh (Boundary)
là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám
tương đối đồng đều hay tính kết cấu tươngđồng.
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng:
phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất
hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên. Ngoài ra còn có
các kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
1.1.2.4.Trích chọn đặc trưng
Ảnh đầu ra sau phân đoạn sẽ đượctrích chọn các tính chất để thể hiện
ảnh, giúp cho việc nhận dạng các đối tượng ảnh chính xác,làm cơ sở để phân


biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được.
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra vài đặc điểm của ảnh sau đây:

- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn...
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (Zonal Filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (Feature Mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn...)
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ
toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (Zero
Crossing) ...
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng bộ nhớ lưu trữ
giảm xuống.
1.1.2.5.Nhận dạng và nội suy ảnh
Đây là giai đoạn cuối của các hệ thống xử lý ảnh. Nhận dạng ảnh
(Image Recognition) là quá trình phân loại các đối tượng được biểu diễn theo
một mô hình nào đó và gán chúng vào một lớp (gán cho đối tượng một tên
gọi) dựa theo những quy luật và mẫu chuẩn. Quá trình nhận dạng dựa vào
những mẫu học biết trước gọi là nhận dạng có thầy hay học có thầy, trong
những trường hợp ngược lại gọi là học không có thầy.
Nội suy (Interpretation) là phán đoán theo ý nghĩa trên cơ sở nhận
dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được
nội suy thành mã điệnthoại.


Có nhiều cách phân loại ảnh khác nhau về ảnh. Theo lý thuyết về nhận
dạng, các mô hình toán học về ảnh được phân theo hai loại nhận dạng ảnh
cơ bản:
- Nhận dạng theo thamsố.

- Nhận dạng theo cấutrúc.
Hay có ba cách tiếp cận khác nhau:
- Nhận dạng dựa vào phân hoạch khônggian.
- Nhận dạng dựa vào cấutrúc.
- Nhận dạng dựa vào kỹ thuật mạngnơron.
Hai cách tiếp cận đầu là các kỹ thuật kinh điển. Các đối tượng ảnh quan
sát và thu nhận được phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất
lượng, làm nổi các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trưng,
cuối cùng mới qua giai đoạn nhậndạng.
Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán nhận, lưu
trữ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh con
người. Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác người không
cần qua giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh
với các mẫu đã lưu trữ để nhận dạng.
Hiện nay, trong khoa học và công nghệ một số đối tượng nhận dạng
đang được áp dụng là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng
đối tượng chuyển động, nhận dạng mặt người…
1.1.2.6.Hậu xử lý
a) Nén ảnh
Nén ảnh là kỹ thuật nhằm giảm thiểu không gian lưu trữ. Do đó khi mô


×