Đồ Án Tốt Nghiệp
Trang i
LỜI CẢM ƠN
Nhóm thực hiện đề tài xin gửi lời cảm ơn chân thành đến thầy Nguyễn Văn
Phúc đã tận tình hướng dẫn giúp đỡ trong quá trình thực hiện đồ án.
Nhóm thực hiện đề tài cũng xin bày tỏ lòng biết ơn đến các thầy cô trường
Đại học Sư phạm kỹ thuật TPHCM đã tận tình giảng dạy trong thời gian qua để
giúp sinh viên có được những kiến thức để hoàn thành đồ án.
Cuối cùng nhóm thực hiện đề tài xin chân thành cảm ơn sự đóng góp ý kiến
của các bạn sinh viên.
Sinh viên thực hiện
Nguyễn Hữu Trung
Nguyễn Huy Minh
Đồ Án Tốt Nghiệp
Trang ii
MỤC LỤC
LỜI CẢM ƠN...........................................................................................................................i
MỤC LỤC .............................................................................................................................. ii
LIỆT KÊ HÌNH ....................................................................................................................... v
LIỆT KÊ BẢNG.................................................................................................................. viii
LIỆT KÊ TỪ VIẾT TẮT ......................................................................................................ix
TÓM TẮT ............................................................................................................................. xii
ABSTRACT ........................................................................................................................ xiii
CHƯƠNG 1: GIỚI THIỆU .......................................................................................................1
1.1. Vai trò và ứng dụng của công nghệ hiện nay...............................................................1
1.2. Lý do chọn đề tài .............................................................................................................1
1.3. Mục tiêu đề tài .................................................................................................................2
1.4. Giới hạn đề tài ..................................................................................................................2
1.5.Bố cục của đồ án ...............................................................................................................2
CHƯƠNG 2:CƠ SỞ LÝ THUYẾT .........................................................................................3
2.1. Giới thiệu về hệ thống xử lí ảnh ....................................................................................3
2.1.1. Phần thu nhận ảnh (Image Acquisition) ................................................................4
2.1.2.Tiền xử lý (Image Processing) .................................................................................4
2.1.3. Phân đoạn (Segmentation) hay phân vùng ảnh.....................................................4
2.1.4.Biểu diễn ảnh (Image Representation) ....................................................................4
2.1.5. Nhận dạng và nội suy ảnh (Image Recognition and Interpretation) ..................5
2.1.6. Cơ sở tri thức (Knowledge Base) ...........................................................................5
2.2. Những vấn đề cơ bản trong hệ thống xử lí ảnh............................................................5
2.2.1. Điểm ảnh (Picture Element) ....................................................................................5
2.2.2. Độ phân giải của ảnh................................................................................................6
2.2.3. Mức xám của ảnh .....................................................................................................6
2.2.4. Khử nhiễu ..................................................................................................................6
2.2.5. Chỉnh mức xám.........................................................................................................7
2.2.6. Nhận dạng ảnh ..........................................................................................................7
2.3. Các hình thái c ủa ảnh ......................................................................................................8
Đồ Án Tốt Nghiệp
Trang iii
2.3.1. Chuyển ảnh màu thành ảnh xám.............................................................................8
2.3.2. Lược đồ xám của ảnh (Histogram).........................................................................9
2.3.3. Không gian màu..................................................................................................... 10
2.4. Tổng quan về hệ thống nhúng..................................................................................... 14
2.4.1. Lịch sử phát triển của hệ thống nhúng................................................................ 14
2.4.2. Khái niệm hệ thống nhúng ................................................................................... 15
2.4.3. Đặc trưng của hệ thống nhúng ............................................................................. 16
2.4.4. Hệ điều hành thời gian thực (RTOS) và kernel thời gian thực ....................... 18
2.4.5. Chương trình, tác vụ và luồng ............................................................................. 19
2.4.6. Kiến trúc hệ thống thời gian thực ........................................................................ 20
2.4.7. Các thành phần của hệ điều hành Embedded Linux ......................................... 21
2.4.8. Các bước xây dựng một hệ thống Embedded Linux......................................... 25
2.5. Giới thiệu về KIT Mini2440 ....................................................................................... 27
CHƯƠNG 3: KỸ THUẬT PHÂN TÁCH MÀU DA ......................................................... 36
3.1 Kỹ thuật phân tách vùng màu da ................................................................................. 36
3.2 Thuật toán phân tách vùng màu da.............................................................................. 37
3.3. Kĩ thuật phân tách vùng màu da PEER ET AL, 2003 ............................................. 39
3.4. Kĩ thuật phân tách vùng màu da TAREK M.MAHMOUD, 2008 ......................... 39
CHƯƠNG 4: BIÊN DỊCH ỨNG DỤNG TRÊN BOARD NHÚNG MINI2440 ........... 41
4.1. Cài đặt trình biên dịch chéo AMR-LINUX-GCC trên Host ................................... 41
4.2. Cài đặt thư viện Tslib trên Host.................................................................................. 42
4.3. Cài đặt thư viện QtEveryWhere trên Host ............................................................... 45
4.4. Cài đặt thư viện OpenCV cho Host............................................................................ 49
4.5. Cài đặt hệ điều hành Linux cho Target...................................................................... 52
4.6. Cấu hình TouchScreen cho Target ............................................................................. 52
4.7. Cài đặt thư viện OpenCV cho Target......................................................................... 54
CHƯƠNG 5: KẾT QUẢ THỰC HIỆN ................................................................................ 56
5.1. Kết quả thực hiện phần mềm Matlab ......................................................................... 56
5.1.1. Lưu đồ giải thuật trên Matlab .............................................................................. 56
5.1.2. Giới thiệu chương trình mô phỏng Matlab......................................................... 57
5.2 Kết quả thực hiện phần cứng........................................................................................ 62
5.2.1. Lưu đồ giải thuật trên Qt ...................................................................................... 62
Đồ Án Tốt Nghiệp
Trang iv
5.2.2. Cài đặt được hệ điều hành lên kit mini2440 ...................................................... 63
5.2.3. Xây dựng được hệ thống nhận dạng màu da dựa trên hệ thống nhúng trên kit
mini2440 ..................................................................................................................... 64
CHƯƠNG 6: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ................................................... 66
6.1. Kết quả đạt được........................................................................................................... 66
6.2. Hạn chế của đề tài......................................................................................................... 66
6.3. Hướng phát triển đề tài ................................................................................................ 66
Tài liệu tham khảo ............................................................................................................... 67
Đồ Án Tốt Nghiệp
Trang v
LIỆT KÊ HÌNH
Hình 2.1: Các bước cơ bản trong xử lý ảnh ............................................................................3
Hình 2.2 Ảnh RGB .....................................................................................................................8
Hình 2.3: Lược đồ histogram ....................................................................................................9
Hình 2.4: Các màu cơ sở......................................................................................................... 10
Hình 2.5: Không gian màu RGB ........................................................................................... 11
Hình 2.6: Không gian màu YCrCb........................................................................................ 12
Hình 2.7: Không gian màu HSV............................................................................................ 13
Hình 2.8: Tổng quan hệ thống nhúng ................................................................................... 16
Hình 2.9: Hệ thống thời gian thực ......................................................................................... 19
Hình 2.10: Tác vụ và luồng .................................................................................................... 19
Hình 2.11 : Kiến trúc điều khiển theo vòng lặp Polling ..................................................... 20
Hình 2.12: Kiến trúc điều khiển theo mô hình sắp xếp mức độ ưu tiên ........................... 21
Hình 2.13: Kiến trúc hệ điều hành Linux ............................................................................. 22
Hình 2.14 : Cấu trúc kit phát triển nhúng mini2440 ........................................................... 28
Hình 2.15 : Bộ nhớ ngoài ....................................................................................................... 30
Hình 2.16 : Bộ nhớ Flash........................................................................................................ 31
Hình 2.17 : Khối nguồn .......................................................................................................... 31
Hình 2.18 : Khối Reset............................................................................................................ 32
Hình 2.19 : Khối Nút nhấn ..................................................................................................... 32
Hình 2.20 : Khối Analog ........................................................................................................ 33
Hình 2.21 : Khối Speaker ....................................................................................................... 33
Hình 2.22 : Khối Serial Port................................................................................................... 33
Hình 2.23 : Khối USB............................................................................................................. 34
Hình 2.24 : Khối LCD ............................................................................................................ 34
Hình 2.25 : Khối EEPROM.................................................................................................... 34
Hình 2.26 : Khối Network Interface...................................................................................... 35
Hình 3.1 : Mật độ các màu da người trên thế giới............................................................... 37
Hình 3.2: Mô hình màu da trong không gian YCrCb ......................................................... 38
Hình 3.3: Phân tách màu da từ 1 ảnh màu............................................................................ 39
Hình 4.1: Nội dung file bashrc ............................................................................................... 41
Hình 4.2: Arm-linux-gcc được cài đặt thành công .............................................................. 41
Đồ Án Tốt Nghiệp
Trang vi
Hình 4.3: Cài đặt tiện ích autoconf........................................................................................ 42
Hình 4.4: Cài đặt tiện ích libtool ........................................................................................... 42
Hình 4.5: Tải gói cài đ ặt Tslib ............................................................................................... 42
Hình 4.6: Quá trình chuẩn bị file cần thiết để cài đặt ......................................................... 43
Hình 4.7: Quá trình kiểm tra các điều kiện của hệ thống cần cho việc cài đặt ................ 43
Hình 4.8: Biên dịch thư viện Tslib ........................................................................................ 44
Hình 4.9: Cài đặt thư viện Tslib ............................................................................................ 44
Hình 4.10 : Quá trình cài đặt thư viện Tslib thành công .................................................... 45
Hình 4.11: Nội dung file g++.conf ........................................................................................ 46
Hình 4.12: Nội dung file qmake.conf ................................................................................... 46
Hình 4.13: Quá trình kiểm tra các điều kiện của hệ thống cần cho việc cài đặt.............. 48
Hình 4.14: Quá trình cài đặt QtEveryWhere thành công ................................................... 48
Hình 4.15: Quá trình cài đặt các gói thư viện cần thiết ...................................................... 49
Hình 4.16: Kiểm tra sự hoạt động các định dạng ảnh cho Host ........................................ 49
Hình 4.17: Quá trình cài đ ặt OpenCV thành công .............................................................. 50
Hình 4.18: Nội dung file opencv.conf ................................................................................. 50
Hình 4.19: Nội dung file bash.bashrc .................................................................................. 51
Hình 4.20: Kết quả test hoạt động của thư viện OpenCV trên Host ................................. 51
Hình 4.21: Quá trình cài đ ặt hệ điều hành Target ............................................................... 52
Hình 4.22: Quá trình truyền tải file từ Host xuống Target ................................................. 52
Hình 4.23 : Đăng nhập vào Target thông qua giao thức FTP ............................................ 53
Hình 4.24 : Các thư mục bên trong Board mini2440 .......................................................... 53
Hình 4.25: Nội dung file profile ............................................................................................ 54
Hình 4.26: Kiểm tra sự hoạt động các định dạng ảnh cho Target ..................................... 55
Hình 4.27: Download thư viện OpenCV xuống Target ...................................................... 55
Hình 5.1: Lưu đồ giải thuật trên Matlab ............................................................................... 56
Hình 5.2: Giao diện giới thiệu ............................................................................................... 57
Hình 5.3: Giao diện chính ...................................................................................................... 58
Hình 5.4: Giao diện chọn ảnh ................................................................................................ 59
Hình 5.5: Kết quả sau khi nhận dạng ảnh tĩnh ..................................................................... 60
Hình 5.6: Kết quả sau khi nhận dạng bằng camera ............................................................. 61
Hình 5.7: Lưu đồ giải thuật trên Qt ....................................................................................... 62
Đồ Án Tốt Nghiệp
Trang vii
Hình 5.8: Các thư mục hệ thống sau khi đã cài đ ặt xuống kit ........................................... 63
Hình 5.9: Giao diện phần cứng .............................................................................................. 64
Hình 5.10: Kết quả thực hiện ................................................................................................. 65
Đồ Án Tốt Nghiệp
Trang viii
LIỆT KÊ BẢNG
Bảng 2.1 : Cấu hình kỹ thuật kit mini2440 .......................................................................... 29
Bảng 2.2 : Các cổng kết nối điều khiển Leds....................................................................... 32
Đồ Án Tốt Nghiệp
Trang ix
LIỆT KÊ TỪ VIẾT TẮT
A
ARM Acorn RISC Machine
AIN0 ADC Input
Cấu trúc vi xử lý 32 bit kiểu RISC
Ngõ vào bộ chuyển đổi số tương tự
B
BIOS Basic Input/Output System
Hệ thống xuất nhập cơ bản
C
CMOS
Complementary Metal-
Công nghệ chế tạo vi mạch tích hợp
Oxide-Semiconductor
CCIR
Consultative committee
international radio
Hội đồng tư vấn quốc tế về vô
tuyến điện
E
EEPROM
Electrically Erasable
Programmable
Bộ nhớ không mất dữ liệu khi
mất điện
Read-Only Memory
G
GPIO General Purpose Input/Output
H
Ngõ vào/ra trong hệ thống nhúng
Đồ Án Tốt Nghiệp
HDD Hard Disk Drive
Trang x
Ổ cứng máy tính
I
I/O
Input/Output
Ngõ vào/ra trong hệ thống
L
LCD Liquid Crystal Display
Màn hình tinh thể lỏng
LAN Local Area Network
Mạng máy tính cục bộ
O
Operating System Hệ điều hành
OS
P
PLC
Programmable Logic
Thiết bị điều khiển lập trình được
Controller
PC
Personal Computer
Máy tính cá nhân
R
Hệ điều hành thời gian thực
RTOS
Real-time operating system
RS232
Recommended Standard 232 Chuẩn truyền thông nối tiếp
RAM Random Access Memory
Bộ nhớ truy xuất ngẫu nhiên
S
SoC System On Chip
mạch
Hệ thống được tích hợp trên một vi
Đồ Án Tốt Nghiệp
SDRAM Synchronous Dynamic
Trang xi
RAM đồng bộ
Random Access Memory
U
USB
Universal Serial Bus
Một chuẩn kết nối tuần tự đa dụng
UART
Universal Asynchronous
Truyền thông nối tiếp bất đồng bộ
Receiver/Transmitte
Đồ Án Tốt Nghiệp
Trang xii
TÓM TẮT
Nhận dạng ảnh là một đề tài được nhiều người nghiên cứu. Các nghiên cứu
đi từ bài toán đơn giản, từ việc nhận dạng màu da người trong ảnh đen trắng cho
đến mở rộng cho ảnh màu. Đến nay các bài toán xác định màu da nhằm tách màu da
ra khỏi ảnh nền, đã mở rộng với nhiều nghiên cứu như nhận dạng khuôn mặt, theo
dõi mặt người hay nhận dạng cảm xúc mặt người, nhận dạng bàn tay…
Có rất nhiều hệ màu được sử dụng trong việc nhận dạng ảnh như hệ màu
RGB, HSV, YCrCb, YES,… Nhưng nhóm thực hiện đề tài quyết định sử dụng hệ
màu YCrCb với những ưu điểm dùng cho việc xử lý video số và thuật toán phân
tách màu da trong hệ màu YCrCb để điều khiển thiết bị bằng cử động đóng mở bàn
tay. Việc thực hiện nhận dạng sẽ được mô phỏng trên Matlab và dùng chương trình
Qt trên hệ điều hành Linux để viết chương trình thực thi cho kit mini2440.
Đồ Án Tốt Nghiệp
Trang xiii
ABSTRACT
Image processing projects are being researched. The researches come from a
simple mathematics in order to detect human skin from the black-white (binary)
images to the colorful (red-green-blue) images. Now, the skin detection's
mathematics expand to the many researches as face recognition, human's emotional
recognition, hand detection and etc.
There are so many color standards as RGB, HSV, YCrCb, YES etc.
However, group decided to use YCrCb standard because of the fortes in digital
video processing and skin detection in YCrCb. The implementation is going to be
simulated by Matlab and executed into kit mini2440 by Qt which is based on
Ubuntu/Linux operation system.
Đồ Án Tốt Nghiệp
Trang 1
CHƯƠNG 1: GIỚI THIỆU
1.1. Vai trò và ứng dụng của công nghệ hiện nay
Với những tiến bộ vượt bậc của khoa học kỹ thuật, bộ môn khoa học xử lý
ảnh đã và đang thu được những thành tựu lớn lao và chứng tỏ vài trò không thể
thiếu với những ứng dụng sâu rộng trong khoa học kỹ thuật cũng như đời sống xã
hội. Một bộ phận của khoa học xử lý ảnh là lĩnh vực thị giác máy tính hiện đang
thu hút rất nhiều sự quan tâm của các nhà nghiên cứu xử lý ảnh với mục tiêu xây
dựng nên một thế giới trong đó hệ thống thị giác kỳ diệu của con người có thể được
mô phỏng bởi các hệ thống máy tính, đem lại khả năng cảm nhận bằng thị giác cho
các hệ thống về môi trường xung quanh. Mơ ước về một hệ thống máy tính có thể
hoà nhập vào thế giới con người với đầy đủ các giác quan trong đó thị giác đóng
vai trò quan trọng đang dần dần được hiện thực hoá với những đóng góp nghiên
cứu của các nhà khoa học trên phạm vi toàn thế giới.
Đồng thời việc phát triển của các thiết bị phần cứng cả về phương diện thu
nhận, hiển thị, tốc độ xử lý đã mở ra nhiều hướng mới cho công nghệ xử lý ảnh. Nó
có thể giải quyết các bài toán như giám sát tự động phục vụ trong cơ quan, ngân
hàng, kho bạc, ... hoặc trong việc giám sát giao thông tự động, phục vụ tại bãi đỗ xe,
trạm thu phí tự động hoặc việc phát hiện và nhận dạng mặt người phục vụ trong
công tác quân sự, an ninh…
Phát hiện vùng màu da là một công cụ rất hữu ích trong việc nhận dạng ảnh.
Nó cho phép nhiều khu vực của một ảnh được loại bỏ một cách nhanh chóng và
hiệu quả, mà không lãng phí thời gian để làm tương quan tốn kém hoặc các hình
thức tính toán phân tích đắt tiền khác.
1.2. Lý do chọn đề tài
Trong vài năm gần đây, cùng với sự phát triển về khoa học và công nghệ,
tương tác người máy đã trở thành một lĩnh vực nổi bật nhằm cung cấp cho con
người khả năng phục vụ của máy móc. Điều này bắt nguồn từ khả năng máy móc
có thể tương tác được với con người. Máy móc cần các khả năng để trao đổi thông
tin với con người và nhận dạng màu da là một trong những khả năng đó. Xuất phát
Chương 1: GIỚI THIỆU
Đồ Án Tốt Nghiệp
Trang 2
từ những ý tưởng trên nên người thực hiện đã chọn đề tài :“ ĐIỀU KHIỀN
THIẾT BỊ BẰNG CỬ ĐỘNG CỦA BÀN TAY DÙNG KIT MINI 2440 .”
1.3. Mục tiêu đề tài
Nhóm thực hiện nghiên cứu với mục tiêu sau:
- Tìm hiểu tổng quát về lý thuyết xử lý ảnh.
- Mô phỏng trên Matlab
- Tìm hiểu kit mini2440.
- Cài đặt hệ thống nhúng trên kit phát triển nhúng mini2440.
- Rèn luyện kỹ năng nghiên cứu, tìm hiểu tài liệu.
- Xây dựng được hệ thống điều khiển thiết bị dựa trên hệ thống nhúng trên kit 2440.
1.4. Giới hạn đề tài
- Khoảng cách đặt camera và ảnh cần thu nằm trong khoảng 0.4m.
- Thực hiện nhận dạng tay đóng mở bằng phương pháp tính phần trăm của pixel
màu da trên tổng pixel của ảnh.
- Ảnh đưa vào phải là bàn tay và chỉ nhận dạng được hai trạng thái đóng mở của
bàn tay.
1.5.Bố cục của đồ án
Chương 1: Giới thiệu.
Chương 2: Cơ sở lý thuyết.
Chương 3: Kỹ thuật phân tích màu da.
Chương 4: Biên dịch ứng dụng trên board nhúng mini2440.
Chương 5: Kết quả thực hiện.
Chương 6: Kết luận và hướng phát triển.
Tài liệu tham khảo.
Chương 1: GIỚI THIỆU
Đồ Án Tốt Nghiệp
Trang 3
CHƯƠNG 2:CƠ SỞ LÝ THUYẾT
2.1. Giới thiệu về hệ thống xử lí ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một ngành
khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ phát triển của nó
rất nhanh, kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy tính
chuyên dụng riêng cho nó.
Xét các bước cần thiết trong xử lý ảnh. Đầu tiên, ảnh tự nhiên từ thế giới ngoài
được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh). Trước đây, ảnh thu
qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR). Gần đây, với sự phát
triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được
chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Máy ảnh số hiện
nay là một thí dụ gần gũi). Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể
quét từ ảnh chụp bằng máy quét ảnh. Hình vẽ dưới đây mô tả các bước cơ bản trong
xử lý ảnh.
Thu nhận
ảnh
Tiền xử lý
ảnh
Phân đoạn
ảnh
Biểu diễn
và mô tả
Cơ sở trí thức
Hình 2.1: Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau:
Chương 2: CƠ SỞ LÝ THUYẾT
Nhận dạng và
nội suy
Đồ Án Tốt Nghiệp
Trang 4
2.1.1. Phần thu nhận ảnh
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua
camera là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25
dòng), cũng có loại camera đã số hoá (như loại CCD – Change Coupled Device) là
loại photodiot tạo cường độ sáng tại mỗi điểm ảnh.
Camera thường dùng là loại quét dòng ; ảnh tạo ra có dạng hai chiều. Chất
lượng một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng,
phong cảnh).
2.1.2.Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền
xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tương phản để làm ảnh rõ hơn, nét hơn.
2.1.3. Phân đoạn hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu
diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong
bì thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên
người thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng. Đây là
phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi, làm mất độ chính
xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
2.1.4.Biểu diễn ảnh
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn)
cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng
thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để
thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection) gắn với việc tách các
đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ sở để phân biệt
lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong
nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự
giúp phân biệt ký tự này với ký tự khác.
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 5
2.1.5. Nhận dạng và nội suy ảnh
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: một loạt chữ số và nét gạch ngang trên
phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh
khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về ảnh được
phân theo hai loại nhận dạng ảnh cơ bản:
-
Nhận dạng theo tham số.
-
Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng trong
khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện tử),
nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng mặt
người…
2.1.6. Cơ sở tri thức
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý
và phân tích ảnh ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện
lợi cho xử lý, người ta mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo
cách của con người. Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các
phương pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
2.2. Những vấn đề cơ bản trong hệ thống xử lí ảnh
2.2.1. Điểm ảnh
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý
bằng máy tính (số), ảnh cần phải được số hoá. Số hoá ảnh là sự biến đổi gần đúng
một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và
độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt
người không phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là
điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai
chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 6
Định nghĩa:
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc
màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích
hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu)
của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử
ảnh.
2.2.2. Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một
ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được
chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng
cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân
bố theo trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor) là
một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm ảnh
(320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn hình CGA
17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
2.2.3. Mức xám của ảnh
-
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị số tại
điểm đó.
-
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là
mức phổ dụng. Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn
mức xám: Mức xám dùng 1 byte biểu diễn: 2^8=256 mức, tức là từ 0 đến
255).
2.2.4. Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh :
-
Nhiều hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
-
Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân → khắc phục bằng các phép
lọc.
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 7
2.2.5. Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường
có 2 hướng tiếp cận:
-
Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành
một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
-
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
2.2.6. Nhận dạng ảnh
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và
phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng
trong nhiều ngành khoa học khác nhau. Mẫu ở đây có thể là ảnh của vân tay, ảnh
của một vật nào đó được chọn, một chữ viết khuôn mặt người ….
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn
chủ yếu sau đây:
1. Thu nhận dữ liệu và tiền xử lý.
2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn
lẻ để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và
cách tiếp cận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử
dụng khi nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các
hệ thống lai (hybrid system) bao gồm nhiều mô hình kết hợp.
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 8
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra
những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là
những đặc điểm đặc trưng cần thiết thường là nhiều, không thể do chuyên gia đề
xuất, mà phải được trích chọn dựa trên các thủ tục phân tích dữ liệu.
2.3. Các hình thái của ảnh
2.3.1. Chuyển ảnh màu thành ảnh xám
Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu hay
ảnh xám mà từng pixel có thông số khác nhau. Đối với ảnh màu từng pixel sẽ
mang thông tin của 3 màu cơ bản tạo ra bản màu khả biến là đỏ (R), xanh lá (G) và
xanh biển (B) [Thomas 1892]. Trong mỗi pixel của ảnh màu, 3 màu cơ bản R, G và
B được bố trí sát nhau và có cường độ sáng khác nhau. Thông thường, mỗi màu cơ
bản được biểu diễn bằng 8 bit tương ứng 256 mức độ màu khác nhau.
Như vậy mỗi pixel chúng ta có 2 8*3 =224 màu (khoảng 16,78 triệu màu). Đối
với ảnh xám, thông thường mỗi pixel mang thông tin của 256 mức xám (tương ứng
với 8 bit) như vậy ảnh xám hoàn toàn có thể tái hiện đầy đủ cấu trúc của một ảnh
màu tương ứng thông qua 8 mặt phẳng bit theo tọa độ xám.
Hình 2.2 Ảnh RGB
Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu
trúc ảnh và bỏ qua sự ảnh hưởng của yếu tố màu sắc. Do đó bước chuyển từ ảnh
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 9
màu thành ảnh xám là 1 công đoạn phổ biến trong các quá trình xử lí ảnh vì nó làm
tăng tốc độ xử lí giảm mức độ phức tạp của các thuật toán trên ảnh.
2.3.2. Lược đồ xám của ảnh (Histogram)
Một phương pháp thường dùng trong xử lí ảnh số là xem xét cường độ sáng
của ảnh f(x,y) như là biến ngẫu nhiên có hàm phân bố xác suất là pk (f). Hàm phân
bố xác suất của ảnh mang thông tin toàn cục về nội dung chứa trong ảnh. Tuy nhiên
hàm phân bố xác suất tổng quát thường không đáp ứng được do đó thường dùng
hàm phân bố xác suất thực nghiệm xác định từ ảnh để thay thế gọi là hàm
histogram. Histogram của ảnh số với mức xám có tầm trong khoảng [0, L-1] là
hàm:
(
)
(2.1)
Với
là mức xám thứ k
là số pixel trong ảnh có mức xám thứ k
tổng số pixel trong ảnh
: 0,1,2,…., L-1
Lược đồ xám bao gồm trục hoành biểu diễn mức xám và trục tung biểu diễn
số lượng điểm sáng tương ứng. Đối với ảnh xám thông thường, giá trị của trục
hoành nằm trong khoảng từ 0 - 255.
Hình 2.3: Lược đồ histogram
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 10
2.3.3. Không gian màu
Như ta đã biết thì khi cho ánh sáng trắng đi qua lăng kính ta sẽ thu được một
dãy phổ màu bao gồm 6 màu rộng: tím , lam , lục , vàng , cam , đỏ. Nếu nhìn kỹ thì
sẽ không có ranh giới rõ ràng giữa các màu mà màu này sẽ từ từ chuyển sang màu
kia.Mắt chúng ta nhìn thấy được là do ánh sáng phản xạ từ vật thể.
Tất cả các màu được tạo ra từ 3 màu cơ bản (màu sơ cấp) là: đỏ (R),lam (B)
và lục (G).Các màu cơ bản trộn lại với nhau theo một tỉ lệ nhất định để tạo ra các
màu thứ cấp.
Hình 2.4: Các màu cơ sở
Vd : đỏ + lục = vàng
Lục +lam = xanh
Trộn ba màu sơ cấp hoặc trộn một màu thứ cấp với màu sơ cấp ngược với nó
sẽ tạo ra được ánh sáng trắng
Các màu gốc có liên quan đến các khái niệm sinh học hơn là vật lý, nó dựa
trên cơ sở phản ứng sinh lý học của mắt người đối với ánh sáng. Mắt người có
các tế bào cảm quang có hình nón nên còn được gọi là tế bào hình nón, các tế bào
này thông thường có phản ứng cực đại với ánh sáng vàng - xanh lá cây (tế bào hình
nón L), xanh lá cây (tế bào hình nón M) và xanh lam (tế bào hình nón S) tương ứng
với các bước sóng khoảng 564 nm, 534 nm và 420 nm. Ví dụ, màu vàng thấy được
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 11
khi các tế bào cảm nhận màu xanh ánh vàng được kích thích nhiều hơn một chút so
với tế bào cảm nhận màu xanh lá cây và màu đỏ cảm nhận được khi các tế bào cảm
nhận màu vàng - xanh ụcá cây được kích thích nhiều hơn so với tế bào cảm nhận
màu xanh lá cây.
Các đặc trưng dùng để phân biệt một màu với màu khác là: độ sáng
(brightness) , sắc màu (hue) và độ bảo hòa màu (Saturation)
Màu sắc có liên quan đến bước sóng ánh sáng .Thông thường, sắc màu chính
là tên của màu. Ví dụ: đỏ, cam, lục…
Độ sáng thể hiện về cường độ ánh sáng :mô tả nó sáng hay tối như thế nào
Độ bảo hòa màu : thể hiện độ thuần khiết của màu. Khi độ bão hòa cao, màu sẽ sạch
và rực rỡ.
2.3.3.1. Không gian màu RGB
Hình 2.5: Không gian màu RGB
Không gian màu RGB chia các màu ra các thành phần màu chính là R (Redđỏ), G (Green-xanh lá), B (Blue-xanh dương). Các màu R, G, B được gọi là các
màu chính hay màu cơ bản vì ánh sáng của ba màu này có thể phối hợp ở những
cường độ khác nhau để tạo ra các màu khác. Mô hình RGB được thể hiện bởi một
hình lập phương. Trong một ảnh 24 bit với 8 bit cho mỗi màu chính thì màu đỏ sẽ
có giá trị (255,0,0), màu xanh dương (0,0,255), màu xanh lá (0,255,0). Mô hình này
được thiết kế cho phần lớn hệ thống đồ họa, tuy nhiên nó chưa phải là lý tưởng cho
Chương 2: CƠ SỞ LÝ THUYẾT
Đồ Án Tốt Nghiệp
Trang 12
các ứng dụng về phát hiện và nhận dạng vật thể. Các thành phần màu đỏ, xanh
dương, xanh lá có sự liên kết chặt chẽ sẽ gây khó khăn trong việc thực hiện một số
thuật toán xử lý ảnh.
2.3.2.3. Không gian màu YCrCb
YCrCb được định nghĩa nhằm phục vụ các mục đích xử lý video số. Nó có
quan hệ với một số không gian màu như YIQ, YUV. Trong khi YCrCb là hệ thống
màu số thì các không gian YIQ và YUV là hệ thống tương tự phục vụ cho các
chuẩn PAL và NTSC. Các không gian màu này sẽ chia RGB ra các thành phần chói,
và thành phần màu nhằm sử dụng cho các ứng dụng nén ảnh. Do đó chúng thường
được sử dụng trong các hệ thống truyền hình.
Hình 2.6: Không gian màu YCrCb
YCrCb là không gian màu được sử dụng nhiều trong vấn đề nén ảnh màu sắc
được biểu diễn bởi luma (đó là giá trị độ sáng tính từ không gian RGB). Gồm ba
thành phần, một thành phần là tổng các trọng số từ RGB, hai thành phần màu Red
và Blue trong không gian màu RGB. Công thức để chuyển đổi như sau:
Y = 0.299R +0.587G + 0.114B
{
(2.2)
Chương 2: CƠ SỞ LÝ THUYẾT