ĐỒ ÁN TỐT NGHIỆP
Ứng dụng một số kĩ thuật xử lý ảnh trong phân tích
chứng minh thư nhân dân
TÓM TẮT
Nhận dạng và xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng
trong thực tiễn như: hệ thống thông tin địa lý, y học, quân sự… Hiện nay, hầu hết
các thông tin cá nhân, bằng cấp, giấy chứng nhận đều được lưu ở dạng thẻ theo một
mẫu nhất định. Để giúp cho quá trình thu nhận dữ liệu từ những thẻ này được nhanh
chóng và chính xác, địi hỏi phải có một chương trình có thể nhận dạng và xử lý
hình ảnh một cách chính xác.
Nhận thấy sự cấp thiết của các cơ quan nhà nước trong công tác quản lý
thông tin của người dân được ghi trên giấy chứng minh nhân dân. Với mong muốn
đóng góp một phần vào cơng tác quản lý này, chúng em đã chọn đề tài “Ứng dụng
một số kĩ thuật xử lý ảnh trong phân tích chứng minh thư nhân dân” để thực hiện.
Luận văn này tập trung vào tìm hiểu và nghiên cứu các phương pháp tiền
xử lý hình ảnh, nhận dạng chữ từ hình ảnh. Để từ đó áp dụng vào nhận dạng các
thông tin trên ảnh giấy chứng minh nhân dân.
Cấu trúc Luận văn gồm 4 chương:
Chương I: Tổng quan về xử lý ảnh. Trong chương này Luận văn nghiên cứu
phần tổng quan của xử lý ảnh, và phạm vi ứng dụng của đề tài.
Chương II: Một số thuật toán tiền xử lý ảnh. Chương này tập trung trình
bày một số thuật tốn cơ bản trong phân đoạn tiền xử lý ảnh.
Chương III: Thuật tốn phân tích chứng minh nhân dân. Trong chương này
trình bày việc áp dụng các thuật toán tiền xử lý ảnh vào ảnh chứng minh
nhân dân. Phân tích và nhận dạng thơng tin trên ảnh chứng minh nhân dân.
Chương IV: Cài đặt chương trình và đánh giá. Trình bày quy trình cài đặt
phần mềm và kết quả thu được.
MỤC LỤC
LỜI CAM ĐOAN.....................................................Error! Bookmark not defined.
LỜI CẢM ƠN..........................................................Error! Bookmark not defined.
TÓM TẮT.................................................................................................................2
DANH MỤC CÁC TỪ VIẾT TẮT...........................................................................5
DANH MỤC CÁC BẢNG........................................................................................6
DANH MỤC CÁC SƠ ĐỒ, HÌNH ẢNH..................................................................7
MỞ ĐẦU................................................................................................................. 10
CHƯƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH.......................................................12
1.1.
Xử lý ảnh là gì?..........................................................................................12
1.2.
Hệ thống xử lý ảnh.....................................................................................12
1.3.
Một số khái niệm liên quan........................................................................14
1.3.1.
Phần tử ảnh..........................................................................................14
1.3.2.
Mức xám.............................................................................................14
1.3.3.
Ảnh......................................................................................................14
1.4.
Một số định dạng ảnh hiện nay..................................................................17
1.4.1.
Ảnh BMP (Bitmap).............................................................................17
1.4.2.
Ảnh JPEG (Joint Photographic Experts Group)..................................17
1.4.3.
Ảnh GIF (Graphics Interchange Format).............................................17
1.4.4.
Ảnh WMF (Windows Metafiles).........................................................17
CHƯƠNG II. MỘT SỐ THUẬT TOÁN TIỀN XỬ LÝ ẢNH.................................18
2.1.
Nhị phân ảnh..............................................................................................18
2.2.
Căn chỉnh độ nghiêng.................................................................................25
2.2.1.
Phương pháp dựa trên biến đổi Hough................................................26
2.2.2.
2.2.4. Nhận xét....................................................................................31
2.3.
Các tốn tử hình thái (Morphological operations)......................................31
2.4.
Kết chương.................................................................................................35
CHƯƠNG III. THUẬT TỐN PHÂN TÍCH CHỨNG MINH NHÂN DÂN.........36
3.1.
Giới thiệu bài tốn......................................................................................36
3.2.
Phân tích và tách các trường thơng tin.......................................................36
3.3.
Tách các trường thông tin ở mặt trước.......................................................38
3.4.
Tách các trường thông tin ở mặt sau..........................................................40
3.5.
Nhận diện kí tự trên ảnh chứng minh nhân dân..........................................41
CHƯƠNG IV. CÀI ĐẶT CHƯƠNG TRÌNH VÀ ĐÁNH GIÁ KẾT QUẢ............44
4.1.
Cài đặt chương trình...................................................................................44
4.2.
Kết quả thực nghiệm..................................................................................47
KẾT LUẬN.............................................................................................................50
KIẾN NGHỊ NHỮNG NGHIÊN CỨU TIẾP THEO...............................................51
DANH MỤC TÀI LIỆU THAM KHẢO.................................................................52
PHỤ LỤC................................................................................................................ 54
DANH MỤC CÁC TỪ VIẾT TẮT
Chứng minh nhân dân
CMND
DANH MỤC CÁC BẢNG
Bảng 3.1
Đặc trưng cho các trường thông tin ở
mặt trước.
DANH MỤC CÁC SƠ ĐỒ, HÌNH ẢNH
Hình 1
Hình 2
Hình 3
Hình 4
Hình 5
Hình 6
Hình 7
Hình 8
Hình 9
Hình 10
Hình 11
Hình 12
Hình 13
Hình 14
Hình 15
Hình 16
Hình 17
Hình 18
Hình 19
Hình 20
Hình 21
Hình 22
Hình 23
Hình 24
Hình 25
Hình 26
Hình 27
Hình 28
Hình 29
Hình 30
Các giai đoạn chính trong xử lý ảnh
Biểu diễn ảnh nhị phân bằng mảng 2 chiều
Biểu diễn ảnh xám bằng mảng 2 chiều
Ma trận biểu diễn mức xám của thành phần RED
Ma trận biểu diễn mức xám của thành phần GREEN
Ma trận biểu diễn mức xám của thành phần BLUE
Minh họa phương pháp Otsu
Biến đổi Hough
Phương pháp láng giềng gần nhất
Phương pháp chiếu nghiêng
Phép giãn ảnh với phần tử cấu trúc 3x3
Phép co ảnh với phần tử cấu trúc 3x3
Phép toán opening
Phép toán closing
Mẫu giấy CMND
Các thông tin cần tách ở mặt trước
Nhận dạng trường số CMND
Xác định vùng thông tin mặt trước
Các trường thông tin cần tách ở mặt sau
Tách trường thông tin mặt sau dựa trên vị trí con dấu
Các bước xử lý các trường thơng tin trong q trình nhận dạng kí tự
Kết quả nhận dạng các trường thơng tin ở mặt trước
Kết quả nhận dạng các trường thông tin ở mặt sau
Giao diện chính của phần mềm
Giao diện đọc mặt trước giấy CMND
Giao diện đọc mặt sau giấy CMND
Giao diện đọc cả hai mặt giấy CMND
Giao diện upload trực tiếp giấy CMND từ camera thiết bị
Kết quả đọc ảnh CMND mặt trước
Kết quả đọc ảnh CMND mặt sau
9
MỞ ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của cơng nghệ thơng tin, nó đã đem lại
những ứng dụng to lớn trong nhiều lĩnh vực khác nhau. Công nghệ thông tin đã trở
thành ngành công nghiệp mũi nhọn của nhiều nước trên thế giới. Bên cạnh đó, hình
ảnh cũng là một dạng dữ liệu đóng vai trị quan trọng trong việc trao đổi, xử lý và
lưu giữ thông tin.
Trong việc quản lý, thu nhận và xử lý thông tin với khối lượng ngày càng
lớn, việc sử dụng phần mềm với cách nhập liệu thủ công sẽ tốn rất nhiều thời gian
và công sức, không đem lại hiệu quả mong muốn. Thực tế, hiện nay mỗi công dân
việt nam đều có nhiều loại giấy tờ tùy thân (giấy phép lái xe, giấy chứng minh nhân
dân, thẻ bảo hiểm,…), được sử dụng trong nhiều lĩnh vực khác nhau: y tế, quản lý
thông tin cá nhân ở các cơ quan nhà nước… Mặt khác, có thể nhận thấy giấy chứng
minh nhân dân là loại giấy tờ quan trọng mà mọi công dân việt nam từ 16 tuổi trở
lên đều có và được sử dụng thường xuyên. Giấy chứng minh nhân dân giúp các cơ
quan nhà nước xác minh danh tính và một số vấn đề liên quan mang tính cá nhân
của người đó. Giúp các cơ quan quản lý, khai thác, điều tra tội phạm một cách dễ
dàng hơn. Tuy nhiên, hiện nay việc thu nhận thông tin này hầu hết đều thực hiện
bằng các phương pháp thủ công dẫn tới sai sót trong q trình nhập liệu và hiệu quả
cơng việc chưa cao. Do đó, việc xử lý thơng tin hình ảnh là rất cần thiết, giúp cho
việc thu nhận thông tin được dễ dàng và nhanh chóng hơn, dữ liệu ít sai sót và mang
lại hiệu quả cao hơn. Đó cũng là mục tiêu của đề tài phân tích và xử lý thơng tin
hình ảnh chứng minh nhân của chúng em.
Để thực hiện và kiểm chứng đề tài này chúng em cũng gặp phải khơng ít khó
khăn. Chứng minh nhân dân chứa những thông tin cá nhân rất quan trọng và thường
được các cơ quan, tổ chức nhà nước tập trung cất giữ rất bảo mật để tránh bị những
kẻ xấu lợi dụng để thực hiện những mục đích xấu. Do đó, việc thu thập bộ dữ liệu
10
chứng minh nhân dân là việc hết sức khó khăn. Và chính vì thế, việc thu thập giấy
chứng minh chủ yếu được thông qua ảnh chụp camera từ nhiều nguồn khác nhau,
dẫn đến nguồn ảnh đầu vào không được đồng nhất về kích thước, màu sắc, độ phân
giải cũng như các thông số kĩ thuật khác. Kết quả là bước xử lý hình ảnh đầu vào
hết sức khó khăn.
11
CHƯƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.
-
Xử lý ảnh là gì?
Xử lý ảnh là phương thức để thực hiện một số hoạt động lên hình ảnh, để có
được một hình ảnh nâng cao hoặc trích xuất một số thơng tin từ ảnh. Quá
trình xử lý ảnh được xem như là quá trình biến đổi ảnh đầu vào sang một ảnh
mới với các đặc tính và kết quả mong muốn.
-
Xử lý ảnh có thể gồm q trình phân tích, phân lớp các đốitượng, làm tăng
chất lượng, phân đoạn và tách cạnh, gán nhãn cho vùng hay q trìnhbiên
dịch các thơng tin của ảnh. Kết quả đầu ra của một quá trình xử lý ảnh có thể
là một ảnh tốt hơn hoặc những ký tự liên quan trong hình.
-
Xử lý ảnh được áp dụng trong nhiều lĩnh vực khác nhau như: Y học, vật lý,
hóa học, truy tìm tội phạm...
Mục đích:
Biến đổi ảnh nhằm tăng chất lượng của ảnh.
Tự động nhận dạng hình ảnh.
1.2.
Hệ thống xử lý ảnh
Hình 1.1 Các giai đoạn chính trong xử lý ảnh
-
Thu nhận ảnh: Đây là cơng đoạn đầu tiên mang tính quyết định đối với quá
trình xử lý ảnh. Ảnh đầu vào sẽ được thu nhận qua các thiết bị như camera,
12
sensor, máy scanner,v.v… và sau đó các tín hiệu này sẽ được số hóa. Việc lựa
chọn các thiết bị thu nhận ảnh sẽ phụ thuộc vào đặc tính của các đối tượng
cần xử lý. Các thông số quan trọng ở bước này là độ phân giải, chất lượng
màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.
-
Tiền xử lý: Ở bước này, ảnh sẽ được chuẩn hóa về độ tương phản, khử
nhiễu,khử bóng, khử độ lệch,v.v… với mục đích làm cho chất lượng ảnh trở
lên tốt hơn. Quá trình này thường được thực hiện bởi các bộ lọc.
-
Trích chọn đặc điểm: Giai đoạn này phân tích ảnh thành những thành phần
có cùng tính chất nào đó dựa theo biên hay các vùng liên thơng. Tiêu chuẩn
để xác định các vùng liên thơng có thể là cùng màu, cùng mức xám v.v…
Mục đích của trích chọn đặc điểm là phân tích ảnh thành các vùng, hiểu được
vai trò, chức năng của mỗi vùng cũng như mối quan hệ giữa chúng. Đồng
thời, qua bước này ta cũng có thể có một miêu tả tổng hợp về nhiều phần tử
khác nhau cấu tạo lên ảnh thơ. Vì lượng thông tin chứa trong ảnh rất lớn,
trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào đó,
do vậy cần có một q trình để giảm lượng thơng tin khổng lồ đó. Q trình
này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
-
Đối sánh và rút ra kết luận: Đây là bước cuối cùng trong quá trình xử lý ảnh.
Nhậndạng ảnh có thể được hiểu một cách đơn giản là việc gán nhãn cho các
đốitượng trong ảnh. Ví dụ đối với nhận dạng chữ viết, các đối tượng trong
ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ đó ra và
tìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu chữ
thu được trong ảnh. Giải thích là cơng đoạn gán nghĩa cho một tập các đối
tượng đã được nhận biết.
Chúng ta cũng có thể thấy rằng, khơng phải bất kỳ một ứng dụng xử lý ảnh
nào cũngbắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví dụ
như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý.
Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng và giải
13
thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán tự
động, được dùng để rút trích ra những thơng tin quan trọng từ ảnh, ví dụ như
các ứng dụng nhận dạng ký tự quang học, nhận dạng chữviết tay v.v…
1.3.
Một số khái niệm liên quan
1.3.1. Phần tử ảnh
-
Ảnh trong tự nhiên là những tín hiệu liên tục về không gian và giá trị độ
sáng. Để có thể lưu trữ và biểu diễn ảnh bằng máy tính, con người phải tiến
hành biến đổi các tín hiệu liên tục đó thành một số hữu hạn các tín hiệu rời
rạc thơng qua q trình lượng tử hóa và lấy mẫu thành phần giá trị độ sáng.
-
Một phần tử ảnh (Picture Element) là một giá trị biểu diễn cho mức xám hay
cường độ ảnh tại một vị trí sau khi đã biến đổi ảnh thành một số các tín hiệu
rời rạc.
1.3.2. Mức xám
-
Là kết quả của sự biến đổi tương ứng với giá trị độ sáng của một điểm ảnh
với một số nguyên dương. Tùy thuộc vào số giá trị biểu diễn mức xám mà
mỗi điểm ảnh sẽ được biểu diễn trên 1, 4, 8, 24 hay 36 bit. Số lượng bit biểu
diễn ảnh càng lớn thì chất lượng ảnh càng cao nhưng sẽ tốn dung lượng bộ
nhớ nhiều hơn để lưu trữ và cần một hệ thống mạnh hơn để xử ly.
1.3.3. Ảnh
-
Ảnh là tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thường được biểu diễn
bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một
điểm ảnh.
-
Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh được
biểu diễn bằng 1 bit(giá trị 0 hoặc 1)
14
Hình 1.2 Biểu diễn ảnh nhị phân bằng mảng 2 chiều
-
Ảnh xám:Giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giá
trị từ 0 đến 255).
Hình 1.3 Biểu diễn ảnh xám bằng mảng 2 chiều
-
Ảnh màu:Thông thường, ảnh màu được tạo nên từ 3 ảnh xám đối với các
màu nền đỏ (RED), xanh lá cây (GREEN) và xanh lam (BLUE). Tất cả các
màu trong tự nhiên đều có thể tổng hợp được từ 3 thành phần màu trên theo
các tỷ lệ khác nhau.
15
Hình 1.4Ma trận biểu diễn mức xám của thành phần RED
Hình 1.5Ma trận biểu diễn mức xám của thành phần GREEN
Hình 1.6Ma trận biểu diễn mức xám của thành phần BLUE
16
1.4.
Một số định dạng ảnh hiện nay
1.4.1. Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu
của các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh Bitmap là tốc độ
vẽ và tốc độ xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
1.4.2. Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG
được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt
nhất cho đồ họa có nhiều màu sắc, ví dụ là ảnh được scan. File ảnh JPEG là
ảnh Bitmap đã được nén lại.
1.4.3. Ảnh GIF (Graphics Interchange Format)
-
Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được
sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như ảnh hoạt hình hoặc là các
bức vẽ có nhiều đường thẳng. File ảnh GIF cũng là ảnh Bitmap đã được nén
-
lại.
Có 2 sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
Ảnh GIF được nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong
khi ảnh JPEG được nén lại nhưng làm mất một số dữ liệu trong ảnh.
Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG
không bị giới hạn số màu mà chúng sử dụng.
1.4.4. Ảnh WMF (Windows Metafiles)
Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh. Có 2 ưu
điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào
1.5.
thiết bị hiển thị hơn ảnh Bitmap.
Kết luận
Chương này đã trình bày quy trình xử lý và nhận dạng hình ảnh. Đồng thời
cũng giới thiệu được khái quát một số khái niệm về hình ảnh và các định
dạng hình ảnh phổ biến hiện nay.
17
CHƯƠNG II. MỘT SỐ THUẬT TOÁN TIỀN XỬ LÝ ẢNH
Dữ liệu đầu vào của các hệ thống xử lý ảnh thường là các ảnh được thu nhận
từ các thiết bị như: máy quét, máy ảnh hoặc các thiết bị thu nhận hình ảnh khác. Các
ảnh thơ này thường có chất lượng thấp (bị nhiễu, mất nét hoặc bị lệch góc so với
ảnh gốc..). Nguyên nhân chính là do các thiết bị thu nhận không đạt yêu cầu, ánh
sáng không tốt, thu nhận trong khi dịch chuyển làm ảnh bị lệch.. Để chuẩn bị cho
bước xử lý, thu thập thông tin của ảnh thu được kết quả tốt, cần phải có quá trình
tiền xử lý để nâng cao chất lượng hình ảnh.
Q trình này bao gồm các cơng đoạn phục hồi ảnh và làm nổi bật ảnh:
Phục hồi ảnh: nhằm loại bỏ hay giảm các ảnh hưởng của môi trường tác
động lên ảnh. Bao gồm: Lọc ảnh, khử nhiễu, xoay ảnh..
Làm nổi bật ảnh: Làm nổi bật các đặc trưng của ảnh phù hợp với mục tiêu
cuối cùng, giúp cho giai đoạn phía sau được hiệu quả hơn. Cơng đoạn này
bao gồm: tùy chỉnh độ tương phản, làm trơn ảnh, xám hóa, nhị phân ảnh..
Trong đó các thao tác như nhị phân ảnh, căn chỉnh độ nghiêng và xóa nhiễu là
các thao tác cơ bản nhất và thường được áp dụng.
2.1.
-
Nhị phân ảnh
Ảnh đầu vào nhận được các thiết bị thu nhận ảnh thường có thành phần phức
tạp về màu sắc và kết cấu. Vì thế để làm nổi bật các thành phần đặc trưng
trong ảnh thì phải chuyển về ảnh nhị phân.
- Ảnh nhị phân là ảnh mà giá trị của các điểm ảnh chỉ được biểu diễn bằng hai
giá trị là 0 (Đen) và 255 (Trắng) (Tương ứng với 0 và 1).Vì giá trị của điểm
ảnh được biểu diễn bởi 2 giá trị là 0 hoặc 1, nên một điểm ảnh được biểu
diễn bằng 1 bit nên ảnh có kích thước rất nhỏ.
18
- Nhị phân ảnh là quá trình chuyển từ ảnh màu ban đầu hoặc ảnh đa cấp xám
về ảnh nhị phân.
Thuật toán 2.1: Nhị phân ảnh
Input: Ảnh màu hoặc ảnh đa cấp xám.
Output: Ảnh nhị phân.
Thuật toán:
Gọi giá trị cường độ sáng tại một điểm ảnh là I(x, y).
INP(x, y) là cường độ sáng của một điểm ảnh trên ảnh nhị phân.
(Với 0 < x < image.Width và 0 < y < image.Height)
Để biến đổi một ảnh thành ảnh nhị phân, ta so sánh giá trị cường độ sáng
với một ngưỡng nhị phân T.
Nếu I(x,y) > T thì INP(x, y) = 0 (0).
Nếu I(x,y) > T thì INP(x, y) = 255 (1).
Ví dụ:
0
8
5
9
2
30
8
12
40
Với T = 8 thì ta thu được ảnh nhị phân sau:
0
0
0
19
1
0
1
0
1
1
Kỹ thuật này làm cho tính chất màu liên tục của ảnh bị gián đoạn nhưng có
hiệu quả trong việc thể hiện các loại ảnh có đường nét như văn bản, vân tay…
Ta có thể chọn giá trị T từ 0 đến 255, nhưng thông thường nhiều người hay
chọn một giá trị đó là 128 tức là giá trị trung bình của max(255) và min(0) của
cường độ sáng của điểm ảnh.
Có thể dễ dàng nhận thấy với mỗi ngưỡng T thì sẽ có một ảnh nhị phân khác
nhau (Khác nhau ở đây là cường độ sáng của các tấm ảnh nhị phân với mỗi giá
trị T).
Như vậy, cơ bản của thuật toán nhị phân ảnh là xác định một ngưỡng T phù
hợp để phân tách giữa nền và các đối tượng trong ảnh.
Việc xác định một ngưỡng T thích hợp ln là một q trình khó khăn và dễ
gây ra lỗi (Hình 2. 1). Điều này sẽ đặc biệt khó khăn khi độ tương phản giữa các đối
tượng và nền thấp hay khi ảnh có độ chiếu sáng khơng đồng đều khi thu nhận. Nếu
ngưỡng T quá thấp thì các đối tượng thu được có thể bị xóa mất các chi tiết của ảnh,
ngược lại nếu ngưỡng T quá cao thì có thể chứa các điểm ảnh nhiễu.
Có rất nhiều phương pháp để xác định ngưỡng phân tách T. Ngưỡng T có thể
được xác định cho tồn bộ ảnh (ngưỡng tổng quát) hay được xác định cho mỗi điểm
ảnh cụ thể (ngưỡng cục bộ). Trong phần tiếp theo sẽ giới thiệu hai phương pháp phổ
biến nhất để xác định ngưỡng T.
Phương pháp Niblack
Đây là phương pháp xác định ngưỡng cục bộ dựa trên việc tính tốn giá
trịtrung bình và độ lệch chuẩn cục bộ. Thuật tốn được mơ tả như sau:
Thuật toán 2.2. Phương pháp phân ngưỡng Niblack
20
Input: Giá trị mức xám của các điểm ảnh g(x, y)
Output: Ngưỡng nhị phân cho mỗi điểm ảnh T(x, y)
Duyệt tất cả các điểm ảnh:
1. Xác định cửa sổ (w × w) bao quanh
2. Tính giá trị trung bình m(x, y)
3. Tính độ lệch chuẩn σ(x, y)
4. Xác định ngưỡng T(x, y)
Với mỗi điểm ảnh, xác định một cửa sổ kích thước (w × w) bao quanh nó.
Giá trị ngưỡng được tính tốn dựa trên giá trị trung bình và độ lệch chuẩn trong cửa
sổ đó.Với điểm ảnh ở vị trí (x, y) giá trị ngưỡng được xác định như sau [1]:
(2.1)
Trong đó: m(x, y) và σ(x, y) tương ứng là giá trị trung bình và độ lệch chuẩn
cục bộ trong cửa sổ (w × w) với tâm ở vị trí (x, y), và được xác định như sau:
(2.1.2)
(2.1.3)
k là tham số dùng để xác định đường biên của đối tượng chiếm bao nhiêu phần
trong đối tượng trả về. Kích thước của cửa sổ phải đủ nhỏ để giữ lại các chitiết và
cũng phải đủ lớn để khử các điểm nhiễu. Theo [1] thì tham số k = -0.2, kíchthước
của sổ w =15.
Cơ bản dựa trên phương pháp của Niblack, Sauvola đưa ra công thức xác
định ngưỡng như sau [2]:
(2.2)
Trong đó: R là giá trị lớn nhất của độ lệch chuẩn (với ảnh đa cấp xám: R
=128), k là tham số nằm trong khoảng [0.2, 0.5], m(x, y) và σ(x, y) là giá trị đáp
21
ứng các mức ngưỡng khác nhau tùy theo các điểm lân cận. Với một vài vùng ảnh có
độtương phản cao thì σ(x, y) ≈ R, khi đó T(x, y) ≈ m(x, y). Kết quả này giống như
phương pháp Niblack. Trong trường hợp T(x, y) nhỏ hơn giá trị trung bình thì sẽxóa
đi một vài vùng tối của nền. Tham số k dùng để điểu chỉnh giá trị ngưỡng sovới giá
trị trung bình m(x, y) (lớn hơn hay nhỏ hơn một tỷ lệ k).
Như vậy ngưỡng của mỗi điểm ảnh được xác định dựa trên việc đánh giá giá
trị của các điểm ảnh lân cận với nó, do đó rất thích hợp cho những ảnh có độ sáng
thay đổi (ví dụ như ảnh chụp từ camera). Nhưng thời gian tính tốn là rất chậm,
tùythuộc vào kích thước của cửa sổ.
Phương pháp Otsu
Đây là phương pháp xác định ngưỡng cho toàn bộ ảnh. Phương pháp này sẽ
tìm một ngưỡng để phân chia các điểm ảnh vào hai lớp tiền cảnh (đối tượng) và
nền. Giá trị ngưỡng được xác định sao cho “khoảng cách” giữa các điểm ảnh trong
mỗi lớp là nhỏ nhất, điều này tương đương với khoảng giữa hai lớp là lớn nhất. Việc
phân chia này dựa trên các giá trị trong histogram của ảnh. Các bước để xác định
ngưỡng TOtsu của ảnh được tiến hành như sau:
Thuật toán2.3.Phương pháp phân ngưỡng Otsu
Input:Ảnh đa cấp xám
Output: Ngưỡng nhị phân cho toàn bộ ảnh
Bước 1: Xác định T1. Giá trị cho T1 ban đầu nên chọn là (0+255) / 2 = 128.
Bước 2: Phân loại thành 2 nhóm điểm ảnh.
Loại 1 (Type1): chứa tất cả các điểm ảnh có giá trị cường độ sáng
(Intensity) <= T.
Loại 2 (Type2): chứa tất cả các điểm ảnh có giá trị cường độ sáng
(Intensity) > T
22
Bước 3: Tính giá trị cường độ sáng trung bình (iAverage) cho Type1 (iAverage1) và
Type2 (iAverage2)
Bước 4: Tính giá trị T2 theo công thức (iAverage1 + iAverage2) /2.
Bước 5: So sánh T1 và T2.
Nếu giá trị chênh lệch của T1 và T2 <= Delta (một giá trị cho trước) thì
T2 chính là T cần tìm.
Nếu giá trị chênh lệch của T1 và T2 > Delta thì quay lại Bước 1.
Hình 2.1 Minh họa phương pháp Otsu (Nguồn: )
Nhận xét: Nhị phân ảnh là một thao tác cơ bản để phân tách giữa nền và đối tượng.
Trong đó việc xác định ngưỡng nhị phân là thao tác quan trọng và khó khăn nhất.
Có thể xác định ngưỡng cho tồn bộ ảnh (phương pháp Otsu) hay xác định ngưỡng
cho từng điểm ảnh riêng biệt (phương pháp Niblack) tùy vào yêu cầu của bài tốn
và tích chất ảnh đầu vào.
23
So sánh các phương pháp nhị phân ảnh đối với có độ sáng thay đổi
a. Ảnhgốc
24
b. Phương pháp Niblack
c. Phương pháp Otsu (ngưỡng 148)
So sánh các phương pháp nhị phân ảnh đối với ảnh Chứng minh nhân dân
a.ảnh gốc
25
b.Phương pháp Niblack
c.Phương pháp Otsu
2.2.
Căn chỉnh độ nghiêng
Đối với những chương trình nhận dạng, có ảnh đầu vào là những trang tài
liệu dạng văn bản thì các ảnh thu nhận được thường bị lệch so với ảnh gốc một góc
bất kỳ. Nguyên nhân là do trong quá trình thu nhận: ảnh gốc bị đặt lệch, thiết bị ghi
nhận hình ảnh đặt khơng đúng vị trí hay thu nhận ảnh bị xê dịch…, điều này là
khơng thể tránh khỏi. Do đó, để cho các bước xử lý tiếp theo (phân tích và nhận
dạng) được chính xác cần phải có thao tác hiệu chỉnh độ nghiêng của ảnh thu nhận
được. Các bước hiệu chỉnh độ nghiêng của ảnh được mô tả trong Thuật toán 2.4.
Thuật toán 2.4. Hiệu chỉnh độ nghiêng của ảnh tài liệu
Input: Ảnh (nhị phân) bị nghiêng
Output: Ảnh đã chỉnh độ nghiêng