ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
BÙI NGỌC HUY
NGHIÊN CỨU KỸ THUẬT XỬ LÝ NHIỄU,
HIỆU CHỈNH ẢNH NHỊ PHÂN VÀ ỨNG DỤNG CHO
PHIẾU THI TRẮC NGHIỆM
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2013
Số hóa bởi trung tâm học liệu
/>
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
BÙI NGỌC HUY
NGHIÊN CỨU KỸ THUẬT XỬ LÝ NHIỄU,
HIỆU CHỈNH ẢNH NHỊ PHÂN VÀ ỨNG DỤNG CHO
PHIẾU THI TRẮC NGHIỆM
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: PGS. TS NGÔ QUỐC TẠO
Thái Nguyên - 2013
Số hóa bởi trung tâm học liệu
/>
i
LỜI CAM ĐOAN
Tôi xin cam đoan Luận văn “Nghiên cứu kỹ thuật xử lý nhiễu, hiệu chỉnh
ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm” là cơng trình nghiên cứu
của tơi, có sự hỗ trợ từ Giáo viên hƣớng dẫn là PGS. TS. Ngô Quốc Tạo. Các
nội dung nghiên cứu và kết quả trong đề tài này là trung thực và chƣa từng
đƣợc ai công bố trong bất cứ cơng trình nghiên cứu nào trƣớc đây.
Những số liệu phục vụ cho việc phân tích, nhận xét, đánh giá đƣợc chính
tác giả thu thập từ các nguồn khác nhau có ghi trong phần tài liệu tham khảo.
Tơi hồn tồn chịu trách nhiệm về tính pháp lý q trình nghiên cứu
khoa học của luận văn này.
Thái Nguyên, ngày
tháng
Tác giả luận văn
Bùi Ngọc Huy
Số hóa bởi trung tâm học liệu
/>
năm 2013
ii
LỜI CẢM ƠN
Trƣớc tiên tôi bày tỏ lời cảm ơn chân thành đến các Thầy, cô giáo đã
giảng dạy, hƣớng dẫn và giúp đỡ tôi trong thời gian học tập và nghiên cứu
hồn thành luận văn này.
Tơi xin chân thành cảm ơn PGS. TS. Ngô Quốc Tạo - ngƣời đã trực tiếp
hƣớng dẫn và định hƣớng giúp tơi có thể nhanh chóng tiếp cận, nắm bắt kiến
thức và hồn thành luận văn “Nghiên cứu kỹ thuật xử lý nhiễu, hiệu chỉnh ảnh
nhị phân và ứng dụng cho phiếu thi trắc nghiệm”.
Xin chân thành cảm ơn các thầy, cô giáo Trƣờng Đại học Công nghệ
Thông tin và Truyền thông - Đại học Thái Nguyên, Viện Công nghệ thông tin
đã giúp đỡ và tạo điều kiện thuận lợi cho tôi trong thời gian học tập.
Tôi xin gửi lời cảm ơn tới trƣờng Cao đẳng Công nghiệp và Xây dựng,
nơi tôi đang công tác đã tạo điều kiện thuận lợi cho tôi trong suốt quá trình
học tập và làm việc tại trƣờng.
Cuối cùng, xin chân thành cảm ơn gia đình và bạn bè đã động viên, quan
tâm, giúp đỡ tơi hồn thành khóa học và luận văn.
Số hóa bởi trung tâm học liệu
/>
iii
MỤC LỤC
LỜI CAM ĐOAN................................................................................................. i
LỜI CẢM ƠN ..................................................................................................... ii
MỤC LỤC ......................................................................................................... iii
DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN .................................. vi
MỞ ĐẦU............................................................................................................ 1
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH............ 3
1.1. Giới thiệu chung về xử lý ảnh ................................................................ 3
1.1.1. Xử lý ảnh là gì? ............................................................................... 4
1.1.2. Các giai đoạn chính trong xử lý ảnh ............................................... 5
1.2. Khái quát quá trình xử lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng
cho phiếu thi trắc nghiệm ........................................................................ 6
1.2.1. Giới thiệu chung .............................................................................. 6
1.2.2. Quá trình xử lý nhiễu và hiệu chỉnh ảnh ......................................... 7
1.3. Một số khái niệm liên quan .................................................................... 8
1.3.1. Ảnh là gì? ........................................................................................ 8
1.3.2. Điểm ảnh (pixel element) ................................................................ 8
1.3.3. Mức xám (Gray Level).................................................................... 9
1.3.4. Độ phân giải của ảnh ....................................................................... 9
1.3.5. Phân loại ảnh ................................................................................... 9
1.4. Kết luận chƣơng 1 ................................................................................ 11
Chƣơng 2: MỘT SỐ KỸ THUẬT XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH .... 12
2.1. Các kỹ thuật tiền xử lý ......................................................................... 12
2.1.1 Giới thiệu chung ............................................................................. 12
2.1.2 Tăng, giảm độ sáng ........................................................................ 13
2.1.3. Tăng, giảm độ tƣơng phản ............................................................ 13
Số hóa bởi trung tâm học liệu
/>
iv
2.1.4. Tách kênh mầu đỏ ......................................................................... 14
2.1.5. Chuyển ảnh xám. ........................................................................... 15
2.1.6. Nhị phân hóa ảnh bằng phân ngƣỡng ........................................... 16
2.2. Kỹ thuật nhận dạng form ..................................................................... 20
2.2.1. Đặt vấn đề ..................................................................................... 20
2.2.2. Nhận dạng các điểm định vị .......................................................... 22
2.3. Một số thuật toán xử lý nhiễu .............................................................. 24
2.3.1. Căn chỉnh độ lệnh trang ................................................................ 24
2.3.2. Phân vùng ô cần tô ........................................................................ 25
2.3.3. Nhận dạng ô cần tô ........................................................................ 29
2.4. Một số kỹ thuật hiệu chỉnh ảnh ............................................................ 33
2.4.1. Phép giãn nhị phân (Dilation) ....................................................... 33
2.4.2. Phép co ảnh nhị phân (Erosion) .................................................... 37
2.4.3. Phép mở ảnh (Opening), đóng ảnh (Closing) ............................... 40
2.4.5. Làm đầy ô cần tô ........................................................................... 45
2.5. Kết luận chƣơng 2 ............................................................................ 47
Chƣơng 3: CHƢƠNG TRÌNH THỰC NGHIỆM ............................................ 49
3.1. Quá trình xử lý nhiễu và hiệu chỉnh ảnh .............................................. 49
3.1.1. Tách kênh màu đỏ ......................................................................... 49
3.1.2. Phân ngƣỡng ................................................................................. 49
3.1.3. Lọc nhiễu ....................................................................................... 50
3.1.4. Căn chỉnh độ lệch .......................................................................... 50
3.1.5. Khoanh vùng đƣợc tô .................................................................... 51
3.1.6. Xác định điểm định vị ................................................................... 51
3.1.7. Tách các vùng đƣợc tô .................................................................. 52
3.2. Chấm bài thi ......................................................................................... 52
3.3 Giới thiệu chƣơng trình ......................................................................... 53
KẾT LUẬN...................................................................................................... 58
Số hóa bởi trung tâm học liệu
/>
v
TÀI LIỆU THAM KHẢO ............................................................................... 59
Số hóa bởi trung tâm học liệu
/>
vi
DANH MỤC HÌNH VẼ SỬ DỤNG TRONG LUẬN VĂN
Hình 1.1. Quá trình xử lý ảnh ........................................................................... 5
Hình 1.2. Các giai đoạn chính trong xử lý ảnh ................................................. 5
Hình 1.3. Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh ........ 7
Hình 1.4. Ví dụ về ảnh đen trắng .................................................................... 10
Hình 1.5. Ví dụ ảnh xám ................................................................................. 10
Hình 1.6. Ví dụ về ảnh màu ............................................................................ 11
Hình 2.1. Ảnh trƣớc khi chuyển xám .............................................................. 16
Hình 2.2. Ảnh đã thực hiện chuyển xám......................................................... 16
Hình 2.3. Chọn ngƣỡng theo Zack .................................................................. 18
Hình 2.4. Phƣơng pháp lấy ngƣỡng ................................................................ 19
Hình 2.5. Phân ngƣỡng theo thuật tốn SIS .................................................... 20
Hình 2.6. Các điểm định vị trong phiếu trả lời câu hỏi trắc nghiệm .............. 22
Hình 2.7. Hệ tọa độ khi xoay ảnh ................................................................... 25
Hình 2.8. Các điểm lân cận gradient ............................................................... 27
Hình 2.9. Căn chỉnh đƣờng biên ..................................................................... 28
Hình 2.10. Vùng số báo danh và mã đề đã qua xử lý ..................................... 29
Hình 2.11. Vùng đáp án đã qua xử lý ............................................................. 29
Hình 2.12. Các dạng tơ trong phiếu trả lời trắc nghiệm.................................. 30
Hình 2.13. Ơ bị tơ trùng .................................................................................. 30
Hình 2.14. Ơ bị tơ lệch, tơ tràn lan .................................................................. 30
Hình 2.15. Ảnh cần kiểm tra tô đƣợc chia thành 3 vùng ................................ 31
Hình 2.16: Phép giãn nhị phân. ....................................................................... 35
Hình 2.17. Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân. ........ 36
Hình 2.18. Phép co nhị phân trên hai đối tƣợng ............................................. 37
Hình 2.19. Quá trình lọc đối tƣợng sử dụng phép co nhị phân và phép
giãn nhị phân ................................................................................. 39
Số hóa bởi trung tâm học liệu
/>
vii
Hình 2.20. Ứng dụng của phép co ảnh dƣới dạng số nhị phân. ...................... 39
Hình 2.21. Quá trình thực hiệp phép mở ảnh. ................................................. 41
Hình 2.22: Phép mở ảnh trên phƣơng diện ý nghĩa hình học. ........................ 42
Hình 2.24. Minh họa phép đóng ảnh trên phƣơng diện ý nghĩa hình học. ..... 43
Hình 2.25. Minh họa phép biến đổi trúng hoặc trƣợt ..................................... 45
Hình 2.26. Quá trình làm đầy đối tƣợng trong ảnh ......................................... 47
Hình 3.1. Ảnh trƣớc và sau khi tách kênh màu đỏ .......................................... 49
Hình 3.2. Ảnh trƣớc và sau khi phân ngƣỡng, lọc nhiễu ................................ 50
Hình 3.3. Ảnh trƣớc và sau khi căn chỉnh độ lệch .......................................... 51
Hình 3.4. Vùng số báo danh và mã đề ............................................................ 52
Hình 3.5. Giao diện chính của chƣơng trình ................................................... 54
Hình 3.6. Menu hiển thị phần tệp.................................................................... 54
Hình 3.7. Menu hiển thị xử lý nhiễu và hiệu chỉnh ảnh.................................. 55
Hình 3.9. Mơ phỏng q trình phân ngƣỡng và lọc nhiễu .............................. 56
Hình 3.10. Mơ phỏng q trình xoay ảnh ....................................................... 56
Hình 3.11. Mơ phỏng phân vùng ơ cần tơ ....................................................... 56
Hình 3.12. Menu hiển thị xử lý bài thi ............................................................ 56
Hình 3.13. Mô phỏng đọc các câu trả lời bài thi ............................................. 57
Hình 3.14. Mơ phỏng kết quả chấm thi........................................................... 57
Số hóa bởi trung tâm học liệu
/>
1
MỞ ĐẦU
- Khoa học xử lý ảnh trên thế giới đang có nhiều bƣớc tiến vững chắc.
Đây cũng là một trong những lĩnh vực có nhiều ứng dụng trong thực tế, góp
phần vào sự lớn mạnh của ngành Cơng nghệ thông tin.
- Việc xử lý nhiễu và hiệu chỉnh ảnh sau khi đã qua các thiết bị vào nhƣ
máy scan về định dạng mẫu ban đầu là việc rất cần thiết, hƣu ích trong đời
sống hàng ngày trong việc ứng dụng Công nghệ thông tin.
- Ở nƣớc ta trong vài năm gần đây, Bộ Giáo dục và Đào tạo đã ứng dụng
hình thức thi trắc nghiệm vào thi Đại học, Cao đẳng làm giảm bớt thời gian
chấm thi một cách đáng kể. Việc chấm thi đã đƣợc xử lý qua máy tính, khơng
cần phải giáo viên hoặc các chun gia trong lĩnh vực có mặt trực tiếp chấm
thi nhƣ trƣớc đây. Việc chấm các bài thi trắc nghiệm có thể đƣợc thực hiện
thông qua giải pháp sử dụng các hệ thống máy chấm thi tự động. Ngƣời dùng
chỉ cần đƣa các phiếu trả lời câu hỏi trắc nghiệm vào máy quét chuyên dụng,
và hệ thống sẽ tự động thực hiện tất cả các cơng việc xử lý nhƣ số hóa phiếu
trả lời, so khớp đáp án và trả lại kết quả. Tuy nhiên, những hệ thống này
thƣờng có chi phí lớn, mặc dù cho tốc độ xử lý cao nhƣng độ chính xác lại
khơng cao, dẫn đến việc phải chấm lại các bài thi gây tốn kém cả về thời gian
và tiền bạc.
- Tại Trƣờng Cao đẳng Công nghiệp và Xây dựng – Quảng Ninh các bài thi
trắc nghiệm sau khi sử dụng máy quét scan thi đƣợc các file ảnh với chất lƣợng
hình ảnh khơng cao. Nên việc xử lý nhiễu và hiệu chỉnh ảnh là rất cần thiết.
- Xuất phát từ những lý do trên, tôi chọn đề tài “Nghiên cứu kỹ thuật xử
lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng dụng cho phiếu thi trắc nghiệm”,
nhằm trợ giúp cho việc xử lý bài thi, chấm bài thi trắc nghiệm có độ chính xác
cao, đảm bảo thời gian xử lý.
- Nội dung luận văn không kể phần mở đầu, kết luận, tài liệu tham khảo
Số hóa bởi trung tâm học liệu
/>
2
bao gồm 3 chƣơng:
Chƣơng 1. Khái quát về xử lý nhiễu và hiệu chỉnh ảnh: Chƣơng này
nêu lên quá trình xử lý nhiễu và hiệu chỉnh ảnh nói chung. Từ đó xây dựng
đƣợc sơ đồ tổng quát của hệ thống xử lý nhiễu, hiệu chỉnh ảnh áp dụng cho
phiếu thi trắc nghiệm. Qua đó xây dựng tổng quát các bƣớc thực hiện quá trình
xử lý nhiễu và hiệu chỉnh ảnh. Chƣơng này cũng nêu lên đƣợc các khái niệm
liên quan đến ảnh của phiếu thi trắc nghiệm đƣợc biến đổi qua quá trình xử lý.
Chƣơng 2. Một số kỹ thuật xử lý nhiễu và hiệu chỉnh ảnh: Chƣơng này
nêu lên đƣợc các phép toán, thuật toán áp dụng cho quá trình xử lý nhiễu cũng
nhƣ hiệu chỉnh ảnh ứng dụng cho phiếu thi trắc nghiệm. Toàn bộ chƣơng tập
trung làm rõ các khái niệm về: phép co nhị phân, phép giãn nhị phân, phép đóng
ảnh, phép mở ảnh, phép trúng hoặc trƣợt, phép trích biên, phép làm đầy,…
Chƣơng 3. Chƣơng trình thực nghiệm: Chƣơng này nêu rõ các ứng dụng
của phép toán, thuật toán xử lý nhiễu cũng nhƣ hiệu chỉnh ảnh ứng dụng cho
phiếu thi trắc nghiệm. Trên cơ sở lý thuyết đã tìm hiểu em xây dựng đƣợc
chƣơng trình thực nghiệm.
Số hóa bởi trung tâm học liệu
/>
3
Chƣơng 1
KHÁI QUÁT VỀ XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH
Trong ngành khoa học máy tính, xử lý ảnh là một dạng của xử lý tín hiệu
cho đầu vào là một ảnh hoặc các frame của phim ảnh. Đầu ra có thể là một
hình ảnh, hoặc tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh.
Thƣờng thì kỹ thuật xử lý ảnh có liên quan tới xử lý tín hiệu hai chiều và
đƣợc áp dụng bằng một chuẩn riêng về kỹ thuật xử lý ảnh cho nó. Các khái
niệm cơ bản để xử lý tín hiệu nhƣ, khái niệm về tích chập, các biến đổi
Fourier, biến đổi Laplace, các bộ lọc hữu hạn,… Ngồi ra cịn cần tới các
cơng cụ tốn học nhƣ đại số tuyến tính, thống kê. Và một số kiến thức cần
thiết nhƣ trí tuệ nhân tao, mạng nơron nhân tạo cũng đƣợc đề cập trong q
trình phân tích và xử lý ảnh.
1.1. Giới thiệu chung về xử lý ảnh
Cũng nhƣ xử lý dữ liệu bằng đồ hoạ, xử lý ảnh là một lĩnh vực của tin
học ứng dụng. Xử lý dữ liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các
ảnh này đƣợc xem xét nhƣ là một cấu trúc dữ liệu và đƣợc tạo ra bởi các
chƣơng trình. Xử lý ảnh bao gồm các phƣơng pháp và kỹ thuật để biến đổi, để
truyền tải hoặc mã hóa các ảnh tự nhiên. Mục đích của xử lý ảnh gồm:
Thứ nhất: biến đổi ảnh và làm đẹp ảnh.
Thứ hai: tự động nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội
dung của ảnh.
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời
ta muốn đặc tả nó. Q trình nhận dạng thƣờng đi sau q trình trích chọn các
đặc tính chủ yếu của đối tƣợng. Có hai kiểu mơ tả đối tƣợng:
- Mơ tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Số hóa bởi trung tâm học liệu
/>
4
Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một hình ảnh
thành những phần có nghĩa để phân biệt đối tƣợng này với đối tƣợng khác.
Dựa vào đó ta có thể mơ tả cấu trúc của hình ảnh ban đầu.
Có thể liệt kê một số phƣơng pháp nhận dạng cơ bản nhƣ nhận dạng
biên của một đối tƣợng trên ảnh, tách cạnh, phân đoạn hình ảnh,... Kỹ thuật
này đƣợc sử dụng nhiều trong y học (xử lý tế bào, nhiễm sắc thể).
Trong thực tế ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công
với nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ
(chữ cái, chữ số, chữ có dấu). Nhận dạng chữ in hoặc đánh máy trong văn bản
phục vụ cho việc tự động hố q trình đọc tài liệu, tăng nhanh tốc độ và chất
lƣợng thu nhận thơng tin từ máy tính, nhận dạng chữ viết tay (với mức độ
ràng buộc khác nhau về cách viết, kiểu chữ,...).
1.1.1. Xử lý ảnh là gì?
Con ngƣời thu nhận thơng tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trị quan
trọng trong tƣơng tác ngƣời máy.
Xử lý ảnh đƣợc xem nhƣ là quá trình thao tác ảnh đầu vào nhằm cho ra
kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một
ảnh “tốt hơn” hoặc một kết luận.
Số hóa bởi trung tâm học liệu
/>
5
Hình 1.1. Quá trình xử lý ảnh
1.1.2. Các giai đoạn chính trong xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ
là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tƣợng trong khơng gian và nó có thể xem nhƣ một hàm n biến. Do đó, ảnh
trong xử lý ảnh có thể xem nhƣ ảnh n chiều.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Lƣu trữ
Thiết bị
thu nhận
ảnh
Thu nhận
ảnh
Lƣu trữ
Số hố
Phân tích
ảnh
Hệ quyết
định
Hình 1.2. Các giai đoạn chính trong xử lý ảnh
Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu
CCIR), nhƣng cũng có thể là tín hiệu số hố (loại CCD - Charge Coupled Device).
Ảnh có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay ảnh,
sách đƣợc quét qua scanner. Tiếp theo là quá trình số hóa (Digitalizer) để biến
đổi tín hiệu tƣơng tự sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa,
trƣớc khi chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại.
Q trình phân tích ảnh thực chất bao gồm nhiều công đoạn nhỏ. Trƣớc
hết là công việc tăng cƣờng hình ảnh (Image Enhancement) để nâng cao chất
lƣợng hình ảnh. Do những ngun nhân khác nhau: có thể do thiết bị thu nhận
ảnh, do nguồn sáng hay do nhiễu, ảnh có thể bị suy biến. Do vậy cần phải
Số hóa bởi trung tâm học liệu
/>
6
tăng cƣờng và khôi phục (Image Restoration) lại ảnh để làm nổi bật một số
đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái gốc- trạng
thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện các đặc tính
nhƣ biên (Edge Detection), phân vùng ảnh (Image Segmentation), trích chọn
các đặc trƣng (Feature Extraction),...
Cuối cùng, tuỳ theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Các giai đoạn chính của q trình xử lý ảnh
có thể mơ tả ở hình 1.2.
Xử lý ảnh là một trong những lĩnh vực có nhiều ứng dụng trong thực tiễn nhƣ:
hệ thông tin địa lý (GIS – Geographic Information System), quân sự, y học,…
Cụ thể, xử lý ảnh số có rất nhiều ứng dụng nhƣ:
+ Làm nét hỡn các ảnh trong y học.
+ Khôi phục lại ảnh do tác động của khí quyển trong thiên văn học.
+ Chuyển tải, nén ảnh khi truyền đi xa hoặc lƣu trữ.
1.2. Khái quát quá trình xử lý nhiễu, hiệu chỉnh ảnh nhị phân và ứng
dụng cho phiếu thi trắc nghiệm
1.2.1. Giới thiệu chung
Đầu vào của quá trình xử lý nhiễu, hiệu chỉnh ảnh là một ảnh gốc của
phiếu thi trắc nghiệm thu đƣợc qua scanner, máy ảnh,… Ảnh ban đầu là
một ảnh mầu, thƣờng có chất lƣợng thấp do ảnh hƣởng của nhiễu, bị nghiêng,
bị đứt nét do thí sinh khi tơ không cẩn thận hoặc do thiết bị thu ảnh không tốt.
Quá trình xử lý nhiễu, hiệu chỉnh ảnh nhằm mục đích loại bỏ hay làm
giảm tối thiểu các ảnh hƣởng của mơi trƣờng bên ngồi lên ảnh thu nhận
đƣợc. Cơng đoạn này bao gồm các bƣớc nhƣ lọc ảnh, khử nhiễu, quay ảnh,
qua đó giảm bớt các biến dạng do quá trình quét ảnh gây ra và đƣa ảnh về
trang thái tốt nhất có thể.
Đầu ra của q trình xử lý nhiễu, hiệu chỉnh ảnh:
Số hóa bởi trung tâm học liệu
/>
7
+ Một ảnh bài thi trắc nghiệm với chất lƣợng ảnh rõ, nét hơn rất nhiều
so với ảnh ban đầu.
+ Trả về đƣợc kết quả thi của bài thi trắc nghiệm của thí sinh một cách
chính xác, chấm điểm đúng với kết quả làm đƣợc của thí sinh.
Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh:
Lƣu trữ
Lƣu trữ
Camera
Sensor
Ảnh bài
thi trắc
nghiệm
Số
hố
XỬ LÝ NHIỄU,
HIỆU CHỈNH HÌNH
ẢNH
Nhận dạng và
chấm thi
Ảnh bài thi trắc
nghiệm với chất
lƣợng tốt hơn
Hình 1.3. Sơ đồ tổng quát của một hệ thống xử lý nhiễu, hiệu chỉnh ảnh
1.2.2. Quá trình xử lý nhiễu và hiệu chỉnh ảnh
Sau khi thu đƣợc ảnh của phiếu thi trắc nghiệm thông qua máy camera
hoặc scan,… ảnh sẽ đƣợc số hóa, sau đó thơng qua q trình xử lý nhiễu, hiệu
chỉnh ảnh sẽ thu đƣợc:
- Ảnh bài thi trắc nghiễm đã đƣợc khử nhiễu với chất lƣợng ảnh tốt hơn
so vơi ảnh ban đầu giúp cho quá trình nhận dạng của hệ thống chấm thi thu
đƣợc kết quả chính xác.
- Đọc đƣợc kết quả bài thi, sau đó đối sánh với đáp án, đƣa ra kết quả
chính xác đúng với nội dung của bài thi trắc nghiệm.
Quá trình xử lý nhiễu và hiệu chỉnh ảnh đƣợc diễn ra qua các quá
trình nhƣ sau:
- CÁC Kỹ THUậT TIềN Xử LÝ
+ Tăng, giảm độ sáng
+ Tăng, giảm độ tương phản
+ Tách kênh mầu đỏ
Số hóa bởi trung tâm học liệu
/>
8
+ Chuyển ảnh xám
+ Nhị phân hóa ảnh bằng phân ngưỡng
- NHậN DạNG FORM QUA CÁC ĐIểM Đị NH Vị
- Xử LÝ NHIễU
+ Căn chỉnh độ lệnh trang
+ Phân vùng ô cần tô
+ Nhận dạng ô cần tô
- MộT Số Kỹ THUậT HIệU CHỉ NH ảNH
+ Phép giãn nhị phân
+ Phép co ảnh nhị phân
+ Phép mở ảnh, đóng ảnh
+ Làm đầy ô cần tô
1.3. Một số khái niệm liên quan
1.3.1. Ảnh là gì?
Là tập hợp hữu hạn các điểm ảnh, thƣờng đƣợc biểu diễn bằng một mảng
hai chiều I(n, m) với n là số hàng, m là số cột. Ta ký hiệu P(x, y) là một điểm
ảnh tại vị trí (x, y). Số lƣợng điểm ảnh trên mỗi hàng hoặc các hàng xác định
độ phân giải của ảnh.
1.3.2. Điểm ảnh (pixel element)
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để
xử lý bằng máy tính (số), ảnh cần phải đƣợc số hố. Số hoá ảnh là sự biến đổi
gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí
(khơng gian) và độ sáng (mức xám). Khoảng cách giữa các điểm ảnh đó đƣợc
thiết lập sao cho mắt ngƣời không phân biệt đƣợc ranh giới giữa chúng. Mỗi
một điểm nhƣ vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi tắt là Pixel.
Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa độ (x, y).
Số hóa bởi trung tâm học liệu
/>
9
1.3.3. Mức xám (Gray Level)
Mức xám của điểm ảnh là kết quả sự biến đổi tƣơng ứng một cƣờng độ
sáng của điểm ảnh đó với một giá trị số (kết quả của q trình lƣợng hố).
Cách mã hố kinh điển thƣờng dùng 16, 32 hay 64 mức. Mã hoá 256 mức là
phổ dụng nhất do lý do kỹ thuật. Vì 28 = 256 (0, 1,..., 255), nên với 256 mức
mỗi pixel sẽ đƣợc mã hoá bởi 8 bit.
1.3.4. Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh đƣợc ấn định trên
một ảnh số đƣợc hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải đƣợc chọn sao cho
mắt ngƣời vẫn thấy đƣợc sự liên tục của ảnh. Việc lựa chọn khoảng cách thích
hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và đƣợc phân bố
theo trục x và y trong khơng gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic Adaptor)
là một lƣới điểm theo chiều ngang màn hình: 320 điểm chiều dọc * 200 điểm
ảnh (320*200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn hơn màn
hình CGA 17” độ phân giải 320*200. Lý do: cùng một mật độ (độ phân giải)
nhƣng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm) kém hơn.
1.3.5. Phân loại ảnh
Ảnh khi số hóa đƣợc chia làm 3 loại:
a, Ảnh nhị phân: Giá trị xám của tất các các điểm ảnh chỉ nhận giá trị 1
hoặc 0. Nhƣ vậy mỗi điểm ảnh trong ảnh nhị phân đƣợc biểu diễn bới 1 bit
điểm đen đƣợc biểu trong ma trận là 0 và điểm sáng đƣợc biểu diễn là 1.
Nhƣng đôi khi để tiện cho quá trình cài đặt các thuật tốn xử lý ảnh ngƣời ta
có thể quy định ngƣợc lại là điểm đen là 1 và điểm trắng là 0.
Số hóa bởi trung tâm học liệu
/>
10
Hình 1.4. Ví dụ về ảnh đen trắng
b, Ảnh xám: Giá trị xám nằm trong khoảng 0..255. Nhƣ vậy đối với ảnh
xám, thông thƣờng mỗi pixel mang thông tin của 256 mức xám (tƣơng ứng
với 8 bit) nhƣ vậy ảnh xám hồn tồn có thể tái hiện đầy đủ cấu trúc của một
ảnh màu tƣơng ứng thông qua tám mặt phẳng bit theo độ xám.
Hình 1.5. Ví dụ ảnh xám
c, Ảnh màu: Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu
cơ bản: đỏ (R), lục (G), lơ (B) và thƣờng thu nhận trên các dải băng tần khác
nhau. Với ảnh màu, cách biểu diễn cũng tƣơng tự nhƣ với ảnh đen trắng, chỉ
Số hóa bởi trung tâm học liệu
/>
11
khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần
24 bit. 24 bit này đƣợc chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành
L cấp màu khác nhau (thƣờng L=256). Mỗi khoảng này biểu diễn cho cƣờng
độ sáng của một trong các màu chính.
Mỗi pixel ảnh màu ký hiệu Px, đƣợc viết: (T: trong cơng thức dƣới đây
là ký hiệu chuyển vị)
Px
red, green, blue
T
Hình 1.6. Ví dụ về ảnh màu
1.4. Kết luận chƣơng 1
- Chƣơng này nêu lên quá trình xử lý nhiễu và hiệu chỉnh ảnh nói chung.
- Xây dựng đƣợc sơ đồ tổng quát của hệ thống xử lý nhiễu, hiệu chỉnh ảnh
áp dụng cho phiếu thi trắc nghiệm.
- Xây dựng tổng quát các bƣớc thực hiện quá trình xử lý nhiễu và hiệu
chỉnh ảnh.
- Nêu lên các khái niệm liên quan đến ảnh của phiếu thi trắc nghiệm đƣợc
biến đổi qua q trình xử lý.
- Từ đó là cở sở để hồn thành chƣơng tiếp theo của luận văn.
Số hóa bởi trung tâm học liệu
/>
12
Chƣơng 2
MỘT SỐ KỸ THUẬT XỬ LÝ NHIỄU VÀ HIỆU CHỈNH ẢNH
2.1. Các kỹ thuật tiền xử lý
2.1.1 Giới thiệu chung
Giai đoạn tiền xử lý ảnh là giai đoạn quan trọng, có ảnh hƣởng trực tiếp
đến độ chính xác của quá trình xử lỹ nhiễu và hiệu chỉnh ảnh, tuy nhiên nó
cũng làm tăng thời gian xử lý chung của tồn bộ hệ thống. Vì vậy, tùy theo
chất lƣợng ảnh thu nhận đƣợc của từng trƣờng hợp cụ thể, mà chúng ta chọn
sử dụng một hoặc một số thủ tục tiền xử lý. Thậm chí, trong trƣờng hợp ảnh
đầu vào có chất lƣợng tốt và cần ƣu tiên tốc độ xử lý, chúng ta có thể bỏ qua
giai đoạn tiền xử lý này.
Đầu vào của quá trình xử lý ảnh là các ảnh gốc ban đầu, thu đƣợc qua
scanner. Ảnh ban đầu thƣờng có chất lƣợng thấp do ảnh hƣởng của nhiễu, bị
nghiêng, bị đứt nét nên chúng ta cần phải có một q trình tiền xử lý ảnh để
nâng cao chất lƣợng ảnh đầu vào trƣớc khi đƣa vào nhận dạng. Q trình này
bao gồm cơng đoạn khơi phục ảnh và tăng cƣờng ảnh.
Khơi phục ảnh nhằm mục đích loại bỏ hay làm giảm tối thiểu các ảnh
hƣởng của mơi trƣờng bên ngồi lên ảnh thu nhận đƣợc. Cơng đoạn khôi
phục ảnh bao gồm các bƣớc nhƣ lọc ảnh, khử nhiễu, quay ảnh, qua đó giảm
bớt các biến dạng do quá trình quét ảnh gây ra và đƣa ảnh về trang thái gần
nhƣ ban đầu.
Tăng cƣờng ảnh là một công đoạn quan trọng, tạo tiền đề cho xử lý
ảnh. Tăng cƣờng ảnh không phải làm tăng lƣợng thông tin trong ảnh mà là
làm nổi bật những đặc trƣng của ảnh giúp cho cơng việc xử lý phía sau
đƣợc hiệu quả hơn. Công đoạn này bao gồm các công việc nhƣ lọc độ tƣơng
Số hóa bởi trung tâm học liệu
/>
13
phản, làm trơn ảnh, nhị phân hóa.
2.1.2 Tăng, giảm độ sáng
Tăng cƣờng độ sáng (Brightness) của một ảnh có thể đƣợc hiểu nhƣ sự
phát sáng tồn bộ ảnh. Hay nói một cách cụ thể đó là sự phát sáng tồn bộ của
mọi Pixel trong ảnh đó.
Đây là một kỹ thuật khá đơn giản: để tăng thêm độ sáng, tất cả các Pixel
của ảnh cần đƣợc cộng thêm giá trị điều chỉnh vào mọi kênh màu RGB. Tuy
kỹ thuật này đơn giản nhƣng nó đem lại hiệu quả khá cao và rất hay đƣợc sử
dụng trong lĩnh vực xử lý ảnh. Nó giúp ích rất nhiều trong các ngành nhƣ y
học, địa lý, quân sự,... trong việc phân tích và nhận dạng.
Ở đây điều chỉnh Brightness không chỉ đƣợc sử dụng để làm sáng lên
những ảnh tối mà còn đƣợc sử dụng để làm tối đi các ảnh sáng. Một ảnh sáng
hoàn toàn đơn giản là tất cả các Pixel đều màu trắng trong khi một ảnh tối
hoàn toàn là tất cả các Pixel đều màu tối. Sự khác nhau duy nhất trong làm tối
một ảnh là trừ đi giá trị điều chỉnh vào mỗi kênh màu RGB của ảnh.
Đối với mỗi kênh màu, chúng chỉ nhận các giá trị [0..255]. Chính vì thế
khi tăng cƣờng hay giảm độ sáng của một ảnh ta phải chú ý đến ngƣỡng của
các kênh. Điều đó có nghĩa là với mỗi kênh màu của một Pixel nếu nhỏ hơn 0
thì ta phải gán bằng 0 và nếu lớn hơn 255 thì ta phải gán bằng 255.
Biểu thức cho kỹ thuật Brightness có dạng:
g(x,y) = f(x,y) + b
Trong đó b là hằng số cộng thêm vào giá trị màu f(x,y). Độ sáng của ảnh
tăng nếu b > 0, và giảm bớt nếu b < 0.
2.1.3. Tăng, giảm độ tương phản
Độ tƣơng phản (Contrast) thể hiện sự thay đổi cƣờng độ sáng của đối
tƣợng so với nền, hay nói cách khác, độ tƣơng phản là độ nổi của điểm ảnh
hay vùng ảnh so với nền.
Số hóa bởi trung tâm học liệu
/>
14
Ảnh số là tập hợp các điểm, mà mỗi điểm có giá trị độ sáng khác nhau.
Ở đây, độ sáng để mắt ngƣời dễ cảm nhận ảnh song không phải là quyết định.
Thực tế chỉ ra rằng hai đối tƣợng có cùng độ sáng nhƣng đặt trên hai nền khác
nhau sẽ cho cảm nhận khác nhau. Vì vậy ta có thể thay đổi độ tƣơng phản của
ảnh sao cho phù hợp.
Việc làm tăng độ tƣơng phản rất hữu ích khi tiến hành xử lý trƣớc theo
phƣơng pháp phân ngƣỡng. Bằng việc làm tăng độ tƣơng phản, sự khác nhau
của giá trị nền và đối tƣợng, độ dốc của cạnh đối tƣợng đƣợc tăng lên. Do đó
sau khi làm tăng độ tƣơng phản ta có thể tìm các giá trị màu thích hợp với
một vùng sáng hơn.
Trong một ảnh có độ tƣơng phản cao, có thể xác định đƣợc các viền rõ
ràng và chi tiết khác nhau của ảnh đó đƣợc nổi bật. Cịn trong một ảnh có độ
tƣơng phản thấp, tất cả các màu đều gần nhƣ nhau gây khó khăn cho việc xác
định các chi tiết của ảnh.
Biểu thức cho kỹ thuật Contrast có dạng:
g(x,y) = af(x,y)
Trong đó a là hằng số nhân vào giá trị màu tại f(x,y). Độ sáng của ảnh
tăng nếu a > 1, và giảm bớt nếu a < 1.
2.1.4. Tách kênh mầu đỏ
Ảnh quét thu đƣợc của phiếu trả lời trắc nghiệm trên thực tế chỉ bao gồm
hai màu chủ đạo là đen và đỏ (khơng xét đến màu bút của thí sinh ghi thông
tin). Màu đỏ dùng để in các thông tin đánh dấu, đƣờng bao và để tô vẽ các
vùng đối tƣợng đánh dấu đặc biệt. Ƣu điểm của việc sử dụng màu đỏ để in
những thông tin này là để trong quá trình xử lý ta sẽ thực hiện tách kênh màu
đỏ làm nổi lên các vùng thông tin cần thiết vì nếu dùng cùng một màu để in,
có thể các vùng này sẽ ảnh hƣởng đến các vùng thông tin làm bài của thí sinh,
gây khó khăn trong q trình xứ lý nhiễu và nhận dạng hoặc có thể dẫn đến
Số hóa bởi trung tâm học liệu
/>
15
nhận nhầm. Tuy nhiên việc sử dụng ảnh màu để xử lý cũng yêu cần một điều
kiện hết sức cần thiết là chất lƣợng màu in và chất lƣợng của máy quét phải
tốt và đồng đều để thu đƣợc ảnh quét với chất lƣợng nhƣ mong muốn.
Ảnh đầu vào sau khi thu nhận về máy tính sẽ đƣợc thực hiện tách lấy
kênh màu đỏ để khi trải qua quá trình phân ngƣỡng thì các vùng thơng tin
đƣợc in màu đỏ sẽ trở thành màu nền. Khi đó các ơ đƣợc tơ sẽ có màu đen nổi
bật lên, giúp cho q trình nhận dạng đƣợc thuận tiện.
2.1.5. Chuyển ảnh xám.
Đơn vị tế bào của ảnh số là pixel. Tùy theo mỗi định dạng là ảnh màu
hay ảnh xám mà từng pixel có thơng số khác nhau. Đối với ảnh màu từng pixel
sẽ mang thông tin của ba màu cơ bản tạo ra bản màu khả kiến là Đỏ (R), Xanh
lá cây (G) và Xanh nƣớc biển (B) [Thomas 1892]. Trong mỗi pixel của ảnh
màu, ba màu cơ bản R, G và B đƣợc bố trí sát nhau và có cƣờng độ sáng khác
nhau. Thông thƣờng, mỗi màu cơ bản đƣợc biểu diễn bằng 8 bit tƣơng ứng
256 mức độ màu khác nhau, hay nói cách khác chúng ta sẽ có
màu
(khoảng 16.78 triệu màu). Đối với ảnh xám, thông thƣờng mỗi pixel mang
thông tin của 256 mức xám (tƣơng ứng với 8 bit) nhƣ vậy ảnh xám hồn tồn
có thể tái hiện đầy đủ cấu trúc của một ảnh màu tƣơng ứng thông qua tám mặt
phẳng bit theo độ xám.
Trong hầu hết quá trình xử lý ảnh, chúng ta chủ yếu chỉ quan tâm đến cấu
trúc của ảnh và bỏ qua ảnh hƣởng của yếu tố màu sắc. Do đó bƣớc chuyển từ
ảnh màu thành ảnh xám là một công đoạn phổ biến trong các q trình xử lý
ảnh vì nó làm tăng tốc độ xử lý và mức độ phức tạp của các thuật toán áp dụng
trên ảnh xám giảm hơn so với các thuật toán áp dụng trên ảnh màu.
Chúng ta có cơng thức chuyển các thơng số giá trị màu của một pixel
thành mức xám tƣơng ứng nhƣ sau:
G = .CR + .CG + .CB
Số hóa bởi trung tâm học liệu
/>
16
Trong đó các giá trị CR, CG và CB lần lƣợt là các mức độ màu đỏ, xanh lá
cây và xanh nƣớc biển của pixel màu,
+
+
Hình 2.1. Ảnh trước khi chuyển xám
Hình 2.2. Ảnh đã thực hiện chuyển xám
2.1.6. Nhị phân hóa ảnh bằng phân ngưỡng
Q trình phân ngƣỡng là quá trình tìm ra ngƣỡng của một ảnh để thực
hiện việc phân vùng. Ngƣỡng đóng vai trị quyết định q trình nhị phân hóa
ảnh số có hiệu quả hay khơng. Nếu chọn ngƣỡng không tốt, một số đối tƣợng
sẽ bị bỏ qua hoặc cho ra đối tƣợng với kích thƣớc và vị trí khơng đúng hoặc
làm cho các đối tƣợng khơng phân biệt đƣợc với nhau.
Có nhiều thuật tốn tìm ngƣỡng khác nhau cho ra các kết quả khác nhau,
trong đó điển hình là tìm ngƣỡng trung bình và tìm ngƣỡng theo Histogram.
Số hóa bởi trung tâm học liệu
/>