Tải bản đầy đủ (.pdf) (13 trang)

Xây dựng hệ thống phát hiện và nhận dạng biển số xe sử dụng học sâu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.82 MB, 13 trang )

<span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

HÀ NỘI - NĂM 2023

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

TOM TAT DE ÁN

<small>Bai toan phat hién va nhan dang biển số xe có</small>

<small>ý nghĩa quan trọng trong các lĩnh vực giao thông</small>

<small>thông minh, bãi đỗ xe thông minh, giám sát vi phạm</small>

<small>an toàn giao thong, ... Trong những năm gan đây,</small>

<small>các nghiên cứu tập trung giải quyết vấn đề theo</small>

<small>hướng sử dụng mạng nơron học sâu với mục tiêu đạtđược độ chính xác cao. Tuy nhiên, các nghiên cứu</small>

<small>nảy thường tập trung vào các bộ dữ liệu chuẩn do</small>

<small>các tác giả tự thu thập. Một số nghiên cứu khác thì</small>

<small>chỉ tập trung chủ yếu vào độ chính xác, trong khi</small>

<small>nhu cầu của các hệ thống hiện nay địi hỏi cả về tốcđộ xử lý. Những điều đó khiến cho chúng khó có thêáp dụng được vào điều kiện thực tế như giao thơng ở</small>

<small>Việt Nam. Vì vậy, dé án này được thực hiện nhằm</small>

<small>đưa ra một giải pháp cho các vân đê nêu trên.</small>

<small>Trong đề án này, tác giả mong muốn pháttriển một hệ thống có thé phát hiện vả nhận dạngbiển số xe trong các ngữ cảnh đa dạng, đặc biệt cóthé áp dụng trong điều kiện giao thông ở Việt Nam.</small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<small>Cụ thể, đề án đề xuất các mơ hình phát hiện và nhận</small>

<small>dạng biển số xe chỉ bao gồm các lớp tích chập và</small>

<small>truyền thăng, điều đó làm giảm đáng ké tốc độ suy</small>

<small>diễn so với các phương pháp có sử dụng mạng</small>

<small>nơron hồi quy. Dé án đã làm thực nghiệm trên các</small>

<small>mơ hình có kích thước khác nhau, sử dụng cả</small>

<small>phương pháp học chuyển đổi và phương pháp huanluyện mạng từ đầu bằng cách khởi tạo tham số ngẫu</small>

<small>nhiên cho mạng. Từ đó, thực hiện so sánh cả về hiệu</small>

<small>suất và tốc độ giữa các mơ hình, cùng với đó là đánh</small>

<small>giá khả năng triển khai thực tế.</small>

<small>Đề án sử dụng bộ dữ liệu UFPR-ALPR và</small>

một tập dữ liệu biển số xe Việt Nam tự đánh

<small>nhãn cho các thử nghiệm, bao gồm đa dạng các ngữcảnh và được ghi lại bởi nhiều loại thiết bị ghi hình.Sau quá trình huấn luyện, mơ hình phát hiện biển sốxe đạt điểm mAP@95 là 0.82 và mAP(@50 là 0.993</small>

với tốc độ suy diễn là 12.92 FPS đo trên card đồ

<small>họa Nvidia GeForce RTX 3060. Trong khi đó, mơ</small>

<small>hình nhận dạng biến số xe đạt độ chính xác là</small>

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<small>97.12%. Điều đó cho thấy tính khả thi của các mơhình phát hiện và nhận dạng biển số xe cả về hiệusuất và tốc độ suy diễn trong các ngữ cảnh thực tếnhư điều kiện giao thông ở Việt Nam.</small>

<small>Nội dung đề án được chưa thành 4 chương,</small>

<small>cụ thê như sau:</small>

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>Chương 1: Tổng quan bài toán phát hiện và nhậndạng biến số xe</small>

Chương 1 của đề án trình bày tổng quan bài toán

<small>phát hiện và nhận dạng biên số xe. Tác giả phân</small>

tích đầu vào và đầu ra của bài tốn, cũng như lợi

<small>ích và những thách thức của bài toán trong việc</small>

<small>áp dụng thực tế.</small>

<small>Tiếp theo, chương | cũng trình bày sơ lược một</small>

số giải pháp đã được sử dụng cho bài toán phát

<small>hiện và nhận dạng biển số xe, bao gom caphương pháp truyền thống và hiện đại. Cácphương pháp truyền thông trước đây bao gồm</small>

việc sử dụng các cửa số trượt, các bộ lọc tĩnh hoặc các thuật tốn như SIFT, HOG để trích rút đặc trưng và các thuật toán như KNN, SVM dé

phan loại đối tượng hoặc ký tự. Trong khi đó,

phương pháp hiện đại được sử dụng phổ biến

<small>nhât hiện nay là sử dụng mạng noron hoc sâu.</small>

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

Từ đó, tác giả so sánh hai phương pháp dé thay

<small>rang phương pháp sử dụng mạng noron học sâuđang được ưa thích do khả năng vượt trội cả về</small>

tốc độ và độ chính xác mà nó đem lại.

Cuối cùng, chương sơ lược một SỐ cơng trình

<small>nghiên cứu nổi bat trong thời gian gan đây để</small>

giải quyết bài toán phát hiện và nhận dạng biển số xe. Từ đó, chỉ ra sự thành cơng và các mặt

<small>hạn chế về độ chính xác cũng như tốc độ suy</small>

diễn khi áp dụng các mô hình này trong điều

<small>kiện thực tế như giao thơng ở Việt Nam. Từ</small>

những hạn chế đó, tac giả lý giải tại sao dé án

<small>này được thực hiện.</small>

<small>Chương 2: Tong quan về một số mang noron</small>

<small>Trong chương 2, tác giả làm rõ câu trúc, mơhình tốn học của các lớp mạng chính câu tạo lên</small>

<small>các mơ hình mạng nơron học sâu được đê án sử</small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<small>dụng làm giải pháp để giải quyết bài toán phát hiệnvà nhận dạng biển số xe.</small>

<small>Trước đây, trong các mơ hình học sâu có độ</small>

<small>chính xác cao, hầu hết trong số chúng đều có đủcác loại mạng tích chập, hồi quy và truyềnthăng. Đặc biệt, trong các bai tốn có u tố</small>

<small>ngơn ngữ, người ta thường sử dụng các lớp</small>

<small>mạng hoặc một số mơ hình mạng học sâu có</small>

kiến trúc hồi quy làm bộ giải mã ký tự như RNN, GRU, LSTM.... Bài tốn nhận dạng biến số xe ở đây cũng khơng ngoại lệ. Tuy nhiên,

<small>kiến trúc hồi quy lại bộc lộ một điểm yếu đó làtốn nhiều thời gian xử lý, do tại mỗi bước cần có</small>

thơng tin của bước trước đó, khiến cho chúng

<small>khơng thể tận dụng được hết năng lực xử lý của</small>

các phần cứng hiện nay. Ké từ sau sự thành cơng

<small>của mơ hình Transformer trong lĩnh vực xử lý</small>

<small>ngơn ngữ tự nhiên vào năm 2018, nó đã trởthành nguôn cảm hứng cho các nghiên cứu trong</small>

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

<small>lĩnh vực thị giác máy tính. Các mơ hình mạng</small>

mà đề án sử dụng được cầu tạo chủ yếu từ các

<small>lớp mạng tích chập và lớp mạng truyén thang. Vì</small>

vậy, chương 2 sẽ tập trung làm rõ kiến trúc cũng

<small>như mơ hình tốn học của từng loại mạng này.</small>

<small>Chương 3: Giải pháp đề xuất</small>

<small>Chương 3 của đề án làm rõ các kiến trúc mơ hình</small>

<small>mạng noron học sâu được sử dụng trong bài toán</small>

<small>phát hiện biển số xe và nhận dạng biển số xe. Cùng</small>

<small>với đó, tác giả cũng chỉ ra khó khăn của bài tốn khi</small>

<small>phải đối mặt với các ngữ cảnh thực tế như biển số xe</small>

<small>bị nghiêng so với góc nhìn chính diện, làm giảm</small>

<small>hiệu suất của mơ hình nhận dạng. Từ đó, tác giả đềxuất một giải pháp biến đổi điểm nhìn (tiếng Anh:perspective transformation) để đưa biển số xe về góc</small>

<small>nhìn cân đơi, chính diện.</small>

<small>Trong chương này, tác gia đề xuất sử dụng YOLOv8làm giải pháp cho bài toán phát hiện biển số xe. Xét</small>

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small>về sự cân bằng giữa độ chính xác và tốc độ suy diễn,mơ hình YOLOv§ đang là mơ hình tốt nhất hiện nay</small>

<small>áp dung cho các bai toán phát hiện đối tượng. Mangbao gồm ba thành phần chính, đó là Backbone, Neck</small>

<small>và Head. Phần Backbone có nhiệm vụ trích rút đặctrưng, nó là phiên bản sửa đổi của CSPDarknet53,</small>

trong đó các khối CSPResBlock được thay thế bởi module C2f giúp cho toàn bộ kiến trúc trở nên nhỏ gọn hơn. Phần Neck sử dụng kiến trúc

<small>SPPF, là phiên bản cải tiễn của SPP. Trong thựcnghiệm, SPPF có tốc độ nhanh gấp hai lần so với</small>

SPP. Cuối cùng là phần Head sử dụng cau trúc

<small>tach rời (tiếng Anh: decoupled head) thay vi cau</small>

trúc hợp nhất như trong các phiên ban YOLO

<small>trước đó.</small>

<small>Đối với bài tốn nhận dạng biển số xe, tác giả dé</small>

xuất sử dụng một kiến trúc có tên là SVTR. Kiến

<small>trúc SVTR gọn nhẹ, được lay cam hứng từ sự</small>

thành công của máy biến đổi thị giác (tiếng Anh:

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<small>visual transformer). Nó bao gơm các khơi trộn,</small>

<small>các tốn tử hợp nhât và kêt hợp nhăm trích rút</small>

<small>các đặc trưng cục bộ như nét chữ và năm bắt sự</small>

phụ thuộc giữa các thành phần ký tự.

Dé giải quyết van dé biển số xe bị nghiêng do góc chụp biển số bị lệch so với phương chính diện, tác giả đề xuất sử dụng hệ tọa độ đồng nhất và tim ma trận các phép biến đổi trong không

<small>gian ba chiêu.</small>

<small>Cuôi cùng, chương trình bày các chỉ sơ được sử</small>

<small>dụng đê đo hiệu st của các mơ hình phát hiện</small>

<small>biên sơ xe (mAP metric) và nhận dạng biên sôxe (accuracy metric).</small>

<small>Chương 4: Thực nghiệm va đánh gia</small>

<small>Trong chương này, tác giả trình bày dữ liệu cùngvới phân cứng được sử dụng đê làm thực nghiệm</small>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<small>với các mơ hình được trình bày trong chương 3.</small>

Về dit liệu, tác giả sử dụng hai tap dit liệu đó là

<small>UFPR-ALPR và một tập dữ liệu biên số xe Việt</small>

<small>Nam. Các tập dữ liệu này đa dạng, được chụp</small>

<small>bởi nhiều thiết bị, trong các điều kiện khác nhau.</small>

Sau khi tổng hợp và lọc dữ liệu, số mẫu dé huấn

<small>luyện mơ hình phát hiện biển số xe là 14338</small>

mẫu, số mẫu để đánh giá mô hình phát hiện biển số xe là 4365 mẫu. Trong khi đó, số mau dé huấn luyện mơ hình nhận dạng biển số xe là

7920 mẫu, số mẫu để đánh giá mơ hình nhận dạng biên số xe là 2570 mẫu.

Phần cứng được sử dụng để huấn luyện các mơ

<small>hình là card đỗ hoa NVIDIA GeForce RTX</small>

<small>Sau quá trình huấn luyện, mơ hình phát hiện</small>

biển số xe đạt giá trị mAP@95 là 0.82,

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<small>mAP@S0 là 0.993. Trong khi, mơ hình nhận</small>

dạng biển số xe đạt giá trị độ chính xác là

Cuối cùng, chương trình bay luồng hồn chỉnh

<small>của hệ thông phát hiện và nhận dạng biên sô xe.</small>

</div>

×