Thiết kế hệ thống tự động nhận dạng và cảnh báo tàu thuyền quá khổ khi qua âu thuyền ứng dụng công nghệ xử lý ảnh deep learning

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.79 MB, 99 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ GIAO THÔNG VẬN TẢI

TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM

--------- oOo --------

NGUYỄN VIỆT CHÍNH

THIẾT KẾ HỆ THỐNG TỰ ĐỘNG NHẬN DẠNG
VÀ CẢNH BÁO TÀU THUYỀN QUÁ KHỔ
KHI QUA ÂU THUYỀN ỨNG DỤNG
CÔNG NGHỆ XỬ LÝ ẢNH DEEP LEARNING

LUẬN VĂN THẠC SĨ

TP. HỒ CHÍ MINH 12-2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO

BỘ GIAO THÔNG VẬN TẢI

TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI TP.HCM
--------- oOo --------

NGUYỄN VIỆT CHÍNH

THIẾT KẾ HỆ THỐNG TỰ ĐỘNG NHẬN DẠNG
VÀ CẢNH BÁO TÀU THUYỀN QUÁ KHỔ

KHI QUA ÂU THUYỀN ỨNG DỤNG
CÔNG NGHỆ XỬ LÝ ẢNH DEEP LEARNING
CHUYÊN NGÀNH: KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA
MÃ SỐ: 8520216

LUẬN VĂN THẠC SĨ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS. ĐẶNG XUÂN KIÊN

TP. HỒ CHÍ MINH 12-2020

LUẬN VĂN ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC GIAO THƠNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH

Cán bộ hướng dẫn khoa học: PGS.TS. ĐẶNG XUÂN KIÊN

Cán bộ chấm nhận xét 1: TS. ĐOÀN VĂN ĐỔNG

Cán bộ chấm nhận xét 2: TS. NGÔ MẠNH DŨNG

Luận văn thạc sĩ được bảo vệ tại Trường Đại học Giao thông vận tải Tp. HCM ngày 24
tháng 12 năm 2020.
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
1.

PGS. TS. Đồng Văn Hướng

Chủ tịch Hội đồng;

2.

TS. Đồn Văn Đổng

Ủy viên, phản biện;

3.

TS. Ngơ Mạnh Dũng

Ủy viên, phản biện;

4.

TS. Lưu Hoàng Minh

Ủy viên;

5.

TS. Võ Nguyên Sơn

Ủy viên, thư ký.

Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Trưởng Khoa quản lý
chuyên ngành sau khi luận văn đã được sửa chữa.
CHỦ TỊCH HỘI ĐỒNG

TRƯỞNG KHOA ĐIỆN-ĐTVT

PGS. TS. Đồng Văn Hướng

TS. Đoàn Văn Đổng

i

LỜI CẢM ƠN
Trước tiên, tôi xin gửi lời cảm ơn tới thầy hướng dẫn luận văn, PGS.TS. Đặng
Xuân Kiên. Thầy đã tạo mọi điều kiện, động viên và giúp đỡ tơi hồn thành tốt luận
văn này. Trong suốt q trình nghiên cứu, Thầy đã kiên nhẫn hướng dẫn, trợ giúp và
động viên tôi rất nhiều. Sự hiểu biết sâu sắc về kiến thức chuyên môn, cũng như kinh
nghiệm của thầy chính là tiền đề giúp tơi hồn thành luận văn của mình.
Bên cạnh đó, tơi cũng xin chân thành cảm ơn các thầy cô giáo trong khoa Điện –
ĐTVT, trong suốt quãng thời gian học tập tại trường, các thầy cô đã trang bị cho tôi
những kiến thức và kỹ năng quý báu. Đó là hành trang tốt nhất để tơi có thể bước đi
vững chắc trên con đường sự nghiệp.
Do thời gian cũng như kiến thức còn nhiều hạn chế nên luận văn của tôi không
thể tránh khỏi các thiếu sót. Tơi rất mong nhận được sự đóng góp ý kiến từ quý thầy cô
và các bạn để luận văn của tơi được hồn thiện hơn.

Thành phố Hồ Chí Minh, tháng 12/2020.
Học viên thực hiện

Nguyễn Việt Chính

ii

LỜI CAM ĐOAN

Tôi cam đoan:
Luận văn “Thiết kế hệ thống tự động nhận dạng và cảnh báo tàu thuyền quá khổ
khi qua âu thuyền ứng dụng công nghệ xử lý ảnh Deep Learning”
1. Là cơng trình nghiên cứu của bản thân tơi được đúc kết từ q trình học tập và
nghiên cứu dưới sự hướng dẫn của PGS.TS. Đặng Xuân Kiên.
2. Số liệu và kết quả trong luận văn nghiên cứu là trung thực và chưa được công bố
trong bất kỳ cơng trình nào khác.
Tơi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được
cảm ơn và các thơng tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc...
Tôi xin chịu hồn tồn trách nhiệm về nghiên cứu của mình.

Thành phố Hồ Chí Minh, tháng 12/2020.
Học viên thực hiện

Nguyễn Việt Chính

iii

MỤC LỤC
LỜI CẢM ƠN ............................................................................................................... ii
LỜI CAM ĐOAN ....................................................................................................... .iii
DANH SÁCH HÌNH.................................................................................................... vi
DANH SÁCH TỪ VIẾT TẮT ................................................................................. .viii
TỔNG QUAN VỀ ĐỀ TÀI ...........................................................................................1
1. Tính cấp thiết của đề tài ............................................................................................. 1
2. Mục tiêu nghiên cứu của đề tài .................................................................................. 1
3. Đối tượng nghiên cứu ................................................................................................ 1
4. Phương pháp nghiên cứu............................................................................................ 1
5. Cấu trúc luận văn ....................................................................................................... 2

CHƯƠNG 1.

TỔNG QUAN VỀ PHÂN TÍCH ẢNH TRONG KHƠNG GIAN

SỐ VÀ XỬ LÝ ẢNH BẰNG MẠNG NƠRON ...........................................................4
1.1

Tổng quan về các cơng trình nghiên cứu liên quan. ............................................... 4

1.1.1

Các cơng trình nghiên cứu trên thế giới ......................................................4

1.1.2

Các cơng trình nghiên cứu ở Việt Nam.......................................................6

1.2

Tổng quan về phân tích ảnh trong khơng gian số................................................... 7

1.2.1

Thu nhận ảnh ...............................................................................................8

1.2.2

Số hóa ..........................................................................................................9

1.2.3

Tiền xử lý ....................................................................................................9

1.2.4

Phân tích ảnh ............................................................................................... 9

1.2.5

Nhận dạng đối tượng trong ảnh sử dụng mạng Nơ ron ..............................9

1.3

Tổng quan về xử lý ảnh bằng mạng nơ ron .......................................................... 10

1.3.1

Mạng nơ ron nhân tạo với thuật tốn lan truyền ngược ............................10

1.3.2

Mạng noron tích chập................................................................................11

1.4

Phân tích mạng noron tích chập trong xử lý ảnh .................................................. 12

1.4.1

Cấu trúc mạng nơ ron tích chập ................................................................12

1.4.2

Lớp tuyến tính chỉnh lưu (ReLU layer) ....................................................15
iii

1.4.3

Lớp tích chập (Convolution layer) ............................................................ 16

1.4.4

Lớp gộp (Pooling layer) ............................................................................19

1.4.5

Lớp kết nối hoàn toàn (Fully connected layer) .........................................20

1.5

Phương thức giao tiếp và truyền dữ liệu............................................................... 21

CHƯƠNG 2.

XÂY DỰNG CƠ SỞ DỮ LIỆU VÀ MẠNG NƠ RON TÍCH

CHẬP CHO HỆ THỐNG ........................................................................................... 23
2.1

Xây dựng cơ sở dữ liệu hình ảnh trong khu vực âu thuyền .................................. 23

2.2

Tiền xử lý dữ liệu ................................................................................................. 23

2.3

Đào tạo mơ hình nhận dạng .................................................................................. 27

2.4

Thử nghiệm mơ hình ............................................................................................ 28

CHƯƠNG 3.

THIẾT KẾ VÀ THỬ NGHIỆM HỆ THỐNG .............................. 31

3.1

Sơ đồ thiết kế nguyên lý hệ thống. ....................................................................... 31

3.2

Lựa chọn phần cứng hệ thống. ............................................................................. 31

3.2.1

Raspberry Pi 4 ........................................................................................... 31

3.2.2

Màn hình LCD 7 inch cho Raspberry Pi ...................................................34

3.2.3

Webcam Logitech C270 ............................................................................35

3.2.4

Bộ nguồn Omron 5V – 24V ......................................................................36

3.2.5

Mạch 8 Relay Opto cách ly 5VDC ........................................................... 37

3.2.6

Đèn xoay có cịi .........................................................................................38

3.3

Xây dựng chương trình phát hiện và cảnh báo tàu thuyền q khổ ..................... 40

3.3.1

Ngơn ngữ lập trình ....................................................................................40

3.3.2

Lưu đồ giải thuật .......................................................................................42

3.4

Thử nghiệm hoạt động cài đặt hệ thống ............................................................... 44

3.5

Thử nghiệm xác định các trạng thái báo động...................................................... 45

3.5.1

Thử nghiệm xác định báo động tàu quá khổ .............................................45

3.5.2

Thử nghiệm chức năng báo động khẩn cấp ..............................................46

3.6

Thử nghiệm xác định thời gian và dữ liệu lưu trữ sự cố ...................................... 47

3.7

Thử nghiệm xác định hoạt động truyền nhận dữ liệu ........................................... 48

KẾT LUẬN VÀ KIẾN NGHỊ .....................................................................................49
iv

1. Kết luận .................................................................................................................... 49
2. Hạn chế của đề tài .................................................................................................... 49
3. Hướng phát triển của đề tài. ..................................................................................... 49
TÀI LIỆU THAM KHẢO........................................................................................... 51
PHỤ LỤC .....................................................................................................................54

v

DANH SÁCH HÌNH
Hình 1.1 Các kỹ sư quản lý cơng trình đang vận hành âu tàu Rạch Chanh ....................7
Hình 1.2 Các cơng trình chống ngập đang xây dựng trên địa bàn TP HCM ..................7
Hình 1.3 Các bước xử lý ảnh ...........................................................................................8
Hình 1.4 Mạng nơ ron nhân tạo 3 lớp ...........................................................................11
Hình 1.5 Mạng nơron tích chập CNN ...........................................................................12
Hình 1.6 Kết quả của hàm ReLU ..................................................................................15
Hình 1.7 Hình minh họa của phép tốn tích chập. ........................................................16
Hình 1.8 Kết nối và điều khiển từ xa bằng phần mềm VNC Viewer ............................ 21
Hình 2.1 Cơ sở dữ liệu hình ảnh ....................................................................................23
Hình 2.2 Sử dụng LabelImg để dán nhãn ......................................................................24
Hình 2.3 Các tệp dữ liệu xml chứa thơng tin về hình ảnh đã được dán nhãn. ..............24
Hình 2.4 Cấu trúc SSD (Single Shot MultiBox Detector). ...........................................26
Hình 2.5 Cấu trúc SSDLite-MobileNetv2 lai ghép .......................................................26
Hình 2.6 Tóm tắt tồn bộ q trình đào tạo...................................................................27
Hình 2.7 Các bước chi tiết chạy chương trình đào tạo mơ hình ....................................27
Hình 2.8 Hình chụp màn hình sau khi đào tạo hơn 40.000 bước ..................................28
Hình 2.9 Hình chụp màn hình sau lưu thành cơng mơ hình ..........................................28
Hình 2.10 Thử nghiệm mơ hình nhận dạng đối tượng ..................................................28
Hình 2.11 Kết quả thực nghiệm phát hiện đối tượng bằng công cụ Tensorflow do đội
ngũ của Google thực hiện. ............................................................................................. 29

Hình 2.12 Kết quả nhận dạng tàu bằng Hệ thống cảnh báo tàu thuyền quá khổ. .........30
Hình 3.1 Cấu trúc hệ thống dựa trên card chun dụng Raspberry Pi 4 .......................31
Hình 3.2 Bảng thơng số phần cứng các dịng Raspberry Pi ..........................................32
Hình 3.3 Board mạch Raspberry Pi 4 ............................................................................33
Hình 3.4 Thiết bị đi kèm với Raspberry ........................................................................34
Hình 3.5 Màn hình LCD 7″ kết nối với Raspberry .......................................................35
Hình 3.6 Webcam Logitech C270 .................................................................................35
Hình 3.7 Bộ nguồn Omron S8VM ................................................................................36
Hình 3.8 Mạch 8 Relay Opto cách ly 5VDC .................................................................38
Hình 3.9 Đèn xoay có cịi .............................................................................................. 38
Hình 3.10 Thiết kế bố trí thiết bị bên trong hệ thống ....................................................39
vi

Hình 3.11 Hình chụp thực tế bố trí thiết bị bên trong hệ thống ....................................39
Hình 3.12 Hình chụp thực tế mơ hình cho việc thử nghiệm hệ thống ..........................40
Hình 3.13 Chương trình thiết kế giao diện Qt Designer ...............................................41
Hình 3.14 Lưu đồ tổng thể và các kết nối của hệ thống ................................................42
Hình 3.15 Mơ tả góc độ ghi hình của camera và hướng tàu chạy .................................43
Hình 3.16 Mơ tả vùng ghi hình và khung phát hiện đối tượng của camera ..................43
Hình 3.17 Mơ tả khung hình chụp của Camera tại khu cực âu thuyền .........................44
Hình 3.18 Mơ tả bố trí camera và thời điểm hệ thống bắt đầu tính tốn.......................44
Hình 3.19 Hình ảnh ghi lại màn hình hiển thị hệ thống. ...............................................45
Hình 3.20 Hiển thị tàu đạt kích thước an tồn khi lưu thơng ........................................45
Hình 3.21 Thử nghiệm xác định báo động tàu quá khổ. ...............................................46
Hình 3.22 Báo động khẩn cấp được bật. .......................................................................47
Hình 3.23 Dữ liệu được ghi vào file Log mỗi chu kỳ ...................................................47
Hình 3.24 Kết nối và điều khiển từ xa bằng phần mềm VNC Viewer. .........................48

vii

DANH SÁCH TỪ VIẾT TẮT
CNN

Convolution Neural Network - Mạng nơ-ron tích chập

API

Application programming interface - Giao diện lập trình ứng dụng

YOLO

You Only Look Once – Bạn chỉ cần nhìn một lần

RGB

R: Red (màu đỏ); G: Green (màu xanh lá cây); B: Blue (màu xanh lam)

POOL

Pooling Layer – Lớp gộp chung

ReLU

Rectified Linear Units - Đơn vị tuyến tính chỉnh lưu

FC

Fully-Connected Layer – Lớp kết nối hoàn toàn

viii

TỔNG QUAN VỀ ĐỀ TÀI
1. Tính cấp thiết của đề tài
Ở TP Hồ Chí Minh, dự án cơng trình chống ngập nhằm kiểm sốt ngập do triều,
chủ động ứng phó với biến đổi khí hậu cho vùng diện tích 750 km2 với khoảng 6,5
triệu dân thuộc khu bờ hữu sông Sài Gòn và trung tâm thành phố. Để đáp ứng được
nhiệm vụ chống ngập nhưng phải đảm bảo sự lưu thơng liên tục của tàu thuyền trên
sơng Sài Gịn, dự án xây dựng các âu thuyền để giải quyết vấn đề này.
Trong bài tốn tổng thể đó, việc các tàu thuyền được phép đi qua hệ thống âu
thuyền trong thời điểm nước triều nên bị giới hạn bởi kích thước của tàu, nếu tàu quá
khổ sẽ phải được cảnh báo kịp thời và ngăn chặn không cho đi qua tránh hư hại đến hệ
thống 10.000 tỷ này, việc này rất quan trọng cho an toàn của sinh mạng người trên tàu
cũng như an tồn của hệ thống kiểm sốt triều nói trên. Việc xây dựng một hệ thống
cảnh báo sớm các trường hợp tàu quá khổ khi lưu thông qua khu vực này là một vấn
đề rất cấp thiết.
2. Mục tiêu nghiên cứu
Mục tiêu đặt ra của luận văn này là thiết kế và thử nghiệm được một hệ thống có
khả năng:
- Nhận dạng được đối tượng là tàu thuyền.
- Tính tốn kích thước tàu và đưa ra các hiển thị hoặc cảnh báo.
Từ đó cảnh báo sớm cho người điều hành âu thuyền và người điều khiển phương
tiện khi kích thước tàu thuyền vượt q cho phép lưu thơng.
3. Đối tượng nghiên cứu
Đối tượng nghiên cứu: Hệ thống cảnh báo tàu thuyền quá khổ
- Phần mềm/ giải thuật: Xử lý ảnh để nhận dạng một đối tượng bằng mạng nơron tích chập. Chương trình chính được viết bằng ngơn ngữ Python.
- Phần cứng: Board máy tính nhúng Raspberry Pi 4 với kích thước nhỏ được tích
hợp nhiều phần cứng mạnh mẽ, đủ khả năng chạy hệ điều hành và cài đặt được nhiều

ứng dụng trên nó. Các thiết bị khác: Camera, màn hình hiển thị, chng đèn cảnh
báo…
4. Phương pháp nghiên cứu
a. Phương pháp nhận dạng:
1

- Sử dụng TensorFlow, chính là thư viện mã nguồn mở cho Machine Learning và
Deep Learning nổi tiếng nhất thế giới, được phát triển bởi các nhà nghiên cứu từ
Google.
- Đào tạo mơ hình nhận dạng, viết chương trình thu thập hình ảnh đầu vào, nhận
dạng và trích xuất khung phát hiện đối tượng .
b. Phương pháp tính tốn kích thước tàu: Sử dụng phương pháp tỉ lệ kích thước
theo số điểm ảnh của khung phát hiện đối tượng.
5. Cấu trúc luận văn
Luận văn gồm 5 nội dung như sau:
Tổng quan về đề tài.
Nội dung này nêu ra những mục tiêu, nhiệm vụ và phương pháp nghiên cứu sẽ
thực hiện trong đề tài này. Phần cuối trình bày sơ lược về nội dung của luận văn.
Chương 1. Tổng quan về phân tích ảnh trong khơng gian số và xử lý ảnh bằng
mạng nơron.
Chương 1 trình bày khái quát các cơ sở lý thuyết về các giải thuật xử lý ảnh, các
phân tích để đưa ra giải pháp lựa chọn trong đề tài. Đồng thời giới thiệu sơ lược quá
trình xử lý ảnh để nhận dạng một đối tượng bằng mạng nơ-rong tích chập.
Chương 2. Xây dựng cơ sở dữ liệu và mạng nơ ron tích chập cho hệ thống tự
động nhận dạng và cảnh báo tàu thuyền quá khổ.
Trong chương 2, học viên trình bày quá trình xây dựng cơ sở dữ liệu, quá trình
xử lý dữ liệu và đào tạo mơ hình nhận dạng bằng mạng nơ ron tích chập. Sau đó thử
nghiệm mơ hình trên hệ thống tự động nhận dạng và cảnh báo tàu thuyền quá khổ.
Chương 3. Thiết kế và thử nghiệm hệ thống.

Chương này nêu ra các phần cứng cơ bản cấu thành nên hệ thống, đồng thời viết
chương trình bằng ngơn ngữ Python để giao tiếp giữa phần cứng và phần mềm.
Chương này cũng nêu ra ý tưởng của học viên nhằm sử dụng cơng nghệ xử lý ảnh để
tính tốn và ước lượng kích thước tàu. Trong chương này, học viên trình bày thử
nghiệm hệ thống trên mơ hình trong phịng thí nghiệm và bằng các hình ảnh được ghi
lại từ khu vực âu thuyền trong thực tế.
2

Kết luận và kiến nghị.
Nội dung: Nêu lên những kết quả đạt được trong luận văn, ưu điểm và nhược
điểm của giải thuật mạng nơ ron tích chập, những ý kiến và đề xuất hướng phát triển
tiếp theo để phát triển các ứng dụng mới cho đề tài này.

3

CHƯƠNG 1. TỔNG QUAN VỀ PHÂN TÍCH ẢNH TRONG KHƠNG GIAN SỐ
VÀ XỬ LÝ ẢNH BẰNG MẠNG NƠRON
1.1 Tổng quan về các cơng trình nghiên cứu liên quan.
1.1.1 Các cơng trình nghiên cứu trên thế giới
Trên thế giới kỹ thuật điều khiển và ứng dụng xử lý ảnh rất phổ biến và có từ rất
lâu và được ứng dụng rất đa dạng trong công nghiệp, nông nghiệp và y học đã được
ứng trong các dây chuyền đống gói, lắp ghép ôtô…. người điều khiển thường giám sát
qua hệ thống camera trong một hệ thống nhà máy. Sử dụng bộ điều khiển để thực hiện
tất cả các cơng đoạn để hồn thành một sản phẩm, điều này đồng nghĩa với việc con
người khơng trực tiếp làm việc, có thể làm việc qua mạng. Ví dụ, người ta có thể nhận
dạng và so sánh hình ảnh, tìm người trong đám đơng, bám theo đối tượng.
Từ những căn cứ nếu trên, đề tài hướng tới nghiên cứu hệ thống có độ chính xác
cao, tốc độ phản hồi nhanh. Thông qua việc ứng dụng các công nghệ tiên tiến và lý

thuyết ước lượng, nhận dạng xử lý hình ảnh sử dụng trí tuệ nhân tạo hướng tới cuộc
cách mạng công nghệ 4.0. Hệ thống này sẽ có độ chính xác và có độ tin cao, hỗ trợ đắc
lực cho các quy trình vận hành và điều động tàu tại khu vực cảng hay âu thuyền. Hệ
thống có khả năng lưu trữ hình ảnh trong tồn bộ hành trình của tàu qua âu thuyền,
tính tốn các thơng số cần thiết và khả năng kiểm sốt và theo dõi từ xa. Đây là tính
năng mới mà các hệ thống giám sát hay quy trình hiện hành chưa có. Đất nước đang
trong giai đoạn hướng tới cuộc cánh mạng 4.0, việc nghiên cứu chế tạo thành công
những hệ thống hiện đại là nhiệm vụ của ngành cũng là nhiệm vụ của toàn xã hội, rất
cần thiết.
Với lĩnh vực giám sát giao thơng, nhiều cơng trình trên thế giới đã nghiên cứu và
ứng dụng các giải thuật xử lý ảnh vào việc quan sát và điều phối giao thơng. Trong
nghiên cứu [1], các tác giả trình bày một phương pháp mới để ngăn chặn sự va chạm
của xe cao quá khổ bằng máy ảnh, như là một cải tiến lớn cho phương pháp chiếu tia
laser hiện có. Nó thay thế máy phát, máy thu và máy dò vòng bằng một camera hiệu
chỉnh duy nhất được gắn ở bên đường. Máy ảnh được lắp đặt ở độ cao của mặt phẳng
trên chiều cao của máy được hình thành bởi mức trung bình của độ cao tối đa cho phép
trên tất cả các làn đường theo một hướng giao thông nhất định.

4

Các nghiên cứu khác[2-4] chỉ ra rất nhiều thiệt hại có thể có khi các hệ thống
giám sát giao thơng khơng được lắp đặt hoặc khơng có đủ chức năng cảnh báo. Một vụ
va chạm do xe quá cao (OHVS) là một sự cố trong đó một phương tiện, thường là xe
tải (xe cẩu) hoặc xe buýt hai tầng, cố gắng đi qua một cây cầu hoặc đường hầm thấp
hơn chiều cao của nó, sau đó va chạm với cấu trúc. Va chạm ngẫu nhiên giữa các
phương tiện quá cao (Over Height) và cấu trúc cầu là tình trạng thường xuyên xảy ra
trên khắp các mạng lưới giao thông trên toàn thế giới [2-4]. Những sự va chạm này
này dẫn đến sự chậm trễ giao thông, thiệt hại cho các cấu trúc cầu, móng cầu và gây
thương vong cho người điều khiển phương tiện. Trong trường hợp xấu nhất, trật bánh,

sụp đổ ngay lập tức các cấu trúc cầu và tình trạng người tham gia giao thơng tử vong
có thể xảy ra [5-6].
Trong nghiên cứu [7], F. Dashuai và các cộng sự sử dụng cảm biến phạm vi
laser, đồng hồ đo tốc độ radar và máy ảnh kỹ thuật số, một hệ thống nhận dạng và phát
hiện đường viền bên ngoài xe được thiết kế. Theo dữ liệu đo từ các phương tiện trên
đường cao tốc, sáu đặc điểm như chiều dài xe, chiều cao, chiều rộng, phương sai chiều
cao, tỷ lệ chiều dài đỉnh và tỷ lệ chiều dài thân xe được trích xuất. Sau đó, các phương
tiện được phân loại thành ô tô con, xe buýt nhỏ, xe tải, xe buýt, đường ray lớn và xe
buýt lớn một cách tự động bằng mạng nơ-ron BP. Kết quả thử nghiệm cho thấy hệ
thống này có hiệu quả phân loại tốt hơn các kết quả hiện có, đặc biệt là có thể phân
biệt hiệu quả hơn các loại xe tải và xe bt có hình dáng tương tự nhau.
Trong bài báo [8] đề xuất hệ thống cảnh báo giới hạn chiều cao dựa trên sự điều
phối đường của phương tiện. Hệ thống áp dụng hình thức điều phối theo chiều xe, sử
dụng thuật toán SSD gắn trên camera, GPS và thuật toán đo độ cao để hỗ trợ người lái
đánh giá giới hạn độ cao và thông báo trước cho người lái khoảng cách an toàn để
vượt qua an toàn.
Năm 1984, Shanafelt & Horn đã nghiên cứu và chỉ ra rằng OHV là nguyên nhân
hàng đầu gây ra thiệt hại (81%) cho cầu bê tông dự ứng lực và trong khoảng thời gian
5 năm, 95% thiệt hại cho cầu thép ở Mỹ là do OHVS [9].
Một nghiên cứu của Fu, Burhouse & Chang (2004) đã khảo sát 29 tiểu bang về
va chạm OHV, và 62% cho biết chúng là một vấn đề nghiêm trọng, mặc dù rất ít người
có thể cung cấp số liệu thống kê chi tiết hơn [10].

5

Tại Vương quốc Anh, Network Rail đã báo cáo 12.829 sự cố trong giai đoạn
1995 đến 2003 [11]. Trong thống kê gần đây nhất của họ, Network Rail đã báo cáo
1.708 vụ va chạm cầu trong năm 2014; tăng 9,9% so với năm trước.
Các tai nạn gây ra rủi ro đáng kể cho sự an toàn và hoạt động của cơ sở hạ tầng

giao thông. Tại Hoa Kỳ, người ta ước tính rằng hơn 7000 cây cầu phải chịu tổng cộng
hơn 5000 lần va chạm mỗi năm, dẫn đến thiệt hại cho tài sản công cộng và cá nhân
trên 100 triệu đô la [12]. Theo Cục Quản lý Đường cao tốc Liên bang (FHWA), va
chạm bởi các phương tiện hoặc tàu thuyền là nguyên nhân thứ ba gây ra hỏng hóc cầu
[13]. Trong một cuộc khảo sát năm 2011, 30 trong số 44 tiểu bang ở Hoa Kỳ (tức là
68% các tiểu bang) xác định tác động lên cầu bởi các phương tiện OH là một vấn đề
nghiêm trọng [14], với các tiểu bang như Kentucky, Mississippi, Iowa và Louisiana
báo cáo các hậu quả tài chính khác nhau từ 250.000 đến 500.000 đô la hàng năm [14].
Các sự kiện đơn lẻ xảy ra ở Maine, Oregon, Washington và Wisconsin đã dẫn đến thiệt
hại về cơ sở hạ tầng từ 150.000 đến 350.000 đơ la, các tuyến đường bị đóng cửa kéo
dài từ 2 tuần đến 2 tháng và giao thông đường vòng dài tới 45 phút [16]. Năm 1994,
FHWA ước tính chi phí xã hội của một vụ va chạm vào cầu OH lớn là 694.000 đô la
[17].
Vấn đề va chạm cầu này phổ biến trên toàn cầu với các vụ va chạm cầu OH được
báo cáo ở Canada, Ireland, Vương quốc Anh, Tây Úc, Nhật Bản và 14 quốc gia Thành
viên Liên minh Châu Âu, tất cả đều coi va chạm cầu là một rủi ro an toàn đáng kể
[18].
1.1.2 Các cơng trình nghiên cứu ở Việt Nam
Về thực tiễn tại Việt Nam, không chỉ với phương tiện đường thủy lưu thông qua
khu vực âu tàu, các phương tiện đường bộ khác cũng có nguy cơ làm hư hại cơng trình
do kích thước q khổ khi lưu thơng qua những nơi có khơng gian chật hẹp. Cơng
nghệ theo dõi và xác định kích thước phương tiện lưu thơng đã được nghiên cứu trên
thế giới và chủ yếu tập trung vào mảng đường bộ, tuy vậy các nghiên cứu trong nước
chưa chú trọng vấn đề này.
Kể từ khi âu tàu Rạch Chanh trên sông Rạch Chanh (tỉnh Long An) là âu tàu đầu
tiên của Việt Nam được đưa vào vận hành 11/2016, cho đến các âu tàu sau này của
nước ta vẫn chưa có cơng nghệ nào tự động xác định kích thước tàu và cảnh báo phù
hợp. Các cơng nghệ giám sát hiện nay chỉ đơn thuần là sử dụng hệ thống camera và
6

liên lạc với tàu, thuyền thông qua bộ đàm để người điều hành ước lượng và điều phối
lưu thông. Điều này mang tính chất định lượng, sai số và rủi ro cao trong quá trình
giám sát và vận hành.

Hình 1.1 Các kỹ sư quản lý cơng trình đang vận hành âu tàu Rạch Chanh

Hình 1.2 Các cơng trình chống ngập đang xây dựng trên địa bàn TP HCM
1.2 Tổng quan về phân tích ảnh trong khơng gian số
Xử lý ảnh là một ngành khoa học mới mẻ so với nhiều ngành khoa học khác
nhưng tốc độ phát triển của nó rất nhanh, kích thích các trung tâm nghiên cứu, ứng
dụng, đặc biệt là máy tính chun dụng riêng cho nó. Đầu tiên phải kể đến các vấn đề
liên quan đến xử lý tín hiệu, các khái niệm về tích chập, các biến đổi Fourier, biến đổi
Laplace, các bộ lọc hữu hạn… Thứ hai, các cơng cụ tốn như đại số tuyến tính, xác
suất, thống kê. Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơ ron nhân tạo
cũng được đề cập trong q trình phân tích và nhận dạng ảnh trên máy tính, trong
khơng gian kỹ thuật số.

7

Lịch sử phát triển của các phương pháp xử lý ảnh, bắt đầu từ các ứng dụng [7]
nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng
cao chất lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm
1920. Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân
giải của ảnh. Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm
1955. Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển
nhanh tạo điều kiện cho quá trình xử lý ảnh sơ thuận lợi. Năm 1964, máy tính đã có
khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của Mỹ
bao gồm: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương tiện xử lý,

nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng. Các phương pháp tri thức
nhân tạo như mạng nơ ron nhân tạo, các thuật tốn xử lý hiện đại và cải tiến, các cơng
cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan.
Xét lcác lbước lcần lthiết ltrong lxử llý lảnh [27], đầu ltiên, lảnh ltự lnhiên ltừ
lthế lgiới lngoài lđược lthu lnhận lqua lcác lthiết lbị lthu l(như lCamera, lmáy lchụp
lảnh). lTrước lđây, lảnh lthu lqua lCamera llà lcác lảnh ltương ltự l(loại lCamera lống
lkiểu lCCIR). lGần lđây, lvới lsự lphát ltriển lcủa lcông lnghệ, lảnh lmàu lhoặc lđen
ltrắng lđược llấy lra ltừ lCamera, lsau lđó lnó lđược lchuyển ltrực ltiếp lthành lảnh lsố
ltạo lthuận llợi lcho lxử llý ltiếp ltheo. llMặt lkhác, lảnh lcũng lcó lthể ltiếp lnhận ltừ
lvệ ltinh; lcó lthể lquét ltừ lảnh lchụp lbằng lmáy lqt lảnh.
Thu nhận
ảnh

Số hóa

Tiền xử
lý

Phân tích
ảnh

Nhận dạng đối tượng
sử dụng mạng Nơ ron

Hình 1.3 Các bước xử lý ảnh
1.2.1 Thu nhận ảnh
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera
là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dịng), cũng
có loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại photodiot
tạo cường độ sáng tại mỗi điểm ảnh.

Camera thường dùng là loại qt dịng; ảnh tạo ra có dạng hai chiều. Chất lượng
một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong
cảnh).

8

1.2.2 Số hóa
Ảnh số thật sự là một ảnh được vẽ nên từ các đường thẳng và mỗi đường thẳng
được xây dựng bằng các điểm. Một ảnh theo chuẩn VGA với độ phân giải 640x480 có
nghĩa là một ma trận gồm 480 đường ngang và mỗi đường gồm 640 điểm ảnh (pixel).
Một điểm ảnh được mã hóa tùy thuộc vào chất lượng của ảnh:
• Ảnh đen trắng: sử dụng một bit để mã hóa một điểm, giá trị 0 cho điểm ảnh
màu đen và 1 cho điểm ảnh màu trắng;
• Ảnh gồm 256 mức xám: mỗi điểm được thể hiện bằng một byte (8 bits);
• Ảnh màu: người ta chứng minh rằng một màu là sự phối hợp của ba màu cơ
bản là đỏ (Red), xanh lá (Green) và xanh dương (Blue). Một màu bất kỳ có
thể được biểu biễn bởi biểu thức: X = aR + bG +cB
Trong đó a, b, c là các lượng của các màu cơ bản. Thơng thường một ảnh đẹp sẽ
có lượng màu với giá trị từ 0 đến 255. Và như thế, một ảnh màu thuộc loại này được
thể hiện bằng 3 ma trận tương ứng cho 3 loại màu cơ bản. Mỗi phần tử của mảng có
giá trị của 8 bits. Chính vì thế cần có 24 bit để mã hóa cho một điểm ảnh màu. Kích
thước của các ảnh màu là đáng kể, vì thế người ta cần có phương pháp mã hóa để giảm
kích thước của các ảnh.
1.2.3 Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp nên cần đưa vào bộ tiền xử
lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng độ
tương phản để làm ảnh rõ hơn, nét hơn.
1.2.4 Phân tích ảnh
Tách hình ảnh đầu vào thành các vùng thành phần để biểu diễn phân tích, nhận

dạng ảnh. Ví dụ: để xử lý và nhận dạng vật thể có trong khung hình, ta dùng thuật tốn
chia nhỏ khung hình thành các vùng khác nhau và quét chúng qua các bộ lọc để đưa ra
kết quả cuối cùng. Kết quả nhận dạng ảnh được đưa ra kèm theo thơng số về độ chính
xác, vị trí khung nhận dạng đối tượng.
1.2.5 Nhận dạng đối tượng trong ảnh sử dụng mạng Nơ ron
Trong các giải thuật hiện đại, tiêu biểu và được ứng dụng, quan tâm nhất là mạng
nơron nhân tạo. Các mạng nơron nhân tạo có thể được coi như những “mơ hình tính

9

tốn” với những đặc tính như khả năng thích nghi hay khả năng học, tổng quát hóa,
phân cụm hay tổ chức dữ liệu.
Mạng nơron với thuật toán học lan truyền ngược để phân loại giúp nhận dạng các
đặc trưng đã trích chọn ở trên. Khi có u cầu nhận dạng, ảnh đầu vào sẽ được trích
chọn đặc trưng, các đặc trưng sẽ được nhận dạng qua các mạng nơron đã huấn luyện.
Tín hiệu ra của từng mạng riêng biệt sẽ được so sánh với nhau để đưa ra câu trả
lời của hệ thống. Kết quả là, bằng việc kết hợp những đặc trưng mang tính chất thống
kê và những đặc trưng mang tính hình thái, hệ thống đã đạt hiệu quả khá cao so với
những hệ thống nhận dạng mặt người trước đây. Đặc biệt, hệ thống nhận dạng dung
mạng nơ ron đáp ứng khá tốt đối với những ảnh có nhiễu.
1.3 Tổng quan về xử lý ảnh bằng mạng nơ ron
Trong rất nhiều lĩnh vực như điều khiển, tự động hóa, cơng nghệ thơng tin…,
nhận dạng được đối tượng là vấn đề mấu chốt quyết định sự thành công của bài toán.
Phần lớn các đối tượng trong thực tế đều là phi tuyến với độ phi tuyến khác nhau.
Mạng nơron có khả năng xấp xỉ các hàm phi tuyến một cách đầy đủ và chính xác, nó
được sử dụng tốt cho các mơ hình động học phi tuyến. Điều quan trọng là thuật lan
truyền ngược tĩnh và động của mạng nơron được sử dụng để hiệu chỉnh các tham số
trong q trình nhận dạng. Cơ sở tốn học của việc khẳng định rằng mạng nơron là
công cụ xấp xỉ vạn năng các hàm số liên tục dựa trên các định lý Stone – Weierstrass

và Kolmogorov [20].
Mạng nơron là một trong những cơng cụ nhận dạng tốt nhất vì các đặc trưng sau:
Khả năng học từ kinh nghiệm (khả năng được huấn luyện), khả năng xử lý song song
với tốc độ xử lý nhanh, khả năng học thích nghi, khả năng khái qt hố cho các đầu
vào khơng được huấn luyện, ví dụ dựa vào cách học mạng có thể sẽ tiên đốn đầu ra từ
đầu vào khơng biết trước [20-22].
1.3.1 Mạng nơ ron nhân tạo với thuật toán lan truyền ngược
Có một vài lớp khác nhau của các luật huấn luyện mạng bao gồm: huấn luyện kết
hợp, huấn luyện cạnh tranh. Huấn luyện chất lượng mạng, performance learning, là
một lớp quan trọng khác của luật huấn luyện, trong phương pháp này thì các thơng số
mạng được điều chỉnh để tối ưu hóa chất lượng của mạng. Thuật tốn lan truyền ngược
là một phát minh chính trong nghiên cứu về mạng nơ-ron, thuộc loại thuật học chất
lượng mạng (học có giám sát). Ngược dòng thời gian, chúng ta thấy rằng sau khoảng
10

mười năm kể từ khi lan truyền ngược bắt đầu được thai nghén, năm 1974, thì thuật học
lan truyền ngược được chính thức nghiên cứu lại và mở rộng ra một cách độc lập bởi
David Rumelhart, Geoffey Hinton và Ronald Williams; David Parker và Yann Le Cun.
Thuật toán đã được phổ biến hóa bởi cuốn sách Parallel Distributed Processing của
nhóm tác giả David Rumelhart và James Mc Clelland. Tuy nhiên, thuật tốn ngun
thủy thì q chậm chạp đối với hầu hết các ứng dụng thực tế [23], có nhiều lý do cho
việc hội tụ chậm trong đó có sự ảnh hưởng của bước học.
1.3.2 Mạng noron tích chập.
Convolutional Neural Network (CNN –Mạng nơ-ron tích chập) là một trong
những mơ hình Deep learning tiên tiến giúp cho chúng ta xây dựng được những hệ
thống thơng minh với độ chính xác cao. Hiện nay các nhà khoa học đã dựa trên CNN
để đưa vào nghiên cứu của mình những chức năng thơng minh như nhận diện khuôn
mặt người [20], phát hiện lỗi đường hàn hay nhận dạng vân tay [21]. CNN được sử
dụng nhiều trong các bài toán nhận dạng các đối tượng trong ảnh đem lại kết quả

nhanh và đáng tin cậy. Để tìm hiểu tại sao thuật tốn này được sử dụng rộng rãi cho
việc nhận dạng, chúng ta hãy cùng tìm hiểu về thuật tốn này.
Các mạng nơron thơng thường biến đổi một đầu vào bằng cách đặt nó qua một
loạt các lớp ẩn. Mỗi lớp được tạo thành từ một tập hợp các nơron, trong đó mỗi lớp
được kết nối hoàn toàn với tất cả các nơron trong lớp trước đó. Cuối cùng, có một lớp
được kết nối đầy đủ cuối cùng - lớp đầu ra - đại diện cho các dự đốn (Hình 1.4).

Hình 1.4 Mạng nơ ron nhân tạo 3 lớp
Mạng nơron tích chập có một kiến trúc khác với các mạng nơron thông thường.
sắp xếp các nơron của nó theo ba chiều (chiều rộng, chiều cao, chiều sâu), như được
hình dung trong một trong các lớp.

11

Hình 1.5 Mạng nơron tích chập CNN
Mỗi lớp của một CNN biến đổi khối lượng đầu vào 3D thành một khối lượng đầu
ra 3D của các kích hoạt nơron (Hình 1.5). Trong đó, lớp đầu vào màu đỏ giữ hình ảnh,
chiều rộng và chiều cao sẽ là kích thước của hình ảnh (Đỏ, Xanh lục, Xanh lam).
Mạng nơron tích chập có một chút khác biệt, các tế bào thần kinh trong một lớp không
kết nối với tất cả các tế bào thần kinh trong lớp tiếp theo mà chỉ đến một vùng nhỏ của
nó. Cuối cùng, đầu ra sẽ được giảm xuống một vectơ duy nhất của các điểm xác suất,
được tổ chức dọc theo chiều sâu.
CNN là một trong những thuật toán cho kết quả tốt nhất hiện nay trong hầu hết
các bài toán về thị giác máy như phân lớp, nhận dạng, … Về cơ bản CNN là một kiểu
mạng ANN truyền thẳng, trong đó kiến trúc chính gồm nhiều thành phần được ghép
nối với nhau theo cấu trúc nhiều tầng đó là: Convolution, Pooling, ReLU và Fully
connected [23].
1.4 Phân tích mạng noron tích chập trong xử lý ảnh
1.4.1 Cấu trúc mạng nơ ron tích chập

Trong nhận dạng đối tượng và các ứng dụng thị giác máy tính ban đầu, hình ảnh
màu thường được chuyển đổi sang dạng ảnh xám (biểu diễn dưới dạng ma trận) bởi vì
chúng ta biết cách xử lý ma trận bằng phương pháp tốn học một cách dễ dàng. Tuy
nhiên thơng tin màu sắc bị mất trong quá trình chuyển đổi này. Nhưng màu sắc rất
quan trọng trong các vấn đề học tập và nhận dạng dựa trên hình ảnh (hoặc video) khác
nhau. Vì vậy các khái niệm về tensor ra đời như một cách xử lý hình ảnh nhưng khơng
bị mất đi thông tin về màu sắc của chúng.
Dữ liệu đầu vào của CNN thường là một hình ảnh có H hàng, W cột và thơng tin
màu D (màu có thể biểu thị qua 3 kênh màu R, G, B). Ta biểu diễn đầu vào này bằng
biến x ( x 

H W D

) và gọi biến này là tensor bậc 3. Bộ ba ( i l ; j l ; d l ) đề cập đến

một phần tử trong x l , trong kênh thứ d l và tại vị trí khơng gian ( i l ; j l ) (ở hàng thứ i,
và cột thứ j)
12

Tuy nhiên, đầu vào tensor bậc cao hơn có thể được CNN xử lý theo cách tương
tự. Đầu vào sau đó tuần tự trải qua một số quy trình. Một bước xử lý thường được gọi
là lớp, có thể là lớp tích chập, lớp gộp, lớp chuẩn hóa, lớp kết nối đầy đủ, lớp mất mát,
v.v ... Trong chương này sẽ giới thiệu chi tiết về ba loại lớp: tích chập, gộp, và ReLU,
là những phần quan trọng của hầu hết tất cả các mơ hình CNN.
Trước tiên ta mơ tả tóm tắt về cấu trúc CNN.

x1 → w1 → x 2 →

→ x L−1 → wL−1 → x L → wL → z

(1.1)

Quá trình ở trên minh họa cách CNN chạy từng lớp trong chuyển tiếp. Đầu vào là

x1 , nó trải qua q trình xử lý ở lớp đầu tiên, là hộp đầu tiên. Tham số liên quan đến
quá trình xử lý của lớp đầu tiên được gọi chung là tensor
là

w1 . Đầu ra của lớp đầu tiên

x2 , cũng đóng vai trị là đầu vào cho q trình xử lý của lớp thứ hai. Quá trình xử

lý này tiếp tục cho đến khi tất cả các lớp trong CNN đã hoàn thành, kết quả là

xL .

Một phương pháp học các giá trị tham số tốt trong CNN đó là bổ sung thêm một
lớp vào để truyền lỗi ngược. Giả sử vấn đề hiện tại là vấn đề phân loại hình ảnh với
các lớp C. Một cách lược thường được sử dụng là xuất ra dưới dạng véc tơ C chiều, có
mục nhập thứ i mã hóa dự đoán (xác suất sau
Để làm cho

xL

x1 đến từ lớp thứ i).

trở thành một hàm khối xác suất, chúng ta có thể đặt quá trình

xử lý trong lớp (L -1) như một phép biến đổi “softmax” của

mục tiêu (groundtruth) tương ứng cho đầu vào

x L−1 . Giả sử t là giá trị

x1 , khi đó hàm chi phí hoặc tổn thất có

thể được sử dụng để đo lường sự khác biệt giữa dự đốn CNN

xL

và mục tiêu t.

Ví dụ, một hàm mất mát đơn giản có thể là:

z=

1
t − xL
2

2

(1.2)

Thơng thường, trong các nghiên cứu chuyên sâu, người ta sử dụng hàm mất mát
phức tạp hơn. Các hàm tổn thất bình phương này có thể được sử dụng trong các bài
tốn hồi quy đơn giản.
Với các phép biến đổi softmax, các đầu vào là các vectơ
tính bằng biểu thức:

13

xl , khi đó đầu ra được

l +1
i

x

=

exp( xil )

(1.3)

 j=1 exp( xlj )
d

Truyền ngược lỗi
Các đạo hàm riêng của lớp cuối cùng rất dễ tính tốn. Vì

x L được kết nối đến z

trực tiếp dưới sự kiểm soát của các tham số wL , dễ dàng tính tốn

z
wL

.

Bước này chỉ cần thiết khi wL khơng phải là tensor rỗng. Trong cùng một
phương pháp, cũng dễ tính
có

z
x L

z
x L

. Ví dụ, nếu sử dụng tổn thất l 2 bình phương , chúng ta

= xL − t
Chúng ta đã tính tốn các điều khoản

z
wi +1

và

z
xi +1

. Cả hai đều được lưu trữ

trong bộ nhớ và sẵn sàng để sử dụng.
Bây giờ nhiệm vụ là tính

Vì

z
xi +1

z
wi

và

z
xi

. Sử dụng quy tắc chuỗi, ta có:

z
z
vec( xi +1 )
=
(vec( wi )T ) (vec( xi +1 )T ) (vec( wi )T )

(1.4)

z
z
vec( xi +1 )
=
 (vec( xi )T ) (vec( xi +1 )T ) (vec( x i )T )

(1.5)

đã được tính tốn và lưu trữ trong bộ nhớ, nó chỉ u cầu một hoạt động

định hình lại ma trận (vec) và một hoạt động chuyển vị bổ sung để lấy

z
,
 (vec( xi +1 )T )

là số hạng đầu tiên ở vế phải (RHS) của cả hai phương trình. Miễn là có thể tính

vec( xi +1 )
vec( xi +1 )
và
, ta có thể dễ dàng có được bên trái của cả hai phương
 (vec( xi )T )
 (vec( wi )T )
trình.

vec( xi +1 )
vec( xi +1 )
Biểu thức
và
dễ tính hơn nhiều so với tính tốn trực tiếp
 (vec( xi )T )
 (vec( wi )T )

z
z
và
vì x i liên quan trực tiếp đến xi +1 , thơng qua một hàm có

i T
i T
 (vec( w ) )
 (vec( x ) )
tham số wi .

14

Thiết kế hệ thống tự động nhận dạng và cảnh báo tàu thuyền quá khổ khi qua âu thuyền ứng dụng công nghệ xử lý ảnh deep learning

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về