Tải bản đầy đủ (.pdf) (61 trang)

Nghiên cứu và phát triển giải pháp dự đoán thời gian đến trạm của xe buýt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2 MB, 61 trang )

CHÂU TRUNG HIẾU

NGHIÊN CỨU VÀ PHÁT TRIỂN GIẢI PHÁP
DỰ ĐOÁN THỜI GIAN ĐẾN TRẠM CỦA XE BUÝT

Chuyên ngành: Khoa học Máy tính
Mã số: 8480101

LUẬN VĂN THẠC SĨ





























TP. HỒ CHÍ MINH, tháng 7 năm 2023







ĐẠI HỌC QUỐC GIA TP. HCM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
_________


Cán bộ hướng dẫn khoa học 1: PGS. TS. Thoại Nam

Cán bộ hướng dẫn khoa học 2: TS. Nguyễn Lê Duy Lai

Cán bộ chấm nhận xét 1: TS. Lê Thanh Vân

Cán bộ chấm nhận xét 2: PGS. TS. Trần Công Hùng

Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp. HCM
ngày 11 tháng 7 năm 2023.
Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:

1. Chủ tịch: PGS. TS. Phạm Quốc Cường
2. Thư ký: TS. Lê Thành Sách
3. Phản biện 1: TS. Lê Thanh Vân
4. Phản biện 2: PGS. TS. Trần Công Hùng
5. Uỷ viên: TS. Lê Hoành Sử
Xác nhận của Chủ tịch Hội đồng đánh giá LV và Trưởng Khoa quản lý
chuyên ngành sau khi luận văn đã được sửa chữa (nếu có).
TRƯỞNG KHOA
KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH












































(Họ tên và chữ ký)



CHỦ TNCH HỘI ĐỒNG










CƠNG TRÌNH ĐƯỢC HỒN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA - ĐHQG - HCM


NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: Châu Trung Hiếu

MSHV: 1970587

Ngày, tháng, năm sinh: 28/06/1990

Nơi sinh: Bến Tre

Chuyên ngành: Khoa học Máy tính

Mã số: 8480101

I. TÊN ĐỀ TÀI:
Nghiên cứu và phát triển giải pháp dự đoán thời gian đến trạm của xe buýt.
(Research and develop a solution for predicting bus arrival time at bus stops)
II. NHIỆM VỤ VÀ NỘI DUNG:
Tìm hiểu tổng quan bài tốn dự đốn thời gian đến trạm của xe buýt và các giải
pháp liên quan. Phân tích và thiết kế giải pháp cho bài toán dự đoán thời gian đến
trạm của xe buýt bao gồm: hệ thống xe buýt và các dạng dữ liệu liên quan, bài toán
dự đoán thời gian xe buýt. Đánh giá giải pháp và kết luận.
III. NGÀY GIAO NHIỆM VỤ: 05/09/2022
IV. NGÀY HOÀN THÀNH NHIỆM VỤ: 12/06/2023
V. CÁN BỘ HƯỚNG DẪN:

- Cán bộ hướng dẫn 1: PGS. TS. Thoại Nam.
- Cán bộ hướng dẫn 2: TS. Nguyễn Lê Duy Lai.
Tp. HCM, ngày … tháng … năm 2023
CB HƯỚNG DẪN 1

CB HƯỚNG DẪN 2

HỘI ĐỒNG NGÀNH

(Họ tên và chữ ký)

(Họ tên và chữ ký)

(Họ tên và chữ ký)

TRƯỞNG KHOA KHOA HỌC VÀ KỸ THUẬT MÁY TÍNH














































(Họ tên và chữ ký)









ĐẠI HỌC QUỐC GIA TP.HCM CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
TRƯỜNG ĐẠI HỌC BÁCH KHOA
Độc lập - Tự do - Hạnh phúc


LỜI CẢM ƠN
Trước hết, tôi muốn gửi lời cảm ơn đến hai thầy hướng dẫn của tôi là PGS. TS.
Thoại Nam và TS. Nguyễn Lê Duy Lai. Cảm ơn hai thầy đã cho tơi có cơ hội thực
hiện luận văn này và đã dành thời gian, chia sẻ những kiến thức quý giá và sự kiên
nhẫn của hai thầy dành cho tôi.
Tôi cũng muốn cảm ơn đến các bạn trong nhóm học tập, cùng với các bạn tạo
nên một mơi trường học tập thú vị, những người không ngại chia sẻ những ý tưởng
và kiến thức của mình.
Cuối cùng tơi xin cảm ơn gia đình vì sự động viên, hỗ trợ và tin tưởng liên tục
dành cho tôi. Niềm tin vững chắc từ gia đình đã cho tơi động lực vượt qua những
thử thách gặp phải trong quá trình thực hiện luận văn này.













i


TĨM TẮT NỘI DUNG
Giao thơng cơng cộng đóng một vai trị quan trọng trong giao thơng đơ thị và dự
đốn chính xác thời gian đến của xe buýt giúp tăng cường sự thuận tiện cho hành
khách và cải thiện hiệu quả vận chuyển tổng thể. Trong luận án này, tôi đề xuất giải
pháp để dự đoán thời gian đến của xe buýt bằng cách tận dụng dữ liệu lịch sử và mơ
hình mạng nơron truy hồi.
Mục tiêu của luận này là đưa ra một giải pháp dự đoán thời gian đến của xe buýt
đáng tin cậy và hiệu quả. Để đạt được điều này, dữ liệu lịch sử bao gồm tọa độ GPS
và thời gian được sử dụng. Các tính năng khơng gian, thời gian khác nhau được
trích xuất từ tập dữ liệu để nắm bắt các mẫu trong dữ liệu. Mơ hình dự đốn dùng
mạng nơron truy hồi (RNN) với cấu trúc Bộ nhớ dài hạn ngắn hạn (LSTM - Long
short term memory) có khả năng nắm bắt các phụ thuộc dài hạn, mơ hình này được
huấn luyện bằng dữ liệu lịch sử của xe buýt. Kết quả chứng minh rằng mơ hình dự
đốn thời gian đến của xe buýt dựa trên LSTM vượt trội so với các phương pháp
truyền thống.
Tóm lại, luận văn này đóng góp cho lĩnh vực kỹ thuật giao thông vận tải bằng
cách đề xuất một giải pháp dự đoán thời gian đến của xe buýt, tận dụng dữ liệu lịch
sử và sử dụng mạng nơron truy hồi làm mơ hình cơ bản. Các kết quả cho thấy tiềm
năng triển khai thực tế của mô hình, cuối cùng dẫn đến nâng cao hiệu quả và sự hài
lòng của người dùng trong các hệ thống xe buýt.













ii


ABSTRACT
Public transport plays an important role in urban transportation and accurately
predicting bus arrival times enhances passenger convenience and improves overall
transport efficiency. In this thesis, I propose a solution to predict bus arrival time by
taking advantage of historical data and recurrent neural network.
The objective of this paper is to provide a reliable and efficient bus arrival time
prediction solution. To achieve this, historical data including GPS coordinates and
time is used. Different spatial and temporal features are extracted from the dataset
to capture patterns in the data. Predictive model using recurrent neural network
(RNN) with Long short term memory (LSTM) structure is able to capture long-term
dependencies, this model is trained using the historical data of the bus. The results
demonstrate that the bus arrival time prediction model based on LSTM is superior
to traditional methods.
In summary, this thesis contributes to the field of transportation engineering by
proposing a solution to predict the arrival time of buses, taking advantage of
historical data and using a recurrent neural network as a basic model. The results

show its potential for practical implementation, ultimately leading to improved
efficiency and user satisfaction in bus systems.












iii


LỜI CAM ĐOAN
Tôi xin cam đoan rằng đây là luận văn do chính tơi thực hiện, có sự hỗ trợ từ
Giáo viên hướng dẫn. Các kết quả trong luận văn này là trung thực và do chính tơi
thực hiện. Những tài liệu liên quan phục vụ cho việc phân tích, nhận xét, đánh giá
từ các nguồn khác nhau đều được trích dẫn nguồn.
Nếu phát hiện có bất kỳ sự gian lận nào tơi xin hồn tồn chịu trách nhiệm trước
Hội đồng cũng như kết quả luận văn của mình.

Tp. HCM, ngày 09 tháng 06 năm 2023
Học viên thực hiện luận văn

Châu Trung Hiếu

















iv


MỤC LỤC
LỜI CẢM ƠN ..............................................................................................................i
TÓM TẮT NỘI DUNG ..............................................................................................ii
ABSTRACT ..............................................................................................................iii
LỜI CAM ĐOAN ......................................................................................................iv
MỤC LỤC ..................................................................................................................v
DANH MỤC HÌNH VẼ ..........................................................................................viii
DANH MỤC BẢNG .................................................................................................ix
CHƯƠNG 1. MỞ ĐẦU ..............................................................................................1
1.1. Bối cảnh và động lực .......................................................................................1
1.2. Mục tiêu ...........................................................................................................2
1.3. Phạm vi và giới hạn của đề tài .........................................................................2

CHƯƠNG 2. TỔNG QUAN BÀI TOÁN DỰ ĐOÁN THỜI GIAN ĐẾN TRẠM
DỪNG CỦA XE BUÝT .............................................................................................4
2.1. Bài toán dự đoán ..............................................................................................4
2.2. Khảo sát các phương pháp cho bài đoán dự đoán ...........................................4
2.2.1. Phương pháp lập lịch .................................................................................4
2.2.2. Phương pháp thống kê ...............................................................................4
2.2.3. Phương pháp tìm kiếm...............................................................................5
2.2.4. Phương pháp học máy ...............................................................................5
2.3. Phương pháp tiếp cận bài toán.........................................................................6
CHƯƠNG 3. CƠ SỞ LÝ THUYẾT ...........................................................................8
3.1. Hồi quy tuyến tính ...........................................................................................8
3.2. Mạng nơron nhân tạo .......................................................................................9
3.3. Dữ liệu chuỗi .................................................................................................11
3.4. Mạng nơron truy hồi ......................................................................................12
3.4. Các phương pháp đánh giá ............................................................................15
CHƯƠNG 4. TỔNG QUAN HỆ THỐNG ...............................................................17











































































































































v


4.1. Hệ thống quản lý buýt ...................................................................................17
4.2. Các thuật ngữ của hệ thống buýt ...................................................................18
4.2.1. Tuyến (Route) ..........................................................................................18
4.2.2. Chuyến (Trip) ..........................................................................................19
4.2.3. Trạm dừng (Bus stop) ..............................................................................20
4.3. Đặc tả bài toán ...............................................................................................20
CHƯƠNG 5. DỮ LIỆU ............................................................................................22
5.1. Dữ liệu GPS (Hệ thống định vị toàn cầu) ......................................................22
5.1.1. Tổng quan về các trường của dữ liệu GPS ..............................................22
5.1.2. Những thách thức khi sử dụng dữ liệu GPS ............................................23
5.2. Dữ liệu GTFS ................................................................................................23
5.2.1. Tổng quan cấu trúc của dữ liệu GTFS .....................................................24
5.2.2. Những thách thức khi sử dụng dữ liệu GTFS ..........................................25
5.3. Tiền xử lý dữ liệu ...........................................................................................26
5.3.1. Xử lý dữ liệu GTFS .................................................................................26
5.3.2. Xử lý dữ liệu GPS....................................................................................28
5.3.3. Trích xuất các đặc trưng ..........................................................................31
CHƯƠNG 6. MƠ HÌNH BÀI TỐN .......................................................................33
6.1. Mơ hình tổng qt..........................................................................................33
6.1.1. Mơ hình của bài tốn dự đốn .................................................................33
6.1.2. Vector đặc trưng .......................................................................................34
6.2. Mơ hình cơ sở ................................................................................................34
6.3. Mơ hình LSTM ..............................................................................................36
6.3.1. Biến đổi các đặc trưng .............................................................................37
6.3.2. Xây dựng mơ hình ...................................................................................39
6.3.3. Hàm mất mát ...........................................................................................39
6.3.4. Hiện thực mơ hình ...................................................................................40

CHƯƠNG 7. KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ ..................................42

















































































































































vi


7.1. Cài đặt thử nghiệm ........................................................................................42
7.2. Kết quả thực nghiệm......................................................................................42
7.2.1. Thực nghiệm với tập 747_O ....................................................................43
7.2.1. Thực nghiệm với tập 747_I .....................................................................44
7.3. Đánh giá kết quả ............................................................................................45

CHƯƠNG 8. KẾT LUẬN ........................................................................................46
TÀI LIỆU THAM KHẢO.........................................................................................47


































vii


DANH MỤC HÌNH VẼ
Hình 3.1. MLP với hai tầng ẩn ..................................................................................10
Hình 3.2. Mơ hình RNN dạng rút gọn và dạng dàn trãi............................................13
Hình 3.3. Sơ đồ khối của đơn vị LSTM ....................................................................14
Hình 4.1. Tổng quan hệ thống quản lý xe buýt hướng dữ liệu .................................17
Hình 4.2. Minh họa cho thời gian đến trạm cần dự đốn..........................................20
Hình 5.1. Q trình trích xuất các trạm dừng của một tuyến bt............................27
Hình 5.2. Vị trí xe buýt và các trạm dừng của một chuyến buýt 747 .......................30
Hình 5.3. Minh họa vị trí xe bt và trạm dừng trên đường .....................................31
Hình 6.1. Minh họa mơ hình dự đốn cơ sở .............................................................36
Hình 6.2. Mơ hình LSTM dạng rút gọn và dạng dàn trãi .........................................36
Hình 6.3. Kiến trúc mơ hình LSTM ..........................................................................39
Hình 7.1. Mơ hình Baseline dự đốn trên 3 chuyến của tập 747_O_test..................43
Hình 7.2. Mơ hình LSTM_1 dự đốn trên 3 chuyến của tập 747_O_test .................43
Hình 7.3. Mơ hình LSTM_O dự đốn trên 3 chuyến của tập 747_O_test ................43
Hình 7.4. Mơ hình LSTM_U dự đốn trên 3 chuyến của tập 747_O_test ................44
Hình 7.5. Mơ hình Baseline dự đốn trên 3 chuyến của tập 747_I_test ...................44
Hình 7.6. Mơ hình LSTM_1 dự đốn trên 3 chuyến của tập 747_I_test ..................44
Hình 7.7. Mơ hình LSTM_O dự đốn trên 3 chuyến của tập 747_I_test .................45
Hình 7.8. Mơ hình LSTM_U dự đốn trên 3 chuyến của tập 747_I_test .................45




































































































viii


DANH MỤC BẢNG
Bảng 5.1. Dữ liệu mẫu GPS của xe buýt ..................................................................22
B ng 5.2. D li u các tr m d ng c a tuy n s 747 sau khi xử lý.............................27
Bảng 5.3. Dữ liệu mẫu sau khi trích xuất đặc trưng .................................................32
Bảng 6.1. Chi tiết vector đặc trưng sau khi biến đổi .................................................38
Bảng 6.2. Thông số của các mô hình khảo sát ..........................................................40
Bảng 7.1. Thơng số của các tập dữ liệu huấn luyện..................................................42
Bảng 7.2. Kết quả thực nghiệm trên tập 747_O........................................................43
Bảng 7.3. Kết quả thực nghiệm trên tập 747_I .........................................................44





































ố



ế




ừ






ệ

ữ



ix


CHƯƠNG 1. MỞ ĐẦU
1.1. Bối cảnh và động lực
Hệ thống giao thông công cộng là một thành phần quan trọng của cơ sở hạ tầng
đô thị hiện đại, cung cấp khả năng di chuyển hiệu quả cho nhiều người mỗi ngày.
Đặc biệt, xe buýt là phương tiện giao thông công cộng phổ biến do tính linh hoạt và
khả năng tiếp cận của chúng. Do đó, việc cải thiện hiệu quả hoạt động của hệ thống
xe buýt là một việc thiết thực, chẳng hạn như cải thiện độ tin cậy trong lịch trình di
chuyển của xe buýt. Độ tin cậy của các dịch vụ xe buýt có thể bị ảnh hưởng bởi
nhiều yếu tố, bao gồm tắc nghẽn giao thông, điều kiện thời tiết và sự chậm trễ
không mong muốn. Một trong những thách thức quan trọng nhất mà hệ thống xe
bt phải đối mặt là dự đốn chính xác thời gian đến của xe buýt tại các trạm dừng
được chỉ định.
Dự đốn chính xác thời gian đến của xe bt là điều cần thiết để hệ thống giao
thông công cộng hoạt động hiệu quả và đáng tin cậy. Hành khách cần biết khi nào

xe buýt của họ sẽ đến để lên kế hoạch cho chuyến đi của mình và tránh những chậm
trễ không cần thiết. Các cơ quan giao thông cơng cộng cũng u cầu dự đốn chính
xác để tối ưu hóa các tuyến xe bt, lịch trình và điều phối, điều này có thể cải thiện
độ tin cậy của dịch vụ và giảm chi phí vận hành. Đối với các nước có hệ thống giao
thơng ổn định hoặc có quy hoạch tuyến đường riêng cho xe buýt thì việc dự đốn
khơng cịn nhiều thách thức.Với phần lớn cịn lại, hoạt động xe buýt chịu ảnh hưởng
lớn từ hệ thống giao thơng chung nhiều biến động, do đó việc dự đốn chính xác
thời gian đến của xe bt cịn nhiều thách thức.
Các phương pháp dự đoán thời gian đến của xe buýt truyền thống, chẳng hạn như
lập lịch trình cố định hoặc điều phối thủ cơng, có thể khơng tính đến hoặc khơng thể
tính đến các yếu tố khách quan ảnh hưởng đến thời gian đến của xe buýt, chẳng hạn
như tình trạng giao thơng, thời tiết… Do đó, các phương pháp này có thể khơng
đáng tin cậy. Ngày nay có nhiều phương pháp được nghiên cứu để giải quyết bài













1


tốn này, có thể kể đến các mơ hình học máy sử dụng dữ liệu lịch sử để huấn luyện

các mơ hình, đưa vào các yếu tố khách quan để đưa ra các dự đốn chính xác hơn.
1.2. Mục tiêu
Mục tiêu của luận văn là phát triển một giải pháp dự đốn thời gian đến trạm
dừng của xe bt, có thể đưa ra những dự đốn chính xác và đáng tin cậy, bằng cách
sử dụng các kỹ thuật hiện đại và tiến bộ gần đây trong lĩnh vực học máy.
Cụ thể hơn, mục tiêu của luận văn là phát triển mơ hình dự đốn thời gian đến
trạm dừng của xe buýt, dữ liệu lịch sử di chuyển của xe buýt huấn luyện cho mơ
hình mạng nơron truy hồi (RNN).
1.3. Phạm vi và giới hạn của đề tài
Phạm vi luận văn này sẽ tập trung vào việc dự đoán thời gian đến của xe buýt
cho một nhóm tuyến xe buýt cụ thể trong một thành phố cụ thể, với dữ liệu là:
1. Dữ liệu lịch sử hành trình của xe buýt chứa các thơng tin như: thời gian, vị trí
xe bt, tên tuyến tương ứng… từ đây gọi là dữ liệu GPS (Global Positioning
System).
2. Dữ liệu tĩnh chứa thông tin của hệ thống xe buýt như tuyến đường, vị trí trạm
dừng… từ đây gọi là dữ liệu GTFS (General Transit Feed Specification).
Hai tập dữ liệu trên được dùng để huấn luyện mơ hình dự đốn, đồng thời dùng
để so sánh với các mơ hình dự đốn khác.
Do tính đặc thù của từng hệ thống xe buýt mà cấu trúc dữ liệu sẽ khác nhau, mặc
khác về tính riêng tư mà dữ liệu xe buýt thường không được chia sẻ công khai. Đây
là hai thách thức nổi bậc về dữ liệu đối với bài toán dự đoán thời gian của xe buýt.
Luận văn sử dụng hai tập dữ liệu được chia sẻ công khai:
- Dữ liệu GPS tháng 1 năm 2013 của thành phố Dublin - Ireland [10]
- Dữ liệu GFTS tháng 12 năm 2016 của thành phố Dublin - Ireland [11]










































2


Chi tiết về các tập dữ liệu này sẽ được mô tả ở Chương 5. Dữ liệu.
Với tập dữ liệu trong một khoảng thời gian ngắn, do đó khơng khai thác được các
ảnh hưởng có tính chu kỳ trong năm như các mùa, các kỳ nghỉ. Mặc khác, mơ hình
dự đoán dùng dữ liệu làm cơ sở, nên chỉ đúng đắn với các tuyến đường đã được
huấn luyện.
Quá trình xử lý dữ liệu cũng sẽ phát triển theo hướng không phụ thuộc quá nhiều
vào cấu trúc dữ liệu, trích xuất những thông tin cơ bản của hệ thống buýt, với mục
đích là dễ dàng áp dụng cho những hệ thống buýt khác có cấu trúc dữ liệu khác
nhau.










3


CHƯƠNG 2. TỔNG QUAN BÀI TOÁN DỰ ĐOÁN THỜI GIAN ĐẾN TRẠM

DỪNG CỦA XE BUÝT
2.1. Bài toán dự đoán
Dự đoán khi nào xe buýt sẽ đến trạm dừng là nhiệm vụ khó khăn do có nhiều
biến ngẫu nhiên liên quan và mối quan hệ phức tạp của chúng, chẳng hạn như: thời
tiết, cường độ giao thông, tai nạn, giao lộ và số lượng hành khách… là các yếu tố có
thể ảnh hưởng đến thời gian di chuyển của xe buýt. Có thể xem thời gian đến trạm
dừng là đầu ra từ một hàm với đầu vào là các biến ảnh hưởng.
Có nhiều phương pháp tiếp cận để giải quyết bài toán dự đoán thời gian đến của
xe buýt, chẳng hạn như: phương pháp lập lịch, phương pháp thống kê, phương pháp
tìm lân cận, phương pháp học máy.
2.2. Khảo sát các phương pháp cho bài đoán dự đoán
2.2.1. Phương pháp lập lịch
Các phương pháp dựa trên lịch trình xe buýt được xác định trước và sử dụng
chúng làm cơ sở để dự đoán thời gian đến. Các phương pháp này giả định rằng xe
bt tn thủ lịch trình đã cơng bố và tính tốn thời gian đến dự kiến dựa trên thời
gian khởi hành theo lịch trình. Tuy nhiên, các phương pháp dựa trên lịch trình có
thể khơng chính xác do các yếu tố khơng thể đốn trước như điều kiện giao thông,
thời tiết và thời gian lên xuống của hành khách.
2.2.2. Phương pháp thống kê
Các phương pháp thống kê nhằm mơ hình hóa và dự đốn thời gian đến của xe
buýt dựa trên dữ liệu lịch sử và kỹ thuật thống kê. Các phương pháp này phân tích
thời gian đến của xe buýt trước đây, cùng với các yếu tố ảnh hưởng khác nhau như
thời gian trong ngày, ngày trong tuần, điều kiện thời tiết và mơ hình giao thơng. Các
mơ hình thống kê như phân tích hồi quy, phân tích chuỗi thời gian như: ARIMA
[12] sử dụng để nắm bắt mối quan hệ giữa các yếu tố này và thời gian đến của xe


























4


bt. Các mơ hình này có thể đưa ra các dự đoán hợp lý dựa trên các mẫu lịch sử
nhưng có thể gặp khó khăn trong việc nắm bắt các biến thể động và theo thời gian
thực.
Phương pháp này hoạt động tốt với những hệ thống giao thông ổn định, tuy nhiên
dễ bị ảnh hưởng bởi tắt nghẽn.
2.2.3. Phương pháp tìm kiếm
Ý tưởng của phương pháp này là tìm các phiên bản dữ liệu gần nhất trong lịch sử

của dữ liệu đang xét, chẳng hạn như: số xe, số tuyến, thời gian trong tuần, khung
giờ…và dùng chúng để đưa ra dự đốn bằng cách tính trung bình chẳng hạn. Có thể
kể đến các kỹ thuật như k-NN [13], KR [14] (Kernel Regression). Phương pháp này
hoạt động khá tốt, tuy nhiên thời gian tính tốn dự đốn sẽ cao và dễ bị ảnh hưởng
bởi dữ liệu xấu.
2.2.4. Phương pháp học máy
Các phương pháp học máy dựa trên dữ liệu để huấn luyện mơ hình dự đốn. Các
phương pháp này sử dụng dữ liệu lịch sử, bao gồm dữ liệu GPS của xe buýt, tốc độ
xe, số lượng hành khách, tình trạng giao thơng, tình trạng thời tiết… để huấn luyện
mơ hình dự đoán.
Chẳng hạn như kỹ thuật SVM (Support Vector Machine) được sử dụng trong bài
báo [15] để dự đoán thời gian đến của xe buýt ở Hồng Kông vào năm 2011, các tác
giả đã sử dụng thời gian di chuyển cùng với dữ liệu thời tiết làm cơ sở cho mơ hình
của họ.
Một cơng trình khai thác dữ liệu lớn (Big data) của mạng lưới giao thông ở Việt
Nam [7], bằng cách sử dụng dữ liệu được tạo từ các thiết bị IoT được trang bị hệ
thống định vị toàn cầu (GPS) được gắn trên các phương tiện di chuyển trên mạng
lưới đường thành phố để trích xuất trạng thái giao thông hiện tại, tức là các luồng
giao thông trên đường… dữ liệu trạng trạng thái giao thông thời gian thực có nhiều























5


ứng dụng như: dự đoán thời gian đến của xe buýt tại các điểm dừng xe buýt, dự
đoán thời gian đến và định tuyến cho taxi, điều hướng hành khách để tránh tắc
đường, dự báo tắc đường…
Các phương pháp dùng dữ liệu trạng thái thời tiết, trạng thái luồng giao thơng sẽ
hiệu quả với bài tốn dự đốn thời gian di chuyển do có thơng tin trạng thái của
đoạn đường sẽ đi đến. Tuy nhiên, cách tiếp cận này cần một hệ thống thu thập rộng
lớn để có thể bao phủ một mạng lưới giao thông.
Một cách tiếp cận khác là dùng chính dữ liệu mà hệ thống xe buýt thu thập được,
chẳng hạn như dữ liệu hành trình của xe bt.
Cách mơ hình mạng nơron nhân tạo thường được dùng để khai thác mối quan hệ
của dữ liệu, chẳng hạn như mơ hình mạng đa tầng (Multilayer perceptron - MLP) từ
bài báo [16], hoặc dùng mạng nơron truy hồi (Recurrent Neural Networks - RNN) ở
bài báo [1] được sử dụng để khai thác các phụ thuộc dài hạn giữa các điểm dữ liệu.
2.3. Phương pháp tiếp cận bài toán
Luận văn sẽ tiếp cận bài toán theo hướng bài toán hồi quy, bài toán dự đoán một
giá trị dựa vào một tập hợp các đầu vào (chi tiết hơn về dạng bài tốn này sẽ được

trình bày ở phần 3.1). Về dữ liệu sẽ sử dụng dữ liệu lịch sử của chính hệ thống xe
bt để huấn luyện mơ hình. Với khả năng biểu diễn tốt dữ liệu, các mạng nơron
nhân tạo ưu tiên được lựa chọn. Mặc khác, nếu xem thời gian đến trạm của xe buýt
là một chuỗi các giá trị tuần tự, thì có thể xem đây là bài toán dự đoán giá trị tương
lai của một chuỗi dữ liệu tuần tự. Trong các mạng nơron nhân tạo, thì mạng nơron
truy hồi (recurrent neural networks - RNN) có khả năng xử lý tốt các dữ liệu dạng
chuỗi [6], có khả năng nắm bắt được các phụ thuộc tuần tự trong chuỗi dữ liệu.
Theo bài báo [1] đề xuất phương pháp dự đoán thời gian đến trạm của xe buýt
dùng RNN cải tiến là mạng LSTM (Long short-term memory) và mơ hình của họ đề
xuất cho kết quả tốt trong các cuộc thử nghiệm của họ.























6


Theo một bài báo khác [2], thử nghiệm các mô hình dự đốn thời gian đến của
bt, thì mơ hình RNN-LSTM do [1] đề xuất cho kết quả về độ chính xác của dự
đốn tốt hơn các mơ hình khác mà họ đã thử nghiệm.
Trên cơ sở đó, luận văn này sẽ khảo sát sử dụng mơ hình mạng LSTM cho bài
toán dự đoán thời gian đến của buýt, đồng thời cũng có những đề xuất để tăng hiệu
quả của mơ hình dự đốn trên tập dữ liệu khảo sát.
Mơ hình chi tiết sẽ được trình bày ở các chương sau. Phần tiếp theo sẽ trình bày
cơ sở lý thuyết được sử dụng trong luận văn.










7


3.1. Hồi quy tuyến tính
Bài tốn hồi quy (regression problem) [4] là một loại bài toán trong lĩnh vực học
máy (machine learning) và thống kê. Mục tiêu của bài toán hồi quy là dự đoán một
hoặc nhiều giá trị số dựa trên một tập hợp các biến đầu vào (input variables). Các ví

dụ phổ biến bao gồm dự đốn giá nhà, giá cổ phiếu, dự báo doanh thu, dự đoán thời
gian bệnh nhân nằm viện…
Bài toán hồi quy trong lĩnh vực học máy, một tập dữ liệu huấn luyện gồm các
mẫu, trong đó mỗi mẫu bao gồm các đặc trưng (features) và giá trị đầu ra tương
ứng. Mục tiêu là xây dựng một mơ hình hồi quy từ dữ liệu huấn luyện, để có thể dự
đốn giá trị đầu ra cho các mẫu mới chưa được quan sát trước đó.
Bài tốn hồi quy có ứng dụng rộng rãi trong nhiều lĩnh vực, bao gồm dự đốn giá
cổ phiếu, ước tính giá nhà đất, dự báo doanh thu và nhiều ứng dụng khác trong kinh
tế, tài chính, y học, và khoa học xã hội.
Hồi quy tuyến tính [5] là một phương pháp dễ hiểu để bắt đầu với bài toán hồi
quy. Ý tưởng là mơ hình hồi quy được xây dựng dựa trên mối quan hệ tuyến tính
giữa các biến đầu vào và giá trị đầu ra. Trong hồi quy tuyến tính, giả định rằng có
một mối quan hệ tuyến tính giữa biến đầu ra và các biến đầu vào. Phương trình của
mơ hình hồi quy tuyến tính là:

ŷ = w1x1 + w2 x2 + ⋯ + wn xn + b

(3.1.1)

ŷ = w T x

(3.1.2)

Hoặc
Trong đó:

ŷ là giá trị đầu ra dự đoán
x ∈ R là các giá trị đầu vào, còn gọi là vector đặc trưng
w T ∈ R n là vector trọng số.











































8





CHƯƠNG 3. CƠ SỞ LÝ THUYẾT


mới, mơ hình sẽ đưa ra dự đốn với sai số nhỏ nhất (theo kỳ vọng).
Với một tập dữ liệu đầu vào X , một hàm mất mát đại diện cho sự sai lệch giữa
giá trị dự đoán và giá trị thực y như bên dưới:

1 n
L(w) =
(yi − yî )
2∑
i

(3.2)


Mục tiêu là với tập dữ liệu đầu vào, tìm giá trị của vector trọng số w sao cho hàm
mất mát L(w) đạt giá trị nhỏ nhất.
Đây cũng là cách tiếp cận của phần lớn các kỹ thuật học máy với cho bài toán hồi
quy, tùy từng phương pháp mà sẽ có một hàm mất mát riêng và các kỹ thuật khác
nhau để cực tiểu hóa hàm mất mát đó.
3.2. Mạng nơron nhân tạo
Mạng nơron nhân tạo (Artificial neural network - ANN) [5] là một mơ hình tính
tốn lấy cảm hứng từ cấu trúc và chức năng của bộ não sinh học. Nó là một loại
thuật tốn học máy có thể được đào tạo để nhận dạng các mẫu từ dữ liệu huấn
luyện, đưa ra dự đoán, phân loại hoặc giải quyết các vấn đề phức tạp.
Một cấu trúc điển hình của ANN là Multilayer Perceptron - MLP, đây là cấu trúc
nhiều lớp bao gồm một lớp đầu vào, một hoặc nhiều lớp ẩn và một lớp đầu ra. Lớp
đầu vào nhận dữ liệu ban đầu và lớp đầu ra cung cấp đầu ra hoặc dự đoán cuối
cùng. Đây là một mạng chuyển tiếp (feedforward), thông tin truyền theo một
hướng, từ lớp đầu vào qua các lớp ẩn đến lớp đầu ra.

























9






Mục tiêu của hồi quy tuyến tính là tìm giá trị vector w để với một dữ liệu đầu vào


Mơ hình tính tốn cho mạng hai tầng ẩn ở trên như sau:

H1 = σ1(W1X + b1)

(3.3)

H2 = σ2(W2 H1 + b2)

(3.4)


O = σ3(W3 H2 + b3)

(3.5)

Trong đó:

X: đầu vào
H1, H2: giá trị tại các tầng ẩn 1 và tầng ẩn 2
O: đầu ra
W1, W2, W3, b1, b2, b3: các trọng số của mơ hình
σ1, σ2, σ3: là các hàm kích hoạt tại mỗi tầng
Có thể thấy mơ hình tính tốn của MLP tương tự như mơ hình hồi quy tuyến tính,
điểm khác nhau là tại mỗi tầng của MLP có thêm hàm kích hoạt, những hàm kích
hoạt giúp cho mơ hình có khả năng tìm hiểu các mối quan hệ phi tuyến trong dữ
liệu, giúp mơ hình có khả năng nhận dạng các mẫu dữ liệu tốt hơn.












































10











Hình 3.1. MLP với hai tầng ẩn


Việc huấn luyện MLP liên quan đến một quá trình lặp được gọi là lan truyền
ngược, trong đó hàm mất mát giữa đầu ra dự đoán và đầu ra thực được lan truyền
ngược qua mạng. Quá trình này điều chỉnh các trọng số bằng cách sử dụng các thuật
toán tối ưu hóa, chẳng hạn như giảm độ dốc (gradient descent), để giảm thiểu lỗi và
cải thiện độ chính xác của các dự đoán.
MLP được sử dụng rộng rãi cho các nhiệm vụ học tập có giám sát, bao gồm các
vấn đề phân loại và hồi quy. Chẳng hạn như nhận dạng hình ảnh, xử lý ngơn ngữ tự
nhiên, tài chính và hệ thống đề xuất.
Tuy nhiên, MLP cũng có những hạn chế. Chúng có thể dễ bị quá khớp (overfit hoạt động tốt trên tập dữ liệu huấn luyện nhưng lại không tốt trên các dữ liệu thực
tế) nếu mô hình trở nên quá phức tạp hoặc nếu dữ liệu huấn luyện bị hạn chế. MLP
có thể yêu cầu một lượng lớn dữ liệu đào tạo được dán nhãn để đạt được hiệu suất
tốt. Ngồi ra, mơ hình MLP cũng hạn chế khả năng nắm bắt các thông tin với dạng
dữ liệu chuỗi, dạng dữ liệu này sẽ được trình bày tiếp theo.
3.3. Dữ liệu chuỗi
Dữ liệu chuỗi (Sequence data) là dữ liệu được tổ chức theo cách tuần tự hoặc
theo thời gian, trong đó thứ tự của các phần tử có ý nghĩa. Với dữ liệu truyền thống,
các phần tử độc lập với nhau, còn với dữ liệu chuỗi thứ tự các thành phần trong
chuỗi thường sẽ mang thông tin. Dữ liệu chuỗi phổ biến phổ biến: chuỗi văn bản (tứ

tự các từ trong câu), chuỗi âm thanh, phim ảnh (các khung hình xuất hiện tuần tự),
dữ liệu thị trường chứng khốn, trình tự DNA và nhiều lĩnh vực khác.
Dữ liệu chuỗi thời gian (time series data) là một dạng đặc biệt của dữ liệu chuỗi,
khi mà ngoài thứ tự xuất hiện, mỗi điểm dữ liệu cịn có thêm thông tin thời gian
(timestamp).
Một đặc điểm của dữ liệu dạng chuỗi là khơng có kích thước cố định, chẳng hạn
như một chuỗi vài từ, và có khi là cả một đoạn văn dài.






















11



Một trong những bài toán phổ biến của dữ liệu chuỗi là bài toán dự đoán giá trị
theo của một chuỗi, chẳng hạn như:
- Người dùng nhập một vài ký tự, gợi ý những từ tiếp theo.
- Cho một chuỗi các thơng tin thời tiết trong một tháng, dự đốn thời tiết vào
ngày mai.
- Cho một chuỗi thông tin sản phẩm mà khách hàng đã mua sắm trước đây, dự
đoán và gợi ý những sản phẩm khách hàng sẽ mua lần tới.
Có thể phân nhóm các bài tốn với dữ liệu chuỗi với một số ví dụ như sau:
1. One-to-many: bài toán sinh nhạc, sinh văn bản từ một đầu vào nhất định.
2. Many-to-one: bài toán phân loại, dự đoán từ một chuỗi đầu vào.
3. Many-to-many (bất đối xứng): bài toán dịch máy.
4. Many-to-many (đối xứng): bài toán phân loại từ trong câu.
Một hạn chế của mơ hình MLP khi xử lý dữ liệu chuỗi không khai thác được các
thông tin tuần tự trong chuỗi dữ liệu. Đặc điểm MLP là một mạng chuyển tiếp
(feedforward) nhận một giá trị đầu vào và tính ra giá trị đầu ra. mặt khác đầu vào
của mạng MLP cố định nên sẽ không tương thích tốt với dữ liệu với độ dài khơng
cố định của dữ liệu chuỗi.
Trong nhóm các mạng nơron nhân tạo, có một loại mạng tương thích tốt với loại
dữ liệu chuỗi này, đó là mạng nơron truy hồi (RNN)
3.4. Mạng nơron truy hồi
Mạng nơron truy hồi [6] l m t ki n tr c mạng với đặc điểm là tr ng th i c a m
h nh t i b

c li n tr

cs đ

c d ng l m đ u v o c a b


c hi n t i. Kết nối truy

hồi này cho phép RNN nắm bắt và sử dụng thơng tin từ các bước trước đó.
Tính năng chính của RNN là khả năng duy trì bộ nhớ trong, cịn được gọi là
trạng thái ẩn, đóng vai trị là bộ nhớ của thông tin và đầu vào trong quá khứ. Tại
mỗi bước thời gian, RNN lấy một đầu vào và kết hợp nó với trạng thái ẩn trước đó




















ệ





ớ






















ầ











ế

ợ

ộ













ớ



ề


ớ










12


để tạo ra đầu ra và cập nhật trạng thái ẩn. Trạng thái ẩn mang thông tin từ các bước
trước đó và ảnh hưởng đến tính tốn ở bước hiện tại, cho phép mạng nắm bắt được
các phụ thuộc dài hạn.

Hình 3.2. Mơ hình RNN dạng rút gọn và dạng dàn trãi
Mơ hình RNN truyền thống gặp phải vấn đề là khó nắm bắt được các ảnh hưởng
dài hạn, dẫn đến hiện tượng tiêu biến hoặc bùng nổ gradient trong quá trình huấn
luyện (hiện tượng vanishing and exploding gradient). Để giải quyết hạn chế này, các
kiến trúc RNN nâng cao, chẳng hạn như Bộ nhớ ngắn hạn dài hạn (LSTM - Long
short term memory) đã được phát triển.
LSTM - Long short term memory
Như đã mô tả ở phần trước, các mạng LSTM [6] là các biến thể đặc biệt của
RNN, giúp kiểm soát các vấn đề về sự bùng nổ hoặc tiêu biến gradient. Ý tưởng là
kiểm soát trạng thái ẩn, cơ chế quyết định khi nào nên cập nhật và khi nào nên xóa
trạng thái ẩn. Ví dụ, nếu dữ liệu đầu tiên có mức độ quan trọng cao, mơ hình sẽ học
để khơng cập nhật trạng thái ẩn sau lần quan sát đầu tiên. Tương tự, mơ hình sẽ học

cách bỏ qua những quan sát tạm thời không liên quan, cũng như cách xóa trạng thái
ẩn khi cần thiết.



















13


×