Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
DỰ BÁO MỰC NƯỚC HẠN DÀI TRÊN DỊNG CHÍNH
SƠNG MEKONG BẰNG MẠNG NORON TIẾN HĨA - EANN
Hồng Thanh Tùng1, Nguyễn Hồng Sơn1, Ngơ Lê An1
1
Trường Đại học Thủy lợi, email:
1. ĐẶT VẤN ĐỀ
Sông Mekong là con sông quốc tế chảy
qua các nước Trung Quốc, Miến Điện, Lào,
Thái Lan, Campuchia và Việt Nam. Phần
diện tích lưu vực trên lãnh thổ Việt Nam gọi
là Đồng bằng Sông Cửu Long (ĐBSCL) đồng bằng sông lớn nhất ở Việt Nam, là vựa
lúa đóng góp lớn đến an ninh lương thực và
xuất khẩu gạo của Việt Nam trên thế giới.
Tuy nhiên do ĐBSCL ở hạ nguồn sông
Mekong do vậy chịu tác động rất lớn của các
cơng trình thủy lợi, thủy điện ở bên trên nên
dịng chảy về ĐBSCL đang có xu thế thay
đổi mạnh và giảm dần ở cả mùa lũ lẫn mùa
kiệt trong những năm gần đây làm cho sản
xuất nông nghiệp, nuôi trồng và đánh bắt
thủy hải sản bị ảnh hưởng mạnh. Chính vì
vậy để hạn chế những ảnh hưởng này và để
chủ động thích nghi với những thay đổi về
dịng chảy về ĐBSCL trong phát triển kinh tế
xã hội thì việc dự báo dòng chảy hạn dài tại
một số trạm trên dịng chính sơng Mekong là
rất cần thiết.
Ở Việt Nam, dự báo hạn dài đã được quan
tâm từ những năm 60 và được xem như một
nhiệm vụ chủ yếu của Tổng Cục Khí tượng
Thủy văn. Một số phương pháp dự báo hạn
dài của nước ngoài đã được nghiên cứu ứng
dụng vào dự báo dòng chảy 10 ngày, tháng,
mùa, năm tại một số trạm cơ bản trên một số
hệ thống sông của Việt Nam. Có thể tổng hợp
các phương pháp dự báo hạn vừa, hạn dài
vào 3 nhóm chính [1]:
- Nhóm 1: Mơ hình tương quan với hồn
lưu khí quyển, khí hậu; hiện nay Tổng Cục
KTTV vẫn đang sử dụng phương pháp này.
Nhóm 2: Các mơ hình nhận thức được xây
dựng dựa vào cơ sở vật lý của các mối quan
hệ giữa dịng chảy và nhân tố ảnh hưởng. Mặc
dù có hạn chế về thời gian dự kiến trong dự
báo nhưng cùng với sự phát triển của các mơ
hình khí hậu tồn cầu với các cơng nghệ, kỹ
thuật xử lý mới, nhóm này có nhiều triển vọng
ứng dụng [theo Ngơ Lê An và nnk (2021)].
Nhóm 3: Các phương pháp nhận dạng tương tự và phương pháp thống kê xác suất,
và mạng trí tuệ nhân tạo (AI). Trong đó
phương pháp thống kê khách quan cũng được
sử dụng trong dự báo hạn dài dịng chảy
sơng. Phương pháp nhận dạng tương tự và AI
được dùng ở nhiều dạng khác nhau, từ đơn
giản, với một hoặc hai nhân tố dự báo, đến
phức tạp với hàng trăm nhân tố, hàng chục
loại số liệu khác nhau. Phương pháp đã được
nghiên cứu ứng dụng trong dự báo hạn vừa,
dự báo tháng và phân phối dòng chảy các
tháng trong năm.
Bài báo này trình bày tóm tắt “Nghiên cứu
dự báo mực nước hạn dài cho một số trạm
trên dịng chính sơng Mekong bằng Mạng Nơ
ron Tiến hóa - EANN”. Mạng EANN là một
trong những dạng lai ghép giữa mạng Nơ ron
thần kinh với thuật toán quét ngược (BPNN Back Propagation Neural Network) được áp
dụng nhiều trong thủy văn với thuật toán giải
đoán gen (GA - Genetic Algorithms). Khi áp
dụng mạng BPNN người dùng sẽ phải chạy
rất nhiều trường hợp để tìm ra mạng nơ ron tốt
nhất (tìm ra số lớp ẩn, số nút trong lớp ẩn) nên
thời gian chạy mô hình sẽ rất lâu, đặc biệt với
yêu cầu cập nhật số liệu liên tục trong dự báo
tác nghiệp. Với việc áp dụng mạng EANN,
thuật toán GA sẽ giúp việc tối ưu mạng nơ ron
567
Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
BPNN nhanh hơn rất nhiều, do vậy rất thích
hợp cho việc dự báo tác nghiệp.
2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Số liệu sử dụng trong nghiên cứu
Dữ liệu KTTV (mưa, mực nước) vùng hạ
nguồn châu thổ sông Mekong thời đoạn ngày,
từ 1/1980 đến 12/2019. Số liệu này được thu
thập được từ Ủy Ban sông Mekong Quốc tế.
2.2. Phương pháp nghiên cứu
Sơ đồ dưới đây minh họa các bước xây
dựng mô hình EANN dự báo mực nước một
số trạm trên dịng chính sơng Mekong.
Trong sơ đồ này, việc lựa chọn số liệu để
phân tích là rất quan trọng, đặc biệt với
phương pháp mạng trí tuệ nhân tạo (AI) khi
có q nhiều biến đầu vào mà khơng biết
những số liệu nào có ảnh hưởng lớn đến biến
đầu ra (biến cần dự báo). Nhóm nghiên cứu
đã sử dụng thuật tốn “Stepwise” để thực
hiện việc này. Thuật toán này cho phép lần
lượt đưa vào và đưa ra từng biến để đánh giá
mức độ ảnh hưởng/đóng góp của từng biến
với biến cần dự báo. Khi mỗi biến đưa vào,
mơ hình sẽ phân tích và đánh giá các chỉ tiêu
thống kê (ví dụ như Fisher (F), Student (T),...
hệ số tương quan bội (R2) nếu chỉ tiêu đạt thì
giữ lại, khơng đạt thì loại ra.
3. KẾT QUẢ NGHIÊN CỨU
Từ số liệu đã thu thập, tiến hành phân tích
ma trận tương quan và sử dụng thuật tốn
Stepwise, nghiên cứu đã lựa chọn ra các biến
tốt nhất đưa vào xây dựng mơ hình EANN.
Tất cả các biến mưa, các biến mực nước ở
các trạm trên dịng chính sơng ở quá xa trạm
cần dự báo cũng bị loại, do đây là mơ hình dự
báo hạn dài thời hạn tháng nên tương quan
các biến này với biến cần dự báo quá nhỏ do
đó bị thuật tốn loại. Các biến tham gia vào
mơ hình EANN cịn lại là các biến mực nước
trung bình tháng thứ i, i-1, i-2, i-3 tại trạm
cần dự báo, mực nước trung bình của trạm
bên trên trạm cần dự báo về phía thượng
nguồn tháng thứ i và mực nước trung bình
ngày cuối cùng của tháng thứ i trạm cần dự
báo. Số liệu dùng để đào tạo mạng (training)
từ tháng 1/1980 đến tháng 12/2005; số liệu
dùng để kiểm tra mạng (testing) từ 1/2006
đến tháng 12/2014. Số liệu dùng để kiểm tra
chéo (cross validation) chọn 20 năm bao gồm
cả 2 liệt trên. Số liệu dùng để dự báo thử
nghiệm từ tháng 1/2015 đến tháng 12/2019.
Kết quả đào tạo mạng tại Tân Châu, Châu
Đốc và Chieng Sean có hệ số tương quan (R)
tương ứng là 0.94, 0.93 và 0.86; sai số tuyệt
đối trung bình (MAE) tương ứng là 0.27,
0.27 và 0.36. Kết quả kiểm tra mạng cũng
cho kết quả tốt với R lần lượt là 0.93, 0.93 và
0.85; MAE lần lượt là 0.27, 0.27 và 0.36.
Bảng 1 và các Hình 2, 3, 4 dưới đây minh
họa kết quả dự báo thử nghiệm cho các trạm
Tân Châu, Châu Đốc và Chieng Sean từ
tháng 1/2015 đến tháng 12/2019:
Hình 2. Dự báo thử nghiệm tại Tân Châu
Hình 1. Các bước xây dựng mơ hình EANN
568
Tuyển tập Hội nghị Khoa học thường niên năm 2021. ISBN: 978-604-82-5957-0
Bảng 1. Kết quả đánh giá dự báo tại một số
vị trí trên dịng chính sơng Mekong
Chỉ số đánh giá
Tân Châu Chieng
Châu Đốc Sean
MSE (sai số tồn phương
trung bình)
0.14
NMSE (sai số tuyệt đối
trung bình hiệu chỉnh)
0.18
0.25
0.12
0.24
0.34
MAE (sai số tuyệt đối
trung bình)
0.27
0.27
Min Abs Error (sai số
nhỏ nhất)
0.02
0.01
Max Abs Error (sai số
lớn nhất)
1.70
1.54
R (hệ số tương quan)
0.93
0.91
0.82
Mức đảm bảo phương án
78%
78%
75%
Mô hình mạng EANN xây dựng để dự báo
mực nước trung bình tháng cho 3 trạm trên
được đánh giá là khá tốt với mức đảm bảo
phương án trên 75%. Mơ hình này có ưu điểm
hơn các mơ hình mạng trí tuệ nhân tạo khác ở
khả năng cập nhật số liệu liên tục sau đó tự tối
ưu mạng mới rất nhanh nên có thể được sử
dụng như một cơng cụ dự báo tác nghiệp.
4. KẾT LUẬN
0.38
Bài báo đã trình bày tóm tắt “Nghiên cứu
dự báo mực nước hạn dài cho một số trạm
trên dịng chính sơng Mekong bằng Mạng Nơ
ron Tiến hóa - EANN”. Kết quả nghiên cứu
thử nghiệm cho 3 trạm Tân Châu, Châu Đốc
và Chieng Sean có mức đảm bảo phương án
trên 75% ở mức khá tốt đối với dự báo hạn
dài. Mạng EANN lại có nhiều ưu điểm về
thời gian chạy mơ hình để dự báo, đặc biệt là
khả năng cập nhật dữ liệu liên tục để dự báo
nên rất thích hợp cho việc đưa vào dự báo tác
nghiệp. Trong thời gian sắp tới, nhóm nghiên
cứu sẽ tiếp tục đưa biến triều vào phân tích
trong mơ hình để có thể dự báo lưu lượng tại
các trạm bị ảnh hưởng của thủy triều như Tân
Châu và Châu Đốc.
0.01
1.19
5. TÀI LIỆU THAM KHẢO
Hình 3. Dự báo thử nghiệm tại Châu Đốc
Hình 4. Dự báo thử nghiệm tại Chieng Sean
[1] Tổng kết đề tài NCKH cấp Nhà nước
“Nghiên cứu cơ sở khoa học phục vụ giám
sát tài nguyên nước mặt và cảnh báo hạn
hán ở Đồng bằng sông Cửu Long trong điều
kiện thiếu số liệu quan trắc ở lưu vực sơng
Mekong ngồi lãnh thổ Việt Nam”.
[2] Ngô Lê An và nnk (2021). Nghiên cứu mơ
phỏng dịng chảy thời đoạn tháng cho lưu
vực sơng Mekong đến Kratie sử dụng dữ
liệu Aphrodite. Tạp chí Khoa học Kỹ thuật
Thủy lợi và Môi trường số 72 (3/2021).
569