Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
ĐÁNH GIÁ MỘT SỐ PHƯƠNG PHÁP NỘI SUY KHÔNG GIAN
CHO BÀI TỐN MƯA NĂM Ở VIỆT NAM
Ngơ Lê An1, Nguyễn Thị Thu Hà1, Hoàng Thanh Tùng1
1
Trường Đại học Thuỷ lợi, email:
1. GIỚI THIỆU CHUNG
Mưa dạng lưới có vai trị quan trọng trong
việc mơ tả trạng thái thay đổi của mưa theo
không gian, giúp cho việc đánh giá mô hình
mơ phỏng khí hậu hay mơ phỏng dịng chảy
trên bề mặt đất được tốt hơn. Để xây dựng
được dữ liệu mưa dạng lưới, nhiều nghiên
cứu tập trung sử dụng các phương pháp nội
suy nhằm nâng cao độ chi tiết của mạng lưới
quan trắc mưa thực đo. Ở Việt Nam, mạng
lưới các trạm quan trắc đo mưa khá thưa với
mật độ trung bình khoảng một trạm đo trên
600 km2 diện tích, mật độ trạm cao tập trung
ở vùng đồng bằng sông Hồng, các vùng núi
cao lại có mật độ trạm thấp. Trong những
năm gần đây, mặc dù đã có nhiều trạm đo
mưa tự động được xây dựng, nhưng thời gian
quan trắc còn ngắn, thường chỉ vài năm nên
việc ứng dụng, khai thác trong các bài toán
liên quan đến tài nguyên nước còn hạn chế.
Do vậy, việc nghiên cứu sử dụng các phương
pháp nội suy đặc trưng mưa theo không gian
ở Việt Nam là rất cần thiết.
Bài báo này đánh giá một số các phương
pháp nội suy thường dùng ở Việt Nam, từ đó
đề xuất các phương pháp phù hợp với điều
kiện Việt Nam.
2. PHƯƠNG PHÁP NGHIÊN CỨU
2.1. Phương pháp nội suy
Các phương pháp nội suy sử dụng trong
nghiên cứu này bao gồm:
- Phương pháp Lân cận gần nhất (NN): trị
số nội suy tại vị trí nghiên cứu được lấy bằng
trị số tại trạm đo gần nhất.
- Phương pháp Lân cận Tự nhiên
(NNI)[1]: được phát triển dựa trên phương
pháp đa giác Thiessen, giả thiết mức độ đóng
góp mưa của các trạm xung quanh tỷ lệ với
diện tích đóng góp của từng trạm cho đa giác
của vị trí nghiên cứu (đối với đa giác
Thiessen được tạo bởi toàn bộ các trạm bao
gồm cả vị trí xem xét), được xác định khi loại
bỏ vị trí cần tính tốn.
- Phương pháp nghịch đảo khoảng cách
(IDW)[2]: Được tính tốn dựa trên các trị số
đo mưa tại các trạm đo lân cận với trị số
được xác định theo nghịch đảo khoảng cách.
- Phương pháp nghịch đảo khoảng cách và
độ cao (IDEW)[3]: Tương tự với IDW nhưng
có bổ sung thêm biến trị số độ cao với trọng
số là nghịch đảo của chênh lệch độ cao giữa
điểm tính tốn và trạm đo lân cận.
- Phương pháp tương quan tuyến tính
(MLR): Giả thiết lượng mưa tại một điểm
phụ thuộc vào các yếu tố địa hình như toạ độ
của điểm, độ cao, độ dốc và hướng.
2.2. Dữ liệu
Trong nghiên cứu này, số liệu mưa tháng
của 392 trạm đo mưa trên toàn lãnh thổ Việt
Nam được sử dụng (Hình 1). Do điều kiện
thu thập dữ liệu thực đo, thời đoạn đánh giá
được lấy từ năm 1980 đến 2006.
Các đặc trưng địa hình như độ cao, độ dốc
và hướng được xác định dựa trên bản đồ số độ
cao có độ phân giải 90m của SRTM
( Nhằm hạn
chế sai số do vị trí trạm đo khơng chính xác,
các trị số độ cao, độ dốc và hướng được xác
727
Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
định bằng cách tính trung bình cho một vùng
nhỏ xung quanh vị trí trạm đo.
2.3. Phương pháp đánh giá
Để đánh giá mức độ chính xác của từng
phương pháp nội suy, bài báo sử dụng kỹ
thuật kiểm tra chéo (cross-validation) đánh
giá sai số nội suy cho từng trạm đo. Đầu tiên,
dữ liệu của một trạm bất kỳ được loại bỏ khỏi
tập dữ liệu, sau đó sử dụng các phương pháp
nội suy kể trên để tính tốn ra lượng mưa tại
trạm đã bị loại bỏ đó. Lặp lại q trình này
cho tồn bộ số trạm đo có trong bộ dữ liệu.
Sự sai khác giữa kết quả tính tốn và thực
đo được mô tả bằng chỉ số MAE (Mean
Absolute Error):
X tt X itd
i 1 i
MAE
n
Nếu lấy hạng 1 tương ứng là 1 điểm cho
đến hạng 5 tương ứng là 5 điểm thì phương
pháp IDEW được coi là phù hợp nhất khi tổng
điểm nhỏ nhất. Phương pháp IDW kém hơn
một chút nhưng có tổng điểm chênh lệch
khơng đáng kể với IDEW. Phương pháp MLR
cho tổng điểm cao nhất thể hiện mức độ phù
hợp kém nhất trong 5 phương pháp nội suy
được nghiên cứu. Phương pháp IDEW cũng
có số lượng trạm đo có mức độ phù hợp cao
nhất với 122 trạm, tuy nhiên số lượng trạm
cho kết quả nội suy IDEW kém nhất cũng
nhiều hơn so với phương pháp IDW. Số lượng
trạm phù hợp với phương pháp MLR nhất
nhiều xấp xỉ với hai phương pháp NN và NNI,
tuy nhiên phương pháp MLR lại có số lượng
trạm ít phù hợp nhất nhiều nhất (chiếm hơn
một nửa số trạm nghiên cứu).
n
trong đó, Xtt và Xtd tương ứng là giá trị mưa
năm tính tốn và mưa năm thực đo (được tính
từ lượng mưa tháng), n là số năm tính tốn.
MAE sẽ khơng bao gồm những năm bị thiếu
số liệu thực đo. Giá trị MAE trung bình tại
từng trạm sẽ được sử dụng để đánh giá sự
phù hợp của từng phương pháp nội suy với
mức độ tốt nhất nếu giá trị trung bình MAE
nhỏ nhất và ngược lại là kém nhất nếu có giá
trị trung bình MAE cao nhất.
3. KẾT QUẢ NGHIÊN CỨU
Giá trị MAE trung bình của từng trạm ứng
với từng phương pháp được sử dụng làm căn
cứ xếp hạng chất lượng nội suy. Kết quả tổng
hợp xếp hạng cho 392 trạm được trình bày ở
Bảng 1 với hạng 1 (H1) là tốt nhất và hạng 5
(H5) là kém nhất.
Bảng 1. Xếp hạng các phương pháp
Phương pháp
H1
H2
H3
H4
H5
IDW
83
165
102
37
5
IDEW
122
126
82
49
13
MLR
53
19
38
56
226
NN
61
27
62
124
118
NNI
73
55
108
126
30
Hình 1. Kết quả đánh giá mức độ
phù hợp nhất của từng phương pháp
nội suy tại từng trạm nghiên cứu
728
Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
Phương pháp tốt nhất cho từng trạm được
thống kê và thể hiện trên Hình 1. Nhìn chung,
kết quả cho thấy khơng có xu thế rõ rệt nào
cho từng phương pháp từ phương pháp ít tốt
nhất (MLR) cho đến phương pháp tốt nhất
(IDEW, IDW). Sự phân bố của các trạm ứng
với từng phương pháp đều trải dải trên toàn
bộ lãnh thổ Việt Nam, từ vùng đồng bằng
cho đến núi cao, ngoại trừ các trạm đo nằm
bên sườn phía tây dãy núi Trường Sơn dường
như phù hợp với các phương pháp IDEW,
IDW hơn. Phương pháp MLR cho kết quả
kém phù hợp ở vùng đồng bằng như đồng
bằng sông Hồng và sông Cửu Long. Điều này
cũng phù hợp với điều kiện số liệu địa hình ở
vùng đồng bằng khi sai số tương đối về độ
cao (dẫn đến sai số về độ dốc, hướng dốc)
của nó thường sẽ kém hơn nhưng khu vực
núi cao.
Hình 2 và 3 là các biểu đồ hộp trình bày về
phân bố độ cao tương ứng với từng phương
pháp cho kết quả tốt nhất và kém nhất tại
từng trạm.
cao độ trung bình hoặc thấp. Phương pháp
IDEW có thể cải thiện được chất lượng nội
suy ở những vị trí có cao độ lớn (> 500m).
Ba phương pháp cịn lại có sự phân bố khá
đồng đều khi ở sự chính xác hoặc khơng
chính xác trong nội suy đều phân bố ở các vị
trí có cao độ từ thấp đến cao.
4. KẾT LUẬN
Kết quả nghiên cứu đánh giá mức độ phù
hợp của 5 phương pháp nội suy mưa năm cho
392 trạm đo mưa trong lãnh thổ Việt Nam
cho thấy nhóm các phương pháp trọng số
khoảng cách và độ cao (IDEW, IDW) là tốt
nhất. Phương pháp tương quan đa biến tuyến
tính với các đặc trưng vị trí, địa hình cho kết
quả kém nhất.Sai số trong việc xác định vị trí
cũng như các trị số đặc trưng mơ tả địa hình
(độ cao, độ dốc, hướng dốc…) cũng có thể là
nguyên nhân dẫn đến sự sai lệch này.Báo cáo
cũng chỉ ra rằng, khơng có nhiều khác biệt rõ
rệt về sự phân bố theo không gian của các
phương pháp phù hợp nhất cho từng trạm.
Điều này thể hiện rằng để xây dựng được bản
đồ đẳng trị mưa hay bộ dữ liệu mưa lưới cho
toàn bộ lãnh thổ Việt Nam thì việc chỉ sử
dụng một số ít phương pháp nội suy sẽ không
phù hợp.
5. TÀI LIỆU THAM KHẢO
Hình 2. Phân bố cao độ (m) ứng với từng
phương pháp nội suy cho kết quả tốt nhất
Hình 3. Phân bố cao độ (m) ứng với từng
phương pháp nội suy cho kết quả kém nhất
Qua hai hình vẽ này, có thể nhận thấy,
phương pháp IDW thích hợp với các vị trí có
[1] R. Sibson, “A brief description of natural
neighbor interpolation,” in Interpolating
Multivariate Data, John Wiley., V. Barnett,
Ed. Chichester: John Wiley, 1981, pp. 21-36.
[2] D.
Shepard,
“A
Two-Dimensional
Interpolation Function for IrregularlySpaced Data,” in ACM National
Conference, 1968, pp. 517-524.
[3] I. Masih, S. Maskey, S. Uhlenbrook, and V.
Smakhtin, “Assessing the Impact of Areal
Precipitation
Input
on
Streamflow
Simulations Using the SWAT Model,”
JAWRA J. Am. Water Resour. Assoc., vol.
47, no. 1, pp. 179-195, Feb. 2011.
729