Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
LỰA CHỌN HÀM PHÂN PHỐI XÁC SUẤT TRONG PHÂN TÍCH
TẦN SUẤT LƯỢNG MƯA LỚN NHẤT THỜI ĐOẠN
Nguyễn Thị Thu Hà1, Ngơ Lê An1 và Hồng Thanh Tùng1
1
Trường Đại học Thủy lợi, email:
1. GIỚI THIỆU CHUNG
Phân tích tần suất lượng mưa lớn nhất thời
đoạn, hay nói cách khác xác định mối quan hệ
giữa lượng mưa lớn nhất thời đoạn tính tốn
tương ứng với chu kỳ lặp lại rất cần thiết trong
thiết kế, xây dựng và quản lý các dự án tài
nguyên nước, cũng như phòng chống những
thiệt hại do lũ gây ra. Thông thường, chu kỳ
lặp lại được lựa chọn vượt quá độ dài của
chuỗi quan trắc, do đó trong thực tế tính tính
tốn, việc xác định các giá trị lượng mưa lớn
nhất thời đoạn tương ứng với các chu kỳ lặp lại
khác nhau thường dựa vào các hàm phân phối
xác suất (gọi tắt là hàm PPXS) phù hợp miêu tả
PPXS của chuỗi lượng mưa đó. Hiện nay trong
thủy văn, tồn tại khá nhiều hàm PPXS dùng
cho mục đích trên. Có thể kể đến một số hàm
PPXS sử dụng phổ biến như phân phối chuẩn
logarit (LN), Gamma (GAM), Gumbel
(GUM), Pearson loại III (P3), Log-Pearsong
loại III (LP3), hàm cực trị tổng qt (GEV)
[1][2]. Tuy nhiên, việc lựa chọn mơ hình PPXS
phù hợp vẫn đang là một thách thức lớn khi nó
chủ yếu dựa vào đặc tính của chuỗi lượng mưa
lớn nhất thời đoạn tại các trạm mưa. Thêm vào
đó, trong Quy phạm tính tốn các đặc trưng
thủy văn thiết kế (QP. TL. C-6-77), khơng có
quy định rõ về hàm PPXS nào là phù hợp cho
các chuỗi lượng mưa lớn nhất thời đoạn, chỉ có
hướng dẫn chung rằng trong tính tốn thủy văn
thường dùng hàm phân bố P3 hoặc đường cong
Gamma 3 tham số hoặc cũng có thể tìm các
hàm PPXS khác nếu có luận chứng thích đáng.
Nếu việc lựa chọn hàm PPXS khơng phù hợp,
có thể dẫn tới kết quả tính tốn thiên lớn hoặc
thiên nhỏ, hậu quả là ảnh hưởng trực tiếp đến
vấn đề an toàn cũng như chi phí lợi ích của các
dự án tài nguyên nước. Mục tiêu của nghiên
cứu này do vậy đề xuất một thủ tục cơ bản
trong việc đánh giá lựa chọn hàm PPXS phù
hợp miêu tả chuỗi lượng mưa lớn nhất thời
đoạn tính toán. Để minh họa thủ tục đề xuất,
bài báo sẽ đánh giá một số mơ hình PPXS
thường dùng nêu ở trên cho các chuỗi lượng
mưa ngày lớn nhất hàng năm của các trạm mưa
thuộc khu vực Tây Nguyên. Hình 1 miêu tả vị
trí các trạm mưa khu vực Tây Nguyên, gồm 38
trạm mưa có chuỗi số liệu tương đối dài (trạm
có chuỗi số liệu ngắn nhất là 30 năm và dài
nhất là 59 năm).
Hình 1. Vị trí trạm mưa khu vực Tây Nguyên
2. PHƯƠNG PHÁP NGHIÊN CỨU
Thục tục lựa chọn ra hàm phân phối xác suất
phù hợp miêu tả chuỗi lượng mưa lớn nhất thời
đoạn tính tốn tn theo các bước sau:
Bước 1: Khớp hàm PPXS lý thuyết với
chuỗi lượng mưa lớn nhất thời đoạn. Việc
khớp các hàm PPXS cho chuỗi lượng mưa
730
Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
lớn nhất thời đoạn chính là đi xác định các
tham số thống kê miêu tả các hàm PPXS đó
sử dụng các phương pháp khác nhau như
phương pháp moments, phương pháp ước
lượng hợp lý cực đại và phương pháp Lmoments. Cho mục đích minh họa, bài báo
sử dụng 6 hàm PPXS thường dùng trong
phân tích tần suất mưa lũ nói chung, gồm
phân phối chuẩn logarit (LN), Gamma
(GAM), Gumbel (GUM), Pearson loại III
(P3), Log-Pearsong loại III (LP3), hàm cực
trị tổng quát (GEV), và sử dụng phương pháp
L-moments để xác định các tham số thống kê
của 6 hàm PPXS trên. Miêu tả chi tiết toán
học cũng như các tham số thống kê của các
hàm xác định theo phương pháp L-moments
có thể tìm thấy trong Naghettini (2017) [3].
Bước 2: Tính tốn giá trị kiểm định thống
kê độ phù hợp (GoF) của hàm PPXS lý
thuyết đã khớp ở Bước 1. Có thể kể đến mốt
số các kiểm định GoF gồm: Chi bình phương
(2), Kolmogorov-Smirnov (KS), AndersonDarling (AD), và Anderson-Darling điều
chỉnh (ADU) trong đó điều chỉnh từ kiểm
định AD để nhấn mạnh nhiều hơn vào độ phù
hợp của hàm PPXS đã khớp tại phần đuôi có
chu kỳ lặp lại lớn. Miêu tả chi tiết tốn học
của 4 loại kiểm định này có thể tìm thấy
trong Naghettini (2017) [3].
Bước 3: Nhận dạng hàm PPXS phù hợp
nhất miêu tả chuỗi lượng mưa lớn nhất thời
đoạn trên cơ sở xếp hạng các giá trị kiểm
định GoF. Với mỗi một loại kiểm định GoF,
các giá trị của nó được sử dụng để xếp hạng
cho tất cả các hàm PPXS đã khớp (6 hàm)
với hạng từ 1 (mơ hình PPXS phù hợp nhất)
tới 6 (mơ hình PPXS ít phù hợp nhất). Bài
báo sử dụng 4 loại kiểm định GoF, do vậy sẽ
có 4 hệ thống xếp hạng. Tổng kết quả xếp
hạng của 4 hệ thống này sẽ cho ra một tổng
điểm xếp hạng cho mỗi một mơ hình PPXS
đã khớp. Mơ hình PPXS đã khớp nào cho kết
quả tổng điểm xếp hạng nhỏ nhất được lựa
chọn là mơ hình phù hợp nhất.
3. KẾT QUẢ NGHIÊN CỨU
Bảng 1 dưới đây trình bày kết quả hàm
PPXS phù hợp nhất trên cơ sở từng loại kiểm
định KS, AD2, AD2U và Chi2, và mô hình
PPXS phù hợp nhất trên cơ sở tổng điểm xếp
hạng từ cả 4 loại kiểm định trên cho tất cả các
trạm mưa khu vực Tây Ngun. Nhìn chung,
có thể thấy các hàm PPXS 3 tham số (GEV,
P3, LP3) được lựa chọn là hàm PPXS phù hợp
nhất so với 3 hàm PPXS 2 tham số còn lại
(LN, GAM, GUM). Trên cơ sở hệ thống xếp
hạng của kiểm định KS, hàm GEV được lựa
chọn nhiều nhất với 13/38 trạm. Đối với kiểm
định AD2, hàm LP3 được lựa chọn nhiều nhất
với 19/38 trạm, trong khi với kiểm đinh ADU,
hàm GEV lại được lựa chọn nhiều nhất với
19/38 trạm. Cuối cùng, đối với kiểm định
Chi2, cả hai hàm GEV và P3 được lựa chọn
nhiều nhất như nhau với 11/38 trạm cho mỗi
trạm. Trên cơ sở tổng điểm xếp hạng từ 4 hệ
thống xếp hạng, hàm LP3 được lựa chọn nhiều
nhất với 15/38 trạm, sau đó đến hàm GEV với
13/38 trạm, tiếp theo là P3 với 9/38 trạm, cuối
cùng là hàm GAM chỉ có 1 trạm duy nhất.
Bảng 1. Kết quả lựa chọn mơ hình
phân phối xác suất phù hợp nhất
Tên Trạm
KS
Pơ Mơ Rê
An Khê
Chư Sê
Đăk Nông
MĐ'Răk
EakMat
Buôn Hồ
Lăk
Đức Xuyên
Cầu 14
Bản Đôn
Buôn Ma
Thuột
Krong Buk
Pleiku
Kon Tum
Kon Plong
Đắk Tô
Sa Thầy
Ea Soup
Bảo Lộc
Đà Lạt
AyunPa
GEV
P3
P3
GEV
LN
LP3
LP3
LP3
P3
LN
LP3
731
Tổng
hạng*
GEV GEV GEV GEV (4)
LP3 LP3 LP3 LP3 (5)
LP3 LP3 LN LP3 (8)
GEV LP3 GEV GEV (5)
GEV GEV LN GEV (7)
LP3 GEV LN LP3 (6)
LP3 LP3 LP3 LP3 (4)
LP3 LP3 LN
P3 (8)
P3 LP3
P3
P3 (6)
LP3 GEV LN LP3 (9)
LP3 GEV LN LP3 (7)
AD ADU Chi2
GEV LP3
LP3
LN
P3
GEV
P3
P3
LP3
GEV
LP3
LP3
GEV
GEV GEV GEV (7)
P3
P3
P3 (4)
GEV GEV GEV (4)
GEV GEV GEV (5)
LP3
P3
LP3 (6)
P3
P3
P3 (6)
LP3 LN LP3 (7)
LP3
P3
LP3 (5)
P3
P3
LP3 (6)
GEV P3 GEV (6)
LP3
P3
GEV
GEV
LP3
P3
LP3
LP3
LP3
GEV
P3
LP3 (6)
Tuyển tập Hội nghị Khoa học thường niên năm 2019. ISBN: 978-604-82-2981-8
Tổng
hạng*
Giang Sơn
P3
P3
P3
LP3
P3 (8)
Đăk Glei
GEV LP3 GEV P3
LP3 (8)
KrongPa
P3
P3
P3
P3
P3 (4)
Chư Prong LN LP3 GEV GEV GEV (7)
Thanh Bình GEV GEV GEV GEV GEV (4)
Liên
LP3 GEV GEV GEV GEV (5)
Khương
Đại Nga
LN LP3 GEV LN LP3 (7)
Đăk Đoa
GEV GEV GEV GEV GEV (4)
Di Linh
GAM LP3 P3 GEV P3 (9)
MangYang GEV LP3 GEV LN LP3 (7)
Trị An
GAM P3 GAM GAM GAM (6)
Đại Ninh
GEV P3
P3
P3
P3 (5)
Đăk Mil
GEV GEV GEV GEV GEV (4)
Lạc Dương LN LP3 GEV LP3 LP3 (6)
Suối Vàng
P3
P3
P3
LP3
P3 (6)
Cheo Reo GEV GEV GEV GAM GEV (7)
* Giá trị trong ngoặc là giá trị tổng điểm xếp hạng
từ 4 hệ thống xếp hạng của 4 loại kiểm định GoF
Tên Trạm
KS
AD ADU Chi2
Tương tự như cột cuối cùng trong Bảng 1,
Hình 2 thể hiển tên mơ hình phân phối xác
suất phù hợp nhất trên cơ sở tổng điểm xếp
hạng từ 4 hệ thống xếp hạng gắn với các trạm
mưa trên bản đồ vị trí các trạm mưa.
4. KẾT LUẬN
Bài báo trình bày một thủ tục cơ bản về
lựa chọn hàm phân phối xác suất phù hợp
trong phân tích tần suất lượng mưa lớn nhất
thời đoạn trên cơ sở các kiểm định thống kê
độ phù hợp của mơ hình. Kết quả của bài báo
có ý nghĩa lớn trong thiết kế và xây dựng các
cơng trình thủy lợi như đê, kè, hay các hệ
thống tiêu thoát nước đô thị… khi cần xác
định mối quan hệ giữa lượng mưa lớn nhất
thời đoạn tính tốn tương ứng với chu kỳ lặp
lại. Bài báo minh họa ứng dụng thủ tục cơ
bản này cho các chuỗi lượng mưa một ngày
lớn nhất tại các trạm mưa khu vực Tây
Nguyên. Kết quả cho thấy, các hàm PPXS 3
tham số GEV, P3 và LP3 được lựa chọn
nhiều nhất để miêu tả PPXS chuỗi lượng mưa
một ngày lớn nhất cho các trạm mưa trên khu
vực. Mặc dù bài báo chỉ minh họa cho các
trạm mưa thuộc khu vực Tây Nguyên với
lượng mưa lớn nhất thời đoạn 1 ngày, thủ tục
về lựa chọn hàm PPXS phù hợp được trình
bày ở đây là tổng quát, và có thể được ứng
dụng cho tất các trạm mưa thuộc bất cứ khu
vực nào, với lượng mưa lớn nhất cho bất kỳ
thời đoạn tính tốn nào (ví dụ 10 phút, 20
phút, 30 phút,… 1 giờ,… 24 giờ,…).
5. TÀI LIỆU THAM KHẢO
Hình 2. Bản đồ trình bày tên mơ hình phân
phối xác suất phù hợp nhất gắn với các trạm
mưa. Tên mơ hình phân phối xác suất tương
ứng với các ký hiệu trình bày trên bản đồ
[1] M. Alam, K. Emura, C. Farnham, and J.
Yuan, “Best-Fit Probability Distributions
and Return Periods for Maximum Monthly
Rainfall in Bangladesh,” Climate, vol. 6,
no. 1, p. 9, 2018.
[2] P. K. Langat, L. Kumar, and R. Koech,
“Identification of the most suitable
probability
distribution
models
for
maximum,
minimum,
and
mean
streamflow,” Water (Switzerland), vol. 11,
no. 4, pp. 1–24, 2019.
[3] M. Naghettini, Fundamentals of Statistical
Hydrology. 2017.
732