The fourth Scientific Conference - SEMREGG 2018
ỨNG DỤNG PHÂN TÍCH THỐNG KÊ VÀ CÔNG NGHỆ GIS
XÁC ĐỊNH VÀ KHOANH VÙNG ĐỒNG NHẤT SỐ LIỆU MƯA
NĂM VÙNG ĐÔNG BẰNG SÔNG CỬU LONG
Phạm Linh Chi1, Phạm Thị Bích Thục2
1
Khoa Khí tượng - Thủy văn, Trường Đại học Tài nguyên và Môi trường TP. HCM
2
Phòng Tài nguyên nước, Viện Địa lý tài nguyên TP. HCM
Email:
TÓM TẮT
Bài báo sử dụng phương pháp phân tích thống kê với kĩ thuật kiểm định Phương sai theo 1 dấu
hiệu [1] cùng sự trợ giúp của hệ thống thông tin địa lý (GIS) trong việc xác định và đánh giá tính
đồng nhất theo khơng và thời gian của dữ liệu mưa khu vực Đồng bằng sông Cửu Long.
Theo đó, dữ liệu mưa được chọn để nghiên cứu là từ năm 1999 - 2015. Kết quả cho thấy, dữ
liệu yếu tố mưa phù hợp với thực tế khách quan, các khu vực mưa xác định bằng phân tích thống kê
tương đối trùng khớp với với quy luật phân bố mưa do hoạt động của hồn lưu gió mùa Tây Nam ở
vùng Đồng bằng sông Cửu Long; đồng thời loại bỏ được sai số trong quá trình quan trắc.
Từ khóa: Phân tích thống kê, GIS, vùng đồng nhất, số liệu mưa năm, Đồng bằng sông Cửu Long.
1. MỞ ĐẦU
Mưa là yếu tố có vai trị rất to lớn đối với sản xuất và đời sống và đây là yếu tố vốn biến động
nên mạng lưới quan trắc yếu tố mưa được chú trọng phát triển và còn phát triển dày hơn trong
tương lai, trong đó có khu vực ĐBSCL, một trong những đồng bằng lớn và phì nhiêu của Việt Nam,
khu vực Đông Nam Á và trên thế giới [4]. Với khối lượng dữ liệu đồ sộ việc đánh giá dữ liệu của
yếu tố mưa là công tác quan trọng nhằm chuẩn hóa dữ liệu theo khơng và thời gian tránh các trường
hợp sai số trong nghiên cứu và tính tốn.
Có nhiều ngun nhân, cả tự nhiên và nhân tạo làm cho tính đồng nhất của chuỗi dữ liệu mưa
bị hạn chế. Tuy nhiên khi phân tích các nhân tố hình thành mưa để chỉ ra sự đồng nhất là chưa đủ,
vì chỉ mới là định tính. Hợp lí hơn cần sử dụng phương pháp thống kê, nó cho phép đánh giá tính
đồng nhất của các chuỗi quan trắc mưa trong dạng định lượng. Phương pháp thống kê còn cho phép
kiểm định tính đồng nhất của chuỗi dữ liệu mưa theo không gian khi cần kết hợp chúng trong một
khu vực địa lí đồng nhất [2].
Bên cạnh đó, kết hợp hệ thống thông tin địa lý GIS để kiểm tra và phân vùng lại kết quả của
phương pháp phân tích thống kê bằng kỹ thuật kiểm định phương sai, một cách trực quan theo
khơng gian là phương án thích hợp để tạo ra nguồn dữ liệu tin cậy làm đầu vào phục vụ các u cầu
tính tốn liên quan đến tài nguyên nước mưa cho khu vực Đồng bằng sông Cửu Long.
2. KHU VỰC NGHIÊN CỨU
Khu vực khảo sát và nghiên cứu được chọn là 102 trạm đo mưa thuộc 13 tỉnh thành phố vùng
Đồng bằng sông Cửu Long (Long An, Tiền Giang, Bến Tre, Vĩnh Long, Trà Vinh, Cần Thơ, Sóc
Trăng, Bạc Liêu, Cà Mau, Kiên Giang, An Giang, Đồng Tháp, Hậu Giang). Trong đó có 58 trạm đo
330
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
mưa nhân dân (nd), 27 trạm Thủy văn (tv) và 17 trạm Khí tượng (kt) được trình bày ở Bảng 1 [5].
Khu vực này mang những đặc điểm chung của khí hậu đồng bằng Nam Bộ, có chế độ khí hậu gió
mùa cận xích đạo với nền nhiệt cao đều quanh năm, lượng mưa lớn phân hoá theo mùa. Một năm có
hai mùa: Mùa mưa bắt đầu từ tháng 5, kết thúc vào tháng 11; Mùa khô bắt đầu từ tháng 12, kết thúc
vào tháng 4 năm sau. Ngoài ra cịn chịu ảnh hưởng của chế độ khí hậu nhiệt đới gió mùa và mang
tính đặc thù của vùng đồng bằng ven biển [4].
Bảng 1.Thống kê các trạm đo mưa và thời gian có số liệu tại các trạm đo mưa ở ĐBSCL.
Trạm
Năm
1
Sông Đốc
1981-2016
tv
54
2
Năm Căn
1960-2016
tv
55
3
Cà Mau
1958-2016
kt
56
4
Cái Nước
1985-2016 nd
57
5
U Minh
1984-2016 nd
NT U Minh
STT
6
Tỉnh
Cà Mau
7
8
Tỉnh
Trạm
Năm
Loại
Bạc Liêu
NT Đơng Hải
1990-2016
nd
Cần Thơ
1985-2016
kt
Rạch Gịi
1988-2016
nd
Ơ Mơn
1989-2016
nd
58
Thốt Nốt
1999-2016
nd
1981-2016 nd
59
Kế Sách
1982-2016
nd
Trần Văn Thời 1982-2016 nd
60
Long Phú
1992-2016
nd
1979-2016 nd
61
Mỹ Tú
1992-2016
nd
Viễn An Đơng 1989-2016 nd
62
Vĩnh Châu
1995-2016
nd
Trần Đề
1989-2016
tv
Thới Bình
9
Loại STT
Cần Thơ
Sóc Trăng
10
Phú Tân
1987-2016 nd
63
11
Đầm Dơi
1984-2016 nd
64
Phụng Hiệp
1977-2016
tv
12
Chợ Lách
1979-2016
tv
65
Đại Ngãi
1977-2016
tv
13
Bình Đại
1978-2016
tv
66
Sóc Trăng
1974-2016
kt
14
Bến Trại
1979-2016
tv
67
Mỹ Thuận
1978-2016
tv
Ba Tri
1978-2016
kt
68
Tam Bình
1989-2016
nd
Giồng Trơm
1979-2016 nd
69
Trà Ơn
1990-2016
nd
17
Huơng Mỹ
1979-2016 nd
70
Vĩnh Long
1992-2016
kt
18
Mỏ Cày
1979-2016 nd
71
Tân Châu
1915-2016
tv
19
Bến Tre
1912-2016
kt
72
Châu Đốc
1911-2016
kt
20
Tân An
1973-2016
kt
73
Long Xun
1913-2016
tv
21
Kiến Bình
1978-2016
tv
74
Chợ Mới
1915-2016
tv
22
Mộc Hóa
1959-2016
kt
75
Vàm Nao
1980-2016
tv
23
Tun Nhơn
1981-2016
tv
76
Xuân Tô
1992-2016
tv
Bến Lức
1978-2016
tv
77
Tri Tôn
1930-2016
tv
15
16
24
Bến Tre
Long An
Vĩnh Long
An Giang
25
Cần Đước
1978-2016 nd
78
Hội An
1984-2016
nd
26
Duc Hoa
1981-2016 nd
79
Núi Sập
1980-2016
nd
27
Tân Trụ
1978-2016 nd
80
Vĩnh T Trung
1979-2016
nd
28
Vĩnh Hưng
1984-2016 nd
81
Thới Sơn
1979-2016
nd
331
The fourth Scientific Conference - SEMREGG 2018
STT
Tỉnh
Trạm
Năm
Trạm
Năm
Loại
29
Hậu Giang
Vị Thanh
1977-2016
kt
82
Cao Lãnh
1978-2016
kt
30
Mỹ Tho
1910-2016
kt
83
Trường Xn
1984-2016
tv
31
Hịa Bình
1978-2016
tv
84
Châu Thành
1977-2016
nd
32
Vàm Kênh
1984-2016
tv
85
Hồng Ngự
1985-2016
nd
33
Long Định
1957-2016
tv
86
Mỹ Thọ
1988-2016
nd
34
Cai Lậy
1976-2016
tv
87
Sa Đéc
1910-2016
nd
35
Cái Bè
1984-2016 nd
88
Thanh Bình
1984-2016
nd
Chợ Gạo
1978-2016 nd
89
Lai Vung
1977-2016
nd
Châu Thành
1978-2016 nd
90
Rạch Giá
1910-2016
kt
Gị Cơng Đông 1910-2016 nd
91
Xẻo Rô
1984-2016
tv
36 Tiền Giang
37
38
Loại STT
Tỉnh
Đồng Tháp
39
An Hữu
1993-2016 nd
92
Phú Quốc
1957-2016
kt
40
Hậu Mỹ Bắc
1978-2016 nd
93
An Biên
1978-2016
nd
41
Phú Mỹ
1991-2016 nd
94
Gò Quao
1978-2016
nd
42
Mỹ Phước
1978-2016 nd
95
Giồng Riềng
1978-2016
nd
43
Trà Vinh
1910-2016
tv
96
Hà Tiên
1911-2016
nd
44
Càng Long
1978-2016
kt
97
Kiên Lương
1962-2016
nd
Bến Giá
1989-2016 nd
98
Hịn Đất (Tri Tơn) 1978-2015
nd
46
Tiểu Cần
1979-2016 nd
99
Vĩnh Hòa Hưng
1981-2016
nd
47
Trà Cú
1977-2016 nd
100
Vĩnh Thuận
1978-2016
nd
48
Phước Long
1978-2016
tv
101
An Minh
1984-2016
nd
49
Gành Hào
1978-2016
tv
102
Thổ Chu
1995-2016
kt
Bạc Liêu
1984-2016
kt
Giá Rai
1984-2016 nd
Ngăn Dừa
1987-2016 nd
45
50
51
52
53
Trà Vinh
Bạc Liêu
Kiên Giang
Long Điền Tân 1992-2016 nd
3. DỮ LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU
3.1. Dữ liệu nghiên cứu
Dữ liệu nghiên cứu trong báo cáo là số liệu mưa bình quân tháng tại các trạm đo mưa do Đài
khí tượng thủy văn Nam Bộ cung cấp. Thời gian có số liệu tại các trạm được trình bày ở Bảng 1.
Các điểm thu kết quả quan trắc được biểu diễn qua bản đồ Hình 1:
332
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Hình 1. Vị trí các điểm thu kết quả quan trắc mưa.
3.2. Phƣơng pháp nghiên cứu
3.2.1. Phương pháp Modified Z - Scores [3]
Sử dụng phương pháp Modified Z - Scores [3] để phát hiện những giá trị đo đạc bất thường
(quá lớn hoặc quá nhỏ) trong chuỗi dữ liệu thơ.
Các bước thực hiện:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |}, ̅ là trung bình của chuỗi số
B2: Tính độ khác biệt giữa các biến số:
Mi = 0,6745
̅
B3: Nếu | Mi | > 3,5 thì xi là điểm bất thường.
3.2.2. Phương pháp thử dần
Tiến hành đánh giá tính đồng nhất cho các trạm trong 1 tỉnh, sau đó đánh giá tính đồng nhất
của chuỗi số liệu của các tỉnh lân cận dựa vào giá trị bình quân của các giá trị bình quân mưa nhiều
năm của các trạm (Xtbtb).
3.2.3. Phương pháp phân tích phương sai theo 1 dấu hiệu [1]
3.2.3.1. Một số khái niệm liên quan
a. Giả thiết không (Null Hypothesis - Ho)
Giả thiết Ho là giả thiết ban đầu đưa ra để kiểm định. Thường giả thiết thiên về sự công nhận.
333
The fourth Scientific Conference - SEMREGG 2018
b. Mức ý nghĩa ( )
Mức ý nghĩa là xác suất khi loại bỏ khơng chính xác giả thiết Ho, hay cịn gọi là xác suất sai
lầm loại 1. Ngược lại với mức ý nghĩa là mức tin cậy: = 1 - Giá trị càng nhỏ thì mức tin
cậy càng lớn.
c. Miền tới hạn - Biên tới hạn
Miền tới hạn: Là miền tập hợp các giá trị xác định theo chỉ tiêu kiểm định và mức ý nghĩa, nếu
giá trị tính tốn rơi vào miền này thì giả thiết Ho bị bác bỏ.
Biên tới hạn (Fth): Là ngưỡng giá trị cho phép của Ftt để chấp nhận giả thiết Ho.
3.2.3.2. Quy trình phân tích
a. Quy trình phân tích
Chọn chuỗi dữ liệu mưa năm từ năm 1999 - 2015 của các trạm đo mưa ở ĐBSCL làm chuỗi dữ
liệu nghiên cứu, các bước phân tích kiểm định tính đồng nhất của chuỗi dữ liệu được tiến hành theo
từng bước (B) sau:
- B1: Xác lập giả thiết Ho
Chọn giá trị trung bình (Xtbtb) của các giá trị trung bình mưa (Xtb) các trạm từ năm 19992015 làm giả thiết là Ho, giả thiết xu thế hội tụ của chuỗi số tiến gần về Xtbtb, khẳng định rằng
khơng có sự khác biệt giữa các giá trị Xtb với giá trị Xtbtb.
- B2: Chọn mức ý nghĩa
ờng chọn 1, 2, 5 và 10 %) [2]
Chọn
0,05 = 5 %. Mức ý nghĩa này cho độ tin cậy là 95 %, có nghĩa là đang chấp nhận sai
sót 5 % khi loại bỏ khơng chính xác giả thiết Ho trường hợp Ho đúng. Ngồi ra, mức ý nghĩa cịn
cho thấy rằng việc chấp nhận có 5 % số liệu Xtb trong chuỗi có sự sai khác với giả thiết Ho (Xtbtb).
- B3: Xác định miền tới hạn và biên tới hạn dựa vào dạng phân bố của chỉ tiêu và mức ý
nghĩa
Sử dụng bảng tra Fisher [2] và mức ý nghĩa
đã chọn để xác định Fth.
- B4: Tính chỉ tiêu thống kê theo tài liệu quan trắc (Ftt) [1]
F =
tt
𝒏 𝒌 ∑𝒊𝒊
𝒌 𝟏
𝒌
̅ ̅ 𝟐
𝟏 𝒏𝒊 𝑿𝒊 𝑿
𝒋
𝒏𝒊
̅𝒊 𝟐
∑𝒊𝒊 𝒌𝟏 ∑𝒋 𝟏 𝑿𝒊𝒋 𝑿
n-k, k-1: các bậc tự do
k: tổng số lớp, lưu vực
ni: số năm quan trắc trong mỗi lớp i
̅
̅ : Tổng bình phương giữa các lớp
∑
∑
∑
̅
: Tổng bình phương nội bộ các lớp
- B5: So sánh Ftt với biên tới hạn (Fth) và kết luận chấp nhận hay loại bỏ giả thiết Ho
Nếu Ftt < Fth thì chấp nhận giả thiết Ho và ngược lại bác bỏ giả thiết Ho.
b. Quy trình đánh giá tính đồng nhất của chuỗi số liệu mưa năm (1999 - 2015) của một số trạm
ở ĐBSCL (thuộc nhóm đồng nhất thứ 4)
(Các trạm cịn lại được tiến hành phân tích tương tự và kết quả được thống kê ở mục 4.1)
334
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Bảng 2. Chuỗi số liệu mưa năm (1999 - 2015) của một số trạm ở ĐBSCL
(thuộc nhóm đồng nhất thứ 4).
Kiên Giang
Cà Mau
j
i
1
2
3
4
5
6
7
8
9
10
11
STT
Trạm
Năm
Xẻo
Rơ
An
Minh
An
Biên
Sơng
Đốc
Năm
Căn
Cà
Mau
U
Minh
NT
U
Minh
Trần
Văn
Thời
Thới
Bình
Viễn
An
Đơng
1
1999
3074
3177
3344
2260
2964 3549
3067
3258
3306 2837
2987
2
2000
2941
2274
2223
2499
2880 2630
3006
2871
2520 2612
2933
3
2001
2242
2031
3014
2372
2637 2393
2471
2032
1542 2442
2860
4
2002
1787
2233
1950
2221
2215 2303
2401
2041
2054 2335
2331
5
2003
2377
2030
2280
2026
2377 2488
2420
2450
2214 2117
2258
6
2004
1743
2444
2132
1935
1781 1932
2535
2120
2018 2285
1653
7
2005
1961
2377
1638
2047
2769 2204
2060
2447
2053 2171
2093
8
2006
2528
3097
1475
2389
2213 2345
2533
2282
2375 2115
1707
9
2007
2768
2997
2634
2508
2613 2611
3291
2929
2938 2871
3385
10
2008
2181
2603
2376
3064
2904 2602
2740
2518
2797 2603
2417
11
2009
2312
2466
2294
2446
2314 2244
2456
2485
2168 2406
1844
12
2010
2236
2351
1614
2422
2811 1987
2553
2515
2192 2335
2136
13
2011
2204
2101
2057
2186
2324 2446
2434
2157
2317 2086
1800
14
2012
2154
2499
2321
2239
2243 2154
2768
2862
2119 2387
1881
15
2013
2621
2347
3113
2403
2250 1941
2410
2231
2114 2466
2060
16
2014
2498
2020
2088
2389
1935 2066
1883
3001
2400 2017
2270
17
2015
2146
2189
1399
2097
2228 2297
1927
2251
2291 2058
2114
tb
2340
2426
2233
2324
2439 2364
2527
2497
2319 2361
2278
tb.tb
2373
B1: Gọi Ho là giá trị bình quân mưa nhiều năm (1999 - 2015) của 11 trạm trong Bảng 2 Xtb.tb
= 2373.
B2: Chọn mức ý nghĩa
= 0,05.
B3: Xác định Fth dựa vào bảng tra Fisher và mức ý nghĩa
B4: Xác định Ftt dựa vào số liệu quan trắc:
- Đầu tiên, tính Tổng bình phương giữa các lớp:
∑𝒊𝒊
𝒊
- Sau đó, xác định Tổng bình phương nội bộ các lớp: ∑𝒊
= 0,05. Thu được: Fth = 3,97.
𝒌
𝟏 𝒏𝒊
̅𝒊
𝑿
𝒌 ∑𝒋 𝒏𝒊
𝟏 𝒋 𝟏
̅
𝑿
𝑿𝒊𝒋
𝟐
= 1387489
̅𝒊
𝑿
𝟐
= 26569863
335
The fourth Scientific Conference - SEMREGG 2018
̅
∑
- Cuối cùng, thu được: Ftt =
∑
∑
̅
̅
= 0,92
B5: Nhận thấy Ftt < Fth nên giả thiết Ho được chấp nhận, chuỗi số liệu đồng nhất.
3.2.4. Phương pháp GIS (Geographic Information S stem)
3.2.4.1. Xây dựng dữ liệu không gian
Sử dụng phần mềm Mapinfo xây dựng:
* Nhóm lớp nền chung: Lớp hành chính, lớp vị trí (các trạm đo mưa), lớp thủy văn.
* Nhóm chuyên đề: Lớp đường đồng mức lượng mưa bình quân năm của các trạm đo mưa
trong khu vực nghiên cứu.
3.2.4.2. Xây dựng dữ liệu thuộc tính
Với mỗi lớp dữ liệu khơng gian trong Mapinfo sẽ có một bảng thuộc tính đi kèm. Từ đó tiến
hành xây dựng dữ liệu thuộc tính cho các trạm đo mưa, phục vụ cho công việc vẽ đường đồng mức
sau này.
4. KẾT QUẢ VÀ THẢO LUẬN
4.1. Kết quả đánh giá tính đồng nhất và phân vùng đồng nhất
Sau khi kiểm định tính đồng nhất chuỗi dữ liệu mưa bình quân nhiều năm các trạm tại ĐBSCL
kết quả thu được 6 nhóm vùng đồng nhất, các bước thực hiện phân tích dữ liệu theo phương pháp
Phân tích phương sai theo 1 dấu hiệu được tóm tắt và thể hiện trong 6 bảng tương ứng với 6 nhóm
dưới đây:
Bảng 1. Nhóm đồng nhất số liệu mưa thứ 1.
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
336
Tên trạm
Cần Thơ
Rạch Gịi
Ơ Mơn
Thốt Nốt
Mỹ Thuận
Tam Bình
Trà Ơn
Vĩnh Long
Kế Sách
Long Phú
Mỹ Tú
Vĩnh Châu
Trần Đề
Phụng Hiệp
Đại Ngãi
Chợ Lách
Bình Đại
Bến Trai
Xtb
1548
1678
1559
1457
1500
1480
1767
1499
1502
1691
1634
1639
1596
1732
1771
1477
1494
1547
STT
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
Tên trạm
Ba Tri
Hương Mỹ
Bến Tre
Trà Vinh
Càng Long
Bến Giá
Tiểu Cần
Trà Cú
Hịa Bình
Vàm Kênh
Long Định
Cai Lậy
Gị Cơng Đơng
Mỹ Phước
Hậu Mỹ Bắc
Tân An
Kiến Bình
Mộc Hóa
Tun Nhơn
Bến Lức
Xtb
1561
1637
1529
1455
1646
1631
1495
1625
1448
1511
1514
1457
1498
1411
1686
1561
1502
1651
1466
1669
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
STT
39
40
41
42
43
44
45
B1
B2
B3
B4
Tên trạm
Cần Đước
Đức Hoà
Vĩnh Hưng
Cái Bè
Chợ Gạo
Phú Mỹ
Mỹ Tho
Ho
B5
Kết luận
Fth
Ftt
Xtb
1469
1561
1466
1447
1513
1527
1523
1560
5%
1.49
0.9807
Ftt < Fth
Đồng nhất
Bảng 2. Nhóm đồng nhất số liệu mưa thứ 2.
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
B1
B2
B3
B4
Tên trạm
Tân châu
Châu đốc
Long xuyên
Chợ Mới
Vàm Nao
Xuân Tô
Tri Tôn
Hội An
Núi Sập
Vĩnh T Trung
Thới Sơn
Cao Lãnh
Trường Xuân
Châu Thành
Hồng Ngự
Mỹ Thọ
Sa Đéc
Thanh Bình
Lai Vung
Ho
B5
Kết luận
Fth
Ftt
Xtb
1301
1310
1537
1426
1403
1427
1291
1346
1395
1317
1443
1554
1506
1310
1370
1509
1486
1391
1413
1407
5%
1.94
1.40
Ftt < Fth
Đồng nhất
Bảng 3. Nhóm đồng nhất số liệu mưa thứ 3.
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
B1
B2
B3
B4
Tên trạm
Rạch Giá
Gò Quao
Hà Tiên
Kiên Lương
Vĩnh Hịa Hưng
Vĩnh Thuận
Giồng Riêng
Hịn Đất (Tri Tơn)
Cái Nước
Đầm Dơi
Vị Thanh
Phước Long
Gành Hào
Bạc Liêu
Giá Rai
Ngan Dừa
Sóc Trăng
Ho
B5
Kết luận
Fth
Ftt
Xtb
2194
2040
2081
2178
1965
2117
1918
1915
2220
1889
1971
2073
1948
2067
2070
1941
1915
2030
5%
2.03
1.64
Ftt < Fth
Đồng nhất
Bảng 4. Nhóm đồng nhất số liệu mưa thứ 4.
STT
1
2
3
4
5
6
7
8
9
10
11
B1
B2
B3
B4
Tên trạm
Xẻo Rô
An Minh
An Biên
Sông Đốc
Năm Căn
Cà Mau
U Minh
NT U Minh
Trần Văn Thời
Thới Bình
Viễn An Đơng
Ho
B5
Kết luận
Fth
Ftt
Xtb
2340
2426
2233
2324
2439
2364
2527
2497
2319
2361
2278
2373
5%
3.97
0.92
Ftt < Fth
Đồng nhất
337
The fourth Scientific Conference - SEMREGG 2018
Bảng 5. Nhóm đồng nhất số liệu mưa thứ 5.
STT
Tên trạm
Xtb
1
NT.Đông Hải
1790
2
Long Điền Tân
1768
B1
Ho
1779
B2
5%
B3
Fth
250.35
B4
Ftt
0.05
B5
Kết luận
Ftt < Fth
Đồng nhất
Bảng 6. Nhóm đồng nhất số liệu mưa thứ 6.
STT
1
2
3
4
B1
B2
B3
B4
Tên trạm
Tân Trụ
Châu Thành
An Hữu
Mỏ Cày
Ho
B5
Kết luận
Fth
Ftt
Xtb
1311
1345
1273
1317
1310
5%
19.47
0.37
Ftt < Fth
Đồng nhất
Trong quá trình kiểm định, trong chuỗi dữ liệu mưa bình qn nhiều năm (1999 - 2015) có
xuất hiện một số giá trị bất thường nên cần tiến hành loại bỏ các giá trị đó ra khỏi chuỗi để đảm bảo
tính đồng nhất cho chuỗi dữ liệu. Sử dụng phương pháp Modified Z - Scores tìm được các trạm cần
được loại bỏ ra khỏi chuỗi kiểm định gồm: Giồng Trôm, Phú Tân.
+ Giồng Trôm: Trạm Giồng Trôm thuộc tỉnh Bến Tre, có lượng mưa bình qn nhiều năm
(1999 - 2015) là Xtb = 1873 trong khi các trạm lân cận Xtb chỉ dao động từ 1400 đến trên 1600. Bởi
vì sự sai khác quá lớn của lượng mưa bình quân nhiều năm của trạm Giồng Trôm so với các trạm
lân cận nên cần loại bỏ trạm Giồng Trôm để đảm bảo tính đồng nhất của chuỗi dữ liệu.
Chuỗi dữ liệu tính tốn gồm lượng mưa bình qn nhiều năm (1999 - 2015) của 25 trạm lân
cận trạm Phú Tân, bao gồm: Giồng Trôm (1873 mm), Chợ Lách (1477 mm), Bình Đại (1494 mm),
Bến Trại (1547 mm), Ba Tri (1561 mm), Hương Mỹ (1637 mm), Bến Tre (1529 mm), Hòa Bình
(1448 mm) vàm Kênh (1511 mm), Long Định (1514 mm), Cai Lậy (1457 mm), Gị Cơng Đơng
(1498 mm), Mỹ Phước (1411 mm), Hậu Mỹ Bắc (1686 mm), Cái Bè (1447 mm), Chợ Gạo (1513
mm), Phú Mỹ (1527 mm), Tân An (1561 mm), Kiến Bình (1502 mm), Mộc Hóa (1651 mm), Tuyên
Nhơn (1466 mm), Bến Lức (1669 mm), Cần Đước (1469 mm), Đức Hịa (1561 mm), Vĩnh Hưng
(1466 mm).
Kết quả tính tốn theo phương pháp Modified Z - Scores được trình bày theo các bước
như sau:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |} = 62 (mm), ̅ = 1539 (mm) là trung bình của chuỗi số.
B2: Tính độ khác biệt giữa các biến số:
Mi = 0,6745
̅
B3: Nhận thấy tính tốn cho trạm Giồng Trơm có | Mi | = 3,51 > 3,5, kết luận rằng giá trị lượng
mưa bình quân nhiều năm tại trạm Giồng Trôm là giá trị bất thường cần loại bỏ khỏi chuỗi
tính tốn.
+ Phú Tân: Trạm Phú Tân là trạm nằm ở tỉnh Cà Mau, có lượng mưa bình quân nhiều năm
(1999 - 2015) là Xtb = 1535 trong khi các trạm lân cận có Xtb>1800. Giá trị Xtb của trạm Phú Tân
quá nhỏ so với toàn bộ Xtb của các trạm lân cận nó, cho nên cần tiến hành loại bỏ trạm Phú Tân ra
khỏi chuỗi dữ liệu để đảm bảo tính đồng nhất cho chuỗi.
338
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Chuỗi dữ liệu tính tốn gồm lượng mưa bình quân nhiều năm (1999 - 2015) của 18 trạm lân
cận trạm Phú Tân, bao gồm: Rạch Giá (2194 mm), Gò Quao (2040 mm), Hà Tiên (2081 mm), Kiên
Lương (2178 mm), Vĩnh Hòa Hưng (1965 mm), Vĩnh Thuận (2117 mm), Giồng Riêng (1918 mm),
Hịn Đất (Tri Tơn) (1915 mm), Cái Nước (2220 mm), Đầm Dơi (1889 mm), Phú Tân (1536mm), Vị
Thanh (1971 mm), Phước Long (2073 mm), Gành Hào (1948 mm), Bạc Liêu (2067 mm), Giá Rai
(2070 mm), Ngan Dừa (1941 mm), Sóc Trăng (1915 mm). Kết quả tính tốn theo phương pháp
Modified Z - Scores được trình bày theo các bước như sau:
B1: Tìm trung vị của độ lệch tuyệt đối (MAD)
MAD = median {|xi − ̅ |} = 81 (mm), ̅ = 2002 (mm) là trung bình của chuỗi số.
B2: Tính độ khác biệt giữa các biến số:
Mi = 0.6745
̅
B3: Nhận thấy tính tốn cho trạm Phú Tân có| Mi | = 3,71 > 3,5, kết luận rằng giá trị lượng
mưa bình quân nhiều năm tại trạm Phú Tân là giá trị bất thường cần loại bỏ khỏi chuỗi tính tốn.
- Ngồi ra, đối với Thổ Chu, Phú Quốc là 2 trạm đảo có đặc điểm mưa khác với các trạm trong
đất liền nên không tiến hành phân vùng chung với các trạm đất liền.
4.2. Kết quả sử dụng phần mềm Mapinfo thể hiện vùng đồng nhất trên bản đồ
Nhằm kiểm tra lại tính chính xác của kết quả kiểm định bằng phương pháp thống kê, tiến hành
khoanh vùng các nhóm điểm đồng nhất với nhau trên Mapinfo và thành lập bản đồ đường đồng mức
lượng mưa bình quân nhiều năm các trạm đo mưa tại ĐBSCL. Các kết quả trên Mapinfo được thể
hiện trong Hình 2. và Hình 3.
Hình 2. Khoanh vùng đồng nhất lượng mưa bình quân nhiều năm các trạm ở ĐBSCL
(1999 - 2015).
339
The fourth Scientific Conference - SEMREGG 2018
Hình 3. Biểu đồ đường đồng mức lượng mưa bình quân nhiều năm các trạm ở ĐBSCL
(1999 - 2015).
Hình 2 là hình thể hiện 6 nhóm vùng đồng nhất theo kết quả kiểm định. Các nhóm đồng nhất
có Xtbtb tăng dần theo hướng từ Biển Tây sang Biển Đơng (nhóm 4 - nhóm 3 - nhóm 5 - nhóm 2 nhóm 1 - nhóm 6).
Hình 3 là Biểu đồ đường đồng mức lượng mưa bình quân nhiều năm các trạm ở ĐBSCL (19992015) cho thấy rằng lượng mưa ở ĐBSCL tăng dần theo không gian hướng từ Biển Tây sang Biển
Đông.
5. KẾT LUẬN
Kết quả kiểm định tính đồng nhất bằng phương pháp phân tích phương sai theo 1 dấu hiệu
phân chia các trạm đo mưa ở ĐBSCL thành 6 vùng đồng nhất về số liệu mưa bình quân nhiều năm
(1999-2015).
Bằng việc sử dụng phương pháp Modified Z - Scores đã phát hiện ra có 2 trạm không phù hợp
và cần được loại bỏ ra khỏi chuỗi kiểm định là trạm Giồng Trôm và Phú Tân.
Hiệu quả của việc sử dụng GIS xây dựng Biểu đồ đường đồng mức lượng mưa bình quân
nhiều năm các trạm ở ĐBSCL (1999-2015), cho hình ảnh trực quan về quy luật phân bố mưa tại
ĐBSCL.
Đối chiếu kết quả kiểm định tính đồng nhất và biểu đồ đường đồng mức lượng mưa bình quân
ĐBSCL khá trùng khớp, thấy rằng lượng mưa ở ĐBSCL chia làm 3 khu vực rõ rệt và giảm dần theo
không gian hướng từ Biển Tây sang Biển Đơng đúng với điều kiện hoạt động của gió mùa Tây
Nam, ngun nhân chính hình thành mưa ở khu vực này.
340
Hội nghị Khoa học Công nghệ lần thứ 4 - SEMREGG 2018
Kết quả đã đáp ứng được yêu cầu chuẩn hóa dữ liệu theo khơng và thời gian nhằm tránh các
trường hợp sai số trong nghiên cứu và tính tốn liên quan đến dữ liệu mưa ở ĐBSCL về sau.
TÀI LIỆU THAM KHẢO
1. Ngơ Đình Tuấn - Tập Bài giảng Phân tích thống kê trong thủy văn. Nxb. Nơng nghiệp, 1998.
2. Nguyễn Hữu Khải - Phân tích thống kê trong thủy văn. Giáo trình ĐHKHTN, 2008.
3. How to Detect and Handle Outlier - Boris Iglewicz, David Caster Hoaglin. ASQC Quality
Press, 1993.
4. Web Hệ thống thông tin địa lý - .
5. Đài Khí tượng - thủy văn Khu vực Nam Bộ - Số liệu khí tượng.
APPLY STATISTICAL ANALYSIS AND GIS TO IDENTIFY DATA CONSOLIDATION
OF RAINFALL IN MEKONG DELTA
Pham Linh Chi1, Pham Thi Bich Thuc2
1
Department Hydro-Meteorology, Ho Chi Minh City University of Natural resources
and Environment
2
Department Water Resources, Ho Chi Minh Institute of Resources Geography
Email:
ABSTRACT
The paper introduced one-way analysis of variance, statistical methods of analysis and
geographic information system (GIS) to identify and delineate the data consolidation of the average
yearly rainfall data for many years in Mekong Delta. According to the rain data were collected in
years 1999 to 2015. The results achieved using statistical methods of analysis and GIS accord with
objective reality, with 6 areas of rainfall data consolidated and have a good agreement with Southest
monsoon activity in Mekong Delta.
Keywords: Statistical methods of analysis, uniform area, GIS, rainfall data, Mekong Delta.
341