Tải bản đầy đủ (.pdf) (66 trang)

thử nghiệm phương pháp lọc kalman tổ hợp cho mô hình wrf để dự báo mưa lớn miền trung việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.29 MB, 66 trang )

1

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN



NGUYỄN ĐỨC PHƢƠNG



THỬ NGHIỆM PHƢƠNG PHÁP LỌC KALMAN
TỔ HỢP CHO MÔ HÌNH WRF ĐỂ DỰ BÁO MƢA LỚN
MIỀN TRUNG VIỆT NAM


Chuyên ngành : Khí tƣợng và Khí hậu học
Mã số : 60.44.87

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƢỜI HDKH: TS Kiều Quốc Chánh




HÀ NỘI - 2012
3
MỤC LỤC

DANH MỤC CÁC KÝ HIỆU VIẾT TẮT


5
DANH MỤC CÁC BẢNG
6
DANH MỤC CÁC HÌNH VẼ
7
MỞ ĐẦU
8
CHƢƠNG I. TỔNG QUAN
10
1.1 Tổng quan về dự báo mƣa lớn
10
1.2 Tổng quan về đồng hóa số liệu
13
CHƢƠNG II. CƠ SỞ LÝ THUYẾT VỀ ĐỒNG HÓA SỐ LIỆU VÀ
MÔ HÌNH DỰ BÁO
15
2.1 Cơ sở lý thuyết về đồng hóa số liệu
15
2.1.1. Phương pháp nội suy tối ưu (OI)
16
2.1.2 Phương pháp lọc Kalman
22
2.1.3 Phương pháp lọc Kalman tổ hợp
25
2.2 Tổng quan về mô hình dự báo (WRF)
34
2.3 Các bƣớc thao tác của mô hình WRF
34
2.4 Các bƣớc chạy mô hình WRF sử dụng phƣơng pháp đồng hóa số
liệu

35
CHƢƠNG III. KẾT QUẢ DỰ BÁO THỬ NGHIỆM
37
3.1 Mô tả thí nghiệm
37

3.1.1 Miền tính và cấu hình mô hình
37

3.1.2 Nguồn số liệu
37

3.1.3 Mô tả thí nghiệm
40
3.2 Kết quả và nhận xét
42

3.2.1 Kết quả dự báo tham chiếu
42

3.2.2 Kết quả dự báo với tập số liệu cao không tại Việt Nam
49
3.3 Đánh giá khả năng dự báo của mô hình
57
4

3.3.1 Đánh giá khả năng dự báo của mô hình khi đồng hóa số
liệu cao không khu vực châu Á
59


3.3.2 Đánh giá khả năng dự báo của mô hình khi đồng hóa số
liệu cao không Việt Nam
60

3.3.3 So sánh khả năng dự báo của mô hình khi đồng hóa số liệu
cao không khu vực Châu Á và khi đồng hóa số liệu cao không
Việt Nam
62
KẾT LUẬN
64
TÀI LIỆU THAM KHẢO
65


5
DANH MỤC KÝ HIỆU VIẾT TẮT
NCEP
Trung tâm quốc gia dự báo môi trƣờng Hoa Kỳ
A
Ma trận sai sô hiệp biến phân tích
A
Vector sai số hiệp biến phân tích
B
Ma trận sai số hiệp biến nền
B
Vector sai số hiệp biến nền
CTL(Control)
Kết quả dự báo từ mô hình WRF
DM
Miền lƣới

EKF
Lọc Kalman tổ hợp
H
Toán tử ma trận
H
Toán tử quan trắc tuyến tính
KF
Lọc Kalman
L
Mô hình tiếp tuyến
LETKF
Bộ lọc Kalman tổ hợp địa phƣơng
M
Đại diện cho mô hình dự báo
M
Mô hình phi tuyến
Mem
Thành phần tổ hợp
n
Kích thƣớc của trạng thái mô hình
OI
Nội suy tối ƣu
p
Kích thƣớc của vectơ quan trắc
P
a

Ma trận sai số hiệp biến phân tích
P
b


Ma trận sai số hiệp biến nền
P
f

Ma trận sai số hiệp biến nền (hay dự báo)
P
o

Ma trận sai số hiệp biến quan trắc
Q
Ma trận sai số hiệp biến mô hình
R
Ma trận sai số hiệp biến quan trắc
R
Vector sai số hiệp biến quan trắc
W
Ma trận trọng số
WRF
Weather and Research Forecasting
x
a

Trạng thái mô hình phân tích
x
b

Trạng thái mô hình nền
x
t


Trạng thái mô hình thực
y
0

Vectơ quan trắc
ε
b
, ε
m

Sai số nền, sai số mô hình
Z
Thời gian Greenwich, ví dụ: 1200Z hay 1200 UTC
6
DANH MỤC CÁC BẢNG

Bảng 3.1: Số liệu mưa ngày 16 một số trạm Khu vực miền Trung
36
Bảng 3.2: Số liệu mưa các trạm khu vực miền Trung
37
Bảng 3.3: Bảng cấp mưa và dạng mưa
54
Bảng 3.4: Bảng so sánh phân loại dự báo khi đồng hóa số liệu cao không khu
vực Châu Á
45
Bảng 3.5: Bảng so sánh các chỉ số đánh giá dự báo khi đồng hóa số liệu cao
không khu vực Châu Á
56
Bảng 3.6: Bảng so sánh phân loại dự báo khi đồng hóa số liệu cao không Việt

Nam
57
Bảng 3.7: Bảng so sánh các chỉ số đánh giá dự báo khi đồng hóa số liệu cao
không Việt Nam
57
Bảng 3.8: Bảng so sánh phân loại dự báo khi đồng hóa số liệu cao không khu
vực Châu Á và Việt Nam
58
Bảng 3.9: Bảng so sánh các chỉ số đánh giá dự báo khi đồng hóa số liệu cao
không khu vực Châu Á và Việt Nam
59
7
DANH MỤC CÁC HÌNH VẼ

Hình 2.1: Sơ đồ biểu diễn sự phân bố giữa điểm lưới trạm quan trắc với phân
bố không đồng đều
13
Hình 2.2: Minh họa hai bước chính của bộ lọc Kalman
21
Hình 2.3: Sơ đồ hệ thống của mô hình WRF
30
Hình 2.4: Sơ đồ chạy mô hình WRF
31
Hình 2.5: Minh họa sơ đồ hệ thống dự báo tổ hợp WRF

32
Hình 3.1: Miền tính và lưới lồng của mô hình
33
Hình 3.2: Miền lưới tính mô hình và vị trí một số trạm quan trắc cao không
34

Hình 3.3: Mạng lưới trạm Thám không vô tuyến tại Việt Nam
35
Hình 3.4: Bản đồ hình thế thời tiết lúc 7 giờ ngày 15 và 16/10/2010
37
Hình 3.5: Kết quả dự báo lúc 12Z ngày 14/10/2010
39
Hình 3.6: Kết quả dự báo lúc 12Z ngày 15/10/2010
40
Hình 3.7: Kết quả dự báo lúc 12Z ngày 16/10/2010
41
Hình 3.8: So sánh lượng mưa từ kết quả dự báo của WRF và WRF-KF với
lượng mưa quan trắc tại trạm.
44
Hình 3.9: Kết quả dự báo lúc 12Z ngày 14/10/2010
46
Hình 3.10: Kết quả dự báo lúc 12Z ngày 15/10/2010
47
Hình 3.11: Kết quả dự báo lúc 12Z ngày 16/10/2010
48
Hình 3.12: So sánh lượng mưa từ kết quả dự báo của WRF và WRF-KF khi sử
dụng số liệu cao không Việt Nam
51
8
MỞ ĐẦU
Trong những năm gần đây các đợt mƣa lớn kéo dài xảy ra ngày càng nhiều và
ngày càng gia tăng về cƣờng độ ví dụ nhƣ đợt mƣa lớn từ ngày 29/10 đến 1/11/2008
tại các tỉnh miền Bắc (gây ra ngập lụt nặng tại Hà Nội và các tỉnh lân cận); đợt mƣa
lớn từ ngày 2 - 4/11/2009 và đợt mƣa lớn từ 29/10 - 3/11/2010 tại các tỉnh Nam Trung
Bộ (gây ngập lụt nặng tại các tỉnh Phú Yên, Khánh Hòa và Ninh Thuận) hay đợt mƣa
từ ngày 1 – 7/10 và từ 13 – 19/10/ 2010 tại các tỉnh miền Trung (gây lũ lụt lớn tại các

tỉnh Nghệ An đến Quảng Bình). Các đợt mƣa này đã gây ra lũ lụt lớn và thiệt hại rất
nhiều về con ngƣời cũng nhƣ tài sản. Chính vì vậy dự báo mƣa lớn là bài toán rất cần
thiết và quan trọng để giảm thiểu những thiệt hại do mƣa lũ gây ra.
Hiện tại, dự báo đƣợc mƣa lớn dựa chủ yếu vào phƣơng pháp mô hình hóa. Đây
là bài toán dự báo có tính bất định cao do sự tƣơng tác phức tạp giữa địa hình và hoàn
lƣu quy mô vừa. Để làm tốt bài toán này không chỉ cần các mô hình bất thủy tĩnh tốt
mà còn phải có trƣờng ban đầu tốt nhất có thể. Hiện tại có rất nhiều phƣơng pháp xử lý
để tạo trƣờng ban đầu, đƣợc gọi là phƣơng pháp đồng hóa số liệu. Một cách cơ bản,
đồng hóa số liệu là phƣơng pháp sử dụng tất cả các giá trị quan trắc có đƣợc để ƣớc
lƣợng một cách tốt nhất các trạng thái của khí quyển và các dòng chảy đại dƣơng tại
một thời điểm nào đó. Có nhiều phƣơng pháp để đồng hóa số liệu nhƣ phƣơng pháp
hiệu chỉnh liên tiếp, phƣơng pháp biến phân, phƣơng pháp nội suy tối ƣu (OI), phƣơng
pháp lọc Kalman (KF) hay phƣơng pháp lọc Kalman tổ hợp (EKF). Hiện nay phƣơng
pháp đồng hóa lọc Kalman tổ hợp đƣợc xem nhƣ là một phƣơng pháp tiếp cận mũi
nhọn trong việc dự báo các bài toán có tính bất định cao. Tuy vậy, ở nƣớc ta phƣơng
pháp này còn ít đƣợc đƣa vào ứng dụng trong quá trình làm dự báo cũng nhƣ nghiên
cứu chuyên sâu. Ƣu điểm của việc đồng hóa số liệu bằng phƣơng pháp lọc Kalman tổ
hợp là không những tạo ra trƣờng ban đầu tốt nhất mà còn tạo ra đƣợc một bộ các nhân
ban đầu tối ƣu hóa cho việc nắm bắt các khu vực có độ bất định cao. Giá trị phân tích
đƣợc cải thiện này sẽ cho phép mở rộng khoảng thời gian dự báo để dự báo đƣợc chính
xác hơn.
Để thấy rõ khả năng và ý nghĩa của việc đồng hóa số liệu, trong đề tài này
chúng tôi chọn phƣơng pháp lọc Kalman tổ hợp cho mô hình bất thủy tĩnh Weather
and Research Forecasting (WRF, V3.2) dự báo đợt mƣa lớn tại các tỉnh miến Trung từ
9
ngày 13 đến 17/10/2010. Đây là đợt mƣa lớn điển hình do tƣơng tác giữa không khí
lạnh và dải hội tụ nhiệt đới.
Ngoài phần mở đầu và kết luận, nội dung luận văn gồm những phần sau:
Chƣơng I : Tổng quan
Chƣơng II : Cơ sở lý thuyết về đồng hóa số liệu và mô hình dự báo

Chƣơng III : Kết quả dự báo thử nghiệm.
10
CHƢƠNG I. TỔNG QUAN
1.1 Tổng quan về dự báo mƣa lớn
Trên thế giới
Dự báo mƣa lớn vẫn là một thử thách lớn đối với bài toán nghiệp vụ trên thế
giới. Các nghiên cứu mô phỏng số với độ phân giải cao bằng các mô hình bất thuỷ tĩnh
trên thế giới trong thời gian qua đã liên tục chỉ ra rằng các dự báo bằng mô hình số có
tính dự báo thấp, mang tính cá biệt thậm chí ngay cả đối với hạn rất ngắn cho đến 2
ngày (Bougeault et al. 2003; Milelli et al. 2005; Elementi et al. 2005; Kieu and Zhang
2010; Schumacher and Davis 2010) [8]. Điều này là do tính dự báo của khí quyển bị
chi phối rất mạnh bởi các nhiễu động có quy mô không gian và thời gian rất nhỏ. Một
kích thích đối lƣu nhỏ hay sai lệch của tâm hội tụ ẩm mực thấp cũng có thể dẫn đến
các thay đổi rất nhanh của các bất ổn định trong khí quyển và tạo nên các phân bố đối
lƣu sâu khác nhau. Điều này đặc biệt dễ nhận thấy trong các vùng có tƣơng tác địa
hình và các hình thế gió mùa phức tạp, ví dụ các vùng chịu ảnh hƣởng gió mùa châu Á
mà ở đó độ ẩm mực thấp đóng vai trò quan trọng trong việc hình thành các hệ thống
thời tiết gây mƣa lớn (Kato and Goda 2001; Kato et al. 2003) [14; 15] . Do tính chất
bất ổn định mạnh của khí quyển trong các bài toán dự báo mƣa lớn, điều quan tâm tiên
quyết đối với các dự báo mô hình dự báo tại thời điểm này là phải tính đƣợc sự bất
định của điều kiện ban đầu cũng nhƣ các sai số nội tại của các sơ đồ tham số hóa đối
lƣu.
Các nghiên cứu gần đây nhất cho thấy khả nằng dự báo mƣa lớn thời hạn 72-h
hoặc lớn hơn một cách thống kê đều liên quan nhiều đến các hình thế mƣa do bão
(Schumacher and Davis 2010; Lin et al. 2010) [ 19; 21]. Với độ chính xác của dự báo
vị trí đổ bộ của bão ngày càng đƣợc nâng cao thì hình thế mƣa lớn đi kèm theo cũng
đƣợc cải thiện đáng kể. Tuy nhiên do dự báo cƣờng độ bão là không chính xác, dự báo
về cƣờng độ của lƣợng mƣa là không đủ tin cậy (Kehoe et al. 2007; Payne et al. 2007)
[17; 20]. Mặc dù các dự báo tổ hợp cho các hình thế mƣa lớn do sự bất ổn định tà áp
vùng ngoại nhiệt đới có thể cho đƣợc các bản tin tin cậy với hạn dự báo lên đến 96-h

(Schumacher and Davis 2010) [21], khả năng dự báo trƣớc 48-h và 72-h đối với các
hình thế gây mƣa lớn điển hình do tƣơng tác gió mùa với địa hình phức tạp là một bài
toán rất thách thức, ngay cả đối với các trung tâm nghiệp vụ lớn. Sử dụng một mô hình
11
khu vực bất thuỷ tĩnh với 2 lƣới lồng có độ phân giải là 7 km và 2.8 km, Elementi et
al. (2005) [13] đã chỉ ra rằng các lực cƣỡng bức do địa hình đóng vai trò quan trọng
trong việc phát triển và phân bố của các thời điểm mƣa lớn.
Bằng cách cập nhật số liệu biên liên tục từng 3-h một từ mô hình toàn cầu
ECMWF của trung tâm dự báo châu Âu với các độ phân giải khác nhau, Elemeti et al.
đã dự báo đƣợc lƣợng mƣa tích luỹ 24-h cho một vài hình thế mƣa điển hình do tƣơng
tác địa hình và trƣờng quy mô lớn. Các phân bố mƣa dự báo tất định của họ tuy nhiên
có những sai lệch rất đáng kể, ngay cả khi với độ phân giải rất cao. Trong nghiên cứu
tƣơng tự của Kato và Aranami (2010) [16], mô hình quy mô meso của trung tâm khí
tƣợng Nhật Bản với độ phân giải 1.5 km cũng đã đƣợc sử dụng để dự báo cho hai đợt
mƣa lớn thử nghiệm cho Nhật Bản với hạn dự báo chỉ giới hạn trong khoảng 3-h. Các
kết quả chỉ ra rằng ngay cả với hạn dự báo 3-h, các dự báo cũng chỉ cho đƣợc ghi nhận
với một trƣờng hợp duy nhất, các trƣờng hợp còn lại không mô phỏng đƣợc do trƣờng
ẩm ban đầu không đƣợc đặc trƣng.
Cùng với phƣơng pháp dự báo mƣa lớn bằng phƣơng pháp số trị, một số các
phƣơng pháp khác cũng đƣợc sử dụng cho các mục đích dự báo ở hạn ngắn. Trong
một nghiên cứu đã sử dụng số liệu vệ tinh viễn thám để phát triển quá trình trích giá trị
điểm ảnh, Yaiprasert và nnk (2007) [10] đã sử dụng quá trình khai thác tự động số liệu
giá trị điểm ảnh từ chuỗi ảnh vệ tinh. Sau đó, quá trình xử lý sẽ tính toán sự tƣơng
quan giữa giá trị pixel ảnh và giá trị lƣợng mƣa có thể xảy ra. Kết quả là khi giá trị
điểm ảnh trung bình cao của dữ liệu hơi nƣớc hàng ngày, lƣợng mƣa hàng ngày có thể
đƣợc dự báo là mƣa lớn. Điều này chỉ ra rằng giá trị điểm ảnh trung bình có thể đƣợc
sử dụng để dự báo mƣa. Sử dụng bộ số liệu vận tốc xuyên tâm ra đa, Lee và nnk
(2007) [18] đã sử dụng một phiên bản với độ phân dải cao của mô hình WRF để
nghiên cứu về khả năng xuất hiện mƣa lớn trên bán đảo Triều Tiên nơi mà hệ thống
đối lƣu quy mô vừa có tƣơng tác mạnh với môi trƣờng quy mô synop. Trong nghiên

cứu, đã tiến hành thí nghiệm chạy mô hình với 4 lƣới lồng nhau với độ phân giải theo
phƣơng ngang 30 -1,1 km để mô phỏng một trƣờng hợp mƣa lớn trên Hàn Quốc vào
tháng 6 năm 2003. Trong thí nghiệm, họ đã đánh giá đƣợc sự ảnh hƣởng của độ phân
giải cao theo phƣơng ngang, sự khác biệt về thời gian ban đầu chạy mô hình, và sự
đồng hóa vận tốc xuyên tâm ra đa tới lƣợng mƣa đƣợc mô phỏng.
12
Ở Việt Nam
Dự báo mƣa lớn tại Việt Nam cũng đƣợc quan tâm từ rất lâu và cũng có rất
nhiều tác giả đã nghiên cứu về vấn đề này. Trong những thập kỷ trƣớc, dự báo mƣa
lớn chủ yếu đƣợc nghiên cứu và thực hiện thông qua các phƣơng pháp nhƣ Synop hay
thống kê. Trong công trình nghiên cứu dự báo trƣớc 3 – 4 ngày mƣa lớn trên lƣu vực
sông Hồng – Thái Bình bằng phƣơng pháp thống kê của TS. Nguyễn Đức Hậu, tác giả
đã xây dựng đƣợc các mô hình mô phỏng hình thế synop ở hai mực này trƣớc 3 – 4
ngày mƣa lớn trên lƣu vực sông Hồng – Thái Bình. Trên cơ sở xác định các dấu hiệu
và những đặc trƣng synop cơ bản gây mƣa lớn ở mực 850 mb và 500 mb, các dấu hiệu
và các đặc trƣng của các mô hình đƣợc tiến hành xây dựng trên máy tính chƣơng trình
dự báo khách quan về mƣa lớn trƣớc từ 3 đến 4 ngày. Chƣơng trình phần mềm khách
quan có kết hợp với sản phẩm số trị và tự động cập nhật kết quả đo lƣợng mƣa đã qua
trên toàn quốc. Đây là phƣơng pháp dự báo mƣa rất có hiệu quả và đã đƣợc sử dụng
dự báo thử nghiệm cho hai mùa mƣa (1999 – 2000) và kết quả cho thấy là có thể sử
dụng đƣợc trong nghiệp vụ dự báo.
Tại Phòng dự báo hạn vừa, hạn dài – Trung tâm Dự báo Khí tƣợng Thủy văn
trung ƣơng, Phạm Đức Thi và các cộng tác viên đã nghiên cứu đƣợc các giới hạn trong
việc xác định khả năng có hay không có mƣa vừa, mƣa to trong thời kỳ 10 ngày (đặc
biệt là 5 ngày đầu của thời kỳ dự báo 10 ngày) bằng phƣơng pháp bản đồ. Bản đồ đƣợc
sử dụng là bản đồ chuẩn sai trung bình 10 ngày và bản đồ biến cao trung bình 5 ngày
5
H
của bản đồ Âu Á mực 500 mb, các bản đồ này đƣợc xây dựng cho mỗi thời kỳ
dự báo. Xuất phát từ một số đặc điểm của các quá trình mƣa vừa, mƣa to trong 2 tháng

V và VI, tác giả đã chọn 2 khu vực: Khu vực phía Bắc nằm trong phạm vi từ vĩ độ 35
– 50
0
N và kinh độ 80 – 100
0
E, và khu vực phía đông, trong phạm vi từ vĩ độ 15-30
0
N
và kinh độ 120 -140
0
E để xét dấu chuẩn sai (∆H), thực chất là sự biến đổi của trƣờng
độ cao địa thế vị của thời kỳ hiện tại so sánh với giá trị trƣờng độ cao địa thế vị trung
bình nhiều năm (TBNN), chuẩn sai âm hoặc dƣơng thể hiện sự hoạt động mạnh mẽ
(sâu xuống) hoặc suy yếu (đầy lên) của rãnh trên đới gió Tây (W), gắn liền với quá
trình xâm nhập KKL xuống miền Bắc nƣớc ta, và bản đồ biến cao trung bình 5 ngày
5
H
với biến cao dƣơng hoặc âm biểu hiện sự biến đổi cƣờng độ của hệ thống. Phạm
vi phía đông đặc trƣng cho sự hoạt động của lƣỡi áp cao tây Thái Bình Dƣơng.
13
Phƣơng pháp phổ biến thứ hai ở Việt Nam là phƣơng pháp synop. Trong báo
cáo công trình nghiên cứu về “Các dạng hình thế thời tiết gây mƣa lớn ở miền Trung”,
Vũ Đình Hải (2000) và nnk đã sử dụng phƣơng pháp thống kê synop để dự báo mƣa
lớn với số liệu đƣợc lấy từ năm 1997 đến năm 1999. Trên cơ sở tổng hợp và phân tích
toàn bộ các dạng mƣa, tác giả đƣa ra kết quả tổng quát về lƣợng mƣa trung bình và
thời gian, cũng nhƣ lƣợng mƣa lớn nhất có thể có… ứng với từng loại hình thời tiết.
Tác giả đã chia ra 6 dạng hình thế synop gây ra mƣa lớn nhƣ sau: 1) mƣa do bão hoặc
áp thấp nhiệt đới đơn thuần ảnh hƣởng đến khu vực; 2) mƣa do bão, áp thấp nhiệt đới
ảnh hƣởng đến khu vực, tiếp sau là sự xâm nhập về phía tây của áp cao Thái Bình
Dƣơng; 3) mƣa do hai cơn bão liên tiếp, hay bão sau đó là áp thấp nhiệt đới khác; 4)

mƣa do bão hoặc áp thấp nhiệt đới hoạt động ở Nam Biển Đông hay đổ bộ trực tiếp
vào phía nam khu vực, trong khi đó phía bắc có sự xâm nhập về phía nam của không
khí lạnh hoặc ở phía bắc của bão; 5) gió mùa đông bắc xâm nhập xuống phía nam theo
hƣớng đông đông nam. Trong bài này, ngoài việc phân tích đầy đủ các dạng hình thế
synop gây mƣa lớn ở Trung Trung Bộ, tác giả đã đƣa ra đƣợc chỉ tiêu để đánh giá và
dự báo mƣa.
Ngoài 2 phƣơng pháp chính ở trên, trong những năm gần đây do có sự phát
triển về mặt công nghệ trong hiện đại hóa khoa học, bài toán dự báo mƣa lớn cũng
đƣợc hiện đại hóa bằng các mô hình số trị ở Việt Nam cũng đã bắt đầu đƣợc thử
nghiệm. Một vài nghiên cứu tiêu biểu là nghiên cứu mƣa cho khu vực Trung Bộ trên
mô hình RAMS của Trần Tân Tiến (2004). Mô hình đã dự báo đƣợc diện và lƣợng
mƣa trạm phù hợp, đặc biệt là mô phỏng đƣợc lƣợng mƣa tới 400mm/3 ngày. Trong
một thử nghiệm khác, Kiều Thị Xin (2005) áp dụng mô hình HRM để dự báo mƣa lớn
diện rộng ở Việt Nam. Kết quả dự báo mƣa lớn diện rộng với lƣợng mƣa khoảng 50
mm/ngày. Gần đây, Hoàng Đức Cƣờng (2008) đã xây dựng thành công tổ hợp 9 dự
báo thành phần của mô hình MM5 để dự báo mƣa lớn ở Việt Nam. Kết quả dự báo
mƣa của MM5 tuy nhiên chƣa thật thuyết phục.
1.2 Tổng quan về đồng hóa số liệu
Trên thế giới, nhiều nƣớc đã thực hiện thành công việc đồng hóa dữ liệu cho
mô hình WRF. Việc đồng hóa này đã đem lại những kết quả rất tốt cho nghiên cứu và
dự báo thời tiết. Đồng hóa đã đƣợc thực hiện với hầu hết các dữ liệu quan trắc nhƣ
14
synop, cao không, tàu biển, ra đa, vệ tinh… Đi đầu trong lĩnh vực này là Mỹ với việc
thực hiện đồng hóa dữ liệu cho hầu hết các loại dữ liệu của các trạm trên biển và dữ
liệu máy bay tàu biển.
Khu vực Châu Âu, đại diện là Trung tâm Dự báo thời tiết Hạn vừa Châu Âu
(ECMWF) đã thực hiện việc đồng hóa dữ liệu phục vụ cho nghiên cứu và dự báo thời
tiết cho các mô hình dự báo số trị trong đó có WRF. Còn với khu vực Châu Á, có một
số nƣớc thực hiện việc đồng hóa dữ liệu cho mô hình WRF nhƣ Trung Quốc, Thái
Lan, Hàn Quốc. Hàn Quốc đã đồng hóa cho các trạm mặt đất, các trạm cao không,

biển, vệ tinh và thu đƣợc kết quả rất tốt. Trong tƣơng lai sẽ có nhiều quốc gia thực
hiện việc đồng hóa này nhằm nâng cao kết quả dự báo thời tiết bằng phƣơng pháp số.
Ở Việt Nam, việc đồng hóa số liệu cũng đƣợc quan tâm từ nhiều năm nay, tuy
vậy trong những năm gần đây việc nghiên cứu về đồng hóa số liệu đƣa vào thử nghiệm
các mô hình dự báo thời tiết cho Việt Nam mới thực sự đƣợc quan tâm và phát triển
mạnh. Hiện nay có rất nhiều trung tâm nghiên cứu dự báo thời tiết và các nhà khoa học
quan tâm, nghiên cứu vấn đề này. Trong các nghiên cứu gấn đây, Trần Tân Tiến
(2004) đã thử nghiệm đồng hóa số liệu cho mô hình RAMS để dự báo mƣa lớn cho
khu vực Trung Bộ. Trong một nghiên cứu khác, Hoàng Đức Cƣờng đã đồng hóa số
liệu cao không bằng phƣơng pháp 3DVAR cho mô hình WRF để dự báo thời tiết ở
Việt Nam [2].
15
CHƢƠNG II. CƠ SỞ LÝ THUYẾT VỀ ĐỒNG HÓA SỐ
LIỆU VÀ MÔ HÌNH DỰ BÁO
2.1 Cơ sở lý thuyết về đồng hóa số liệu.
Một cách tổng quát, đồng hóa số liệu là quá trình tạo trƣờng ban đầu tốt nhất có
thể cho một mô hình dự báo, dựa trên các mối quan hệ động lực và xác suất thống kê.
Do đặc thù của mô hình dự báo thời tiết bằng mô hình số có tính phụ thuộc ban
đầu mạnh, các bản tin dự báo thời tiết đôi khi cho các kết quả hoàn toàn sai lệch
do điều kiện ban đầu không chính xác.
Quá trình đồng hóa về cơ bản bao gồm hai bƣớc chính là 1) phân tích khách
quan và 2) ban đầu hóa. Theo bƣớc phân tích khách quan, trƣờng quan trắc sẽ đƣợc
ngoại suy về điểm lƣới của mô hình số một cách tối ƣu. Trong bƣớc tiếp theo,
trƣờng ngoại suy này sẽ đƣợc cân bằng hóa sao cho các biến quan trắc phụ thuộc lẫn
nhau sẽ đƣợc ràng buộc bởi một mối quan hệ động lực cho trƣớc. Điều này là cần
thiết để tránh đƣa vào các giá trị quan trắc tùy ý. Mặc dù đồng hoá số liệu trong khí
tƣợng đã đƣợc quan tâm từ đầu những năm 1950, bài toán này lại chỉ thực sự
phát triển mạnh trong thời gian gần 20 năm gần đây do sự phát triển mạnh của máy
tính cho phép thực hiện đƣợc các thuật toán một cách nhanh chóng và có hiệu quả.
Đồng hóa số liệu đã trở thành một phƣơng pháp quan trọng trong ngành dự báo.

Hiện nay phƣơng pháp đồng hóa dữ liệu nhấn mạnh đặc biệt vào phƣơng pháp liên tiếp
Talagrand (1997) đã phân loại các phƣơng pháp hiện tại của phƣơng pháp đồng hóa dữ
liệu nhƣ sau đồng hóa số liệu có thể chia thành nhiều nhóm khác nhau: tuần tự, không
tuần tự, liên tục, biến phân v.v… Phụ thuộc vào quá trình đồng hóa, thuật toán trong
đồng hóa chia thành hai nhóm chính là đồng hóa biến phân và đồng hóa dãy:
- Đồng hoá biến phân (ĐHBP), tập trung vào việc tìm kiếm trạng thái khí
quyển có khả năng xảy ra cao nhất ứng với một tập quan trắc và một trạng thái nền
cho trƣớc. Phụ thuộc vào cách xử lý số liệu là tức thời hay trong một khoảng thời
gian, bài toán ĐHBP có thể chia nhỏ thành bài toán 3 chiều (3DVAR) hay 4
chiều (4DVAR).
- Phƣơng pháp đồng hóa dãy dò tìm trạng thái phân tích theo cách làm tối thiểu
hoá sai số của trạng thái phân tích so với quan trắc và trạng thái nền. Tiêu biểu nhất
16
cho phƣơng pháp đồng hóa dãy là phƣơng pháp nội suy tối ƣu và các bài toán đồng
hóa lọc Kalman.
2.1.1 Phương pháp nội suy tối ưu (OI)
Để đánh giá tốt nhất về trạng thái của khí quyển ta cần kết nối thông tin trƣớc
về trạng thái khí quyển (trƣờng nền) với những quan trắc, nhƣng để kết nối chúng đạt
hiệu quả tốt nhất chúng cần có thông tin thống kê về sai số trong từng giai đoạn của
thông tin có đƣợc.
Một ví dụ cơ bản của sự đánh giá tốt nhất giá trị thực của một vectơ vô hƣớng
xét nhiệt độ thực T
t
. Khi đó đƣa ra hai quan trắc phụ thuộc T
1
và T
2
:

11

22
t
t
TT
TT

(1.1)
Ở đây quan trắc có sai số là ε
i
chƣa biết. E( ) là giá trị kì vọng giả sử rằng
E(T
1
-T
t
)=E(T
2
-T
t
) hoặc tƣơng đƣơng E(ε
1
)=E(ε
2
)=0 (1.2)
và có biến sai số quan trắc là:

22
11
()E

22

22
()E

(1.3)
Giả sử rằng sai số của hai đại lƣợng này là không tƣơng quan với nhau:
E(ε
1
ε
2
) = 0 (1.4)
Từ phƣơng trình ( 1.2) (1.3) (1.4) biểu diễn thông tin thống kê mà chúng ta cần
biết về giá trị quan trắc thực tế. Để đánh giá T
t
từ sự kết hợp hai quan trắc:
T
a
= a
1
T
1
+ a
2
T
2
(1.5)
Nhiệt độ T
a
có thể là không thiên vị
E(T
a

)=E(T
t
) (1.6)
Khi đó ta có:
a
1
+ a
2
= 1 (1.7)
T
a
= T
1
+ a
2
( T
2
- T
1
) (1.8)
Ta sẽ ƣớc lƣợng giá trị của T
t
tốt nhất khi sai số bình phƣơng đƣợc chọn là nhỏ
nhất:
17

1
2
()
()

()
()
n
yt
yt
yt
yt

(1.9)
Khi đó ta có:
2
1
1
22
12
1/
1/ 1/
a

2
2
2
22
12
1/
1/ 1/
a

hoặc:
2

2
1
22
12
a

2
1
2
22
12
a
(1.10)
Ở đây trọng số tỉ lệ với độ chính xác hay là xấp xỉ của phép đo tuy nhiên thay
trọng số trong (1.10) vào (1.8) thì ta có mối tƣơng quan giữa biến phân tích và biến
quan trắc:

2 2 2
12
1 1 1
a

(1.11)
Có nghĩa là nếu trọng số là tối ƣu và thống kê của sai số là chính xác thì độ
chính xác của biến phân tích là tổng các phép đo.
Để khảo sát vấn đề tìm ra phân tích tối ƣu cho một miền của mô hình nhiều
biến x
a
, giả thiết một trƣờng nền dữ liệu x
b

trong không gian hai hoặc ba chiều, và tập
các quan sát y
o
không liên tục trong không gian (hình 2.1).

Hình 2.1. Sơ đồ biểu diễn sự phân bố giữa điểm lưới (hình tròn) trạm quan trắc với
phân bố không đồng đều (hình vuông)
18
Trƣờng nền có thể là miền không gian hai chiều của một biến đơn nhƣ nhiệt độ
T
a
(x,y), hoặc không gian ba chiều của các điều kiện ban đầu cho tất cả các biến dự báo
x=(p
s
,T,q,u,v). Các biến nền đƣợc sắp đặt bằng cách chia lƣới điểm và có thể thay đổi
đƣợc, chiều của vector có độ dài là n, ở đó n là số biểu thị số lƣợng điểm của các biến.
Ẩn số thực sự x
t
, miêu tả ở mô hình các điểm, cũng giống nhƣ độ dài vector n. Chú ý
rằng chúng ta sử dụng các quan trắc y
o
khác nhau cho trƣờng mà chúng ta cần phân
tích.
Chúng ta sẽ xét bài toán với một vecto có độ dài n, có một vectơ đo đƣợc là y
o

và một vectơ nền x
b
tìm mối liên hệ tốt nhất giữa y
o

và x
b
sao cho sai số đạt đƣợc là
nhỏ nhất.
Dựa vào phép thống kê nội suy ta có:
x
t
– x
b
= W[y
o
– H(x
b
)] – ε
a
= Wd – ε
a

ε
a
= x
a
- x
t
(1.12)
Trong đó W là ma trận trọng số kích thƣớc (nxp) chiều, giá trị thực, giá trị phân
tích, và trƣờng nền là vectơ có độ dài n. Toán tử H chuyển trƣờng nền thành phỏng
đoán đầu tiên của quan sát, H có thể là không tuyến tính. Trƣờng quan trắc y
o
là một

vectơ có chiều dài là p (số điểm quan trắc). Vectơ d cũng có độ dài là p đƣợc cho bởi:
d = y
o
– H(x
b
) (1.13)
Chú ý:
(a) Một ma trận sai số hiệp biến nhận đƣợc từ nhiều vectơ sai số
1
2

n
e
e
e

(b) Khi đó ma trận chuyển vị ε
T
= [ e
1
, e
2
, e
n
] và ƣớc lƣợng sai số trung bình
trên các điểm quan trắc đƣợc xác định bởi giá trị sau:
19

1 1 1 2 1
2 1 2 2 2

12
n
T
n
n n n n
e e e e e e
e e e e e e
e e e e e e


  

P
(1.14)
Ma trận hiệp biến trên là đối xứng nhau qua đƣờng chéo trong khi đó các phần
tử trên đƣờng chéo chính là phƣơng sai e
i
e
i
= ζ
2
i
. Nếu chúng ta biến đổi ma trận hiệp
biến bằng cách chia từng thành phần cho độ lệch chuẩn e
i
e
j

i
ζ

j
ta đƣợc ma trận tƣơng
quan (e
i
, e
j
)= ρ
ij
trong đó giá trị của các phần tử trên đƣờng chéo là 1.

12 1
12 2
12
1
1
1
n
n
nn
C


  


(1.15)
nếu đặt:
2
1
2

2
2
00
00
00
n
D


  


Thì ma trận trận hiệp biến ở trên có thể viết lại thành:
P=D
1/2
CD
1/2
(1.16)
Giả sử chúng ta có hai chuỗi thời gian của hai vectơ:

1
2
()
()
()

()
n
xt
xt

t
xt
x

1
2
()
()
()

()
n
yt
yt
t
yt
y

Giả thiết giá trị trung bình E(x) = 0, E(y) = 0 chúng ta nhận đƣợc sự tuyến tính
hóa tốt nhất của giá trị x bởi y với giá trị tối ƣu của ma trận trọng số W nhƣ sau:
x
a
(t) = Wy(t) (1.17)
Phƣơng trình trên có thể đƣợc viết lại nhƣ sau:
x(t) = Wy(t)- ε(t) (1.18)
20
Ở đây, ε(t) = x
a
(t) – x(t) là sai số hồi quy tuyến tính và W là ma trận có số
chiều là (nxp) nó là sai số bình phƣơng nhỏ nhất E( ε

T
ε ). Để nhận đƣợc W chúng ta
viết phƣơng trình hồi quy các thành phần của ma trận một cách rõ ràng:
1
( ) ( )
p
i ik k i
k
x t y t t

Khi đó:

2
1
n
i
i
t

2
11
( ) ( )
p
n
ik k
ik
y t x t
(1.19)
Đạo hàm sai số bậc hai theo ma trận trọng số ta đƣợc:


2
1
1
ij
1
2 ( ) ( )
2 ( ) ( )
n
i
p
i
ik k i j
k
p
ik k i i j
k
t
y t x t y t
y t y t x t y t

(1.20)
Viết dƣới dạng ma trận nhƣ sau:
2 ( ) ( ) ( )
T
TT
ij ij
ij
t t t
w
Wy y x y


Vì vậy nếu chúng ta đạo hàm trong một khoảng thời gian trung bình dài và
chọn ma trận W giảm đến mức tối thiểu, chúng ta nhận đƣợc phƣơng trình:
WE(yy
T
) – E(xy
T
) = 0
Hoặc
W = E(xy
T
)[E(yy
T
)]
-1
(1.21)
Tính chất thống kê
Chúng ta định nghĩa sai số nền và sai số phân tích khi vectơ có độ dài n:
ε
b
(x,y) = x
b
(x,y) – x
t
(x,y)
ε
a
(x,y) = x
a
(x,y) - x

t
(x,y) (1.22)
Có p giá trị quan trắc không đồng đều trong không gian, tại điểm y
o
(r
i
) có sai số
quan trắc:
21
ε
oi
= y
o
(r
i
) – y
t
(r
i
) = y
o
(r
i
) – H[x
t
(r
i
)] (1.23)
Trong thực tế chúng ta không biết giá trị thực x
t

bởi vậy chúng ta không biết sai
số chính xác của giá trị nền và quan trắc nhƣng chúng ta có thể tạo ra dựa trên một số
tính chất của hàm thống kê. Trƣờng nền và quan trắc đƣợc giả thiết là khách quan:
E {ε
b
(x,y)} = E{x
b
(x,y)} – E{x
t
(x,y)} = 0
E {ε
o
(r
i
)} = E{y
o
(r
i
)} – E{y
t
(r
i
)} = 0 (1.24)
Nếu dự báo (trƣờng nền) và quan trắc là không đối xứng thì theo nguyên tắc
chúng ta có thể xác định đƣợc xu hƣớng trƣớc khi tiến hành dự báo.
Chúng ta xác định ma trận sai số hiệp biến cho giá trị phân tích, giá trị nền và
quan trắc lần lƣợt nhƣ sau:
P
a
= A = E{ε

a
ε
T
a
}
P
b
= B = E {ε
b
ε
T
b
} (1.25)
P
o
= R = E{ε
o
ε
T
o
}
Quan trắc phi tuyến toán tử H đó chuyển biến số mô hình vào trong biến số
quan trắc có thể phi tuyến khi:
H(x + δx) = H(x) + Hδx (1.26)
Ở đây, H là một ma trận (nxp) chiều chỉ rõ toán tử quan trắc tuyến tính với yếu
tố h
i,j
= ∂ H
i
/ ∂x

j
: chúng ta cũng có thể giả sử rằng giá trị nền (thƣờng một mô hình
dự báo) là một xấp xỉ tốt của giá trị thực vì vậy giá trị phân tích và quan trắc là cân
bằng với giá trị nền cộng với sự gia tăng nhỏ. Bởi vậy vectơ cải tiến có thể đƣợc viết
lại dƣới dạng sau:
d = y
o
– H(x
b
)

= y
o
– H(x
t
+ (x
b
– x
t
))
= y
o
– H(x
t
) – H(x
b
– x
t
) = ε
o

– Hε
b
(1.27)
Ma trận H chuyển vectơ trong không gian mô hình vào giá trị tƣơng ứng trong
không gian quan trắc, ma trận chuyển vị của nó chuyển từ vectơ trong không gian
quan trắc vào trong vectơ trong không gian mô hình. Ma trận sai số hiệp biến nền B
(một ma trận có số chiều nxn) và ma trận sai số hiệp biến quan trắc R (ma trận có số
22
chiều pxp) đƣợc giả thiết đã biết. Trong phần thêm vào chúng ta giả thiết rằng sai số
quan trắc và sai số nền là không tƣơng quan với nhau:
E{ε
o
ε
T
b
} = 0 (1.28)
Bây giờ chúng ta sẽ sử dụng sự xác định tuyến tính không thiên vị công thức
(1.21) để đạo hàm ma trận trọng số tối ƣu W trong (1.12). x
a
– x
b
=Wd, nó xấp xỉ với
giá trị thực x
t
– x
b
= Wd – ε
a
.
Từ công thức (1.27) d = y

o
– H(x
b
) = ε
o
– Hε
b
, và từ (1.21) ma trận trọng số tối
ƣu W tối thiểu ε
T
a
ε
a
đƣợc đƣa ra:
W = E{(x
t
– x
b
)[y
o
– H(x
b
)]
T
} (E{[y
o
– H(x
b
)][y
o

– H(x
b
)]
T
})
-1

= E[(-ε
b
)(ε
o
- Hε
b
)
T
]{E[(ε
o
– Hε
b
)(ε
o
– Hε
b
)
T
]}
-1
(1.29)
Xét lại công thức (1.28) chúng ta đã giả thiết rằng sai số quan trắc là không
tƣơng quan với sai số nền vì vậy phƣơng sai của chúng là bằng 0. Thay định nghĩa của

ma trận sai số hiệp biến nền B và sai số quan trắc R (1.25) vào trong (1.29) ta có ma
trận trọng số tối ƣu W:
W = BH
T
(R+HBH
T
)
-1
(1.30)
Cuối cùng ta nhận đƣợc sai số hiệp biến quan trắc:
P
a
= E{ε
a
ε
a
T
}
= E{ε
b
ε
b
T
+ ε
b

o
– Hε
b
)

T
W
T
+ W(ε
o
-Hε
b

T
b
+ W(ε
o
- Hε
b
)(ε
o
-Hε
T
b
)
T
W
T

= B - BH
T
W
T
– WHB + WRW
T

+ WHBH
T
W
T
Và thay (1.30) ta nhận đƣợc:
P
a
= ( I – WH)B (1.31)
2.1.2 Phương pháp lọc Kalman
Giả sử rằng một trong hai phần thông tin T
1
= T
b
là dự báo (hoặc bất kỳ giá trị
nền khác) và một giá trị khác là quan trắc T
2
= T
o
từ (1.8) và ( 1.10) ta có thể viết lại
T
a
nhƣ sau:
T
a
= T
b
+ W( T
o
– T
b

) (1.32)
23
Ở đây, ( T
o
– T
b
) đƣợc định nghĩa là "đổi mới" quan trắc, nghĩa là những thông
tin mới đƣa ra bởi quan trắc. Nó cũng đƣợc biết đến nhƣ là gia số quan trắc, W là trọng
số tối ƣu, đƣợc đƣa ra bởi:
W = ζ
2
b

2
b
+ ζ
2
o
)
-1
(1.33)
Và biến sai số phân tích nhƣ trƣớc đây:
ζ
2
a
= (ζ
-2
b
+ ζ
2

o
)
– 1
(1.34)
Biến phân tích có thể đƣợc viết lại nhƣ sau:
ζ
2
a

2
b
ζ
2
o
/(

ζ
2
b
+

ζ
2
o
) hoặc ζ
2
a
=( 1-W )ζ
2
b

(1.35)
Nếu trƣờng nền là một dự báo, chúng ta có thể sử dụng phƣơng trình (1.32),
(1.33) và (1.35) để tạo ra một chu trình phân tích dãy đơn giản, trong đó quan trắc
đƣợc sử dụng một lần tại thời điểm nó xuất hiện và sau đó mất đi. Giả sử rằng chúng ta
đã hoàn thành phân tích tại thời điểm t
i
và tiến hành các chu kì tiếp theo cho thời điểm
t
i + 1
. Chu trình phân tích gồm hai giai đoạn: giai đoạn dự báo để cập nhật giá trị nền T
b

và sai số hiệp biến ζ
2
b
, giai đoạn phân tích cập nhật giá trị phân tích T
a
và sai số hiệp
biến của nó ζ
2
a
.
Trong giai đoạn dự báo của chu trình phân tích giá trị nền đầu tiên có đƣợc
thông qua một dự báo:
T
b
(t
i+1
) = M[T
a

(t
i
)] (1.36)
Ở đây, M đại diện cho một mô hình dự báo (mà có thể là một mô hình động lực,
kiên trì, khí hậu học, ngoại suy …). Chúng ta cũng cần đánh giá sai số hiệp biến nền.
Trong OI điều này đƣợc thực hiện bằng cách làm cho một số giả thiết đơn giản phù
hợp, chẳng hạn nhƣ mô hình hợp gia tăng sai số hiệp biến ban đầu bởi một số lƣợng cố
định:
ζ
2
b
(t
i+1
) = aζ
2
a
(t
i
) (1.37)
Điều này cho phép trọng số mới W(t
i+1
) đƣợc đánh giá bằng cách sử dụng
(1.33).
Trong bộ lọc Kalman (1.36) là tƣơng tự nhƣ OI, nhƣng thay vì giả thiết một giá
trị cho σ
2
b
(t
i+1
) nhƣ trong (1.37) chúng ta tính toán sai số hiệp biến dự báo bằng cách

24
sử dụng chính các mô hình dự báo. Nếu chúng ta áp dụng mô hình (1.36) để cập nhật
giá trị nhiệt độ sẽ có lỗi vì mô hình không hoàn hảo:
T
t
(t
i+1
) = M[T
t
(t
i
)] – ε
M

Mô hình sai số đƣợc giả thiết là không thiên vị với một sai số hiệp biến
Q
2
=E(ε
2
M
). Sau đó:
ε
b,i+1
= (T
a
– T
t
)
i+1
= M(T

a
)
i
– M(T
t
)
i
+ ε
M
= Mε
a,i
+ ε
M
(1.38)
Ở đây, M = ∂M/∂T là tuyến tính hoặc toán tử mô hình tiếp tuyến, và dự báo cho
sai số hiệp biến nền tại thời điểm mới:
ζ
2
b,i+1
= E(ε
2
b,i+1
) = M
2
ζ
2
a,i
+ Q
2
(1.39)

Trong giai đoạn phân tích của chu kỳ phân tích (cả OI và lọc Kalman) ta có
đƣợc phân tích mới T
a
(t
i+1
) từ (1.32), ƣớc tính của ζ
b
2
từ (1.34) cho OI, hoặc (1.39) cho
lọc Kalman, và sai số hiệp biến phân tích mới ζ
a
2
(t
i+1
) từ (1.35). Sau khi phân tích, chu
kỳ cho thời điểm t
i+1
đƣợc hoàn thành, và chúng ta có thể thực hiện chu kỳ tiếp theo.
Các phƣơng trình cho lọc Kalman tƣơng tự nhƣ đối với OI. Khác biệt chính là
sai số hiệp biến nền B, thay vì đƣợc giả thiết là không đổi theo thời gian nhƣ trong OI
hay 3D-Var, thì lại đƣợc cập nhật từ thời điểm phân tích trƣớc đó t
n
đến thời điểm phân
tích mới t
n+1
. Các mô hình dự báo bắt đầu phân tích tại t
n
, x
b
n+1

= M(x
n
a
), trong đó M là
mô hình phi tuyến.
Do đó, trừ x
t
n+1
= M(x
t
n
)-ε
M
từ cả hai bên:
ε
b
n+1

= Mε
n
a
+ ε
M
(1.40)
với ε
M
là sai số mô hình. Từ (1.40), ta có đƣợc bộ lọc Kalman sai số hiệp biến dự báo
mới:
B = P
f

(t
n+1
)= ε
b
n+1

b
n+1
)
T
= M(t
n
)P
a
(t
n
)M(t
n
) + Q(t
n
) (1.41)
Với Q = E (ε
m
ε
T
m
) là sai số hiệp biến mô hình dự báo, M là mô hình tiếp tuyến
tuyến tính và M
T
chuyển vị của nó. Với sự thay đổi này, ma trận trọng số trở thành ma

trận Kalman K. Mặc dù điều này rõ ràng là một thay đổi nhỏ từ OI, các phép nhân ma
trận của M trong phƣơng pháp nội suy tối ƣu tƣơng đƣơng với việc tích hợp các mô
hình dự báo n/2 lần, với n là số bậc tự do của mô hình.
25

Hình 2.2. Minh họa hai bước chính của bộ lọc Kalman
2.1.3 Phương pháp lọc Kalman tổ hợp
a) Lọc Kalman tổ hợp
Do khả năng phát triển mô hình tiếp tuyến và tích phân ma trận sai số hiệp
biến theo thời gian với mô hình tiếp tuyến là không thực tế trong các mô hình dự
báo thời tiết, lọc Kalman phải đƣợc cải tiến để có thể áp dụng đƣợc cho các bài toán
nghiệp vụ. Một cách tiếp cận phổ biến nhất dựa trên tích phân ngẫu nhiên Monte-
Carlo theo đó một tập các đầu vào đƣợc tạo ra xung quanh một giá trị trƣờng phân
tích cho trƣớc. Lƣu ý rằng tập đầu vào này không phải đƣợc lấy bất kỳ mà đƣợc tạo
ra dựa theo phân
bố xác xuất cũng nhƣ giá trị sai số của trƣờng phân tích P
a
tại
từng thời điểm. Ví dụ nếu
phân bố của trƣờng phân tích có dạng phân bố chuẩn
Gauss, khi đó tập đầu vào của trƣờng phân tích sẽ phải tuân theo phân bố


(1.42)
trong đó là giá trị trƣờng phân tích trung bình tổ hợp thu đƣợc từ bƣớc phân tích
của lọc Kalman. Với một tập K các đầu vào { x
a
}
k=1… K
sinh ra từ phân bố

(1.42), chúng ta có thể thu đƣợc ma trận sai số hiệp biến dự báo cho bƣớc thời
gian tiếp theo nhƣ sau:


(1.43)


26
trong đó:


Các nghiên
cứu trong trong trƣớc đây đã chỉ ra rằng một tổ hợp khoảng
25-50
các thành phần là đủ để lọc Kalman tổ
hợp phát huy tác dụng
Ngoài việc giản lƣợc quá trình phát triển mô hình tiếp tuyến, cách tiếp cận
EnKF có một vài ƣu điểm nổi trội bao gồm 1) rút bớt các tính toán với các ma trận có
số chiều lớn; 2) không cần tuyến tính hóa mô hình cũng nhƣ mô hình liên hợp; 3)
cung cấp một tổ hợp các nhiễu ban đầu tối ƣu hóa cho việc dự báo các
ma trận sai
số hiệp biến
. EnKF hiện đƣợc coi là một hƣớng đi phát triển mạnh nhất trong thời
gian tới cho các bài toán nghiên cứu có tính dự báo thấp nhƣ bão nhiệt đới và ngoại
nhiệt đới, mƣa lớn, hay dông.
Hai biến thể đƣợc phát
triển phổ biến nhất hiện này của bộ lọc bộ lọc Kalman
tổ hợp (EnKF) là
bộ lọc EnKF chuỗi (Serial EnKF), và bộ lọc EnKF địa phƣơng
biến đổi (LETKF) [1].

b) Lọc Kalman tổ hợp chuỗi
Về mặt bản chất, lọc EnKF chuỗi (SEnKF) là quá trình trong đó số liệu quan
trắc đƣợc đồng hóa lần lƣợt từng giá trị một. Quá trình này sẽ làm giảm kích thƣớc
cũng nhƣ khối lƣợng tính toán. Để thảo luận đƣợc rõ ràng chúng ta viết lại phƣơng
trình cập nhật trạng thái phân tích sau:

(1.43)
P
a
= (I – KH)P
f

(1.44)
Trong đó
K = P
f
H
T
(R+HP
f
H
T
)
-1
(1.45)
Lƣu ý rằng quá trình cập nhật trạng thái phân tích này sẽ chỉ đƣợc áp dụng cho
trường trung bình tổ hợp. Để tạo ra đƣợc các thành phần tổ hợp phân tích tiếp
theo, cần phải tạo
thêm một bộ nhiễu phân tích và cộng vào
trƣờng phân tích trung

bình tổ hợp

nhƣ sẽ trình bày trong các phần tiếp theo.

×