TỔNG CỤC MÔI TRƯỜNG
TRUNG TÂM QUAN TRẮC MÔI TRƯỜNG
SỔ TAY HƯỚNG DẪN
XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU QUAN TRẮC MÔI TRƯỜNG
Đơn vị thực hiện : Trung tâm Quan trắc Môi trường
Cơ quan chủ trì: Tổng cục Môi trường
Cơ quan chủ quản: Bộ Tài nguyên và Môi trường
0
Hà Nội, 2015
Mục lục
Trang
Phần I: QUY ĐỊNH CHUNG .......................................................................... 2
1. Phạm vi điều chỉnh ...................................................................................... 2
2. Đối tượng áp dụng ...................................................................................... 2
3. Giải thích từ ngữ ........................................................................................ 2
4. Các nguyên tắc xây dựng sổ tay .................................................................. 3
5. Mục đích của việc xử lý và phân tích số liệu quan trắc môi trường ............. 3
Phần II: XỬ LÝ SỐ LIỆU QUAN TRẮC MÔI TRƯỜNG ........................... 4
1. Xử lý số liệu quan trắc định kỳ .....................Error! Bookmark not defined.
1.1. Mục đích thực hiện xử lý số liệu quan trắc định kỳ .... Error! Bookmark
not defined.
1.2. Yêu cầu về chất lượng đối với số liệu sau xử lý ... Error! Bookmark not
defined.
1.3. Quy trình xử lý số liệu ........................... Error! Bookmark not defined.
2. Xử lý số liệu tự động, liên tục ........................Error! Bookmark not defined.
2.1. Mục đích thực hiện xử lý ....................... Error! Bookmark not defined.
2.2. Yêu cầu về chất lượng đối với số liệu sau xử lý ... Error! Bookmark not
defined.
2.3. Quy trình xử lý số liệu tự động, liên tục ............................................... 13
Phần III: TRÌNH BÀY SỐ LIỆU BẰNG ĐỒ THỊ ........................................23
1. Sự cần thiết của việc thể hiện dữ liệu bằng đồ thị ...................................... 23
2. Các dạng đồ thị chính ............................................................................... 23
Phần IV: PHÂN TÍCH SỐ LIỆU ...................................................................30
1. Đặc trưng của số liệu môi trường .............................................................. 30
2. Mục đích thực hiện phân tích số liệu ......................................................... 30
3. Phương pháp phân tích số liệu .................................................................. 30
Phần V: GIỚI THIỆU PHẦN MỀM HỖ TRỢ VIỆC PHÂN TÍCH VÀ XỬ
LÝ SỐ LIỆU SAS, SPSS VÀ STATA ............................................................35
1. Phần mềm SAS .......................................................................................... 35
2. Phần mềm SPSS ........................................................................................ 36
3. Phần mềm STATA...................................................................................... 37
Phần VI: TỔ CHỨC THỰC HIỆN ................................................................39
1
2
Phần I: QUY ĐỊNH CHUNG
1. Phạm vi điều chỉnh
Sổ tay này hướng dẫn việc xử lý và phân tích các số liệu quan trắc môi
trường của các chương trình quan trắc định kỳ và trạm quan trắc tự động.
2. Đối tượng áp dụng
Sổ tay hướng dẫn này là tài liệu tham khảo đối với cơ quan quản lý nhà
nước về môi trường Trung ương và địa phương; các tổ chức, cá nhân có tham
gia vào mạng lưới quan trắc môi trường.
3. Giải thích từ ngữ
Trong sổ tay hướng dẫn, các từ ngữ dưới đây được hiểu như sau:
1. Số liệu quan trắc định kỳ: là kết quảquan trắc được định kỳ đo đạc, lấy
mẫu phân tích.
2. Số liệu quan trắc tự động, liên tục:là kết quả quan trắc từ các trạm
quan trắc tự động, liên tục.
3. QC số liệu(Kiểm soát chất lượng số liệu) trong quan trắc môi
trường: là việc thực hiện các biện pháp để đánh giá, theo dõi và kịp
thời điều chỉnh để đạt được độ tập trung, độ chính xác của các phép đo
nhằm bảo đảm cho hoạt động quan trắc môi trường đạt các tiêu chuẩn
chất lượng theo quy định.
4. Mẫu trắng:là mẫu vật liệu sạch được sử dụng để kiểm soát sự nhiễm
bẩn trong các quá trình: lấy mẫu, quá trình vận chuyển mẫu, sử dụng
thiết bị lấy mẫu, quá trình phân tích mẫu (mẫu trắng hiện trường, mẫu
trắng vận chuyển, mẫu trắng thiết bị, mẫu trắng phương pháp).
5. Mẫu lặp phòng thí nghiệm: gồm hai hoặc nhiều hơn các phần của cùng
một mẫu được chuẩn bị, phân tích độc lập với cùng một phương pháp.
Mẫu lặp phòng thí nghiệm là mẫu được sử dụng để đánh giá độ chụm
của kết quả phân tích.
6. Mẫu chuẩn đối chứng (certified reference materials - viết tắt là
CRMs) là một lượng vật liệu hay loại chất có đầy đủ các tính chất để
hiệu chuẩn thiết bị, đánh giá một phép thử hoặc để xác định giá trị đối
với các vật liệu. Mỗi mẫu chuẩn đối chứng phải được kèm theo một
3
chứng nhận về giá trị tham khảo, độ không đảm bảo đo ở một mức độ
tin cậy.
4. Các nguyên tắc xây dựng sổ tay
Các nguyên tắc xây dựng sổ tay bao gồm:
- Bảo đảm tính phù hợp;
- Bảo đảm tính chính xác;
- Bảo đảm tính nhất quán;
- Bảo đảm tính liên tục;
- Bảo đảm tính sẵn có;
- Bảo đảm tính có thể so sánh.
5. Mục đích của việc xử lý và phân tích số liệu quan trắc môi trường
- Tăng độ tin cậy của bộ số liệu quan trắc môi trường
- Cung cấp thông tin môi trường cho cộng đồng một cách đơn giản, dễ
hiểu, trực quan;
- Nâng cao nhận thức về môi trường.
4
Phần II: XỬ LÝ SỐ LIỆU QUAN TRẮC MÔI TRƯỜNG
1. Xử lý số liệu quan trắc định kỳ
1.1. Mục đích thực hiện xử lý số liệu quan trắc định kỳ
- Kiểm tra tổng hợp về tính hợp lý của số liệu quan trắc thông qua
những đánh giá khoa học và các công cụ thống kê;
- Áp dụng các biện pháp xử lý nhằm tăng tính tin cậy của số liệu quan
trắc.
1.2. Yêu cầu về chất lượng đối với số liệu sau xử lý
Số liệu sau xử lýđảm bảo về mặt chất lượng và số lượng đáp ứng các mục
tiêu sử dụng.
1.3. Quy trình xử lý số liệu
1.3.1. Sơ đồ quy trình xử lý
STT
Bước 1:
Yêu cầu
Nội dung
Tập hợp đủ các tài liệu liên
quan:
Chuẩn bị số liệu
Tập hợp các tài liệu
Đủ tài liệu
N
Y
Bước 2:
Đánh giá tính đầy đủ và phù hợp của
số liệu quan trắc
(1) Kiểm tra dữ liệu ngoài hiện trường
(2) Kiểm tra dữ liệu phân tích Phòng thí
nghiệm
5
- Kế hoạch quan trắc đợt;
- Biên bản/ nhật ký lấy mẫu
tại hiện trường;
- Biên bản giao nhận mẫu;
- Biểu ghi kết quả đo, phân
tích tại hiện trường;
- Biểu ghi kết quả phân tích
trong phòng thí nghiệm;
- Số liệu của mẫu QC (mẫu
trắng,
mẫu
lặp,
mẫu
chuẩn,…).
Đánh giá tính đầy đủ và
phù hợp dựa trên thông tin
của các tài liệu về:
- Vị trí lấy mẫu; tính phù
hợp, thống nhất giữa
phương pháp, thiết bị quan
trắc;
- Tính phù hợp, thống nhất
về thời gian, thông số phân
tích, các loại mẫu, các
phương pháp và thiết bị
phân tích; phù hợp với tiêu
chí chấp nhận kết quả phép
đo.
N
Đầy đủ?
Kiểm tra lại với các tài liệu
liên quan khác để bổ sung
và chỉnh sửa.
Phù hợp?
Y
Bước 3:
Kiểm tra tính phù hợp của đơn vị đo với
từng loại thông số và từng loại thiết bị
Kiểm tra đơn vị đo, so sánh với đơn vị
chuẩn
N
Đơn vị phù hợp?
Bước 4:
- Quy định thứ nguyên cho
các thông số
- Kiểm tra đơn vị đo của
các thông số so với đơn vị
chuẩn nhằm tạo ra bộ số
liệu có cùng hệ đơn vị
Y
Kiểm tra tính hợp lý của số liệu so với
thông số kỹ thuật của thiết bị
N
Giá trị phù hợp?
- Thiết lập một bộ cơ sở dữ
liệu bao gồm đầy đủ các
thông số kỹ thuật của thiết
bị;
- So sánh giá trị đo đạc,
phân tích với giới hạn phát
hiện trên và dưới của thiết
bị.
Loại bỏ số liệu nằm ngoài
khoảng giới hạn.
Y
Bước 5:
Kiểm soát tính tương thích của số liệu so
với giới hạn phát hiện của phương pháp
đo đạc
N
Giá trị phù hợp?
Y
6
- So sánh giá trị đo đạc,
phân tích với giới hạn phát
hiện dưới và giới hạn tuyến
tính của phương pháp đo
đạc;
- Ghi chép kết quả phân
tích kèm theo hệ số pha
loãng (đối với mẫu nước).
Loại bỏ số liệu nằm ngoài
khoảng giới hạn
Bước 6:
- Thiết lập một bộ cơ sở dữ
liệu bao gồm đầy đủ các
giới hạn giá trị thực của
mỗi thông số;
- So sánh và loại bỏ số liệu
nằm ngoài khoảng giới hạn
So sánh giá trị kết quả với ngưỡng giá trị
của các thông số
Đánh giá kết quả với ngưỡng giá trị của
thông số
N
Giá trị phù hợp?
Bước 7:
Loại bỏ số liệu không phù
hợp.
Y
- Xác định độ chênh lệch
của từng giá trị đo đạc và
các giá trị khác trong bộ số
liệu cần kiểm soát;
- So sánh độ chênh lệch với
giá trị tới hạn để kết luận
mức độ tin cậy của số liệu
Phát hiện những giá trị đo đạc bất thường
Y
Giá trị bất thường?
- Trường hợp không giải
thích được thì đánh dấu độ
tin cậy của số liệu đó là
chưa cao.
N
Bước 8:
Đánh giá độ chụm của phép phân tích
Tính giá trị RPD (áp dụng với mẫu lặp)
N
RPD < 30%
Y
Bước 9:
- Trường hợp có giải thích
được nguyên nhân thì số
liệu được chấp nhận.
Phân tích tính tương quan
Tính hệ số tương quan R (-1
7
Mẫu lặp được sử dụng để
đánh giá độ chụm của kết
quả phân tích, dựa trên giá
trị phần trăm sai khác
tương đối(RPD).
- Phương pháp phân tích
không đảm bảo độ tin cậy
- Đưa vào báo cáo QC để
đánh giá chất lượng của bộ
số liệu.
Phân tích tương quan R,giá
trị tuyệt đối của R càng lớn
gần về 1 thì mức tương
quan càng cao, càng về 0
thì tương quan càng thấp.
Giá trị R âm thể hiện sự
tương quan nghịch.
Y
Giá trị nghi ngờ?
- Kiểm tra các tài liệu quan
trắc hiện trường và phân
tích tại phòng thí nghiệm.
- Số liệu nghi ngờ được
đánh dấu lại.
N
Bước 10:
Đánh giá tính hoàn thiện của số liệu
(1) Xác định tỷ lệ % được chấp nhận đối với
tính hoàn thiện của số liệu
(2) Tính toán tỷ lệ phần trăm phép đo hợp lệ
N
C > 95%
Về mặt lý thuyết tỷ lệ này
đạt >95% là đạt yêu cầu
nhưng thực tế tuỳ mục đích
sử dụng tỷ lệ này có thể
dao động ở mức trên 7080% vẫn có thể sử dụng.
- Đưa ra kết luận bộ số liệu.
-Xem xét để đưa mục tiêu
chất lượng cho các năm
tiếp theo.
Y
Bước 11:
Lưu trữ
Ghi chú:
-
Y: Có;
N: Không;
C: Phần trăm đầy đủ của số liệu (%);
RPD: phần trăm sai khác tương đối của mẫu lặp;
- C: Phần trăm đầy đủ của số liệu (%).
- (1);(2): bước 1; bước 2
3.1.2. Diễn giải sơ đồ
Bước 1: Chuẩn bị số liệu
Thu thập, tập hợp các tài liệu và số liệu liên quan:
- Kế hoạch quan trắc đợt;
- Biên bản/ nhật ký lấy mẫu tại hiện trường;
- Biên bản giao nhận mẫu;
- Biểu ghi kết quả đo, phân tích tại hiện trường;
- Biểu ghi kết quả phân tích trong phòng thí nghiệm;
- Số liệu của mẫu QC (mẫu trắng, mẫu lặp, mẫu chuẩn,…).
8
Bước 2: Đánh giá tính đầy đủ, phù hợp của số liệu quan trắc
Kiểm tra tính phù hợp của dữ liệu từ công tác ngoài hiện trường và phân
tích trong phòng thí nghiệm nhằm khẳng định dữ liệu là phù hợp với các yêu cầu
đặt ra trong Chương trình/ Dự án quan trắc:
S1:Kiểm tra dữ liệu từ công tác ngoài hiện trường.
Số liệu trong hoạt động quan trắc tại hiện trường phải bảo đảm đầy đủ,
thống nhất với hồ sơ quan trắc tại hiện trường; phù hợp, thống nhất với thời gian
và vị trí lấy mẫu; phù hợp, thống nhất với phương pháp, thiết bị quan trắc:
- Trường hợp thiếu thông tin: cần bổ sung đầy đủ;
- Trường hợp thông tin sai khác: cần đối chiếu lại các tài liệu liên quan
để xác minh tính chính xác của thông tin, số liệu.
S2: Kiểm tra dữ liệu từ phân tích Phòng thí nghiệm.
Số liệu trong hoạt động phân tích trong phòng thí nghiệm phải bảo đảm
đầy đủ, thống nhất với hồ sơ phân tích trong phòng thí nghiệm; phù hợp, thống
nhất với thời gian, thông số phân tích, các loại mẫu, các phương pháp và thiết bị
phân tích; phù hợp với tiêu chí chấp nhận kết quả phép đo:
- Trường hợp thiếu thông tin: cần bổ sung đầy đủ;
- Trường hợp thông tin sai khác: cần đối chiếu lại các tài liệu liên quan
để xác minh tính chính xác của thông tin, số liệu.
Bước 3: Kiểm tra tính phù hợp của đơn vị đo với từng loại thông số và
từng loại thiết bị
- Quy định thứ nguyên cho các thông số (sử dụng hệ đơn vị chuẩn)
- Kiểm tra đơn vị đo của các thông số so với đơn vị chuẩn nhằm tạo ra
bộ số liệu có cùng hệ đơn vị
Bước 4:Kiểm tra tính hợp lý của số liệu so với thông số kỹ thuật của thiết
bị
- Thiết lập một bộ cơ sở dữ liệu bao gồm đầy đủ các thông số kỹ thuật
của thiết bị (hiện trường và phòng thí nghiệm) dùng trong quan trắc
môi trường (xác định giới hạn phát hiện của thiết bị và khoảng tuyến
tính).
9
- So sánh giá trị đo đạc, phân tích với giới hạn phát hiện trên và dưới
của thiết bị phải loại bỏ số liệu nằm ngoài khoảng giới hạn
Bước 5:Kiểm soát tính tương thích của số liệu so với giới hạn phát hiện
của phương pháp đo đạc.
- So sánh giá trị đo đạc, phân tích với giới hạn phát hiện dưới và giới
hạn tuyến tính của phương pháp đo đạc nhằm loại bỏ số liệu nằm
ngoài khoảng giới hạn (xác định giới hạn phát hiện của phương pháp).
- Ghi chép kết quả phân tích kèm theo hệ số pha loãng (đối với mẫu
nước).
Bước 6: Kiểm tra tính hợp lý của số liệu so với khoảng giá trị thực của thông
số
- Thiết lập một bộ cơ sở dữ liệu bao gồm đầy đủ các giới hạn giá trị thực
của mỗi thông số (ví dụ pH trong khoảng 0-14).
- So sánh giá trị đo đạc, phân tích với giới hạn giá trị thực của thông số
nhằm loại bỏ số liệu nằm ngoài khoảng giới hạn
Bước 7:Phát hiện những giá trị đo đạc bất thường so với khoảng giá trị thực
đo của chuỗi số liệu đo đạc tại từng vị trí đo.
Giá trị bất thường là giá trị chênh lệch nhiều so với chuỗi số liệu hiện có
(chuỗi số liệu giá trị thực đo tại từng vị trí đo). Có thể phát hiện một cực trị
trong chuỗi số liệu đo đạc bằng phương pháp Grubbs. Các bước tiến hành như
sau:
S1:Xác định độ chênh lệch của từng giá trị đo đạc và các giá trị khác
trong bộ số liệu cần kiểm soát.
X Xi
Zi
trong đó:
SD
Zi là độ chênh lệch của giá trị đo Xi (i=1,2,…,n), n: số lượng mẫu
(hay còn gọi là kích thước mẫu);
X i - giá trị đo;
X - giá trị trung bình của bộ số liệu;
n
SD - độ lệch chuẩn: SD
(X
i 1
i
X )2
n 1
10
.
S2:Kết thúc bước S1, ta có giá trị độ lệch Zi. So sánh giá trị Zi với giá
trị tới hạn Cz tương ứng với kích thước mẫu n trong bảng giá trị tới hạn Cz được
Grubbs và cộng sự tính toán (bảng 1).
- Nếu Zi> Cz: có thể kết luận với mức độ tin cậy 95% X i là giá trị bất
thường trong bộ số liệu, cần phải kiểm tra và giải thích.
- Nếu Zi< Cz: có thể kết luận với mức độ tin cậy 95% Xi không phải là
giá trị bất thường.
Bảng “Giá trị tới hạn” Cz thống kê xác suất 95% của độ chênh lệch Z
n
Giá trị tới
hạn (Cz)
n
Giá trị tới
hạn (Cz)
n
Giá trị tới
hạn (Cz)
n
Giá trị tới
hạn (Cz)
3
1,15
15
2,55
27
2,86
39
3,03
4
1,48
16
2,59
28
2,88
40
3,04
5
1,71
17
2,62
29
2,89
50
3,13
6
1,89
18
2,65
30
2,91
60
3,2
7
2,02
19
2,68
31
2,92
70
3,26
8
2,13
20
2,71
32
2,94
80
3,31
9
2,21
21
2,73
33
2,95
90
3,35
10
2,29
22
2,76
34
2,97
100
3,38
11
2,34
23
2,78
35
2,98
110
3,42
12
2,41
24
2,8
36
2,99
120
3,44
13
2,46
25
2,82
37
3,00
130
3,47
14
2,51
26
2,84
38
3,01
140
3,49
Việc xác định nhiều giá trị bất thường trong chuỗi số liệu đo đạc là khá
phức tạp. Do đó, nên sử dụng các phần mềm sẵn có trên thế giới như SPSS,
Mplus, R, MLOD… để tính toán.
Trường hợp phát hiện giá trị đo đạc bất thường, cần đối chiếu lại các tài liệu
liên quan để kiểm chứng thông tin và bổ sung, hiệu đính lại số liệu nếu thấy sai
khác. Trường hợp không có thông tin kiểm chứng cần loại bỏ số liệu.
11
Bước 8: Đánh giá độ chụm của phép phân tích
- Mẫu lặp được sử dụng để đánh giá độ chụm của kết quả phân tích. Đối
với hai lần lặp, độ chụm được đánh giá dựa trên việc đánh giá RPD,
được tính toán như sau:
Trong đó:
- RPD: phần trăm sai khác tương đối của mẫu lặp;
- LD1: kết quả phân tích lần thứ nhất;
- LD2: kết quả phân tích lần thứ hai.
Giới hạn RPD được tổ chức thực hiện quan trắc thiết lập dựa trên kết quả
phê duyệt phương pháp phân tích nhưng không vượt quá 30%.
Bước 9: Phân tích tính tương quan
Việc phân tích tương quan có thể thực hiện bằng nhiều cách, đơn giản
nhất là tính hệ số tương quan R trong excel. Trong đó giá trị R dao động từ -1
đến 1, giá trị tuyệt đối của R càng lớn gần về 1 thì mức tương quan càng cao,
càng về 0 thì tương quan càng thấp. Giá trị R âm thể hiện sự tương quan nghịch.
Việc tính tương quan giữa chuỗi số liệu quan trắc với một số giá trị khác
hoặc với chuỗi số liệu chuẩn hoặc có độ ổn định, có quy luật rõ ràng có thể giúp
phát hiện ra quy luật nhất định của chuỗi số liệu, các sai số hệ thống và lý giải
những khác thường trong kết quả quan trắc vào những thời điểm nhất định. (Ví
dụ: Tính tương quan của O3 và cường độ bức xạ).
Bước 10. Đánh giá tính hoàn thiện của số liệu
Kiểm tra tính hoàn thiện của dữ liệu dựa vào kế hoạch của chương trình,
dự án quan trắc. Tính hoàn thiện của số liệu được xác định thông qua tỷ lệ phần
trăm các phép đo số lượng mẫu cần quan trắc hợp lệ (đạt yêu cầu) trên tổng số
các phép đo số lượng mẫu quan trắc theo yêu cầu của kế hoạch đề ra.
S1: Căn cứ theo từng Chương trình quan trắc, xác định tỷ lệ % được chấp
nhận đối với tính hoàn thiện của số liệu.
12
S2: Tính toán tỷ lệ phần trăm phép đo hợp lệ, so sánh với tỷ lệ được chấp
nhận đã xác định trong Chương trình quan trắc. Công thức sau đây được sử dụng
để xác định phần trăm đầy đủ của số liệu (%):
Trong đó:
C: Phần trăm đầy đủ của số liệu (%);
v: số lượng phép đo mẫu quan trắc theo kế hoạch được chấp nhận
hợp lệ;
T: tổng số mẫu cần quan trắc theo dự kiến ban đầu.
Về mặt lý thuyết tỷ lệ này đạt >95% là đạt yêu cầu nhưng thực tế tuỳ mục
đích sử dụng tỷ lệ này có thể dao động ở mức trên 70-80% vẫn có thể sử dụng.
Bước 11: Lưu trữ số liệu đã xử lý
Lưu trữ số liệu và các lưu ý trong quá trình kiểm tra số liệu
2. Xử lý số liệu tự động, liên tục
2.1. Mục đích, yêu cầu
Mục đích
- Kiểm tra tổng hợp về tính hợp lý của số liệu quan trắc thông qua
những đánh giá khoa học và các công cụ thống kê;
- Áp dụng các biện pháp xử lý nhằm tăng tính tin cậy của số liệu quan
trắc.
2.2.Yêu cầu về chất lượng đối với số liệu sau xử lý
Số liệu sau xử lý đảm bảo về mặt chất lượng và số lượng đáp ứng các mục
tiêu sử dụng.
13
2.3. Quy trình xử lý số liệu tự động, liên tục
2.3.1. Sơ đồ quy trình xử lý
STT
Bước 1:
Yêu cầu
Nội dung
Tập hợp đủ các tài liệu liên
quan:
- Số liệu các thông số
- Thông tin về hiệu chuẩn
- Thông tin về hoạt động
vận hành trạm
Chuẩn bị số liệu
N
Đủ số liệu
Bước 2:
Y
Loại bỏ số liệu bất thường và đánh dấu
các trường hợp nghi ngờ
N
Số liệu hợp lý
- Loại bỏ số liệu bất thường
- Đánh dấu số liệu nghi ngờ
Loại bỏ số liệu bất thường
Số liệu nghi ngờ được ghi
chép lại
Y
So sánh giá trị kết quả với
ít nhất 10 số liệu thời gian
trước và 10 số liệu thời
gian sau đó
So sánh giá trị kết quả với bộ số liệu
cần xử lý
Bước 3:
Y
Số liệu lỗi
N
Bước 4:
So sánh chuỗi kết quả với chuỗi số liệu
đã có
So sánh chuỗi số liệu cần phân tích với chuỗi
số liệu đã có của thông số
14
Loại bỏ các số liệu
cao/thấp bất thường đối với
số liệu có tần suất trả ra
nhỏ hơn 1 giờ. Trường hợp
số liệu có tần suất kết quả
trả ra lớn hơn 1 giờ thì
đánh giá là số liệu nghi ngờ
Tiến hành phân tích thống
kê chuỗi số liệu quan trắc
để có thể đánh giá diễn
biến và phát hiện ra các
quy luật liên quan đến kêt
quả thu được
N
Số liệu hợp lý
- Trường hợp có giải thích
được nguyên nhân thì số
liệu được chấp nhận.
- Trường hợp không giải
thích được thì đánh dấu lại.
Y
Bước 5
Giá trị tuyệt đối của hệ số
tương quan càng lớn gần về
1 thì mức tương quan càng
cao, càng về 0 thì tương
quan càng thấp.
Phân tích tính tương quan
Phân tích tương quan giữa các thông số
Phân tích tương quan giữa thông số với các
điều kiện môi trường đã biết quy luật
N
Số liệu hợp lý
Y
Bước 6
Đánh giá tính hoàn thiện số liệu
Xác định tỷ lệ % số liệu thu được
Xác định tỷ lệ % số liệu hợp lệ
Bước 7
Tính toán các đặc trưng của số liệu
Bước 8
- Trường hợp có giải thích
được nguyên nhân thì số
liệu được chấp nhận.
- Trường hợp không giải
thích được thì đánh dấu lại
Bộ số liệu đảm bảo chất
lượng:
- Tỉ lệ số liệu thu được lớn
hơn 80%
Tỉ lệ số liệu hợp lớn hơn
70%
- TB 1 giờ, TB 8 giờ, TB
24 giờ, TB tháng, TB năm
Số liệu được lưu trữ phục
Lưu trữ
vụ việc phân tích về sau
2.3.2. Diễn giải sơ đồ
Bước 1: Chuẩn bị tài liệu, số liệu tự động, liên tục
Các tài liệu, số liệu, thông tin cần thu thập:
- Số liệu quan trắc các thông số của trạm
- Thông tin về phạm vi đo, giới hạn phát hiện, giới hạn báo cáo, độ chính
xác của thiết bị quan trắc.
- Thông tin về hiệu chuẩn: số liệu hiệu chuẩn, kết quả đánh giá hiệu chuẩn
định kỳ
- Thông tin về hoạt động của trạm: thời gian trạm dừng hoạt động, thời gian
trạm bảo trì, bảo dưỡng, sửa chữa thay thế thiết bị, thời gian thay thế khí
chuẩn, giấy lọc và các vật tư tiêu hao khác.
15
Bước 2: Loại bỏ các số liệu bất thường và đánh dấu trường hợp nghi ngờ
Loại bỏ các số liệu bất thường trước khi phân tích:
- Số liệu trong thời gian thiết bị báo lỗi/có sự cố
-
Số liệu trong thời gian hiệu chuẩn thiết bị
Số liệu âm
Số liệu nằm ngoài ngưỡng thông số và phạm vi đo của thiết bị
Các số liệu lỗi được phát hiện qua các bước xử lý số liệu tiếp theo
Một số trường hợp số liệu nghi vấn cần được đánh giá thêm:
- Số liệu bằng 0
- Số liệu bằng nhau liên tục: có ít nhất 3 giá trị liên tiếp bằng nhau
Khi phát hiện các trường hợp số liệu nghi vấn cần xem xét lại toàn bộ quá
trình quan trắc (vận hành, hoạt động của trạm) trong khoảng thời gian đó. Ngoài
ra các số liệu nghi ngờ cần được đánh dấu lại.
Bước 3: So sánh giá trị kết quả với chuỗi số liệu đã có của thông số
Phương pháp này thực hiện so sánh mỗi giá trị quan trắc với các giá trị
trong bộ số liệu cần xử lý. Loại bỏ các số liệu cao/thấp bất thường đối với số
liệu có tần suất trả ra nhỏ hơn 1 giờ. Trường hợp số liệu có tần suất kết quả trả ra
lớn hơn hoặc bằng 1 giờ thì đánh giá là số liệu nghi ngờ.
Cần so sánh giá trị quan trắc với ít nhất 10 giá trị trước và 10 giá trị sau
thời gian đó.
Ví dụ so sánh thông số CO tại thời gian 12 giờ với 10 số liệu các thời gian
trước và 10 số liệu thời gian sau đó thì thấy giá trị thông số tại thời gian này cao
đột biến. Số liệu này cần được loại bỏ.
16
Bước 4: So sánh giá trị kết quả với chuỗi số liệu đã có của thông số
Các trạm quan trắc tự động liên tục thường cung cấp chuỗi số liệu liên tục
trong thời gian dài. Từ các chuỗi số liệu đó có thể đánh giá, xác định đặc trưng,
diễn biến của các thông số theo các quy luật. Từ các quy luật đó ta có thể đánh
giá chuỗi số liệu mới có phù hợp với các quy luật đã được xác định.
Ví dụ quy luật về giá trị thông số: trạm quan trắc tại một vị trí tại Hà Nội cho
kết quả diễn biến thông số PM10 trung bình 24 giờ nằm trong khoảng từ 100 –
150 µg/m3. Tuy nhiên số liệu thông số PM10 trong các tháng gần đây rất thấp
(nhỏ hơn 50 µg/m3) thì các số liệu đó cần phải đánh giá, xem xét lại.
Ví dụ quy luật biến thiên theo các tháng trong năm của thông số O3, thông số
O3 thường cao vào các tháng mùa đông (từ tháng 10 đến tháng 2) và thấp hơn
các tháng mùa hè (từ tháng 3 đến tháng 9) đối với khu vực miền Bắc Việt Nam.
Nếu thông số O3 trong 1 năm nào đó không đúng với quy luật như trên thì cần
đánh giá, xem xét lại.
Bước 5: Phân tích tính tương quan
Phương pháp phân tích tương quan có thể được sử dụng để đánh giá sự
hợp lý của chuỗi số liệu. Phương pháp đánh giá tương quan bao gồm: tương
quan giữa các thông số và tương quan giữa thông số quan trắc và các điều kiện
môi trường đã biết quy luật.
a. Đánh giá tương quan giữa các thông số: tất cả các thông số của trạm
đều có thể tính toán tương quan với nhau, tuy nhiên cần chú ý đặc biệt đến các
thông số có tương quan chặt chẽ theo lý thuyết. Ví dụ các thông số có tương
quan chặt với nhau như: thông số bức xạ mặt trời và O3, thông số NO2 và O3,
thông số PM2.5 và PM10, thông số nhiệt độ và DO, thông số độ dẫn và TDS.
Phương pháp đánh giá tương quan giữa các thông số: sử dụng hệ số tương
quan pearson
Hệ số tương quan ρX, Y giữa hai thông số X và Y với giá trị trung bình tương
ứng là μX; μY và độ lệch chuẩn σX; σY được định nghĩa:
Trong đó: E là toán tử tính kỳ vọng và cov là hiệp phương sai.
17
Bảng giá trị hệ số tương quan
Hệ
số
tương Thông số 1
Thông sô 2
Thông số 3
….
quan
Thông số 1
Thông số 2
1
1
Thông số ....
1
Bảng hệ tương quan cho biết các thông số nào có tương quan với nhau,
thông số nào không có tương quan với nhau:
- Hệ số tương quan càng gần 1: hai thông số tương quan thuận càng chặt
- Hệ số tương quan càng gần -1: hai thông số tương quan nghịch càng chặt
- Hệ số tương quan càng gần 0: hai thống số càng ít tương quan (hai thông
số càng độc lập)
Đánh giá tương quan thường được thực hiện giữa các thông số khác nhau
trong cùng 1 trạm: mục đích đánh giá mối quan hệ giữa các thông số, xem xét
các thông số diễn biến theo quy luật thông thường hay bất thường. Trong trường
hợp bất thường trái với quy luật cần phải xem xét lại vấn đề độ chính xác của
thiết bị quan trắc. Ví dụ: Thông số O3 và bức xạ mặt trời có tương quan chặt với
nhau, nếu tính toán thực tế thông số O3 và bức xạ mặt trời không tương quan thì
cần xem xét lại tính chính xác của 2 thông số trên.
Ví dụ tương quan giữa các thông số
Ví dụ 1: Tương quan giữa thông số thông số O3 và NOx và VOC
Thông số O3 là thông số ô nhiễm thứ cấp được sinh ra do phản ứng của
NOx, VOC dưới tác dụng của bức xạ mặt trời. Tương quan giữa O3, NOx và
VOC được thể hiện trong hình như dưới đây:
18
Hình 1: Mối quan hệ giữa O3 và NOx, VOC
Tùy theo sự tăng giảm của VOC và NOx mà thông số O3 có sự biến động tương
ứng.
Ví dụ 2: Tương quan giữa thông số O3 và cường độ bức xạ mặt trời
Nồng độ thông số O3 phụ thuộc rất lớn vào cường độ bức xạ mặt trời.
Thông số O3 thường đạt cực đại vào thời điểm bức xạ mặt trời lớn nhất (thời
gian từ 11h đến 14h). Tương quan giữa thông số O3 và bức xạ mặt trời như sau:
Giờ
Khi xử lý số liệu có thể vẽ đồ thị diễn biến thông số O3 trong ngày, nếu đồ
thị thể hiện cực đại nồng độ O3 vào các giờ có bức xạ mặt trời cao (từ 11h đến
14h hàng ngày) thì đó là một căn cứ để khẳng định chất lượng số liệu là tốt.
19
Ví dụ 3: Tương quan giữa các thông số bụi (PM10, PM2.5, PM1)
Các thông số PM10, PM2.5 và PM1 luôn có tương quan chặt chẽ với nhau.
Có thể kiểm tra tương quan giữa PM10, P2.5 và PM1 thông qua tính toán hệ số
tương quan.
Ví dụ 4: Tương quan giữa thông số DO và nhiệt độ đối với trạm quan trắc nước
Trong nước cùng một điều kiện thông số DO và nhiệt độ có tỉ lệ nghịch
với nhau, vì vậy xử lý số liệu DO có thể tính toán tương quan giữa DO và nhiệt
độ hoặc thể hiện 2 thông số trên cùng một biểu đồ.
b. Đánh giá tương quan giữa các thông số quan trắc với các điều kiện
môi trường đã biết rõ quy luật. Một số điều kiện môi trường tác động đến các
thông số quan trắc không được quan trắc, tuy nhiên quy luật diễn biến của các
điều kiện môi trường này ta đã biết. Ví dụ như: quy luật diễn biến cường độ xe
của các đường giao thông, các quy luật nhiệt độ, bức xạ mặt trời trong ngày…Vì
vậy ta có thể đánh giá tương quan giữa thông số quan trắc với các quy luật đã
biết này.
Ví dụ tương quan giữa các thông số quan trắc với các điều kiện môi trường
Ví dụ 1: Tương quan giữa thông số CO và diễn biến theo thời gian
Đối với các trạm quan trắc ven đường nồng độ CO tương quan rất rõ với
diễn biến theo thời gian. Trong ngày diễn biến giao thông thường đạt cực đại
vào 8 – 9 giờ và 17-19h, cực đại nồng độ thông số CO thường vào các giờ đó.
Đồ thị thông số CO thông thường trong các ngày như sau:
Giờ
Hình : Diễn biến thông số CO trong ngày
Nồng độ thông số CO thường đạt cực đại vào các giờ cao điểm giao thông,
nếu số liệu CO của trạm ven đường thể hiện điều này thì đó cũng là 1 căn cứ để
xác định tính chính xác của số liệu.
20
Ví dụ 2: Tương quan giữa thông số NOx và diễn biến theo thời gian
Đối với trạm quan trắc ven đường thông số NOx cũng tương tự thông số
CO, NOx được sinh do các phương tiện giao thông vì vậy cực đại nồng độ NOx
thường trùng với cực đại diễn biến cường độ giao thông. Đồ thị thông số NOx
trong ngày như sau:
Giờ
Hình : Diễn biến thông số NOx trong ngày
Bước 6: Đánh giá tính hoàn thiện của số liệu
Tính hoàn thiện của số liệu được đánh giá thông qua tỉ lệ số liệu thu được
và tỉ lệ số liệu hợp lệ.
Tỉ lệ số liệu thu được là tỉ số giữa số lượng số liệu thu thực tế so với
số lượng số liệu thu được theo thiết kế.
Tỉ lệ số liệu hợp lệ là tỉ số giữa số số liệu thu được sau khi đã loại bỏ các
số liệu lỗi, sốliệu bất thường so với số liệu thu được theo thiết kế.
Bảng . Bảng thống kê số liệu quan trắc
Nội dung
Thông số 1
Tỉ lệ số liệu thu được (%)
Tỉ lệ số liệu hợplệ (%)
Bộ số liệu đảm bảo chất lượng:
- Tỉ lệ số liệu thu được lớn hơn 80%
- Tỉ lệ số liệu hợp lớn hơn 70%
21
Thông số 2
Thông số…
Bước 7: Tính toán các đặc trưng của số liệu
Đối với số liệu quan trắc không khí:
Tính toán các giá trị trung bình 1 giờ, 8 giờ, 24 giờ, tháng, năm:
- Trung bình một giờ là giá trị trung bình của các giá trị đo được trong
khoảng thời gian một giờ.
- Trung bình 8 giờ là giá trị trung bình của các giá trị đo được trong khoảng
thời gian 8 giờ liên tục.
- Trung bình 24 giờ là giá trị trung bình của các giá trị đo được trong
khoảng thời gian 24 giờ liên tục (một ngày đêm).
- Trung bình tháng: là giá trị trung bình của các giá trị đo được trong
khoảng thời gian một tháng.
- Trung bình năm: là giá trị trung bình của các giá trị đo được trong khoảng
thời gian một năm.
Biểu mẫu các bảng số liệu sau khi tính toán như sau:
Bảng số liệu trung bình 1 giờ trong 1 ngày
Giờ
Thông số 1
Thông số 2
Thông số 3
….
1
2
…
24
Bảng số liệu trung bình 8 giờ trong 1 ngày
Giờ
Thông số 1
Thông số 2
1
2
…
24
22
Thông số 3
….
Bảng số liệu trung bình 24 giờ trong 1 tháng
Ngày
Thông số 1
Thông số 2
Thông số 3
….
1
2
…
31
Bảng số liệu trung bình tháng trong 1 năm
Tháng
Thông số 1
Thông số 2
Thông số 3
….
1
2
…
12
Bảng số liệu trung bình năm
Năm
Thông số 1
Thông số 2
Thông số 3
….
2015
2016
2017
…
Đối với số liệu quan trắc nước:
- Tùy theo yêu cầu trong việc phân tích đánh giá chất lượng môi trường
trong các khoảng thời gian ngắn hạn hay dài hạn có thể tính toán các giá
trị trung bình 1 giờ, trung bình tháng, trung bình năm.
Bước 8: Lưu trữ
Các bảng số liệu được lưu tữ phục vụ việc phân tích về sau.
23
Phần III: TRÌNH BÀY SỐ LIỆU BẰNG ĐỒ THỊ
1. Sự cần thiết của việc thể hiện dữ liệu bằng đồ thị
Phương pháp đồ thị thống kê là phương pháp sử dụng con số kết hợp với
các hình vẽ, đường nét và màu sắc để chuyển các số liệu thành những thông tin
có ý nghĩa, trực quan và dễ hiểu.
Bước đầu tiên của khâu xử lý số liệu ta nên vẽ chúng ra. Thể hiện dữ liệu
bằng đồ thị sẽ làm cho các số liệu thực tế hơn và trực quan hơn. Ta có thể vẽ
nhiều loại đồ thị khác nhau để quan sát dữ liệu theo những cách khác nhau.
Thực hiện điều này ta có thể:
1. Làm sáng tỏ vấn đề chỉ cần 1 ít thao tác phân tích
2. Chỉ ra một số tính chất của dữ liệu có thể không phù hợp với một
phương pháp phân tích thống kê nào đó
3. Thấy được những số liệu bất thường trong mẫ
4. Tiết kiệm thời gian cho những bước phân tích tiếp theo
5. Có thể xuất hiện được những vấn đề mà ta chưa nghĩ đến
6. Tránh những sai sót không đáng có.
2. Các dạng đồ thị chính
2.1. Đồ thị dạng thanh (Bar chart)
Biểu đồ thanh là loại biểu đồ biểu hiện các tài liệu thống kê bằng các hình
chữ nhật hay khối chữ nhật thẳng đứng hoặc nằm ngang có chiều rộng và chiều
sâu bằng nhau, còn chiều cao tương ứng với các đại lượng cần biểu hiện.Các
loại giá trị quan trắc môi trường định kỳ theo tháng, quý, …không liên tục
thường thể hiện loại đồ thị này.
Ví dụ:Đồ thị biểu diễn lượng mưa trung bình từ năm 2008 – 2012 được
thể hiện trong hình sau:
24