Tải bản đầy đủ (.docx) (58 trang)

Nckh 2023 cua tien si kh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.98 MB, 58 trang )

Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

1.

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Đặt vấn đề
Việt Nam là quốc gia có tiềm năng điện gió lớn nhất trong khu vực Đơng Nam Á.

Theo đánh giá của Ngân hàng Thế giới (WB), Việt Nam có tiềm năng điện gió lớn nhất
khu vực Đơng Nam Á (khoảng 599GW) .Diện tích đất liền và biển của Việt Nam rất giàu
tiềm năng, thuận lợi cho việc lắp đặt các tuabin gió lớn. Trong việc phát triển năng lượng
điện gió tại Việt Nam hiện nay, một trong những vấn đề khó khăn nhất cần giải quyết là
lưới điện truyền tải và phân phối. Hệ thống điện lưới hiện tại được thiết kế để truyền tải
một chiều: điện năng chỉ đi theo một hướng từ các nguồn phát điện đến người tiêu thụ
(phụ tải điện). Việc dự trữ điện có thể được thực hiện nhưng khá khó khăn trong khi việc
truyền tải thông tin chỉ diễn ra một chiều.

Nhưng việc khai thác lại gặp một thách thức lớn đó là cơng suất của hệ thống điện gió
phụ thuộc rất nhiều vào điều kiện thời tiết: hướng gió, vận tốc gió, …; dẫn đến hệ thống


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18


Ban hành lần: 04
Ngày hiệu lực:

làm việc không ổn định và tải không được cấp nguồn điện đáng tin cậy. Vì vậy khi năng
lượng điện gió kết hợp với nguồn năng lượng truyền thống gặp các vấn đề như:


Điện gió khơng liên tục, khó dự báo chính xác gây khó khăn cho cơng tác điều độ
và tham gia thị trường điện



Biến động công suất điện gió mang lại vấn đề mất cân bằng nguồn điện



Tỷ trọng lớn cơng suất điện gió làm tăng nhu cầu về công suất dự trữ và các yếu
tốc khác.



Các nhà máy điện gió kém linh hoạt hơn và ít kiểm sốt hơn so với các nhà máy
điện thơng thường.



Hệ thống chuyển đổi năng lượng gió khác với các máy phát điện thơng thường về
qn tính, điều khiển cơng suất, tần số và điều chỉnh công suất phản kháng, ....






Để giải quyết các vấn đề với sự cân bằng cơng suất, hệ thống điện có thể cần đủ lượng
điện điều tiết, và điều độ công suất phù hợp giữa hệ thống điện gió các hệ thống điện
truyền thống:


Cải thiện mơ hình dự báo năng lượng điện gió;



Cung cấp quy định và dự trữ điện từ các tổ máy phát điện khác (trạm điện chính và
CHP);



Cung cấp năng lượng điều tiết và dự trữ từ các tuabin gió / trang trại lớn;



Quản lý nhu cầu điện (DSM);



Điều chỉnh tải điện (DR)



Ứng dụng công nghệ lưu trữ năng lượng;







Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

2. Tổng quan tài liệu
Phương pháp đề xuất là sử dụng Keras –1 API (Application Programming Interface)
cấp cao của TensorFlow để huấn luyện mạng nơron nhân tạo trong dự báo điện gió.
Chương trình được viết bằng ngơn ngữ lập trình Python chạy trên mơi trường
Google Colaboratory cho phép xử lý dữ liệu với tốc độ cao, lập trình đơn giản, thuận tiện,
chương trình ngắn gọn, dễ hiểu và đặc biệt là cho kết quả tính tốn nhanh chóng, đáp ứng
nhu cầu vận hành thị trường điện luôn luôn biến đổi.
Dự án này nghiên cứu dự báo công suất phát điện của các nhà máy điện gió, từ đó
nâng cao hiệu quả vận hành lưới điện tại các khu vực sử dụng điện gió bằng cơng cụ
chính của Machine Learning. Kỹ thuật phân tích dữ liệu dạy máy tính để làm những việc
giống như con người. Nghiên cứu trước tiên sẽ tập trung vào kiểm tra mối tương quan
giữa tốc độ gió, hướng gió,… với cơng suất gió từ chọn ra những điều kiện ảnh hưởng
đến giá trị công suất.
Sau đó, xử lý các giá bị khuyết bằng thuật tốn nội suy. Xóa các giá trị bất thường
trong dữ liệu; phướng án đề xuất là sử dụng thuật toán kết hợp giữ phương pháp xác định
điểm thay đổi (The Change Point Grouping) và thuật toán IQR (Interquartile Range)

Cuối cùng, một mạng nơ-ron sẽ được sử dụng để tạo ra một dự đốn cơng suất. Dự
đốn cơng suất mạng thần kinh có hiệu quả cao bởi vì nó thiết lập mối quan hệ giữa sản
xuất điện gió và liên quan các yếu tố, khả năng ánh xạ các kết nối và học hỏi từ các mẫu
dữ liệu. Mặc khác phương pháp này khơng cần mơ hình tốn học để xây dựng mối quan
hệ giữa đầu vào và đầu ra để ước tính sản lượng điện gió.


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

3. Mục tiêu - Phương pháp
Mục tiêu đề tài này xây dựng mơ hình dự báo cơng suất phát điện gió ngắn hạn dựa
trên thuật tốn học sâu sử dụng ngơn ngữ lập trình Python dựa trên thư viện TensorFlow.
Hơn nữa, dự án nghiên cứu so sánh, đánh giá các mơ hình huấn luyện máy học nhằm
nâng cao độ chính xác của kết quả dự báo. Mơ hình đã được thử nghiệm với dữ liệu thực
tế thu thập từ nhà máy điện gió. Kết quả thu thập cho thấy,tính ưu việt của phương pháp
trong dự báo với sai số thấp và tiết kiệm thời gian tính tốn.
Với những yêu cầu trong công tác vận hành hệ thống điện và thị trường điện cạnh
tranh trong tương lai, đề tài tiếp trục phát triễn dự báo điện gió thích hợp với bài toán dự
báo trước 30 phút, 01 giờ, 24 giờ,...ứng dụng cho việc lập kế hoạch điều độ, đưa ra các
quyết định vận hành hợp lý và đảm bảo an ninh hoạt động thị trường điện.


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN


Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

4. Kết quả - Thảo luận
CHƯƠNG 1.
111Equation
Chapter 1
Section 1
Hệ thống dự báo năng lượng gió có thể được phân loại thành bốn loại dựa trên khung
thời gian:


Dự báo rất ngắn hạn: Từ vài giây đến vài phút.



Dự báo ngắn hạn Từ 30 phút đến trước 1 giờ.



Dự báo trung hạn: Từ 6 giờ đến trước 1 ngày.



Dự báo dài hạn: Từ 1 ngày đến 1 tuần hoặc 1 năm.
Bảng 1.1: Phận loại dự báo năng lượng điện gió theo khung thời gian


Quy mô thời gian
Nhanh-rất ngắn hạn

Ngắn hạn

Phạm vi
Từ vài giây đến vài
phút

Từ 30 phút đến trước
1 giờ

Các ứng dụng
Thanh tốn bù trừ thị trường điện.
Điều độ cơng suất trong lưới điện.
Quản lý lưới điện.
Lập kế hoạch điều độ tải kinh tế.
Quyết định tải hợp lý.
An ninh hoạt động trong thị trường
điện.
Đưa ra các quyết định bật tắt tuabin vì

Trung hạn

Từ 6 giờ đến trước 1
ngày

an tồn hoặc điều kiện trên thị trường.
Các quyết định yêu cầu dự trữ.
Các quyết định cam kết đơn vị.

Lập kế hoach dài hạn:

Dài hạn

Từ 1 ngày đến 1 tuần
hoặc 1 năm

 Để lên kế hoạch bảo trì
 Cam kết với đơn vị
 Tối ưu hóa chi phí vận hành


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Xây dựng mơ hình dự báo thực hiện trong một thời gian 10 phút. Thuật toán tổng quát

được trình bày như sau:
i.

Đọc số liệu đầu vào cho chương trình dự báo: Ngày, miền thời gian dự báo, hướng
gió, vận tốc, và công suất thực đo được của nhà máy.

ii.

Hệ số tương quan (Correlation Coefficient) giữa tham số đấu vào (vận tốc gió,
hướng gió, …), tham số đầu ra (cơng suất gió)

iii.

Xử lý số liệu bị thiếu (Fill missing value): Sử dụng phương pháp nội suy tuyến
tính (Interpolation); nội suy tuyến tính về cơ bản là ước tính của một giá trị chưa
biết nằm trong hai giá trị đã biết.

iv.

Xóa dữ liệu bất thường (Remove outliers)
Các phương pháp xóa dữ liệu loại ngoại lai như:
 Phương thức IQR (Inter Quartile Range)
 Phương pháp xác định điểm thay đổi (The Change Point Grouping)

iv.

Chuẩn hóa dữ liệu: chuẩn hóa được sử dụng để xử lý dữ liệu đầu vào, dữ liệu đầu
ra sao cho giá trị dữ liệu mẫu nằm trong khoảng từ 0 đến 1

v.


.

Phân cụm dữ liệu trong tập dữ liệu
 Xác định số cụm K tối ưu: Thuật toán Elbow
 Phân cụm dữ liệu (Clustering Method): K-Means

vi.

Tách dữ liệu để huấn luyện, kiểm định và kiểm tra từng mơ hình theo số cụm dữ
liệu đã xác định ở bước vi:
 Dữ liệu để huấn luyện (Training data)
+ Dữ liệu huấn luyện: 70%
+ Dữ liệu kiểm định: 20%
 Dữ liệu kiểm tra (Testing data): 10%

vii.

Xây dựng mơ hình dự báo công suất LSTM: xác định mạng thần kinh LSTM và
cài đặt tham số như: số lớp mạng, số lượng tế bào thần kinh trong mỗi lớp, hàm
kích hoạt, kích thước lớp ẩn, …


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

viii.

Mã số:
TT/P.QLPTKHCN/13/BM18

Ban hành lần: 04
Ngày hiệu lực:

Biên dịch mạng: đặt trình tối ưu hóa, các chỉ số tính sai số mơ hình và lưu trữ các
tham số đào tạo và biên dịch của mô hình dự báo cơng suất gió bằng mơ hình
mạng thần kinh LSTM đã xây dựng.

ix.

Đánh giá chất lượng mơ hình LSTM: tập dữ liệu huấn luyện được sử dụng đào tạo
mơ hình, lỗi của mơ hình dự đốn đã thiết lập được đánh giá và cài đặt thông số
của mô hình được tinh chỉnh theo kết quả để có được một dự đoán tốt hơn tác
dụng.
Các hàm đánh giá sai số:
 Mean Absolute Error (MAE)
MAE 

1
N

N

y
i


212\* MERGEFORMAT (.)

i 1


 Mean Squared Error (MSE)
MSE 

1 N
2
 yi  yˆ  1

N i 1

313\* MERGEFORMAT (.)

 Root Mean Square Error (RMSE)

RMSE  MSE 

1 N
2
 yi  yˆ 

N i 1
414\* MERGEFORMAT (.)

2

 R-square ( R )

R 2 = 1-

µˆ
Y -ˆ Y


å (
)
å ( Y -ˆ Y )
i=1
n

i

i=1
n

2

i

2

515\* MERGEFORMAT (.)

x.

Phân nhóm dữ liệu kiểm tra với thuật toán Naive Bayes Classification.

xi.

Dự báo và đánh giá: Sử dụng tập dữ liện kiểm tra được sử dụng kiểm tra tối ưu mơ
hình; so sánh kết quả dự báo với kết quả thực tế và tính tốn sai sơ mơ hình.



Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Hình 1.1 Mơ hình tổng qt dự báo cơng suất gió

CHƯƠNG 2.
622Equation


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Chapter 2
Section 2X
Ử LÝ SỐ
LIỆU
Tiền xử lý dữ liệu là một bước rất quan trọng trong việc giải quyết bất kỳ vấn đề nào
trong lĩnh vực học máy. Hầu hết các bộ dữ liệu được sử dụng trong các vấn đề liên quan
đến học máy cần được xử lý, làm sạch và biến đổi trước khi một thuật tốn học máy có
thể được huấn luyện trên những bộ dữ liệu này. Các kỹ thuật tiền xử lý dữ liệu phổ biến

hiện nay bao gồm:


Hệ số tương quan giữa tham số đầu vào đầu ra (Correlation Coefficient)



Xử lý dữ liệu bị khuyết (Fill Missing Data)



Xóa dữu liệu bất thường (Remove Outlier)



Chuẩn hóa dữ liệu (standardizing data)

Hình 2.2: Xử lý số liệu
Những kỹ thuật này tương đối dễ hiểu nhưng sẽ có nhiều vấn đề phát sinh khi chúng
ta áp dụng vào các dữ liệu thực tế. Bởi lẽ các bộ dữ liệu ứng với các bài toán trong thực tế


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:


rất khác nhau và mỗi bài tồn thì đối mặt với những thách thức khác nhau về mặt dữ liệu.
Trong bài viết này, chúng ta sẽ cùng nhau tìm hiểu về các kỹ thuật tiền xử lý dữ liệu và
cách áp dụng chúng trong các bài toán thực tế.

2.1

Các số liệu dùng cho dự báo
Để xây dựng mô hình dự báo cơng suất phát của nhà máy điện gió, với dữ liệu vận tốc

gió, nhiệt độ, miền thời gian và công suất phát của nhà máy đo được trong ngày 1/1/2020
đến ngày 30/12/2020; thời gian thu thập 10 phút. Sau đây là số liệu thu thập được tại một
cột gió của nhà máy điện gió:
Bảng 2.2: Bảng trích dẫn số liệu của mơ hình dự báo
date
1/1/2020 0:00
1/1/2020 0:10
1/1/2020 0:20
1/1/2020 0:30
1/1/2020 0:40
1/1/2020 0:50
1/1/2020 1:00
1/1/2020 1:10
1/1/2020 1:20
1/1/2020 1:30

Tổng

2.2

wind_speed

1.234189916
1.482291833
1.090630334
0.724122349
1.071949702
1.530795588
1.912540369
1.816564433
1.946185913
1.968865063


wind_direction
206.832468
197.3613282
194.204615
197.4560416
203.0716156
192.8073578
189.9302815
189.1015022
189.7091628
173.3235437

52704x4

blade_angle
44.99000168
44.99000168
44.99000168

44.99000168
44.99000168
44.99000168
44.99000168
44.99000168
44.99000168
44.99000168


power
-1.192550363
-0.83190436
-1.300317355
-1.371450701
-1.353311694
-1.058905545
-1.658118041
-2.534480695
-2.71836036
-3.061922086


Hệ số tương quan (Correlation Coefficient)

2.2.1 Tổng quan
Pearson Correlation là gì? Phân tích tương quan Pearson là một trong các bước chúng
ta thực hiện trong bài nghiên cứu sử dụng phân tích định lượng SPSS. Thường bước này
sẽ được thực hiện trước khi phân tích hồi quy. Mục đích chạy tương quan Pearson nhằm
kiểm tra mối tương quan tuyến tính chặt chẽ giữa biến phụ thuộc với các biến độc lập và
sớm nhận diện vấn đề đa cộng tuyến khi các biến độc lập cũng có tương quan mạnh với

nhau.


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Tương quan tuyến tính giữa hai biến là mối tương quan mà khi biểu diễn giá trị quan
sát của hai biến trên mặt phẳng Oxy, các điểm dữ liệu có xu hướng tạo thành một đường
thẳng. Hệ số tương quan Pearson (ký hiệu r) để lượng hóa mức độ chặt chẽ của mối liên
hệ tuyến tính giữa hai biến định lượng.
 Hệ số tương quan xác định theo cơng thức tính như sau:

N  xy    x    y 

r

 N  x2    x  2   N  y2    y  2 


 727\* MERGEFORMAT
(.)

Trong đó:
 N: Số cặp điểm



 xy : tổng các tích của các điểm được ghép nối



 x : tổng điểm x



 y : tổng điểm y



 x 2 : tổng điểm x bình phương



 x 2 : tổng điểm y bình phương

Hoặc,



r



n

n

i 1

( xi  x )( yi  y )

( xi  x )
i 1

2



n

( yi  y )
i 1

2

828\* MERGEFORMAT (.)

Trong đó:


r : là hệ số tương quan cần tìm biểu diễn mối quan hệ giữa x , y




xi , yi : lần lượt là các giá trị biến x , y
n : là số giá trị của biến x , y




x , y : lần lượt là giá trị trung bình của biến x , y


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

 Hệ số tương quan Pearson r có giá trị dao động từ -1 đến 1:
 Nếu r càng tiến về 1, -1: tương quan tuyến tính càng mạnh, càng chặt chẽ. Tiến
về 1 là tương quan dương, tiến về -1 là tương quan âm.
 Nếu r càng tiến về 0: tương quan tuyến tính càng yếu.
 Nếu r = 1: tương quan tuyến tính tuyệt đối, khi biểu diễn trên đồ thị phân tán
Scatter, các điểm biểu diễn sẽ nhập lại thành 1 đường thẳng.
 Nếu r = 0: khơng có mối tương quan tuyến tính. Lúc này sẽ có hai tình huống
xảy ra. Một, khơng có một mối liên hệ nào giữa hai biến. Hai, giữa chúng có
mối liên hệ phi tuyến.
 Lưu ý:
 Hệ số tương quan pearson (r) chỉ có ý nghĩa khi và chỉ khi mức ý nghĩa quan
sát (sig.) nhỏ hơn mức ý nghĩa α = 5%.
 Nếu r nằm trong khoảng từ 0,50 đến ± 1, thì nó được cho là tương quan mạnh.
 Nếu r nằm trong khoảng từ 0,30 đến ± 0,49, thì nó được gọi là tương quan
trung bình.
 Nếu r nằm dưới ± .29, thì nó được gọi là một mối tương quan yếu.

 Trên đồ thị phân tán Scatter, nếu r = -1 dữ liệu sẽ phân bổ trên một đường
thẳng với độ dốc âm, r = 1 dữ liệu sẽ phân bổ trên một đường thẳng với độ dốc
dương.


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Hình 2.3: Hệ số tương quan biểu thị trên đồ thị phân tán Scatter
 Để dễ dàng tính tốn Correlation Coefficient sử dụng cơng thức này cần thực hiện
theo các bước sau:


Bước 1: Xác định mẫu dữ liệu cần tính tốn và đặt biến x , y tương ứng với các
mẫu giá trị dữ liệu



Bước 2: Từ mẫu dữ liệu trên ta tính giá trị trung bình

 x ,  y

tướng ứng biến x

, y



Bước 3: Với biến x , trừ x của mỗi giá trị biến x hay thường gọi là " a " , tương
ứng với biến y gọi là " b "



Bước 4: Tiến hành nhân mỗi giá trị " a " với " b " tương ứng. Sau đó tìm tổng của
các phép nhân lần lượt cho ra kết quả cuối là tử số trong cơng thức.



Bước 5: Bình phương mỗi giá trị của " a " và tính tổng kết quả. Tiếp đến tính căn
bậc hai và đây là mẫu số trong cơng thức


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN



Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Bước 6: Chia kết quả ở bước 4 cho kết quả ở bước 5 sẽ có được kết quả hệ số
Correlation Coefficient.

2.2.2 Áp dụng vào mơ hình

 Tham số đầu vào: WIN_SPEED, WIND_DIRECTION, BLADE_ANGLE


Tham số đầu ra: POWER
Bảng 2.3: Hệ số tương quan giữa các giá trị trong tập dữ liệu
WIN_SPEE
D

WIND_DIRECTIO
N

BLADE_ANGL
E

WIN_SPEED

1.000000

0.110953

-0.310440

WIND_DIRECTIO
N

0.110953

1.000000

-0.084360


BLADE_ANGLE

-0.310440

-0.084360

1.000000

POWER

0.900817

0.085191

-0.342798

POWER
0.90081
7
0.08519
1
0.34279
8
1.00000
0

Kết luận:
 Tương quan giữa tốc WIN_SPEED và POWER bằng 0.900817 nằm trong khoảng
từ 0.50 đến ± 1: tương quan cao

 Tương quan giữa BLADE_ANGLE và POWER bằng -0.342798 nằm trong
khoảng từ 0.30 đến ± 0.49: tương quan trung bình
 Tương quan giữa WIND_DIRECTION và POWER bằng 0.110953 nằm dưới ±
0.29: tương quan yếu


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Hình 2.4: Đồ thị tương quan giữa các các giá trị trong tập dữ liệu


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

2.3

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Xử lý giá trị khuyết

2.3.1 Tổng quan

Một số nguyên nhân thường gặp dẫn đến khuyết dữ liệu trong các tập dữ liệu điện gió
bao gồm:
 Lỗi thiết bị đo: Các thiết bị đo như anemometer, cảm biến tốc độ gió có thể gặp sự
cố kỹ thuật dẫn đến mất dữ liệu.
 Trục trặc hệ thống thu thập dữ liệu: Vấn đề về phần cứng, phần mềm hoặc kết nối
mạng làm gián đoạn việc ghi nhận dữ liệu.
 Bảo trì, bảo dưỡng trạm đo: Khoảng thời gian ngừng hoạt động để bảo trì sẽ dẫn
đến thiếu dữ liệu.
 Lỗi người vận hành: Đôi khi nhân viên quên khởi động lại hệ thống sau bảo
dưỡng.
 Ảnh hưởng thời tiết: Sấm sét, mưa bão, tuyết rơi dày có thể khiến cảm biến khơng
hoạt động đúng.
 Vấn đề tài chính: Kinh phí hạn chế có thể dẫn tới việc khơng thay thế kịp thời các
thiết bị lỗi.
 Sai sót xử lý dữ liệu: Lỗi trong các bước xử lý, tổng hợp dữ liệu ban đầu cũng gây
mất mát dữ liệu.
 Phương pháp xử lý các dữ liệu khuyết:
Nội suy tuyến tính (Linear Interpolation) là kỹ thuật xác định giá trị của các hàm của
bất kỳ điểm trung gian nào khi các giá trị của hai điểm liền kề được biết đến. Nội suy
tuyến tính về cơ bản là ước tính của một giá trị chưa biết nằm trong hai giá trị đã biết.
Nội suy tuyến tính được sử dụng trong các lĩnh vực khác nhau như thống kê, kinh tế
học, xác định giá, v.v. Nó được sử dụng để lấp đầy những khoảng trống trong dữ liệu
thống kê vì mục đích liên tục của thông tin.
Bằng cách sử dụng công thức sau, chúng ta có thể nội suy tuyến tính điểm dữ liệu đã cho:


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:

TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

(y  y )
y y1  ( x  x1 )  2 1
( x2  x1 ) 929\* MERGEFORMAT (.)

Trong đó:


y : giá trị điểm nội suy



x : điểm thực hiện nội suy



x1 , y1 : giá trị tọa điểm thứ nhất



x2 , y2 : giá trị tọa độ điểm thứ hai

2.3.2 Áp dụng vào mơ hình
Bảng 2.4: Thống kế số liệu trước xử lý các dữ liệu khuyết
STT
1
2

3

Thông số
Dữ liệu gốc ban đầu
Dữ liệu tốc độ gió (wind_speed)
Dữ liệu cơng suất (power)

Dữ liệu
52704
49819
49979


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04
Ngày hiệu lực:

Hình 2.5: Đồ thị wind_speed, power trước khi xử lý dữ liệu khuyết


Thủ tục:
NGHIÊN CỨU KHOA HỌC SINH VIÊN

Mã số:
TT/P.QLPTKHCN/13/BM18
Ban hành lần: 04

Ngày hiệu lực:

Bảng 2.5: Thống kê số liệu sau khi xử lý số liệu khuyết

2.4

STT

Thông số

1
2
4

Dữ liệu gốc ban đầu
Dữ liệu tốc độ gió (wind_speed)
Dữ liệu cơng suất (power)

Dữ liệu trước Dữ liệu sau xử
xử lý

52704
52704
49819
52704
49979
52704

Xóa giá trị dữ liệu bất thường


2.4.1 Tổng quan
2.4.2 Phương pháp loại bỏ các giá trị bất thường
2.4.2.1Phương pháp xác định điểm thay đổi phương sai (The Change Point Grouping)

Hình 2.6: Đường cong đặc tuyến tuabin gió
Sản lượng điện của tuabin gió thay đổi thay đổi của tốc độ gió. Trong điều kiện làm
việc lý tưởng, vận tốc gió (v) nằm trong vùng vận tốc cho phép: điểm giới hạn trên (Shutdown speed) và điểm giới hạn dưới (Cut-in speed); cơng suất ra tuabin gió bằng khơng
khi vận tốc gió nằm ngồi vùng giới hạn cho phép.
Cơng suất đầu ra tuabin gió được xác định theo công thức:

1
P  R 2 Cp v3
2
10210\* MERGEFORMAT (.)
Trong đó:
 R: bán kính cán quạt tuabin



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×