Tải bản đầy đủ (.docx) (165 trang)

Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.73 MB, 165 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

HÀ NỘI – 2022

download by :


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC


DỰ BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
Chun ngành: Khoa học máy tính
Mã số: 9 48 01 01

Người hướng dẫn khoa học:
1. TS. Nguyễn Công Điều
2. TS. Nguyễn Minh Tuấn

Hà Nội – 2022

download by :


1
LỜI CAM ĐOAN
Tác giả xin cam đoan luận án “Một số phương pháp nâng cao độ chính xác dự
báo trong mơ hình chuỗi thời gian mờ” là cơng trình nghiên cứu của bản thân tác giả.
Ngoại trừ các trích dẫn từ tài liệu tham khảo được ghi rõ trong luận án, các kết quả
nghiên cứu và các kết luận nêu trong luận án là hoàn toàn trung thực, chưa từng được
cơng bố trong các cơng trình nào khác. Những đóng góp của luận án đã được cơng bố
trên các tạp chí khoa học chuyên ngành và các hội thảo với sự đồng ý của các đồng tác
giả trước khi đưa vào luận án. Những số liệu trong các bảng biểu và hình vẽ phục vụ
cho việc phân tích, so sánh, đánh giá do chính tác giả thu thập từ các thử nghiệm.

Tác giả của luận án

Nghiêm Văn Tính


download by :


2
LỜI CẢM ƠN
Luận án của tác giả được thực hiện tại Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn tận tình của
thầy TS. Nguyễn Cơng Điều và TS. Nguyễn Minh Tuấn. Lời đầu tiên cho phép tôi
được bày tỏ lịng kính trọng và biết ơn sâu sắc đến hai Thầy về định hướng khoa
học, người đã động viên, trao đổi nhiều kiến thức và hướng dẫn tôi vượt qua những
khó khăn để hồn thành luận án.
Tơi cũng xin gửi lời cảm ơn chân thành đến các nhà khoa học, tác giả của các
cơng trình cơng bố đã được trích dẫn trong luận án, đây là những tư liệu quý báu,
kiến thức liên quan làm nền tảng giúp tơi hồn thành luận án.
Tơi xin chân thành gửi lời cảm ơn đến các thầy PGS. TSKH. Nguyễn Cát Hồ,
TS. Vũ Như Lân, TS. Trần Thái Sơn và các thầy cơ trong nhóm Đại số gia tử đã có
nhiều ý kiến góp ý về nội dung liên quan đến luận án thông qua các buổi seminar và
học thuật chuyên môn.
Tôi xin chân thành cảm ơn đến Ban lãnh đạo Học viện Khoa học và Công
nghệ, Viện Công nghệ Thông tin, Khoa “Cơng nghệ thơng tin và Viễn thơng”,
Phịng “Đào tạo sau đại học” đã tạo điều kiện thuận lợi trong q trình học tập,
nghiên cứu và hồn thành luận án.
Xin trân thành cảm ơn Ban giám hiệu trường Đại học Kỹ thuật công nghiệp –
ĐH Thái Nguyên, Khoa Điện tử, Bộ môn Tin học Công nghiệp và các đồng nghiệp
đã giúp đỡ và tạo điều kiện thuận lợi để tôi có thể thực hiện kế hoạch nghiên cứu,
hồn thành luận án.
Tơi xin được bày tỏ tình cảm và lịng biết ơn vơ hạn tới những người thân
trong Gia đình, những người ln dành cho tơi sự động viên, khích lệ, sẻ chia, giúp
đỡ trong những lúc khó khăn.

download by :



3

MỤC LỤC
LỜI CAM ĐOAN .......................................................................................................
LỜI CẢM ƠN .............................................................................................................
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT .................................................
DANH MỤC CÁC BẢNG ..........................................................................................
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ .............................................................
MỞ ĐẦU ...................................................................................................................
CHƯƠNG 1. NHỮNG KIẾN THỨC LIÊN QUAN ................................................
1.1. Các khái niêm về chuỗi thời gian .......................................................................
1.1.1. Chuỗi thời gian ...........................................................................................
1.1.2. Bài toán dự báo chuỗi thời gian ..................................................................
1.2. Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ ........................
1.2.1. Một số khái niệm về tập mờ .......................................................................
1.2.2. Chuỗi thời gian mờ và các định nghĩa liên quan ........................................
1.2.3. Các thành phần của mơ hình dự báo FTS ...................................................
1.2.3.1 Giai đoạn huấn luyện (Xây dựng mơ hình dự báo) ..............................
1.2.3.2 Giai đoạn kiểm thử (Giai đoạn dự báo) ................................................
1.2.4. Một số mơ hình chuỗi thời gian mờ cơ bản ................................................
1.2.4.1 Mơ hình dự báo của Song và Chissom [8,9] ........................................
1.2.4.2. Mơ hình dự báo của Chen [10] ............................................................
1.2.4.3 Mơ hình dự báo của Yu [13] ................................................................
1.2.5. Tiêu chuẩn đánh giá độ chính xác của các mơ hình dự báo .......................
1.3. Một số phương pháp liên quan đến phân khoảng tập nền..................................
1.3.1. Thuật toán phân cụm K-means ...................................................................
1.3.2. Thuật toán phân cụm mờ Fuzzy C-means ..................................................
1.3.3. Thuật toán tối ưu bầy đàn (PSO) ................................................................

1.3.4. Đại số gia tử ................................................................................................
1.4. Kết luận Chương 1 .............................................................................................
CHƯƠNG 2. XÂY DỰNG CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
VỚI NHĨM QUAN HỆ MỜ PHỤ THUỘC THỜI GIAN .......................................
2.1. Nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG) ..................................
2.1.1. Các định nghĩa về nhóm quan hệ mờ phụ thuộc thời gian .........................

download by :


4
2.1.2. Thuật tốn tạo NQHM-PTTG bậc m ..........................................................
2.2. Các mơ hình chuỗi thời gian mờ một nhân tố và hai nhân tố đề xuất ...............
2.2.1. Mơ hình dự báo chuỗi thời gian mờ một nhân tố (FTS-1NT) ....................
2.2.2. Mơ hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT) .....................
2.3. Các phương pháp phân khoảng dữ liệu trong tập nền........................................
2.3.1. Phân khoảng dữ liệu ...................................................................................
2.3.2. Các phương pháp phân khoảng dữ liệu ......................................................
2.3.2.1 Phân khoảng với độ dài bằng nhau ......................................................
2.3.2.2. Phân khoảng với độ dài khác nhau ......................................................
2.3.3. Các phương pháp phân khoảng đề xuất ......................................................
2.3.3.1 Phân khoảng sử dụng phân cụm K-means ...........................................
2.3.3.2 Phân khoảng sử dụng Đại số gia tử ......................................................
2.4. Tổ chức thực nghiệm và so sánh đánh giá cho các mơ hình FTS đề xuất và các
phương pháp phân khoảng ........................................................................................
2.4.1. Mô tả dữ liệu ...............................................................................................
2.4.2. Kết quả thực nghiệm của mơ hình FTS một nhân tố (FTS-1NT) ...............
2.4.2.1 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu tuyển sinh
..........................................................................................................................
2.4.2.2 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu thị trường

chứng khoán (TAIFEX) ...................................................................................
2.4.3. Kết quả thử nghiệm của mơ hình FTS hai nhân tố (FTS-2NT) ..................
2.4.4. Kết quả thực nghiệm trên mơ hình FTS-1NT sử dụng hai phương pháp phân
khoảng HA và K-means ............................................................................................

2.4.4.1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means
với các phương pháp phân khoảng khác trên cùng mơ hình FTS-1NT ...........
2.4.4.2 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân khoảng
HA và K-means với các mô hình dự báo khác dựa trên QHM bậc 1...............
2.4.4.3 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân khoảng
HA và K-means với các mơ hình dự báo khác dựa trên QHM bậc cao ...........
2.5. Kết luận Chương 2 .............................................................................................
CHƯƠNG 3. NÂNG CAO HIỆU QUẢ CỦA MƠ HÌNH DỰ BÁO SỬ DỤNG CÁC
KỸ THUẬT TÍNH TỐN MỀM .............................................................................
3.1. Các mơ hình dự báo chuỗi thời gian mờ đề xuất ...............................................

download by :


5
3.1.1. Mơ hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và
PSO .......................................................................................................................
3.1.2. Mơ hình chuỗi thời gian mờ hai nhân tố (FTS-2NT) sử dụng FCM và PSO
............................................................................................................................. 100
3.2. Tổ chức thực nghiệm và đánh giá hiệu quả của các mơ hình dự báo được đề xuất
................................................................................................................................. 105

3.2.1. Đánh giá hiệu quả của mơ hình FTS một nhân tố FTS1NT-CMPSO ......
3.2.1.1 Mô tả các chuỗi dữ liệu thời gian .......................................................
3.2.1.2 Thiết lập các tham số của mơ hình FTS1NT-CMPSO cho các tập dữ liệu

........................................................................................................................
3.2.1.3 Áp dụng dự báo tuyển sinh đại học của trường đại học Alabama .....
3.2.1.4 Áp dụng dự báo thị trường chứng khoán Đài Loan TAIFEX ............
3.2.1.5 Áp dụng dự báo tai nạn ô tô tại Bỉ .....................................................
3.2.2. Đánh giá hiệu quả của mơ hình FTS hai nhân tố FTS2NT-CMPSO .......
3.2.2.1 Áp dụng dự báo trên tập dữ liệu nhiệt độ ...........................................
3.2.2.2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán. .................
3.3. Kết luận Chương 3 ...........................................................................................
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ..............................................................
DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN ...............................................................................................................
TÀI LIỆU THAM KHẢO .......................................................................................

download by :


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

μ(h)
fm(x)
+

H
H
̃̃

A

TS
FTS

TAIEX
TAIFEX
PSO
KM
HA
ARIMA
FCM
MAPE
MSE
FTS-1NT
FTS-2NT
KM-FTS-1NT

HA-FTS-1NT
FTS1NT-


CMPSO
FTS2NTCMPSO
QHM
NQHM
NQHM-PTTG

download by :


7
DANH MỤC CÁC BẢNG
Bảng 1.1: Các nhóm quan hệ mờ từ tập dữ liệu tuyển sinh ......................................
Bảng 1.2: Một số hạn chế của các mơ hình dự báo sử dụng quan hệ mờ .................

Bảng 2.1: Sự khác nhau giữa nhóm quan hệ mờ đề xuất và nhóm quan hệ trong mơ
hình [10, 13] ..............................................................................................................
Bảng 2.2: Dữ liệu tuyển sinh thực tế của trường đại học Alabama ..........................
Bảng 2.3: Kết quả mờ hóa dữ liệu tuyển sinh thành các tập mờ ..............................
Bảng 2.4: Biểu diễn mối quan hệ mờ bậc 1 và bậc 3 trên tập dữ liệu tuyển sinh .....
Bảng 2.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 3 ................
Bảng 2.6: Kết quả dự báo tuyển sinh dựa trên quan hệ mờ bậc 1 và bậc 3 ..............
Bảng 2.7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ
01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan ..................................................
Bảng 2.8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và
nhân tố thứ hai “mật độ của mây” .............................................................................
Bảng 2.9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố ..............................
Bảng 2.10: Kết quả tính tốn giá trị cho mỗi NQHM-PTTG bậc 3 ..........................
Bảng 2.11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996
tại Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3. ......................
Bảng 2.12: Ánh xạ cơ sở ...........................................................................................
Bảng 2.13: Các mơ hình FTS sử dụng PSO để phân khoảng kết hợp với các phương
pháp khác...................................................................................................................
Bảng 2.14: Các mơ hình FTS sử dụng FCM để phân khoảng kết hợp với các
phương pháp khác .....................................................................................................
Bảng 2.15: Ưu và nhược điểm chính của các phương pháp phân khoảng ................
Bảng 2.16: Kết quả phân cụm trên tập dữ liệu tuyển sinh sử dụng K-means ...........
Bảng 2.17: Giá trị của các khoảng từ tập dữ liệu tuyển sinh sử dụng K-means .......
Bảng 2.18: Số lượng hạng từ ngôn ngữ ....................................................................
Bảng 2.19: So sánh sai số dự báo MSE giữa mơ hình FTS-1NT với các mơ hình
khác trên cùng 7 khoảng. ..........................................................................................
Bảng 2.20: Kết quả và sai số dự báo giữa mơ hình FTS-1NT với các mơ hình khác
trên cùng 14 khoảng ..................................................................................................
Bảng 2.21: Kết quả và sai dự báo MSE giữa mô hình FTS -1NT với các mơ hình
khác dựa trên QHM bậc cao khác nhau với số khoảng chia bằng 14. ......................

Bảng 2.22: So sánh sai số dự báo MSE của mơ hình đề xuất so với các mơ hình khác
dựa trên QHM bậc cao với số khoảng chia bằng 14. ................................................
Bảng 2.23: Kết quả và sai số dự báo của mơ hình FTS-1NT với các mơ hình khác
dựa vào số bậc khác nhau với cùng số khoảng là 16. ...............................................

download by :


8
Bảng 2.24: So sánh kết quả và sai số dự báo trong pha kiểm thử giữa mơ hình đề
xuất FTS-1NT với các mơ hình khác dựa trên QHM bậc 5 với 16 khoảng ..............
Bảng 2.25: So sánh sai số dự báo MAPE trong tháng 6 của mơ hình đề xuất với các
mơ hình trước ............................................................................................................
Bảng 2.26: So sánh sai số dự báo MAPE trong tháng 7 của mơ hình đề xuất với các
mơ hình trước ............................................................................................................
Bảng 2.27: So sánh sai số dự báo MAPE trong tháng 8 của mơ hình đề xuất với các
mơ hình trước ............................................................................................................
Bảng 2.28: So sánh sai số dự báo MAPE trong tháng 9 của mô hình đề xuất với các
mơ hình trước. ...........................................................................................................
Bảng 2.29: Kết quả và sai số dự báo của mơ hình FTS-1NT sử dụng các phương
pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia. ...................
Bảng 2.30: Sai số dự báo MSE của mơ hình FTS-1NT sử dụng các phương pháp
phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia. ...............................
Bảng 2.31: Kết quả dự báo của mơ hình FTS-1NT sử dụng phương pháp phân
khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia ..........................
Bảng 2.32: So sánh sai số dự báo MSE giữa mơ hình đề xuất với các mơ hình khác
sử dụng 7 khoảng chia ...............................................................................................
Bảng 2.33: So sánh sai số dự báo giữa mơ hình đề xuất sử dụng K-means với các
mơ hình khác dựa trên QHM bậc 1 với 14 khoảng chia ...........................................
Bảng 3.1: Các cụm và tâm của nó đạt được trên tập dữ liệu tuyển sinh [8] .............

Bảng 3.2: Các khoảng và điểm giữa của mỗi khoảng ...............................................
Bảng 3.3: Kết quả mờ hóa chuỗi dữ liệu tuyển sinh với 7 khoảng chia tập nền ......
Bảng 3.4: Kết quả biểu thị quan hệ mờ bậc 1 và bậc 2 .............................................
Bảng 3.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 2 ................
Bảng 3.6: Kết quả dự báo của mơ hình đề xuất với 7 khoảng chia ..........................
Bảng 3.7: Khởi tạo vị trí của các cá thể ....................................................................
Bảng 3.8: Khởi tạo vận tốc của các cá thể. ...............................................................
Bảng 3.9: Khởi tạo vị trí tốt nhất
_ của các cá thể id ..................................

Bảng 3.10: Cập nhật vận tốc của các cá thể ..............................................................
Bảng 3.11: Cập nhật vị trí thứ hai của các cá thể ......................................................
Bảng 3.12: Vị trí pbest cuối cùng được chọn làm.......................................
Bảng 3.13: Kết quả phân cụm trên chuỗi dữ liệu hai nhân tố sử dụng FCM..........
Bảng 3.14: Các khoảng đạt được từ phân cụm FCM ..............................................
Bảng 3.15: Các tham số của mơ hình FTS1NT-CMPSO cho mỗi tập dữ liệu .......
Bảng 3.16: So sánh kết quả và sai số dự báo giữa mơ hình đề xuất FTS1NTCMPSO với các mơ hình khác dựa trên QHM bậc 1 với 14 khoảng ......................
Bảng 3.17: Điểm khác biệt giữa mơ hình FTS1NT-CMPSO với các mơ hình so sánh
trên Bảng 3.16 .........................................................................................................

download by :


9
Bảng 3.18: So sánh sai số dự báo MSE giữa mơ hình đề xuất FTS1NT-CMPSO với
các mơ hình khác dựa trên QHM bậc 1 và các khoảng chia khác nhau..................
Bảng 3.19: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao .........................................................
Bảng 3.20: So sánh sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 7 khoảng ....................................

Bảng 3.21: So sánh kết quả và sai số dự báo MSE của mơ hình đề xuất với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 16 khoảng chia ..........................
Bảng 3.22: So sánh kết quả dự báo trong giai đoạn kiểm thử dựa trên QHM bậc 5
với 16 khoảng và sử dụng wh = 3. ..........................................................................
Bảng 3.23: So sánh kết quả và sai số dự báo RMSE giữa mơ hình FTS1NT-CMPSO
và các mơ hình trước đây với số khoảng chia và bậc khác nhau. ...........................
Bảng 3.24: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự báo
nhiệt độ ....................................................................................................................
Bảng 3.25: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự báo
thị trường chứng khoán ...........................................................................................
Bảng 3.26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan
theo từng tháng từ ngày 01/06/1996 đến 30/09/1996. ............................................
Bảng 3.27: Sai số dự báo MAPE (%) trên từng bậc của mơ hình FTS2NT-CMPSO
................................................................................................................................. 117
Bảng 3.28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau .....................................
Bảng 3.29: So sánh sai số dự báo MAPE(%) trong tháng 7 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau .....................................
Bảng 3.30: So sánh sai số dự báo MAPE(%) trong tháng 8 giữa mô hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau. ....................................
Bảng 3.31: So sánh sai số dự báo MAPE(%) trong tháng 9 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau .....................................
Bảng 3.32: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS2NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao với 16 khoảng chia cho mỗi nhân tố
................................................................................................................................. 120

download by :


10
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1: Cấu trúc tổng quan của luận án .................................................................
Hình 1.2: Chuỗi tỷ giá hối đối BP / USD hàng tuần [53] .......................................
Hình 1.3: Đồ thị của 3 hàm thuộc phổ biến:(a) tam giác, (b) hình thang, (c) Gauss 23

Hình 1.4: Mơ hình dự báo FTS tổng quát .................................................................
Hình 1.5: Các thành phần trong giai đoạn huấn luyện. .............................................
Hình 1.6: Ví dụ phân khoảng tập nền sử dụng các hàm thuộc khác nhau. ...............
Hình 1.7: Các thành phần trong giai đoạn kiểm thử .................................................
Hình 1.8: Tóm tắt các bước thực hiện mơ hình dự báo của Chen [10] trên tập dữ liệu
tuyển sinh của trường Đại học Alabama ...................................................................
Hình 1.9: Sơ đồ thuật tốn phân cụm k-means .........................................................
Hình 1.10: Sơ đồ thuật tốn phân cụm bằng FCM ...................................................
Hình 1.11: Đồ thị minh họa một điểm tìm kiếm bằng PSO ......................................
Hình 1.12: Biểu diễn sự sắp xếp của các phần tử ∈ , ℎ ∈ , ∈ ...................

Hình 2.1. Minh họa chuỗi thời gian được mờ hóa bới các tập mờ ...........................
Hình 2.2: Các bước của mơ hình dự báo ...................................................................
Hình 2.3: Biểu diễn dữ liệu tuyển sinh được mờ hóa bởi các tập mờ ..................
Hình 2.4: Các bước của mơ hình FTS-2NT ..............................................................
Hình 2.5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập mẫu. .
Hình 2.6: Các phương pháp phân khoảng .................................................................
Hình 2.7: Minh hoạ các khoảng chia liên tiếp có độ dài bằng nhau là 1000 ............
Hình 2.8: Độ thị phân bổ giá trị chênh lệch của chuỗi dữ liệu tuyển sinh ................
Hình 2.9: Các phương pháp phân khoảng khác nhau kết hợp với mơ hình FTS-1NT
...................................................................................................................................
Hình 2.10: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng K-means ......
Hình 2.11: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng HA ...............
Hình 2.12: Biểu diễn sai số dự báo MSE giữa hình FTS-1NT với các mơ hình so
sánh dựa trên các bậc khác nhau với 14 khoảng chia ...............................................
Hình 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mơ hình FTS-1NT
dựa trên các phương pháp phân khoảng khác nhau. .................................................
Hình 2.14: Đường cong mô tả kết quả dự báo của mơ hình FTS-1NT sử dụng
phương pháp phân khoảng HA và K-means so với dữ liệu thực tế. .........................
Hình 2.15: Đường cong biểu diễn giữa giá trị dự báo của mô hình KM-FTS-1NT và

các mơ hình khác so với dữ liệu thực tế ....................................................................
Hình 2.16: So sánh sai số dự báo MSE giữa mơ hình đề xuất sử dụng phân khoảng Kmeans và HA với các mơ hình khác dựa trên QHM bậc cao với 7 khoảng chia. . 84
Hình 3.1: Cấu trúc và các giai đoạn của mơ hình dự báo đề xuất (FTS1NT-CMPSO)
................................................................................................................................... 87

download by :


11
Hình 3.2: Cấu trúc khoảng của một cá thể trong PSO ..............................................
Hình 3.3: Sơ đồ thuật tốn biểu diễn mơ hình FTS1NT-CMPSO ............................
Hình 3.4: Cấu trúc và các giai đoạn của mơ hình đề xuất FTS2NT- CMPSO .......
Hình 3.5: Biểu diễn các khoảng và bậc của mơ hình theo cá thể i trong PSO........
Hình 3.6: Biểu diễn giá trị thực của các chuỗi dữ liệu thời gian ............................
Hình 3.7: Đồ thị biểu diễn sai số dự báo MSE giữa mô hình FTS1NT-CMPSO và
các mơ hình so sánh trong Bảng 3.18 với số lượng khoảng khác nhau. .................
Hình 3.8: Đồ thị biểu diễn sai số dự báo giữa mơ hình đề xuất FTS1NT-CMPSO
với các mơ hình khác trong Bảng 3.20 ...................................................................
Hình 3.9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung
bình hàng ngày trong tháng 6, dựa trên mơ hình FTS2NT-CMPSO bậc 7.............
Hình 3.10: Đồ thị thể hiện thời gian tính tốn và tốc độ hội tụ của mơ hình
FTS2NT-CMPSO với 150 lần lặp ...........................................................................

download by :


12
MỞ ĐẦU
Những thành tựu đạt được trong các hoạt động của con người được đặc trưng
bởi các quá trình ra quyết định hiệu quả của họ. Để giúp quá trình ra quyết định

được chính xác, tiết kiệm được thời gian và giảm các chi phí khơng cần thiết thì bài
tốn dự báo đóng vai trị rất quan trọng. Dự báo là một công cụ trợ giúp cần thiết
cho việc ra quyết định và lập kế hoạch để quản lý hiệu quả các tổ chức hiện đại. Ví
dụ, dự báo bán hàng ln đóng một vai trị nổi bật trong hoạt động kinh doanh. Nó
cung cấp cho các doanh nghiệp những chỉ dẫn đáng tin cậy về chi phí cơng việc và
phân bổ ngân sách cho một khoảng thời gian sắp tới. Các nhà khoa học cũng phải
đối mặt với thách thức quan trọng trong việc dự báo các sự kiện xảy ra trong tương
lai như nhiệt độ, lượng mưa, tăng trưởng nền kinh tế, ... Để dự báo các sự kiện này
với độ chính xác 100% là khơng thể, nhưng rất nhiều lợi ích có thể thu được từ kết
quả dự báo cũng như một bức tranh về tương lai đó. Một trong các hướng nghiên
cứu nâng cao độ chính xác của các bài toán dự báo là nghiên cứu dữ liệu chuỗi thời
gian. Chuỗi thời gian (TS – time series) là một chuỗi các giá trị số hoặc chuỗi các từ
trong ngôn ngữ tự nhiên được ghi lại tại các thời điểm liên tiếp trong một khoảng
thời gian, thường được đo cách nhau tại các thời điểm thống nhất: hàng ngày, hàng
tuần, hàng tháng, hàng quý hoặc hàng năm. Nói một cách đơn giản, một chuỗi thời
gian là một chuỗi dữ liệu lịch sử được thu thập một cách đều đặn.
Phân tích chuỗi thời gian để xây dựng các mơ hình dự báo chuỗi thời gian hiệu
quả là một trong các khâu quan trọng trong việc tạo ra các cơng cụ dự báo tốt nhằm giải
quyết các bài tốn thực tế. Một loạt các phương pháp đã được đề xuất để giải quyết
những bài tốn này, thơng dụng hơn cả là mơ hình tự hồi quy (autoregression model AR), trung bình trượt (moving average - MA) và kết hợp của chúng thành mơ hình
ARMA và ARIMA do Box và Jenkins [1] phát triển năm 1976. Các mơ hình dự báo
nêu trên được xây dựng cho chuỗi thời gian tuyến tính và dừng. Bên cạnh các mơ hình
chuỗi thời gian dừng thì các mơ hình ARCH [2] (Autoregressive Conditionally
Hestoroscedastic)



GARCH

[3]


(Generalize Autoregressive

Conditionally

Hestoroscedastic) được xây dựng để giải quyết các chuỗi thời gian khơng dừng hay
chuỗi thời gian có phương sai thay đổi. Để áp dụng các mơ hình dự báo chuỗi thời gian
trên với độ chính xác khả quan địi hỏi một số ràng buộc chặt chẽ như: chuỗi thời gian
phải là tuyến tính hay cần một số lượng dữ liệu lớn. Trong thực tế, việc đòi hỏi các
chuỗi thời gian là dừng và tuyến tính khơng phải lúc nào cũng đáp ứng được, thậm chí
chúng cịn mang tính khơng chắc chắn và biến thiên mạnh.
Việc áp dụng các mơ hình nêu trên đối với chuỗi dữ liệu thời gian ngắn hay phi
tuyến là không phù hợp và kết quả dự báo đạt được chưa cao. Để khắc phục các hạn
chế đó, một số tác giả đã sử dụng mạng nơron để xây dựng mơ hình dự báo chuỗi

download by :


13
thời gian dựa trên tính phi tuyến và linh hoạt của chúng. Donaldson và công sự [4]
đã đề xuất mô hình chuỗi thời gian sử dụng mạng nơron nhân tạo (Artificial Neural
Network – ANN) để dự báo sự biến động của thị trường chứng khoán Mỹ, Canada,
Nhật Bản và Anh. Hansen và Nelson [5] cũng sử dụng mạng nơron để xây dựng mơ
hình dự báo doanh thu từ thuế. Quan sát thấy rằng, phương pháp sử dụng mạng
nơron đạt được độ chính xác cao hơn so với các mơ hình truyền thống. Mặt khác,
một số nghiên cứu đã sử dụng suy luận mờ dựa trên mạng nơron [6] (Adaptive
Neuro-Fuzzy Inference System-ANFIS) để nâng cao độ chính xác dự báo của mơ
hình chuỗi thời gian. Khác so với mạng ANN, hệ này có khả năng thích nghi với
mơi trường cao hơn trong q trình huấn luyện. Do đó, đã có nhiều cơng trình áp
dụng hệ ANFIS trong sự báo TS và thu được những kết quả nhất định. Tuy nhiên,

các mô hình tiên tiến sử dụng mạng nơron đơn lẻ vẫn phải đối mặt với một số vấn
đề như cần giả định một số lượng dữ liệu lớn trong quá trình huấn luyện mạng, phụ
thuộc vào kinh nghiệm trong việc chọn nút mạng và khơng có phương pháp rõ ràng
để phân tích mối quan hệ giữa đầu vào và đầu ra trong mạng.
Hơn nữa, trong cuộc sống hàng ngày, con người thường quan sát, phân tích các
sự vật, hiện tượng và các sự kiện xảy ra trong thế giới thực và đưa ra các quyết định
của mình dưới dạng ngơn ngữ tự nhiên. Với bài toán dự báo chuỗi thời gian, dữ liệu có
thể được biểu diễn dưới dạng các từ trong ngôn ngữ tự nhiên và dễ dàng mô tả cách con
người thực hiện quá trình dự báo dưới dạng ngôn ngữ trong thực tế. Thật vậy, khi con
người quan sát dữ liệu chuỗi thời gian, họ nhanh chóng chuyển các biến động của chuỗi
thời gian sang dạng ngôn ngữ và lập luận trong suy nghĩ theo một cách nào đó dựa trên
quan hệ giữa các hạng từ trong chuỗi thời gian để ước lượng kết quả dự báo dưới dạng
ngôn ngữ. Trong ngữ cảnh như vậy, các phương pháp thống kê nêu trên chỉ được sử
dụng để giải quyết chuỗi thời gian số (Numerical time series - NTS) mà không thể sử
dụng để giải quyết một cách hiệu quả các bài tốn ra quyết định như vậy. Vì vậy, chuỗi
thời gian mờ ra đời nhằm giải quyết các bài toán dự báo với chuỗi số liệu được biểu
diễn dưới dạng ngôn ngữ. Chuỗi thời gian mờ (Fuzzy time series - FTS) được Song và
Chissom giới thiệu lần đầu tiên vào năm 1993, dựa trên lý thuyết tập mờ của Zadeh [7],
trong đó các tập mờ được xem như là ngữ nghĩa của các hạng từ ngôn ngữ. Theo cách
tiếp cận này, Song và Chissom đã đề xuất hai mô hình FTS [8, 9] để dự báo số lượng
sinh viên nhập học của trường Đại học Alabama. Tuy nhiên, mô hình của Song và
Chissom cịn tồn tại một số hạn chế như mất nhiều thời gian tính tốn do thực hiện
phép hợp thành max – min phức tạp đối với ma trận quan hệ mờ ( − 1, ) lớn và
thiếu sự thuyết phục trong việc xác định độ dài của khoảng chia tập nền. Để khắc phục
hạn chế trên, Chen [10] đã đề xuất nhóm quan hệ mờ và sử dụng các phép toán số học
đơn giản trong quá trình giải mờ.

download by :



14
Mặc dù các mơ hình này đã chứng tỏ những ưu việt khi áp dụng cho chuỗi dữ liệu
thời gian tổng qt nhưng độ chính xác dự báo cịn khá thấp. Đây là cơ sở để mở ra
một hướng nghiên cứu mới và thu hút được nhiều công bố cả về cải tiến phương
pháp luận lẫn nghiên cứu ứng dụng. Vì điểm trên, nhiều nghiên cứu đã cải tiến mơ
hình của Chen nhằm nâng cao độ chính xác của kết quả dự báo theo các hướng sau:
1) xác định tập nền và tìm độ dài khoảng phù hợp [11- 28]; 2) xây dựng các mối
quan hệ mờ và nhóm quan hệ mờ trên cơ sở dữ liệu được mờ hóa [18, 24, 29-31] và
3) cải tiến các quy tắc giải mờ cho dự báo đầu ra [13, 18, 32-33].
Trước hết, việc phân khoảng tập nền: làm thế nào để phân tập nền chứa dữ liệu
lịch sử thành các khoảng với độ dài thích hợp và bao nhiêu khoảng là phù hợp? Bắt đầu
từ cơng trình nền tảng [11], Huarng đã xác định rằng độ dài của khoảng chia tập nền là
một yếu tố quan trọng và ảnh hưởng đáng kể đến độ chính xác dự báo của mơ hình. Từ
quan điểm này, Huarng đã đưa ra hai phương pháp chọn độ dài khoảng tập nền theo
phân bố và độ dài trung bình. Các phương pháp của Huarng đã đạt được độ chính xác
tốt hơn so với một số mơ hình dự báo trước đó. Yolcu và cộng sự [22] đưa ra một cách
tiếp cận mới dựa trên việc tối ưu tỷ lệ để xác định độ dài của các khoảng chia bằng hàm
“fminbnd” trong MATLAB. Trong những năm gần đây, các kỹ thuật tính tốn mềm và
các phương pháp tối ưu tiến hóa được sử dụng rộng rãi để xác định phân khoảng tối ưu
trong mơ hình FTS. Chen & Chung đưa ra hai mơ hình chuỗi thời gian mờ bậc nhất
[15] và bậc cao [16] dựa trên thuật toán di truyền để phân tập nền thành các khoảng có
độ dài phù hợp và áp dụng cho dự báo tuyển sinh tại trường Đại học Alabama. Lee và
cộng sự [34] áp dụng thuật tốn tơi luyện (Simulated Annealing
- SA) để xác định độ dài khoảng thích hợp trong mơ hình FTS bậc cao cho dự báo thị

trường chứng khoán Đài Loan (TAIFEX). Eren Bas và cộng sự [35] đã đề xuất một
thuật toán di truyền cải tiến (MGA) để tránh những phán đoán chủ quan trong việc xác
định độ dài của mỗi khoảng tập nền trong mơ hình FTS để dự báo tai nạn xe hơi ở Bỉ
và tuyển sinh vào trường Đại học Alabama. Bên cạnh đó, nhiều thuật tốn tối ưu được
lấy cảm hứng từ các lồi sinh vật học cũng được sử dụng cho mục đích phân khoảng

nhằm nâng cao độ chính xác dự báo của mơ hình FTS như: tối ưu bầy đàn
(Particle Swarm Optimization - PSO) [14, 18, 30 - 33, 35], tối ưu đàn kiến (Ant Colony
Optimization - ACO) [36] và tối ưu dựa trên sự di chuyển của đàn ngỗng( Geese
Movement Based Optimization- GMBO) [37]. Cùng mục đích sử dụng PSO để hiệu
chỉnh độ dài khoảng tập nền, một số tác giả khác đã đề xuất các mơ hình FTS dựa trên
quan hệ mờ bậc cao [35, 38] và quan hệ mờ hai nhân tố [39-41] để áp dụng dự báo các
bài toán khác nhau. Ngoài ra, Chen và cộng sự [42] đã áp dụng PSO để tối ưu đồng thời
các khoảng chia và các trọng số trên mỗi nhóm quan hệ mờ cho dự báo TAIFEX và tỷ
giá NTD / USD. Song song với kỹ thuật tối ưu, thì các phương

download by :


15
pháp phân cụm như: phân cụm mờ C-mean [28, 43], phân cụm tự động [17] cũng
được sử dụng cho mục đích phân khoảng nhằm giảm thiểu sai số dự báo trong mơ
hình chuỗi thời gian mờ.
Thứ hai, việc thiết lập các quan hệ logic mờ hay có thể gọi tắt là quan hệ mờ
(QHM) và nhóm quan hệ mờ (NQHM) có tác động lớn đến độ chính xác của kết quả
dự báo. Do đó, làm cách nào để thiết lập nhóm quan hệ mờ phù hợp là một trong những
yếu tố quan trọng trong mơ hình FTS. Nhận thấy tầm quan trọng này, nhiều nghiên cứu
đã đề xuất các mô hình FTS khác nhau theo hướng tiếp cận NQHM. Khái niệm nhóm
quan hệ mờ đầu tiên do Chen [10] đề xuất bằng cách gộp các thành phần bên vế phải
của các quan hệ mờ khi chúng có cùng vế trái. Theo cách này, các nhóm quan hệ mờ
được thiết lập giúp cho giai đoạn giải mờ và tính tốn giá trị dự báo rõ một cách dễ
dàng hơn. Vì ưu điểm này, nhiều mơ hình dự báo đã được đề xuất dựa trên NQHM của
Chen [10] để giải quyết các bài toán khác nhau [15-19, 40, 44]. Tuy nhiên, các mơ hình
sử dụng nhóm quan hệ này gặp phải hạn chế do khơng để ý đến tính lặp và vị trí của
các quan hệ khi tham gia vào NQHM. Tình trạng này dẫn đến thiếu thông tin để dự báo
và giảm khả năng giải thích của mơ hình. Yu [13] đã chỉ ra tầm quan trọng của sự lặp

lại các thành phần trong NQHM và gán các trọng số khác nhau theo vị trí xuất hiện của
chúng trong NQHM. Đây được xem như một đề xuất thứ 2 về NQHM và đã được các
nghiên cứu khác đề xuất sử dụng [45, 46].

Thứ ba, thiết lập quy tắc giải mờ để nhận kết quả dự báo rõ là một bước quan
trọng và ảnh hưởng trực tiếp đến kết quả dự báo của mơ hình. Một quy tắc giải mờ
có thể cho kết quả tốt đối với mơ hình chuỗi thời gian mờ bậc nhất nhưng hạn chế
đối với mơ hình chuỗi thời gian mờ bậc cao và ngược lại; hoặc có thể phù hợp với
một bài toán dự báo nhất định nhưng lại khơng phù hợp cho các bài tốn dự báo
khác và ngược lại. Thông thường giá trị dự báo lấy trung bình điểm giữa của các
khoảng liên quan đến từng tập mờ bên vế phải của NQHM [15-18]. Tuy nhiên, do
có sự đóng góp khác nhau của các thành phần trong vế phải của NQHM nên nhiều
tác giả đã sử dụng trọng số để gán cho từng giá trị điểm giữa [13, 46, 47]. Ngoài
điểm giữa của khoảng dự báo, một số kỹ thuật khác được sử dụng để nâng cao độ
chính xác dự báo bằng cách chia khoảng này thành các đoạn con để lấy thêm thông
tin dự báo [32]. Bên cạnh đó, để tính giá trị dự báo khi vế phải của quan hệ mờ chưa
được xác định, nhiều tác giả đã sử dụng phương pháp phiếu bầu (voting) [18, 33] để
gán một trọng số ưu tiên cho thành phần có đóng góp gần nhất về tương lai.
Vấn đề về bậc của mơ hình và nhân tố ảnh hưởng của chuỗi thời gian cũng được
nhiều tác giả xem xét và giới thiệu đối với từng bài toán dự báo cụ thể. Đối với vấn đề
thứ nhất, đã có một số lượng lớn các nghiên cứu [14, 16, 17, 35, 39, 48] được công bố
dựa trên QHM bậc cao nhằm cải thiện hiệu quả dự báo của mô hình bậc nhất.

download by :


16
Tuy nhiên, các mơ hình bậc cao đã cơng bố trước đây thường chọn bậc với độ chính
xác tốt nhất bằng trực giác hay thử nghiệm một số lần chạy trên mỗi bậc cho trước.
Vậy, có giải pháp hiệu quả nào để xác định bậc của mơ hình với độ chính xác dự

báo tốt nhất một cách tự động? Câu hỏi này, đã được đáp ứng trong luận án bằng
việc sử dụng PSO để tối ưu đồng thời độ dài khoảng và bậc của mơ hình. Đối với
vấn đề thứ hai, thực tế cho thấy đôi khi chuỗi thời gian chính (hay gọi là nhân tố dự
báo) lại bị ảnh hưởng bởi một hay nhiều nhân tố khác, ví dụ: chỉ số chứng khoán
của Nhật bị ảnh hưởng bởi chuỗi chỉ số chứng khốn New-York. Do đó, để nâng
cao hiệu quả dự báo, một số nghiên cứu đã xét thêm các nhân tố phụ để tăng khả
năng dự báo cho nhân tố chính trên từng bài tốn mà các nhân tố này có mối quan
hệ tiềm năng. Điển hình có thể thấy trong các cơng trình [34, 35, 40] đã đề xuất kết
hợp các kỹ thuật khác nhau với mô hình FTS bậc cao hai nhân tố để giải quyết dự
báo các bài toán khác nhau: như dự báo nhiệt độ trung bình tại Đài Bắc, Đài Loan
[34, 40] với nhân tố thứ hai là độ che phủ của mây; dự báo thị trường chứng khoán
Đài Loan TAIFEX [35, 40] nhận chỉ số TAIEX là nhân tố thứ hai.
Như đã phân tích ở trên, dự báo chuỗi thời gian mờ đã thu hút được nhiều sự
quan tâm của các nhà nghiên cứu quốc tế và họ đã có được các thành quả đáng kể.
Tại Việt Nam, lĩnh vực này cũng nhận được sự quan tâm của các nhóm nghiên cứu
tại Viện Công nghệ Thông tin (CNTT) và tại các trường Đại học phía nam. Điển
hình như, nhóm tác giả tại Đại học Cần Thơ đã xây dựng mơ hình chuỗi thời gian
mờ với các tập mờ có cấp độ thuộc là một hàm liên tục có chứa tham số [49]. Các
tác giả này đã xây dựng thuật toán để xác định các tham số phù hợp nhất trên mỗi
tập dữ liệu tương ứng, sau đó thực hiện nội suy dữ liệu để có được kết quả dự báo.
Các cơng trình [19, 20] đã đề xuất phương pháp phân khoảng dựa trên các ánh xạ
ngữ nghĩa của đại số gia tử [50], từ đó xây dựng mơ hình dự báo tương tự như mơ
hình chuỗi thời gian mờ. Một số tác giả khác đã cố gắng xây dựng mơ hình dự báo
bằng chuỗi ngôn ngữ của đại số gia tử thay vì các tập mờ như trong các nghiên cứu
[51, 52]. Tuy nhiên, các nghiên cứu này mới chỉ tập trung vào việc xây dựng mơ
hình bậc nhất, chưa sử dụng thêm nhân tố phụ vào dự báo nên kết quả dự báo thu
được chưa thực sự tốt cũng như việc sử dụng tập dữ liệu chưa được phong phú. Mặt
khác, để phát triển mơ hình dự báo chuỗi thời gian dựa trên lý thuyết đại số gia tử
rất cần có những mở rộng mới.
Qua phân tích ưu điểm và hạn chế của các cơng trình nghiên cứu trong và

ngồi nước cho thấy mơ hình chuỗi thời gian mờ vẫn cần có những cải tiến khác
nhau để chúng có thể đạt được độ chính xác dự báo tốt hơn cũng như cần các bước
tính tốn hợp lý hơn để có thể ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau.
Tính cấp thiết của đề tài luận án:

download by :


17
Khái niệm quan hệ mờ và nhóm quan hệ mờ do Chen đề xuất đóng vai trị
quyết định trong việc phát triển mơ hình dự báo chuỗi thời gian mờ. Nhờ những
khái niệm này, việc tính tốn dự báo đã đơn giản hơn rất nhiều so với mơ hình của
Song và Chissom. Những cơng trình nghiên cứu về chuỗi thời gian mờ đa số sử
dụng mơ hình của Chen để thực hiện dự báo. Tuy nhiên, cấu trúc nhóm quan hệ mờ
của Chen và Yu là cố định đối với từng thời điểm dự báo và có sự bất hợp lý. Khi
lập nhóm quan hệ mờ ở một thời điểm t nào đó thì sẽ xuất hiện những thành phần
khơng xem xét đến lịch sử xuất hiện của các tập mờ bên vế phải của quan hệ mờ.
Điều này dẫn đến việc có thành phần xuất hiện sau thời điểm t mà vẫn được tham
gia dự báo cùng với các thành phần tại thời điểm t hoặc thời điểm trước đó. Vấn đề
này được xem là khơng phù hợp với tính thực tiễn. Để khắc phục điểm này, nghiên
cứu trong luận án đưa ra khái niệm nhóm quan hệ mờ phụ thuộc thời gian (NQHMPTTG). Với cách tiếp cận này, tác giả đã chỉ ra rằng việc sử dụng nhóm NQHMPTTG có thể cải thiện đáng kể kết quả dự báo và đã được chứng minh là phù hợp
hơn trong thực tế. Đóng góp này của luận án đã được cơng bố trong cơng trình [P1]
và đề xuất mở rộng cũng như được ứng dụng trong các cơng trình [P2-P8].
Bên cạnh đó, các mơ hình dự báo chuỗi thời gian mờ bao gồm mơ hình bậc một,
mơ hình bậc cao và mơ hình hai hay nhiều nhân tố đã được xem xét trong một loạt
cơng trình nghiên cứu. Do vậy, một vấn đề đặt ra là cần kiểm nghiệm liệu khái niệm
nhóm quan hệ mờ phụ thuộc thời gian mới có thực sự tạo được những lợi thế hay
khơng trong các mơ hình trên. Đồng thời trong một số bước của mơ hình dự báo chuỗi
thời gian mờ vẫn tồn tại một số vấn đề cần được cải tiến như tìm các phương pháp phân
khoảng mới dựa trên các kỹ thuật như phân cụm, tối ưu tiến hóa hay sử dụng đại số gia

tử. Trong bước giải mờ cũng cần một số tinh chỉnh nhằm nâng cao hiệu quả của mơ
hình dự báo. Nhìn chung cịn khá nhiều vấn đề có thể giải quyết được để cải tiến mơ
hình dự báo. Đây là những nội dung sẽ được trình bày trong suốt luận án mà tập trung
vào đề xuất khái niệm nhóm quan hệ mờ mới để kết hợp với các kỹ thuật khác nhau
như tối ưu độ dài khoảng chia và kỹ thuật tối ưu bậc của mơ hình nhằm nâng cao hiệu
quả dự báo. Thơng qua đó, luận án xây dựng các mơ hình dự báo một và hai nhân tố
cũng như những mơ hình bậc cao dựa trên cơ sở các đề xuất mới. Hiệu quả của các mơ
hình đề xuất được đánh giá trên các chuỗi dữ liệu khác nhau và so sánh với các mơ
hình dự báo hiện có trên cùng tiêu chí và cùng tập dữ liệu mẫu.

Mục tiêu nghiên cứu của luận án:
-

Mở rộng khái niệm nhóm quan hệ mờ trên cơ sở khắc phục các nhược

điểm của khái niệm nhóm quan hệ mờ hiện có nhằm xây dựng các mơ hình
dự


download by :


18
báo chuỗi thời gian mờ hiệu quả trong việc giải quyết các bài toán dự báo
thực tế.
Nghiên cứu xây dựng các mơ hình dự báo chuỗi thời gian mờ hiệu
quả trên cơ sở áp dụng các kỹ thuật tính tốn mềm và các luật giải mờ
mới.
Đối tượng và giới hạn phạm vi nghiên cứu:
Đối tượng nghiên cứu của luận án là chuỗi thời gian mờ, nhóm quan hệ mờ

và các kỹ thuật tính tốn mềm.
Giới hạn: Tập trung vào việc xây dựng mơ hình và kiểm chứng mơ hình dự
báo dựa trên lý thuyết then chốt là chuỗi thời gian mờ và nhóm quan hệ mờ phụ
thuộc thời gian. Thêm nữa, luận án còn đề cập đến các kỹ thuật phân khoảng dựa
trên Đại số gia tử và các phương pháp tính tốn mềm như: phương pháp phân cụm,
thuật tốn tối ưu trong việc lựa chọn khoảng chia và bậc nhằm nâng cao hiệu quả dự
báo của mơ hình được đề xuất.
Với mục tiêu và phạm vi nghiên cứu đặt ra, những đóng góp của luận án là:



Đề xuất khái niệm NQHM-PTTG dựa trên lý thuyết về chuỗi thời gian

mờ và xây dựng thuật tốn nhóm các quan hệ mờ. Đây là một khái niệm mới
làm nền tảng để kết hợp các kỹ thuật khác nhau nhằm nâng cao hiệu quả dự báo
của mơ hình. Đóng góp này của luận án đã được công bố ở Kỷ yếu Hội nghị
Quốc gia lần thứ VI về Nghiên cứu cơ bản và ứng dụng Cơng nghệ thơng tin
(FAIR’9) năm 2016 (cơng trình [P1]) và tạp chí ứng dụng tốn học (cơng trình
[P2])



Xây dựng mơ hình dự báo chuỗi thời gian mờ bậc cao để giải quyết bài

toán dự báo khác nhau dựa vào NQHM-PTTG. Kết quả này được cơng bố trên
tạp chí International Journal of Computational Intelligence and ApplicationsESCI/Scopus Q3 năm 2018 (cơng trình [ P4])



Đề xuất các phương pháp phân khoảng dựa trên phân cụm K-means và


đại số gia tử. Các đóng góp này được cơng bố trên các tạp chí tạp chí khoa học
và cơng nghệ Đà Nẵng năm 2017 trong cơng trình [P3] và Advances in Science
Technology and Engineering Systems Journal năm 2021 (cơng trình [ P8])



Xây dựng mơ hình chuỗi thời gian mờ bậc cao hai nhân tố sử dụng
phân cụm

FCM và PSO để xác định độ dài khoảng và bậc tối ưu một cách đồng thời.
Các đóng góp này trong luận án đã được cơng bố trong cơng trình [P5]



Đề xuất, sử dụng kỹ thuật phân cụm FCM với tối ưu PSO trong việc
xác định khoảng chia tập nền và các quy tắc giả mờ mới nhằm tăng độ chính xác
dự báo của mơ hình FTS bậc 1 và bậc cao. Các đóng góp này được cơng bố trên
tạp chí Tin học và Điều khiển năm 2019, đưa ra trong cơng trình [P7].


download by :


19
Các nội dung và kết quả nghiên cứu trình bày trong luận án đã được cơng bố
trong 8 cơng trình khoa học, bao gồm: 02 bài báo trên tạp chí quốc tế uy tín (trong đó

1 bài báo thuộc danh mục ESCI); 01 bài báo ở Tạp chí Tin học và Điều khiển; 01
bài báo ở Tạp chí Khoa học và Công nghệ Đà Nẵng, 01 bài báo ở Tạp chí Ứng dụng

Tốn học; 03 báo cáo trong kỷ yếu hội thảo quốc gia có phản biện. Một số kết quả
của luận án cũng được báo cáo trong nhóm Đại số gia tử tại Viện CNTT.
Cấu trúc của luận án
Luận án được trình bày với cấu trúc gồm các phần chính dưới đây và được
tóm tắt như Hình 1.1.
Mở đầu
Trình bày tổng quan về nội dung nghiên cứu của đề tài, lý do chọn đề tài, mục
đích nghiên cứu, những đóng góp mới của luận án, đối tượng và phạm vi nghiên cứu.

Chương 1: Những kiến thức liên quan
Trình bày tổng quan về chuỗi thời gian, chuỗi thời gian mờ và các khái niệm
cùng với các thuật toán liên quan. Chương này cũng mơ tả các giai đoạn của mơ
hình FTS nói chung và ứng dụng của nó trên các bài toán thực tế. Các kiến thức cơ
sở trong chương này làm nền tảng để phát triển và xây dựng mơ hình dự báo chuỗi
thời gian mờ được trình bày trong các chương tiếp theo.
Chương 2: Xây dựng các mô hình dự báo chuỗi thời gian mờ với
NQHM_PTTG và ứng dụng
Chương 2 đưa ra đề xuất NQHM-PTTG và xây dựng các mơ hình dự báo
chuỗi thời gian mờ một nhân tố và hai nhân tố. Chương này cũng trình bày và phân
tích ưu điểm và hạn chế của từng phương pháp chia khoảng được sử dụng trong mơ
hình dự báo, đồng thời đề xuất các phương pháp chia khoảng và thử nghiệm trên bài
toán cụ thể. Kết quả dự báo trên các tập dữ liệu khác nhau của mơ hình được đề
xuất đưa ra so sánh với kết quả thu được từ các mơ hình khác trong luận án. Đồng
thời đưa ra các phân tích về hạn chế của các mơ hình trước đây cũng như sự phù
hợp của mơ hình được đề xuất dựa trên kết quả thực nghiệm.
Chương 3: Nâng cao hiệu quả của mơ hình dự báo sử dụng các kỹ thuật
tính tốn mềm
Chương này trình bày các mơ hình dự báo FTS cải tiến bằng việc kết hợp kỹ
thuật phân cụm, kỹ thuật tối ưu với mơ hình chuỗi thời gian mờ một nhân tố và hai
nhân tố ở Chương 2 nhằm nâng cao độ chính xác của kết quả dự báo. Các kết quả

thực nghiệm từ mơ hình được đề xuất trên các tập dữ liệu khác nhau được so sánh
với các mơ hình dự báo trước đây được luận án tham chiếu.
Kết luận và hướng phát triển

download by :


20
Tóm tắt các kết quả chính của luận án, những đóng góp mới của luận án về
phương pháp luận và ứng dụng thực tiễn. Kiến nghị về các định hướng nghiên cứu.
Danh mục các cơng trình khoa học của tác giả liên quan đến luận án
Tài liệu tham khảo.

Hình 1.1: Cấu trúc tổng quan của luận án

download by :


×