Tải bản đầy đủ (.doc) (140 trang)

Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.36 MB, 140 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

HÀ NỘI – 2022
BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM


HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ
NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
Chun ngành: Khoa học máy tính
Mã số: 9 48 01 01


Người hướng dẫn khoa học:
1. TS. Nguyễn Công Điều
2. TS. Nguyễn Minh Tuấn

Hà Nội – 2022


3

LỜI CAM ĐOAN
Tác giả xin cam đoan luận án “Một số phương pháp nâng cao độ chính xác
dự báo trong mơ hình chuỗi thời gian mờ” là cơng trình nghiên cứu của bản thân tác
giả. Ngoại trừ các trích dẫn từ tài liệu tham khảo được ghi rõ trong luận án, các kết
quả nghiên cứu và các kết luận nêu trong luận án là hoàn toàn trung thực, chưa từng
được cơng bố trong các cơng trình nào khác. Những đóng góp của luận án đã được
cơng bố trên các tạp chí khoa học chuyên ngành và các hội thảo với sự đồng ý của
các đồng tác giả trước khi đưa vào luận án. Những số liệu trong các bảng biểu và
hình vẽ phục vụ cho việc phân tích, so sánh, đánh giá do chính tác giả thu thập từ
các thử nghiệm.
Tác giả của luận án

Nghiêm Văn Tính


LỜI CẢM ƠN
Luận án của tác giả được thực hiện tại Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn tận tình của
thầy TS. Nguyễn Cơng Điều và TS. Nguyễn Minh Tuấn. Lời đầu tiên cho phép tôi
được bày tỏ lịng kính trọng và biết ơn sâu sắc đến hai Thầy về định hướng khoa
học, người đã động viên, trao đổi nhiều kiến thức và hướng dẫn tôi vượt qua những
khó khăn để hồn thành luận án.

Tơi cũng xin gửi lời cảm ơn chân thành đến các nhà khoa học, tác giả của các
cơng trình cơng bố đã được trích dẫn trong luận án, đây là những tư liệu quý báu,
kiến thức liên quan làm nền tảng giúp tơi hồn thành luận án.
Tơi xin chân thành gửi lời cảm ơn đến các thầy PGS. TSKH. Nguyễn Cát Hồ,
TS. Vũ Như Lân, TS. Trần Thái Sơn và các thầy cơ trong nhóm Đại số gia tử đã có
nhiều ý kiến góp ý về nội dung liên quan đến luận án thông qua các buổi seminar và
học thuật chuyên môn.
Tôi xin chân thành cảm ơn đến Ban lãnh đạo Học viện Khoa học và Công
nghệ, Viện Công nghệ Thông tin, Khoa “Cơng nghệ thơng tin và Viễn thơng”,
Phịng “Đào tạo sau đại học” đã tạo điều kiện thuận lợi trong q trình học tập,
nghiên cứu và hồn thành luận án.
Xin trân thành cảm ơn Ban giám hiệu trường Đại học Kỹ thuật công nghiệp –
ĐH Thái Nguyên, Khoa Điện tử, Bộ môn Tin học Công nghiệp và các đồng nghiệp
đã giúp đỡ và tạo điều kiện thuận lợi để tôi có thể thực hiện kế hoạch nghiên cứu,
hồn thành luận án.
Tơi xin được bày tỏ tình cảm và lịng biết ơn vơ hạn tới những người thân
trong Gia đình, những người ln dành cho tơi sự động viên, khích lệ, sẻ chia, giúp
đỡ trong những lúc khó khăn.


MỤC LỤC
LỜI CAM ĐOAN...................................................................................................... 1
LỜI CẢM ƠN........................................................................................................... 2
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT................................................ 6
DANH MỤC CÁC BẢNG........................................................................................ 7
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ............................................................ 10
MỞ ĐẦU................................................................................................................. 12
CHƯƠNG 1. NHỮNG KIẾN THỨC LIÊN QUAN................................................ 20
1.1. Các khái niêm về chuỗi thời gian...................................................................... 21
1.1.1. Chuỗi thời gian.......................................................................................... 21

1.1.2. Bài toán dự báo chuỗi thời gian................................................................. 22
1.2. Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ.......................22
1.2.1. Một số khái niệm về tập mờ...................................................................... 22
1.2.2. Chuỗi thời gian mờ và các định nghĩa liên quan........................................ 24
1.2.3. Các thành phần của mơ hình dự báo FTS.................................................. 26
1.2.3.1 Giai đoạn huấn luyện (Xây dựng mơ hình dự báo).............................27
1.2.3.2 Giai đoạn kiểm thử (Giai đoạn dự báo)............................................... 30
1.2.4. Một số mơ hình chuỗi thời gian mờ cơ bản............................................... 30
1.2.4.1 Mơ hình dự báo của Song và Chissom [8,9].......................................31

1.2.4.2. Mơ hình dự báo của Chen [10]........................................................... 31
1.2.4.3 Mơ hình dự báo của Yu [13]................................................................ 34
1.2.5. Tiêu chuẩn đánh giá độ chính xác của các mơ hình dự báo.......................36
1.3. Một số phương pháp liên quan đến phân khoảng tập nền.................................36
1.3.1. Thuật toán phân cụm K-means.................................................................. 37
1.3.2. Thuật toán phân cụm mờ Fuzzy C-means................................................. 38
1.3.3. Thuật toán tối ưu bầy đàn (PSO)............................................................... 39
1.3.4. Đại số gia tử.............................................................................................. 42
1.4. Kết luận Chương 1............................................................................................ 44

CHƯƠNG 2. XÂY DỰNG CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
VỚI NHÓM QUAN HỆ MỜ PHỤ THUỘC THỜI GIAN...................................... 45
2.1. Nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG)..................................45
2.1.1. Các định nghĩa về nhóm quan hệ mờ phụ thuộc thời gian.........................45


2.1.2. Thuật tốn tạo NQHM-PTTG bậc m......................................................... 48
2.2. Các mơ hình chuỗi thời gian mờ một nhân tố và hai nhân tố đề xuất...............49
2.2.1. Mơ hình dự báo chuỗi thời gian mờ một nhân tố (FTS-1NT)....................49
2.2.2. Mơ hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT).....................56

2.3. Các phương pháp phân khoảng dữ liệu trong tập nền....................................... 62
2.3.1. Phân khoảng dữ liệu.................................................................................. 62
2.3.2. Các phương pháp phân khoảng dữ liệu..................................................... 63
2.3.2.1 Phân khoảng với độ dài bằng nhau...................................................... 63

2.3.2.2. Phân khoảng với độ dài khác nhau..................................................... 64
2.3.3. Các phương pháp phân khoảng đề xuất..................................................... 67
2.3.3.1 Phân khoảng sử dụng phân cụm K-means........................................... 68
2.3.3.2 Phân khoảng sử dụng Đại số gia tử..................................................... 69
2.4. Tổ chức thực nghiệm và so sánh đánh giá cho các mơ hình FTS đề xuất và các

phương pháp phân khoảng....................................................................................... 72
2.4.1. Mô tả dữ liệu............................................................................................. 72
2.4.2. Kết quả thực nghiệm của mơ hình FTS một nhân tố (FTS-1NT)..............73
2.4.2.1 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu tuyển sinh

..........................................................................................................................73
2.4.2.2 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu thị trường

chứng khốn (TAIFEX).................................................................................. 76
2.4.3. Kết quả thử nghiệm của mơ hình FTS hai nhân tố (FTS-2NT).................78
2.4.4. Kết quả thực nghiệm trên mơ hình FTS-1NT sử dụng hai phương pháp

phân khoảng HA và K-means.................................................................................. 79
2.4.4.1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means

với các phương pháp phân khoảng khác trên cùng mơ hình FTS-1NT...........80
2.4.4.2 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân

khoảng HA và K-means với các mơ hình dự báo khác dựa trên QHM bậc 1.. 82

2.4.4.3 So sánh đánh giá mô hình FTS-1NT sử dụng phương pháp phân

khoảng HA và K-means với các mơ hình dự báo khác dựa trên QHM bậc cao
84
2.5. Kết luận Chương 2............................................................................................ 85

CHƯƠNG 3. NÂNG CAO HIỆU QUẢ CỦA MƠ HÌNH DỰ BÁO SỬ DỤNG
CÁC KỸ THUẬT TÍNH TỐN MỀM................................................................... 86
3.1. Các mơ hình dự báo chuỗi thời gian mờ đề xuất.............................................. 86


3.1.1. Mơ hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và

PSO 87
3.1.2. Mơ hình chuỗi thời gian mờ hai nhân tố (FTS-2NT) sử dụng FCM và PSO

.............................................................................................................................100
3.2. Tổ chức thực nghiệm và đánh giá hiệu quả của các mơ hình dự báo được đề xuất

.................................................................................................................................105
3.2.1. Đánh giá hiệu quả của mơ hình FTS một nhân tố FTS1NT-CMPSO......106
3.2.1.1 Mô tả các chuỗi dữ liệu thời gian...................................................... 106
3.2.1.2 Thiết lập các tham số của mơ hình FTS1NT-CMPSO cho các tập dữ liệu

........................................................................................................................106
3.2.1.3 Áp dụng dự báo tuyển sinh đại học của trường đại học Alabama.....107
3.2.1.4 Áp dụng dự báo thị trường chứng khoán Đài Loan TAIFEX............112
3.2.1.5 Áp dụng dự báo tai nạn ô tô tại Bỉ..................................................... 113
3.2.2. Đánh giá hiệu quả của mơ hình FTS hai nhân tố FTS2NT-CMPSO........114
3.2.2.1 Áp dụng dự báo trên tập dữ liệu nhiệt độ.......................................... 115

3.2.2.2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán..................119
3.3. Kết luận Chương 3.......................................................................................... 121

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN............................................................. 122
DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN
ĐẾN LUẬN ÁN.................................................................................................... 123
TÀI LIỆU THAM KHẢO..................................................................................... 124


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Các ký hiệu:
𝒜𝒜
μ(h)
fm(x)

Đại số tuyến tính
Độ đo tính mờ của gia tử h
Độ đo tính mờ của từ ngơn ngữ
Tập các gia tử dương
Tập các gia tử âm
Biến ngôn ngữ

H+
HÃ
Các chữ viết tắt:
TS
FTS
TAIEX
TAIFEX
PSO

KM
HA
ARIMA
FCM
MAPE
MSE
FTS-1NT
FTS-2NT
KM-FTS-1NT
HA-FTS-1NT
FTS1NTCMPSO
FTS2NTCMPSO
QHM
NQHM
NQHM-PTTG

Time series
Fuzzy time series
Taiwan
capitalization
weighted stock index
Taiwan Stock Index Futures
Particle Swam Optimization
K-means clustering
Hegde Algeras
Autoregressive
integrated moving average
Fuzzy C-Means Clustering
Mean Absolute Percentage
Error

Mean square error

Chuỗi thời gian mờ
Chuỗi thời gian mờ
Chỉ số chứng khoán Đài Loan
Tối ưu bầy đàn
Phân cụm mờ
Đại số gia tử
Quá trình trung bình trượt tích
hợp tự hồi quy
Phân cụm mờ
Sai số trung bình phần trăm tuyệt
đối
Sai số bình phương trung bình
Chuỗi thời gian mờ một nhân tố
Chuỗi thời gian mờ hai nhân tố
Phân cụm Kmeans kết hợp với
chuỗi thời gian mờ một nhân tố
Đại số gia tử kết hợp với chuỗi
thời gian mờ một nhân tố
Chuỗi thời gian mờ một nhân tố
kết hợp giữa FCM và PSO
Chuỗi thời gian mờ hai nhân tố
kết hợp giữa FCM và PSO
Quan hệ mờ
Nhóm quan hệ mờ
Nhóm quan hệ mờ phụ thuộc thời
gian



DANH MỤC CÁC BẢNG
Bảng 1.1: Các nhóm quan hệ mờ từ tập dữ liệu tuyển sinh..................................... 33
Bảng 1.2: Một số hạn chế của các mơ hình dự báo sử dụng quan hệ mờ.................35
Bảng 2.1: Sự khác nhau giữa nhóm quan hệ mờ đề xuất và nhóm quan hệ trong mơ
hình [10, 13]............................................................................................................ 47
Bảng 2.2: Dữ liệu tuyển sinh thực tế của trường đại học Alabama..........................49
Bảng 2.3: Kết quả mờ hóa dữ liệu tuyển sinh thành các tập mờ..............................51
Bảng 2.4: Biểu diễn mối quan hệ mờ bậc 1 và bậc 3 trên tập dữ liệu tuyển sinh.....52
Bảng 2.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 3...............53
Bảng 2.6: Kết quả dự báo tuyển sinh dựa trên quan hệ mờ bậc 1 và bậc 3..............55
Bảng 2.7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ
01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan.................................................. 57
Bảng 2.8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và
nhân tố thứ hai “mật độ của mây”........................................................................... 59
Bảng 2.9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố..............................60
Bảng 2.10: Kết quả tính tốn giá trị cho mỗi NQHM-PTTG bậc 3.........................61
Bảng 2.11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996
tại Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3.......................61
Bảng 2.12: Ánh xạ cơ sở......................................................................................... 65
Bảng 2.13: Các mơ hình FTS sử dụng PSO để phân khoảng kết hợp với các phương
pháp khác................................................................................................................. 66
Bảng 2.14: Các mơ hình FTS sử dụng FCM để phân khoảng kết hợp với các
phương pháp khác................................................................................................... 67
Bảng 2.15: Ưu và nhược điểm chính của các phương pháp phân khoảng...............67
Bảng 2.16: Kết quả phân cụm trên tập dữ liệu tuyển sinh sử dụng K-means...........68
Bảng 2.17: Giá trị của các khoảng từ tập dữ liệu tuyển sinh sử dụng K-means.......69
Bảng 2.18: Số lượng hạng từ ngôn ngữ................................................................... 70
Bảng 2.19: So sánh sai số dự báo MSE giữa mơ hình FTS-1NT với các mơ hình
khác trên cùng 7 khoảng.......................................................................................... 73
Bảng 2.20: Kết quả và sai số dự báo giữa mơ hình FTS-1NT với các mơ hình khác

trên cùng 14 khoảng................................................................................................ 74
Bảng 2.21: Kết quả và sai dự báo MSE giữa mơ hình FTS -1NT với các mơ hình
khác dựa trên QHM bậc cao khác nhau với số khoảng chia bằng 14.......................74
Bảng 2.22: So sánh sai số dự báo MSE của mơ hình đề xuất so với các mơ hình
khác dựa trên QHM bậc cao với số khoảng chia bằng 14........................................ 75
Bảng 2.23: Kết quả và sai số dự báo của mơ hình FTS-1NT với các mơ hình khác
dựa vào số bậc khác nhau với cùng số khoảng là 16............................................... 76


Bảng 2.24: So sánh kết quả và sai số dự báo trong pha kiểm thử giữa mơ hình đề
xuất FTS-1NT với các mơ hình khác dựa trên QHM bậc 5 với 16 khoảng..............77
Bảng 2.25: So sánh sai số dự báo MAPE trong tháng 6 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 78
Bảng 2.26: So sánh sai số dự báo MAPE trong tháng 7 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 78
Bảng 2.27: So sánh sai số dự báo MAPE trong tháng 8 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 79
Bảng 2.28: So sánh sai số dự báo MAPE trong tháng 9 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 79
Bảng 2.29: Kết quả và sai số dự báo của mơ hình FTS-1NT sử dụng các phương
pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia....................80
Bảng 2.30: Sai số dự báo MSE của mơ hình FTS-1NT sử dụng các phương pháp
phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia...............................80
Bảng 2.31: Kết quả dự báo của mơ hình FTS-1NT sử dụng phương pháp phân
khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia..........................81
Bảng 2.32: So sánh sai số dự báo MSE giữa mơ hình đề xuất với các mơ hình khác
sử dụng 7 khoảng chia............................................................................................. 82
Bảng 2.33: So sánh sai số dự báo giữa mô hình đề xuất sử dụng K-means với các
mơ hình khác dựa trên QHM bậc 1 với 14 khoảng chia.......................................... 83
Bảng 3.1: Các cụm và tâm của nó đạt được trên tập dữ liệu tuyển sinh [8].............88

Bảng 3.2: Các khoảng và điểm giữa của mỗi khoảng.............................................. 88
Bảng 3.3: Kết quả mờ hóa chuỗi dữ liệu tuyển sinh với 7 khoảng chia tập nền......89
Bảng 3.4: Kết quả biểu thị quan hệ mờ bậc 1 và bậc 2............................................ 90
Bảng 3.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 2...............91
Bảng 3.6: Kết quả dự báo của mơ hình đề xuất với 7 khoảng chia..........................94
Bảng 3.7: Khởi tạo vị trí của các cá thể................................................................... 98
Bảng 3.8: Khởi tạo vận tốc của các cá thể............................................................... 98
Bảng 3.9: Khởi tạo vị trí tốt nhất _
của các cá thể id................................98
Bảng 3.10: Cập nhật vận tốc của các cá thể............................................................. 99
Bảng 3.11: Cập nhật vị trí thứ hai của các cá thể..................................................... 99
Bảng 3.12: Vị trí pbest cuối cùng được chọn làm 𝒜𝒜𝒜𝒜𝒜..............................100
Bảng 3.13: Kết quả phân cụm trên chuỗi dữ liệu hai nhân tố sử dụng FCM.........102
Bảng 3.14: Các khoảng đạt được từ phân cụm FCM............................................. 102
Bảng 3.15: Các tham số của mơ hình FTS1NT-CMPSO cho mỗi tập dữ liệu........106
Bảng 3.16: So sánh kết quả và sai số dự báo giữa mô hình đề xuất FTS1NTCMPSO với các mơ hình khác dựa trên QHM bậc 1 với 14 khoảng.....................107
Bảng 3.17: Điểm khác biệt giữa mơ hình FTS1NT-CMPSO với các mơ hình so sánh
trên Bảng 3.16....................................................................................................... 108


Bảng 3.18: So sánh sai số dự báo MSE giữa mơ hình đề xuất FTS1NT-CMPSO với
các mơ hình khác dựa trên QHM bậc 1 và các khoảng chia khác nhau.................108
Bảng 3.19: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao........................................................ 109
Bảng 3.20: So sánh sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 7 khoảng.................................... 111
Bảng 3.21: So sánh kết quả và sai số dự báo MSE của mơ hình đề xuất với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 16 khoảng chia..........................112
Bảng 3.22: So sánh kết quả dự báo trong giai đoạn kiểm thử dựa trên QHM bậc 5
với 16 khoảng và sử dụng wh = 3.......................................................................... 113

Bảng 3.23: So sánh kết quả và sai số dự báo RMSE giữa mơ hình FTS1NT-CMPSO
và các mơ hình trước đây với số khoảng chia và bậc khác nhau............................ 113
Bảng 3.24: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự báo
nhiệt độ.................................................................................................................. 115
Bảng 3.25: Các tham số của mô hình FTS2NT-CMPSO được thiết lập cho dự báo
thị trường chứng khoán.......................................................................................... 115
Bảng 3.26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan
theo từng tháng từ ngày 01/06/1996 đến 30/09/1996............................................. 116
Bảng 3.27: Sai số dự báo MAPE (%) trên từng bậc của mơ hình FTS2NT-CMPSO
.................................................................................................................................117
Bảng 3.28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau.................................... 118
Bảng 3.29: So sánh sai số dự báo MAPE(%) trong tháng 7 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau.................................... 118
Bảng 3.30: So sánh sai số dự báo MAPE(%) trong tháng 8 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau.................................... 118
Bảng 3.31: So sánh sai số dự báo MAPE(%) trong tháng 9 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau.................................... 119
Bảng 3.32: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS2NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao với 16 khoảng chia cho mỗi nhân tố
.................................................................................................................................120


DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1.1: Cấu trúc tổng quan của luận án................................................................ 20
Hình 1.2: Chuỗi tỷ giá hối đối BP / USD hàng tuần [53]....................................... 21
Hình 1.3: Đồ thị của 3 hàm thuộc phổ biến:(a) tam giác, (b) hình thang, (c) Gauss
23 Hình 1.4: Mơ hình dự báo FTS tổng quát........................................................... 26
Hình 1.5: Các thành phần trong giai đoạn huấn luyện............................................. 27
Hình 1.6: Ví dụ phân khoảng tập nền sử dụng các hàm thuộc khác nhau................28
Hình 1.7: Các thành phần trong giai đoạn kiểm thử................................................ 30
Hình 1.8: Tóm tắt các bước thực hiện mơ hình dự báo của Chen [10] trên tập dữ liệu
tuyển sinh của trường Đại học Alabama.................................................................. 34
Hình 1.9: Sơ đồ thuật tốn phân cụm k-means........................................................ 38

Hình 1.10: Sơ đồ thuật tốn phân cụm bằng FCM................................................... 39
Hình 1.11: Đồ thị minh họa một điểm tìm kiếm bằng PSO..................................... 40
Hình 1.12: Biểu diễn sự sắp xếp của các phần tử 𝒜 ∈ 𝒜, ℎ ∈ 𝒜 , 𝒜 ∈ 𝒜 .......44
Hình 2.1. Minh họa chuỗi thời gian được mờ hóa bới các tập mờ...........................46
Hình 2.2: Các bước của mơ hình dự báo................................................................. 49
Hình 2.3: Biểu diễn dữ liệu tuyển sinh được mờ hóa bởi các tập mờ 𝒜 𝒜..............51
Hình 2.4: Các bước của mơ hình FTS-2NT............................................................. 56
Hình 2.5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập mẫu. 63
Hình 2.6: Các phương pháp phân khoảng................................................................ 63
Hình 2.7: Minh hoạ các khoảng chia liên tiếp có độ dài bằng nhau là 1000............64
Hình 2.8: Độ thị phân bổ giá trị chênh lệch của chuỗi dữ liệu tuyển sinh...............65
Hình 2.9: Các phương pháp phân khoảng khác nhau kết hợp với mơ hình FTS-1NT
...................................................................................................................................68
Hình 2.10: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng K-means......69
Hình 2.11: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng HA..............72
Hình 2.12: Biểu diễn sai số dự báo MSE giữa hình FTS-1NT với các mơ hình so
sánh dựa trên các bậc khác nhau với 14 khoảng chia.............................................. 75
Hình 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mơ hình FTS-1NT
dựa trên các phương pháp phân khoảng khác nhau................................................. 81
Hình 2.14: Đường cong mô tả kết quả dự báo của mô hình FTS-1NT sử dụng
phương pháp phân khoảng HA và K-means so với dữ liệu thực tế..........................82
Hình 2.15: Đường cong biểu diễn giữa giá trị dự báo của mơ hình KM-FTS-1NT và
các mơ hình khác so với dữ liệu thực tế................................................................... 84
Hình 2.16: So sánh sai số dự báo MSE giữa mơ hình đề xuất sử dụng phân khoảng
K-means và HA với các mơ hình khác dựa trên QHM bậc cao với 7 khoảng chia. 84
Hình 3.1: Cấu trúc và các giai đoạn của mơ hình dự báo đề xuất (FTS1NT-CMPSO)
...................................................................................................................................87


Hình 3.2: Cấu trúc khoảng của một cá thể trong PSO............................................. 95

Hình 3.3: Sơ đồ thuật tốn biểu diễn mơ hình FTS1NT-CMPSO............................97
Hình 3.4: Cấu trúc và các giai đoạn của mơ hình đề xuất FTS2NT- CMPSO........101
Hình 3.5: Biểu diễn các khoảng và bậc của mơ hình theo cá thể i trong PSO.......103
Hình 3.6: Biểu diễn giá trị thực của các chuỗi dữ liệu thời gian............................106
Hình 3.7: Đồ thị biểu diễn sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO và
các mơ hình so sánh trong Bảng 3.18 với số lượng khoảng khác nhau..................109
Hình 3.8: Đồ thị biểu diễn sai số dự báo giữa mơ hình đề xuất FTS1NT-CMPSO với
các mơ hình khác trong Bảng 3.20........................................................................ 111
Hình 3.9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung
bình hàng ngày trong tháng 6, dựa trên mơ hình FTS2NT-CMPSO bậc 7.............117
Hình 3.10: Đồ thị thể hiện thời gian tính tốn và tốc độ hội tụ của mơ hình
FTS2NT-CMPSO với 150 lần lặp.......................................................................... 120


MỞ ĐẦU
Những thành tựu đạt được trong các hoạt động của con người được đặc trưng
bởi các quá trình ra quyết định hiệu quả của họ. Để giúp quá trình ra quyết định
được chính xác, tiết kiệm được thời gian và giảm các chi phí khơng cần thiết thì bài
tốn dự báo đóng vai trị rất quan trọng. Dự báo là một công cụ trợ giúp cần thiết
cho việc ra quyết định và lập kế hoạch để quản lý hiệu quả các tổ chức hiện đại. Ví
dụ, dự báo bán hàng ln đóng một vai trị nổi bật trong hoạt động kinh doanh. Nó
cung cấp cho các doanh nghiệp những chỉ dẫn đáng tin cậy về chi phí cơng việc và
phân bổ ngân sách cho một khoảng thời gian sắp tới. Các nhà khoa học cũng phải
đối mặt với thách thức quan trọng trong việc dự báo các sự kiện xảy ra trong tương
lai như nhiệt độ, lượng mưa, tăng trưởng nền kinh tế, ... Để dự báo các sự kiện này
với độ chính xác 100% là khơng thể, nhưng rất nhiều lợi ích có thể thu được từ kết
quả dự báo cũng như một bức tranh về tương lai đó. Một trong các hướng nghiên
cứu nâng cao độ chính xác của các bài toán dự báo là nghiên cứu dữ liệu chuỗi thời
gian. Chuỗi thời gian (TS – time series) là một chuỗi các giá trị số hoặc chuỗi các từ
trong ngôn ngữ tự nhiên được ghi lại tại các thời điểm liên tiếp trong một khoảng

thời gian, thường được đo cách nhau tại các thời điểm thống nhất: hàng ngày, hàng
tuần, hàng tháng, hàng quý hoặc hàng năm. Nói một cách đơn giản, một chuỗi thời
gian là một chuỗi dữ liệu lịch sử được thu thập một cách đều đặn.
Phân tích chuỗi thời gian để xây dựng các mơ hình dự báo chuỗi thời gian
hiệu quả là một trong các khâu quan trọng trong việc tạo ra các cơng cụ dự báo tốt
nhằm giải quyết các bài tốn thực tế. Một loạt các phương pháp đã được đề xuất để
giải quyết những bài tốn này, thơng dụng hơn cả là mơ hình tự hồi quy
(autoregression model - AR), trung bình trượt (moving average - MA) và kết hợp
của chúng thành mơ hình ARMA và ARIMA do Box và Jenkins [1] phát triển năm
1976. Các mơ hình dự báo nêu trên được xây dựng cho chuỗi thời gian tuyến tính và
dừng. Bên cạnh các mơ hình chuỗi thời gian dừng thì các mơ hình ARCH [2]
(Autoregressive Conditionally Hestoroscedastic) và GARCH [3] (Generalize
Autoregressive Conditionally Hestoroscedastic) được xây dựng để giải quyết các
chuỗi thời gian không dừng hay chuỗi thời gian có phương sai thay đổi. Để áp dụng
các mơ hình dự báo chuỗi thời gian trên với độ chính xác khả quan đòi hỏi một số
ràng buộc chặt chẽ như: chuỗi thời gian phải là tuyến tính hay cần một số lượng dữ
liệu lớn. Trong thực tế, việc đòi hỏi các chuỗi thời gian là dừng và tuyến tính khơng
phải lúc nào cũng đáp ứng được, thậm chí chúng cịn mang tính khơng chắc chắn và
biến thiên mạnh.
Việc áp dụng các mơ hình nêu trên đối với chuỗi dữ liệu thời gian ngắn hay
phi tuyến là không phù hợp và kết quả dự báo đạt được chưa cao. Để khắc phục các
hạn chế đó, một số tác giả đã sử dụng mạng nơron để xây dựng mơ hình dự báo
chuỗi


thời gian dựa trên tính phi tuyến và linh hoạt của chúng. Donaldson và công sự [4]
đã đề xuất mô hình chuỗi thời gian sử dụng mạng nơron nhân tạo (Artificial Neural
Network – ANN) để dự báo sự biến động của thị trường chứng khoán Mỹ, Canada,
Nhật Bản và Anh. Hansen và Nelson [5] cũng sử dụng mạng nơron để xây dựng mơ
hình dự báo doanh thu từ thuế. Quan sát thấy rằng, phương pháp sử dụng mạng

nơron đạt được độ chính xác cao hơn so với các mơ hình truyền thống. Mặt khác,
một số nghiên cứu đã sử dụng suy luận mờ dựa trên mạng nơron [6] (Adaptive
Neuro-Fuzzy Inference System-ANFIS) để nâng cao độ chính xác dự báo của mơ
hình chuỗi thời gian. Khác so với mạng ANN, hệ này có khả năng thích nghi với
mơi trường cao hơn trong q trình huấn luyện. Do đó, đã có nhiều cơng trình áp
dụng hệ ANFIS trong sự báo TS và thu được những kết quả nhất định. Tuy nhiên,
các mô hình tiên tiến sử dụng mạng nơron đơn lẻ vẫn phải đối mặt với một số vấn
đề như cần giả định một số lượng dữ liệu lớn trong quá trình huấn luyện mạng, phụ
thuộc vào kinh nghiệm trong việc chọn nút mạng và khơng có phương pháp rõ ràng
để phân tích mối quan hệ giữa đầu vào và đầu ra trong mạng.
Hơn nữa, trong cuộc sống hàng ngày, con người thường quan sát, phân tích
các sự vật, hiện tượng và các sự kiện xảy ra trong thế giới thực và đưa ra các quyết
định của mình dưới dạng ngơn ngữ tự nhiên. Với bài toán dự báo chuỗi thời gian,
dữ liệu có thể được biểu diễn dưới dạng các từ trong ngôn ngữ tự nhiên và dễ dàng
mô tả cách con người thực hiện quá trình dự báo dưới dạng ngôn ngữ trong thực tế.
Thật vậy, khi con người quan sát dữ liệu chuỗi thời gian, họ nhanh chóng chuyển
các biến động của chuỗi thời gian sang dạng ngôn ngữ và lập luận trong suy nghĩ
theo một cách nào đó dựa trên quan hệ giữa các hạng từ trong chuỗi thời gian để
ước lượng kết quả dự báo dưới dạng ngôn ngữ. Trong ngữ cảnh như vậy, các
phương pháp thống kê nêu trên chỉ được sử dụng để giải quyết chuỗi thời gian số
(Numerical time series - NTS) mà không thể sử dụng để giải quyết một cách hiệu
quả các bài tốn ra quyết định như vậy. Vì vậy, chuỗi thời gian mờ ra đời nhằm giải
quyết các bài toán dự báo với chuỗi số liệu được biểu diễn dưới dạng ngôn ngữ.
Chuỗi thời gian mờ (Fuzzy time series - FTS) được Song và Chissom giới thiệu lần
đầu tiên vào năm 1993, dựa trên lý thuyết tập mờ của Zadeh [7], trong đó các tập
mờ được xem như là ngữ nghĩa của các hạng từ ngôn ngữ. Theo cách tiếp cận này,
Song và Chissom đã đề xuất hai mơ hình FTS [8, 9] để dự báo số lượng sinh viên
nhập học của trường Đại học Alabama. Tuy nhiên, mơ hình của Song và Chissom
còn tồn tại một số hạn chế như mất nhiều thời gian tính tốn do thực hiện phép hợp
thành max – min phức tạp đối với ma trận quan hệ mờ (

− 1, 𝒜) lớn và thiếu sự
thuyết phục trong việc xác định độ dài của khoảng chia tập nền. Để khắc phục hạn
chế trên, Chen [10] đã đề xuất nhóm quan hệ mờ và sử dụng các phép tốn số học
đơn giản trong q trình giải mờ.


Mặc dù các mơ hình này đã chứng tỏ những ưu việt khi áp dụng cho chuỗi dữ liệu
thời gian tổng qt nhưng độ chính xác dự báo cịn khá thấp. Đây là cơ sở để mở ra
một hướng nghiên cứu mới và thu hút được nhiều công bố cả về cải tiến phương
pháp luận lẫn nghiên cứu ứng dụng. Vì điểm trên, nhiều nghiên cứu đã cải tiến mơ
hình của Chen nhằm nâng cao độ chính xác của kết quả dự báo theo các hướng sau:
1) xác định tập nền và tìm độ dài khoảng phù hợp [11- 28]; 2) xây dựng các mối
quan hệ mờ và nhóm quan hệ mờ trên cơ sở dữ liệu được mờ hóa [18, 24, 29-31] và
3) cải tiến các quy tắc giải mờ cho dự báo đầu ra [13, 18, 32-33].
Trước hết, việc phân khoảng tập nền: làm thế nào để phân tập nền chứa dữ
liệu lịch sử thành các khoảng với độ dài thích hợp và bao nhiêu khoảng là phù hợp?
Bắt đầu từ cơng trình nền tảng [11], Huarng đã xác định rằng độ dài của khoảng
chia tập nền là một yếu tố quan trọng và ảnh hưởng đáng kể đến độ chính xác dự
báo của mơ hình. Từ quan điểm này, Huarng đã đưa ra hai phương pháp chọn độ dài
khoảng tập nền theo phân bố và độ dài trung bình. Các phương pháp của Huarng đã
đạt được độ chính xác tốt hơn so với một số mơ hình dự báo trước đó. Yolcu và
cộng sự [22] đưa ra một cách tiếp cận mới dựa trên việc tối ưu tỷ lệ để xác định độ
dài của các khoảng chia bằng hàm “fminbnd” trong MATLAB. Trong những năm
gần đây, các kỹ thuật tính tốn mềm và các phương pháp tối ưu tiến hóa được sử
dụng rộng rãi để xác định phân khoảng tối ưu trong mơ hình FTS. Chen & Chung
đưa ra hai mơ hình chuỗi thời gian mờ bậc nhất [15] và bậc cao [16] dựa trên thuật
toán di truyền để phân tập nền thành các khoảng có độ dài phù hợp và áp dụng cho
dự báo tuyển sinh tại trường Đại học Alabama. Lee và cộng sự [34] áp dụng thuật
tốn tơi luyện (Simulated Annealing
- SA) để xác định độ dài khoảng thích hợp trong mơ hình FTS bậc cao cho dự báo

thị trường chứng khoán Đài Loan (TAIFEX). Eren Bas và cộng sự [35] đã đề xuất
một thuật toán di truyền cải tiến (MGA) để tránh những phán đoán chủ quan trong
việc xác định độ dài của mỗi khoảng tập nền trong mơ hình FTS để dự báo tai nạn
xe hơi ở Bỉ và tuyển sinh vào trường Đại học Alabama. Bên cạnh đó, nhiều thuật
tốn tối ưu được lấy cảm hứng từ các loài sinh vật học cũng được sử dụng cho mục
đích phân khoảng nhằm nâng cao độ chính xác dự báo của mơ hình FTS như: tối ưu
bầy đàn (Particle Swarm Optimization - PSO) [14, 18, 30 - 33, 35], tối ưu đàn kiến
(Ant Colony Optimization - ACO) [36] và tối ưu dựa trên sự di chuyển của đàn
ngỗng( Geese Movement Based Optimization- GMBO) [37]. Cùng mục đích sử
dụng PSO để hiệu chỉnh độ dài khoảng tập nền, một số tác giả khác đã đề xuất các
mơ hình FTS dựa trên quan hệ mờ bậc cao [35, 38] và quan hệ mờ hai nhân tố [3941] để áp dụng dự báo các bài toán khác nhau. Ngoài ra, Chen và cộng sự [42] đã áp
dụng PSO để tối ưu đồng thời các khoảng chia và các trọng số trên mỗi nhóm quan
hệ mờ cho dự báo TAIFEX và tỷ giá NTD / USD. Song song với kỹ thuật tối ưu,
thì các phương


pháp phân cụm như: phân cụm mờ C-mean [28, 43], phân cụm tự động [17] cũng
được sử dụng cho mục đích phân khoảng nhằm giảm thiểu sai số dự báo trong mơ
hình chuỗi thời gian mờ.
Thứ hai, việc thiết lập các quan hệ logic mờ hay có thể gọi tắt là quan hệ mờ
(QHM) và nhóm quan hệ mờ (NQHM) có tác động lớn đến độ chính xác của kết
quả dự báo. Do đó, làm cách nào để thiết lập nhóm quan hệ mờ phù hợp là một
trong những yếu tố quan trọng trong mơ hình FTS. Nhận thấy tầm quan trọng này,
nhiều nghiên cứu đã đề xuất các mô hình FTS khác nhau theo hướng tiếp cận
NQHM. Khái niệm nhóm quan hệ mờ đầu tiên do Chen [10] đề xuất bằng cách gộp
các thành phần bên vế phải của các quan hệ mờ khi chúng có cùng vế trái. Theo
cách này, các nhóm quan hệ mờ được thiết lập giúp cho giai đoạn giải mờ và tính
tốn giá trị dự báo rõ một cách dễ dàng hơn. Vì ưu điểm này, nhiều mơ hình dự báo
đã được đề xuất dựa trên NQHM của Chen [10] để giải quyết các bài tốn khác
nhau [15-19, 40, 44]. Tuy nhiên, các mơ hình sử dụng nhóm quan hệ này gặp phải

hạn chế do khơng để ý đến tính lặp và vị trí của các quan hệ khi tham gia vào
NQHM. Tình trạng này dẫn đến thiếu thông tin để dự báo và giảm khả năng giải
thích của mơ hình. Yu [13] đã chỉ ra tầm quan trọng của sự lặp lại các thành phần
trong NQHM và gán các trọng số khác nhau theo vị trí xuất hiện của chúng trong
NQHM. Đây được xem như một đề xuất thứ 2 về NQHM và đã được các nghiên
cứu khác đề xuất sử dụng [45, 46].
Thứ ba, thiết lập quy tắc giải mờ để nhận kết quả dự báo rõ là một bước quan
trọng và ảnh hưởng trực tiếp đến kết quả dự báo của mơ hình. Một quy tắc giải mờ
có thể cho kết quả tốt đối với mơ hình chuỗi thời gian mờ bậc nhất nhưng hạn chế
đối với mơ hình chuỗi thời gian mờ bậc cao và ngược lại; hoặc có thể phù hợp với
một bài toán dự báo nhất định nhưng lại khơng phù hợp cho các bài tốn dự báo
khác và ngược lại. Thông thường giá trị dự báo lấy trung bình điểm giữa của các
khoảng liên quan đến từng tập mờ bên vế phải của NQHM [15-18]. Tuy nhiên, do
có sự đóng góp khác nhau của các thành phần trong vế phải của NQHM nên nhiều
tác giả đã sử dụng trọng số để gán cho từng giá trị điểm giữa [13, 46, 47]. Ngoài
điểm giữa của khoảng dự báo, một số kỹ thuật khác được sử dụng để nâng cao độ
chính xác dự báo bằng cách chia khoảng này thành các đoạn con để lấy thêm thông
tin dự báo [32]. Bên cạnh đó, để tính giá trị dự báo khi vế phải của quan hệ mờ chưa
được xác định, nhiều tác giả đã sử dụng phương pháp phiếu bầu (voting) [18, 33] để
gán một trọng số ưu tiên cho thành phần có đóng góp gần nhất về tương lai.
Vấn đề về bậc của mơ hình và nhân tố ảnh hưởng của chuỗi thời gian cũng
được nhiều tác giả xem xét và giới thiệu đối với từng bài toán dự báo cụ thể. Đối
với vấn đề thứ nhất, đã có một số lượng lớn các nghiên cứu [14, 16, 17, 35, 39, 48]
được công bố dựa trên QHM bậc cao nhằm cải thiện hiệu quả dự báo của mơ hình
bậc nhất.


Tuy nhiên, các mơ hình bậc cao đã cơng bố trước đây thường chọn bậc với độ chính
xác tốt nhất bằng trực giác hay thử nghiệm một số lần chạy trên mỗi bậc cho trước.
Vậy, có giải pháp hiệu quả nào để xác định bậc của mơ hình với độ chính xác dự

báo tốt nhất một cách tự động? Câu hỏi này, đã được đáp ứng trong luận án bằng
việc sử dụng PSO để tối ưu đồng thời độ dài khoảng và bậc của mơ hình. Đối với
vấn đề thứ hai, thực tế cho thấy đôi khi chuỗi thời gian chính (hay gọi là nhân tố dự
báo) lại bị ảnh hưởng bởi một hay nhiều nhân tố khác, ví dụ: chỉ số chứng khoán
của Nhật bị ảnh hưởng bởi chuỗi chỉ số chứng khốn New-York. Do đó, để nâng
cao hiệu quả dự báo, một số nghiên cứu đã xét thêm các nhân tố phụ để tăng khả
năng dự báo cho nhân tố chính trên từng bài tốn mà các nhân tố này có mối quan
hệ tiềm năng. Điển hình có thể thấy trong các cơng trình [34, 35, 40] đã đề xuất kết
hợp các kỹ thuật khác nhau với mô hình FTS bậc cao hai nhân tố để giải quyết dự
báo các bài toán khác nhau: như dự báo nhiệt độ trung bình tại Đài Bắc, Đài Loan
[34, 40] với nhân tố thứ hai là độ che phủ của mây; dự báo thị trường chứng khoán
Đài Loan TAIFEX [35, 40] nhận chỉ số TAIEX là nhân tố thứ hai.
Như đã phân tích ở trên, dự báo chuỗi thời gian mờ đã thu hút được nhiều sự
quan tâm của các nhà nghiên cứu quốc tế và họ đã có được các thành quả đáng kể.
Tại Việt Nam, lĩnh vực này cũng nhận được sự quan tâm của các nhóm nghiên cứu
tại Viện Công nghệ Thông tin (CNTT) và tại các trường Đại học phía nam. Điển
hình như, nhóm tác giả tại Đại học Cần Thơ đã xây dựng mơ hình chuỗi thời gian
mờ với các tập mờ có cấp độ thuộc là một hàm liên tục có chứa tham số [49]. Các
tác giả này đã xây dựng thuật toán để xác định các tham số phù hợp nhất trên mỗi
tập dữ liệu tương ứng, sau đó thực hiện nội suy dữ liệu để có được kết quả dự báo.
Các cơng trình [19, 20] đã đề xuất phương pháp phân khoảng dựa trên các ánh xạ
ngữ nghĩa của đại số gia tử [50], từ đó xây dựng mơ hình dự báo tương tự như mơ
hình chuỗi thời gian mờ. Một số tác giả khác đã cố gắng xây dựng mơ hình dự báo
bằng chuỗi ngôn ngữ của đại số gia tử thay vì các tập mờ như trong các nghiên cứu
[51, 52]. Tuy nhiên, các nghiên cứu này mới chỉ tập trung vào việc xây dựng mơ
hình bậc nhất, chưa sử dụng thêm nhân tố phụ vào dự báo nên kết quả dự báo thu
được chưa thực sự tốt cũng như việc sử dụng tập dữ liệu chưa được phong phú. Mặt
khác, để phát triển mơ hình dự báo chuỗi thời gian dựa trên lý thuyết đại số gia tử
rất cần có những mở rộng mới.
Qua phân tích ưu điểm và hạn chế của các cơng trình nghiên cứu trong và

ngồi nước cho thấy mơ hình chuỗi thời gian mờ vẫn cần có những cải tiến khác
nhau để chúng có thể đạt được độ chính xác dự báo tốt hơn cũng như cần các bước
tính tốn hợp lý hơn để có thể ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau.
Tính cấp thiết của đề tài luận án:


Khái niệm quan hệ mờ và nhóm quan hệ mờ do Chen đề xuất đóng vai trị
quyết định trong việc phát triển mơ hình dự báo chuỗi thời gian mờ. Nhờ những
khái niệm này, việc tính tốn dự báo đã đơn giản hơn rất nhiều so với mơ hình của
Song và Chissom. Những cơng trình nghiên cứu về chuỗi thời gian mờ đa số sử
dụng mơ hình của Chen để thực hiện dự báo. Tuy nhiên, cấu trúc nhóm quan hệ mờ
của Chen và Yu là cố định đối với từng thời điểm dự báo và có sự bất hợp lý. Khi
lập nhóm quan hệ mờ ở một thời điểm t nào đó thì sẽ xuất hiện những thành phần
khơng xem xét đến lịch sử xuất hiện của các tập mờ bên vế phải của quan hệ mờ.
Điều này dẫn đến việc có thành phần xuất hiện sau thời điểm t mà vẫn được tham
gia dự báo cùng với các thành phần tại thời điểm t hoặc thời điểm trước đó. Vấn đề
này được xem là khơng phù hợp với tính thực tiễn. Để khắc phục điểm này, nghiên
cứu trong luận án đưa ra khái niệm nhóm quan hệ mờ phụ thuộc thời gian (NQHMPTTG). Với cách tiếp cận này, tác giả đã chỉ ra rằng việc sử dụng nhóm NQHMPTTG có thể cải thiện đáng kể kết quả dự báo và đã được chứng minh là phù hợp
hơn trong thực tế. Đóng góp này của luận án đã được cơng bố trong cơng trình [P1]
và đề xuất mở rộng cũng như được ứng dụng trong các cơng trình [P2-P8].
Bên cạnh đó, các mơ hình dự báo chuỗi thời gian mờ bao gồm mơ hình bậc
một, mơ hình bậc cao và mơ hình hai hay nhiều nhân tố đã được xem xét trong một
loạt cơng trình nghiên cứu. Do vậy, một vấn đề đặt ra là cần kiểm nghiệm liệu khái
niệm nhóm quan hệ mờ phụ thuộc thời gian mới có thực sự tạo được những lợi thế
hay khơng trong các mơ hình trên. Đồng thời trong một số bước của mơ hình dự báo
chuỗi thời gian mờ vẫn tồn tại một số vấn đề cần được cải tiến như tìm các phương
pháp phân khoảng mới dựa trên các kỹ thuật như phân cụm, tối ưu tiến hóa hay sử
dụng đại số gia tử. Trong bước giải mờ cũng cần một số tinh chỉnh nhằm nâng cao
hiệu quả của mô hình dự báo. Nhìn chung cịn khá nhiều vấn đề có thể giải quyết
được để cải tiến mơ hình dự báo. Đây là những nội dung sẽ được trình bày trong

suốt luận án mà tập trung vào đề xuất khái niệm nhóm quan hệ mờ mới để kết hợp
với các kỹ thuật khác nhau như tối ưu độ dài khoảng chia và kỹ thuật tối ưu bậc của
mơ hình nhằm nâng cao hiệu quả dự báo. Thơng qua đó, luận án xây dựng các mơ
hình dự báo một và hai nhân tố cũng như những mơ hình bậc cao dựa trên cơ sở các
đề xuất mới. Hiệu quả của các mơ hình đề xuất được đánh giá trên các chuỗi dữ liệu
khác nhau và so sánh với các mơ hình dự báo hiện có trên cùng tiêu chí và cùng tập
dữ liệu mẫu.
Mục tiêu nghiên cứu của luận án:
- Mở rộng khái niệm nhóm quan hệ mờ trên cơ sở khắc phục các nhược

điểm của khái niệm nhóm quan hệ mờ hiện có nhằm xây dựng các mơ
hình dự


báo chuỗi thời gian mờ hiệu quả trong việc giải quyết các bài toán dự báo
thực tế.
- Nghiên cứu xây dựng các mơ hình dự báo chuỗi thời gian mờ hiệu quả trên

cơ sở áp dụng các kỹ thuật tính toán mềm và các luật giải mờ mới.
Đối tượng và giới hạn phạm vi nghiên cứu:
Đối tượng nghiên cứu của luận án là chuỗi thời gian mờ, nhóm quan hệ mờ
và các kỹ thuật tính tốn mềm.
Giới hạn: Tập trung vào việc xây dựng mơ hình và kiểm chứng mơ hình dự
báo dựa trên lý thuyết then chốt là chuỗi thời gian mờ và nhóm quan hệ mờ phụ
thuộc thời gian. Thêm nữa, luận án còn đề cập đến các kỹ thuật phân khoảng dựa
trên Đại số gia tử và các phương pháp tính tốn mềm như: phương pháp phân cụm,
thuật toán tối ưu trong việc lựa chọn khoảng chia và bậc nhằm nâng cao hiệu quả dự
báo của mô hình được đề xuất.
Với mục tiêu và phạm vi nghiên cứu đặt ra, những đóng góp của luận án là:
 Đề xuất khái niệm NQHM-PTTG dựa trên lý thuyết về chuỗi thời gian mờ và


xây dựng thuật tốn nhóm các quan hệ mờ. Đây là một khái niệm mới làm
nền tảng để kết hợp các kỹ thuật khác nhau nhằm nâng cao hiệu quả dự báo
của mơ hình. Đóng góp này của luận án đã được công bố ở Kỷ yếu Hội nghị
Quốc gia lần thứ VI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin
(FAIR’9) năm 2016 (cơng trình [P1]) và tạp chí ứng dụng tốn học (cơng
trình [P2])
 Xây dựng mơ hình dự báo chuỗi thời gian mờ bậc cao để giải quyết bài toán
dự báo khác nhau dựa vào NQHM-PTTG. Kết quả này được cơng bố trên tạp
chí International Journal of Computational Intelligence and ApplicationsESCI/Scopus Q3 năm 2018 (cơng trình [ P4])
 Đề xuất các phương pháp phân khoảng dựa trên phân cụm K-means và đại số
gia tử. Các đóng góp này được cơng bố trên các tạp chí tạp chí khoa học và
cơng nghệ Đà Nẵng năm 2017 trong cơng trình [P3] và Advances in Science
Technology and Engineering Systems Journal năm 2021 (công trình [ P8])
 Xây dựng mơ hình chuỗi thời gian mờ bậc cao hai nhân tố sử dụng phân cụm
FCM và PSO để xác định độ dài khoảng và bậc tối ưu một cách đồng thời.
Các đóng góp này trong luận án đã được cơng bố trong cơng trình [P5]
 Đề xuất, sử dụng kỹ thuật phân cụm FCM với tối ưu PSO trong việc xác định
khoảng chia tập nền và các quy tắc giả mờ mới nhằm tăng độ chính xác dự
báo của mơ hình FTS bậc 1 và bậc cao. Các đóng góp này được cơng bố trên
tạp chí Tin học và Điều khiển năm 2019, đưa ra trong cơng trình [P7].


Các nội dung và kết quả nghiên cứu trình bày trong luận án đã được cơng bố
trong 8 cơng trình khoa học, bao gồm: 02 bài báo trên tạp chí quốc tế uy tín (trong
đó 01 bài báo thuộc danh mục ESCI); 01 bài báo ở Tạp chí Tin học và Điều khiển;
01 bài báo ở Tạp chí Khoa học và Công nghệ Đà Nẵng, 01 bài báo ở Tạp chí Ứng
dụng Tốn học; 03 báo cáo trong kỷ yếu hội thảo quốc gia có phản biện. Một số kết
quả của luận án cũng được báo cáo trong nhóm Đại số gia tử tại Viện CNTT.
Cấu trúc của luận án

Luận án được trình bày với cấu trúc gồm các phần chính dưới đây và được
tóm tắt như Hình 1.1.
Mở đầu
Trình bày tổng quan về nội dung nghiên cứu của đề tài, lý do chọn đề tài,
mục đích nghiên cứu, những đóng góp mới của luận án, đối tượng và phạm vi
nghiên cứu.
Chương 1: Những kiến thức liên quan
Trình bày tổng quan về chuỗi thời gian, chuỗi thời gian mờ và các khái niệm
cùng với các thuật toán liên quan. Chương này cũng mơ tả các giai đoạn của mơ
hình FTS nói chung và ứng dụng của nó trên các bài toán thực tế. Các kiến thức cơ
sở trong chương này làm nền tảng để phát triển và xây dựng mô hình dự báo chuỗi
thời gian mờ được trình bày trong các chương tiếp theo.
Chương 2: Xây dựng các mơ hình dự báo chuỗi thời gian mờ với
NQHM_PTTG và ứng dụng
Chương 2 đưa ra đề xuất NQHM-PTTG và xây dựng các mơ hình dự báo
chuỗi thời gian mờ một nhân tố và hai nhân tố. Chương này cũng trình bày và phân
tích ưu điểm và hạn chế của từng phương pháp chia khoảng được sử dụng trong mơ
hình dự báo, đồng thời đề xuất các phương pháp chia khoảng và thử nghiệm trên bài
toán cụ thể. Kết quả dự báo trên các tập dữ liệu khác nhau của mơ hình được đề
xuất đưa ra so sánh với kết quả thu được từ các mơ hình khác trong luận án. Đồng
thời đưa ra các phân tích về hạn chế của các mơ hình trước đây cũng như sự phù
hợp của mơ hình được đề xuất dựa trên kết quả thực nghiệm.
Chương 3: Nâng cao hiệu quả của mơ hình dự báo sử dụng các kỹ thuật
tính tốn mềm
Chương này trình bày các mơ hình dự báo FTS cải tiến bằng việc kết hợp kỹ
thuật phân cụm, kỹ thuật tối ưu với mô hình chuỗi thời gian mờ một nhân tố và hai
nhân tố ở Chương 2 nhằm nâng cao độ chính xác của kết quả dự báo. Các kết quả
thực nghiệm từ mơ hình được đề xuất trên các tập dữ liệu khác nhau được so sánh
với các mơ hình dự báo trước đây được luận án tham chiếu.
Kết luận và hướng phát triển



Tóm tắt các kết quả chính của luận án, những đóng góp mới của luận án về
phương pháp luận và ứng dụng thực tiễn. Kiến nghị về các định hướng nghiên cứu.
Danh mục các cơng trình khoa học của tác giả liên quan đến luận án
Tài liệu tham khảo.
Hình 1.1: Cấu trúc tổng quan của luận án


CHƯƠNG 1. NHỮNG KIẾN THỨC LIÊN QUAN
Nội dung chương này trình bày tổng quan về ứng dụng của lý thuyết tập mờ,
các khái niệm về chuỗi thời gian cũng như chuỗi thời gian mờ trong các bài toán dự
báo và các thuật tốn liên quan. Chương này cũng trình bày các bước trong từng
giai đoạn thực hiện của mơ hình chuỗi thời gian mờ tổng qt và các mơ hình chuỗi
thời gian mờ cơ bản. Các nội dung này được xem là cơ sở nền tảng để phát triển các
đề xuất mới trong các chương tiếp theo của luận án.
1.1. Các khái niêm về chuỗi thời gian
1.1.1. Chuỗi thời gian

Chuỗi thời gian x(t) là một tập hợp các quan sát được diễn biến và ghi lại
theo thời gian t. Trong đó t đại diện cho thời gian, x(t) được coi là biến ngẫu nhiên
[53]. Chuỗi thời gian có thể liên tục hoặc rời rạc. Khi các quan sát được thực hiện
tại các khoảng thời gian cố định, được gọi là một chuỗi thời gian rời rạc. Nếu các
quan sát được ghi lại liên tục trong một khoảng thời gian, thì được gọi là chuỗi thời
gian liên tục. Ví dụ, các chỉ số về nhiệt độ, dịng chảy của sơng, nồng độ của một
q trình hóa học, v.v. có thể được ghi lại thành một chuỗi thời gian liên tục. Mặt
khác, dân số của một thành phố, sản lượng hàng hoá của một cơng ty, tỷ giá hối đối
giữa hai loại tiền tệ khác nhau có thể đại diện cho chuỗi thời gian rời rạc. Thông
thường trong một chuỗi thời gian rời rạc, các quan sát liên tiếp được ghi lại ở các
khoảng thời gian cách đều nhau như khoảng thời gian hàng giờ, hàng ngày, hàng

tuần, hàng tháng hoặc hàng năm. Những dữ liệu quan sát liên tục cho một hiện
tượng (vật lý, kinh tế ...) trong một khoảng thời gian sẽ tạo nên một chuỗi thời gian
liên tục. Ví dụ, doanh số của công ty trong 20 năm gần đây, hoặc nhiệt độ ghi nhận
tại một trạm quan trắc khí tượng, hoặc cơng suất điện năng tiêu thụ trong một nhà
máy, đó là các ví dụ điển hình cho một chuỗi thời gian. Dưới đây là ví dụ điển hình
thể hiện chuỗi thời gian được minh họa bởi Hình 1.2:

Hình 1.2: Chuỗi tỷ giá hối đối BP / USD hàng tuần [53]


1.1.2. Bài toán dự báo chuỗi thời gian

Đầu vào của bài toán dự báo là một chuỗi thời gian gồm n giá trị quan sát xuất
hiện theo thứ tự thời gian, đầu ra của bài toán là giá trị của 𝒜(t) tại thời điểm
� �+1 trở đi. Dạng tổng quát của chuỗi thời gian thường được biểu diễn bởi một mặt
phẳng với trục hoành biểu thị thời gian và trục tung đặc trưng cho giá trị quan sát.
𝒜
𝒜1
𝒜2
��

𝒜𝒜+
1

𝒜(𝒜1
𝒜(𝒜2
𝒜(𝒜𝒜
….
?
)

)
)
Trong đó: 𝒜� , � = 1,2, ..., n chỉ mốc thời gian thứ �; và 𝒜(𝒜𝒜 ) là giá trị quan
y=𝒜(t)

sát tương ứng với thời gian thứ 𝒜.
Về cơ bản, mục tiêu của dự báo chuỗi thời gian là ước tính một số giá trị
trong tương lai dựa vào mẫu dữ liệu trong quá khứ và hiện tại. Về mặt toán học có
thể biểu diễn như sau:
𝒜(𝒜+𝒜
̂
= f(𝒜(𝒜−𝒜𝒜1) , 𝒜(𝒜−𝒜𝒜2) , 𝒜(𝒜−𝒜𝒜3) , …, 𝒜(𝒜−𝒜𝒜𝒜 ) )
𝒜)
Trong đó, 𝒜̂(𝒜+𝒜𝒜 ) là giá trị dự đoán tại mốc thời gian (� + ∆�) của một chuỗi
thời gian rời rạc x.
1.2. Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ
1.2.1. Một số khái niệm về tập mờ

Trong thực tế, thông tin mờ luôn tồn tại trong suy luận và cách diễn đạt của
con người. Có thể quan sát các từ như “nóng”, “khá nóng”, “rất nóng”, “lạnh”, “rất
lạnh”, … chúng chứa đựng những khái niệm trừu tượng về ngữ nghĩa của thông tin
mờ, không rõ ràng, không chắc chắn mà chỉ mang tính định tính. Những khái niệm
chứa đựng thơng tin khơng chính xác, mơ hồ như vậy được gọi chung là các khái
niệm “mờ”.
Lý thuyết tập mờ lần đầu được Zadeh giới thiệu trong cơng trình nghiên cứu
[7] vào năm 1965, mở rộng khái niệm tập hợp kinh điển, nhằm biểu diễn mức độ
thuộc của các phần tử vào một tập hợp trong tập nền nào đó.
Định nghĩa 1.1: Định nghĩa tập mờ
Cho tập nền �. Tập mờ 𝒜 xác định trên � là một tập mà mỗi phần tử của nó
được biểu diễn bởi một cặp giá trị (,


𝒜

µ (𝒜)). Trong đó 𝒜 ∈ � và hàm µ : � →


[0, 1] là hàm thuộc với giá
𝒜 trị µ (𝒜) biểu diễn mức độ thuộc của x vào A.
𝒜

Ví du 1.1: Gọi U = {𝒜1, 𝒜2, 𝒜3, 𝒜4, 𝒜5} là tập gồm 5 người tương ứng với các
tuổi là 10, 20, 50, 55, 70. Gọi A là tập hợp các người “Trẻ”. Khi đó có thể xây dựng
hàm thuộc với cấp độ là: µ𝒜𝒜ẻ(10) = 0.95, 𝒜𝒜ẻ
µ (20) = 0.8, µ (50) =
𝒜𝒜ẻ
0.4,
µ (55) = 0.35, µ (70) = 0.15 và tập mờ A là: 𝒜 =
𝒜𝒜ẻ

𝒜𝒜ẻ

0.95

𝒜1

+ 0.8 +…+0.15.
𝒜
2

𝒜5



Kiểu của tập mờ phụ thuộc vào các kiểu hàm thuộc khác nhau. Các hàm
thuộc trên U biểu diễn các tập con mờ của U. Hàm thuộc biểu diễn một tập mờ
thường được𝒜 ký hiệu là µ . Đối với một phần tử 𝒜𝒜 ∈ �, giá trị µ ()

được gọi là

cấp độ thuộc của x trong A. Có rất nhiều dạng hàm thuộc được đề xuất để biểu diễn
cho tập mờ như: tam giác (Triangular), hình thang (Trapezoidal), Gauss, S-shape, Zshape, … trong đó dạng tam giác là dạng thông dụng và được sử dụng nhiều trong
lĩnh vực dự báo [8-10]. Các dạng hàm thuộc điển hình được minh họa trong Hình

1.3.
Hình 1.3: Đồ thị của 3 hàm thuộc phổ biến: (a) tam giác, (b) hình thang, (c) Gauss
+

Dạng hàm thuộc tam giác (Triangles): Hàm thuộc tam giác được xác

định bởi 3 tham số là cận dưới �, cận trên � và giá trị � (ứng với đỉnh tam giác),
với
�<�<�. Hàm thuộc này được gọi là đối xứng nếu giá trị � – � bằng giá trị � – �, hay

� = (� + c) /2. Công thức xác định hàm thuộc dạng tam giác như sau:
0;
𝒜≤ 𝒜

; ≤ ≤
𝒜𝒜𝒜𝒜 𝒜( 𝒜; , 𝒜, 𝒜) = −−
; ≤ ≤ 𝒜


{ 0; 𝒜 ≥ 𝒜
+ Dạng hàm thuộc hình thang (Trapezoids): Hàm thuộc hình thang được
xác định bởi bộ 4 giá trị a, b, c, d, với (a< b < c < d) theo công thức sau:
0
; < 𝒜
( − )⁄(𝒜 − 𝒜) ;
≤𝒜< 𝒜
𝒜𝒜𝒜𝒜𝒜 𝒜( 𝒜; , , 𝒜, 𝒜 ) =
1
; ≤𝒜 ≤ 𝒜
( − 𝒜 )⁄(𝒜 − 𝒜) ; ≤ 𝒜 < 𝒜
{
0
; 𝒜≥𝒜
+ Dạng hàm thuộc Gauss: Hàm thuộc Gauss được xác định bởi 2 tham số
bao gồm giá trị c là giá trị trung bình (ứng với giá trị cực đại của hàm thuộc) và 𝒜 là
độ lệch chuẩn (độ rộng của hàm). Việc điều chỉnh hình dáng của đồ thị hàm thuộc
này bằng cách thay đổi giá trị tham số 𝒜. Xác định hàm thuộc Gauss dựa vào công
thức sau:
( − 𝒜 )2
𝒜𝒜𝒜𝒜𝒜𝒜 𝒜( 𝒜; , 𝒜 ) = 𝒜𝒜𝒜 (−
)2 2

(1.2)


×