Tải bản đầy đủ (.docx) (159 trang)

Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.85 MB, 159 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ

NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

HÀ NỘI – 2022
BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM


HỌC VIỆN KHOA HỌC VÀ CƠNG NGHỆ
NGHIÊM VĂN TÍNH

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
Chun ngành: Khoa học máy tính
Mã số: 9 48 01 01


Người hướng dẫn khoa học:
1. TS. Nguyễn Công Điều
2. TS. Nguyễn Minh Tuấn

Hà Nội – 2022


3
LỜI CAM ĐOAN
Tác giả xin cam đoan luận án “Một số phương pháp nâng cao độ chính xác
dự báo trong mơ hình chuỗi thời gian mờ” là cơng trình nghiên cứu của bản thân tác
giả. Ngoại trừ các trích dẫn từ tài liệu tham khảo được ghi rõ trong luận án, các kết
quả nghiên cứu và các kết luận nêu trong luận án là hoàn toàn trung thực, chưa từng
được cơng bố trong các cơng trình nào khác. Những đóng góp của luận án đã được
cơng bố trên các tạp chí khoa học chuyên ngành và các hội thảo với sự đồng ý của
các đồng tác giả trước khi đưa vào luận án. Những số liệu trong các bảng biểu và
hình vẽ phục vụ cho việc phân tích, so sánh, đánh giá do chính tác giả thu thập từ
các thử nghiệm.
Tác giả của luận án

Nghiêm Văn Tính


LỜI CẢM ƠN
Luận án của tác giả được thực hiện tại Học viện Khoa học và Công nghệ Viện Hàn lâm Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn tận tình của
thầy TS. Nguyễn Cơng Điều và TS. Nguyễn Minh Tuấn. Lời đầu tiên cho phép tôi
được bày tỏ lịng kính trọng và biết ơn sâu sắc đến hai Thầy về định hướng khoa
học, người đã động viên, trao đổi nhiều kiến thức và hướng dẫn tôi vượt qua những
khó khăn để hồn thành luận án.
Tơi cũng xin gửi lời cảm ơn chân thành đến các nhà khoa học, tác giả của các

cơng trình cơng bố đã được trích dẫn trong luận án, đây là những tư liệu quý báu,
kiến thức liên quan làm nền tảng giúp tơi hồn thành luận án.
Tơi xin chân thành gửi lời cảm ơn đến các thầy PGS. TSKH. Nguyễn Cát Hồ,
TS. Vũ Như Lân, TS. Trần Thái Sơn và các thầy cơ trong nhóm Đại số gia tử đã có
nhiều ý kiến góp ý về nội dung liên quan đến luận án thông qua các buổi seminar và
học thuật chuyên môn.
Tôi xin chân thành cảm ơn đến Ban lãnh đạo Học viện Khoa học và Công
nghệ, Viện Công nghệ Thông tin, Khoa “Cơng nghệ thơng tin và Viễn thơng”,
Phịng “Đào tạo sau đại học” đã tạo điều kiện thuận lợi trong q trình học tập,
nghiên cứu và hồn thành luận án.
Xin trân thành cảm ơn Ban giám hiệu trường Đại học Kỹ thuật công nghiệp –
ĐH Thái Nguyên, Khoa Điện tử, Bộ môn Tin học Công nghiệp và các đồng nghiệp
đã giúp đỡ và tạo điều kiện thuận lợi để tôi có thể thực hiện kế hoạch nghiên cứu,
hồn thành luận án.
Tơi xin được bày tỏ tình cảm và lịng biết ơn vơ hạn tới những người thân
trong Gia đình, những người ln dành cho tơi sự động viên, khích lệ, sẻ chia, giúp
đỡ trong những lúc khó khăn.


MỤC LỤC
LỜI CAM ĐOAN...................................................................................................... 1
LỜI CẢM ƠN........................................................................................................... 2
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT................................................ 6
DANH MỤC CÁC BẢNG........................................................................................ 7
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ............................................................ 10
MỞ ĐẦU................................................................................................................. 12
CHƯƠNG 1. NHỮNG KIẾN THỨC LIÊN QUAN................................................ 20
1.1. Các khái niêm về chuỗi thời gian...................................................................... 21
1.1.1. Chuỗi thời gian.............................................................................................. 21
1.1.2. Bài toán dự báo chuỗi thời gian..................................................................... 22

1.2. Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ.......................22
1.2.1. Một số khái niệm về tập mờ.......................................................................... 22
1.2.2. Chuỗi thời gian mờ và các định nghĩa liên quan........................................... 24
1.2.3. Các thành phần của mơ hình dự báo FTS...................................................... 26
1.2.3.1 Giai đoạn huấn luyện (Xây dựng mơ hình dự báo)........................................ 27
1.2.3.2 Giai đoạn kiểm thử (Giai đoạn dự báo)......................................................... 30
1.2.4. Một số mơ hình chuỗi thời gian mờ cơ bản................................................... 30
1.2.4.1 Mơ hình dự báo của Song và Chissom [8,9].................................................. 31
1.2.4.2. Mơ hình dự báo của Chen [10]........................................................... 31
1.2.4.3 Mơ hình dự báo của Yu [13]................................................................ 34
1.2.5. Tiêu chuẩn đánh giá độ chính xác của các mơ hình dự báo........................... 36
1.3. Một số phương pháp liên quan đến phân khoảng tập nền.................................36
1.3.1. Thuật toán phân cụm K-means...................................................................... 37
1.3.2. Thuật toán phân cụm mờ Fuzzy C-means..................................................... 38
1.3.3. Thuật toán tối ưu bầy đàn (PSO)................................................................... 39
1.3.4. Đại số gia tử.................................................................................................. 42
1.4. Kết luận Chương 1............................................................................................ 44
CHƯƠNG 2. XÂY DỰNG CÁC MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
VỚI NHĨM QUAN HỆ MỜ PHỤ THUỘC THỜI GIAN...................................... 45
2.1. Nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG)..................................45
2.1.1. Các định nghĩa về nhóm quan hệ mờ phụ thuộc thời gian.............................45


2.1.2. Thuật tốn tạo NQHM-PTTG bậc m............................................................. 48
2.2. Các mơ hình chuỗi thời gian mờ một nhân tố và hai nhân tố đề xuất...............49
2.2.1. Mơ hình dự báo chuỗi thời gian mờ một nhân tố (FTS-1NT).......................49
2.2.2. Mơ hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT).........................56
2.3. Các phương pháp phân khoảng dữ liệu trong tập nền....................................... 62
2.3.1. Phân khoảng dữ liệu...................................................................................... 62
2.3.2. Các phương pháp phân khoảng dữ liệu......................................................... 63

2.3.2.1 Phân khoảng với độ dài bằng nhau................................................................ 63
2.3.3................................................................................................................2.3.2
.2. Phân khoảng với độ dài khác nhau............................................................. 64
2.3.4. Các phương pháp phân khoảng đề xuất......................................................... 67
2.3.4.1 Phân khoảng sử dụng phân cụm K-means..................................................... 68
2.3.4.2 Phân khoảng sử dụng Đại số gia tử............................................................... 69
2.4. Tổ chức thực nghiệm và so sánh đánh giá cho các mơ hình FTS đề xuất và các
phương pháp phân khoảng................................................................................ 72
2.4.1. Mô tả dữ liệu................................................................................................. 72
2.4.2. Kết quả thực nghiệm của mơ hình FTS một nhân tố (FTS-1NT)..................73
2.4.2.1 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu tuyển sinh
2.4.3.
..................................................................................................................
........73
2.4.3.1 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu thị trường
chứng khốn (TAIFEX)...................................................................... 76
2.4.4. Kết quả thử nghiệm của mơ hình FTS hai nhân tố (FTS-2NT).....................78
2.4.5. Kết quả thực nghiệm trên mơ hình FTS-1NT sử dụng hai phương pháp
phân khoảng HA và K-means.................................................................... 79
2.4.5.1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means
với các phương pháp phân khoảng khác trên cùng mơ hình FTS-1NT
80
2.4.5.2 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân
khoảng HA và K-means với các mơ hình dự báo khác dựa trên QHM
bậc 1.................................................................................................... 82
2.4.5.3 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân
khoảng HA và K-means với các mơ hình dự báo khác dựa trên QHM
bậc cao................................................................................................ 84
2.5. Kết luận Chương 2............................................................................................ 85
2.5.1......................................................................................................................... C

HƯƠNG 3. NÂNG CAO HIỆU QUẢ CỦA MƠ HÌNH DỰ BÁO SỬ DỤNG CÁC


KỸ THUẬT TÍNH TỐN MỀM............................................................................ 86
3.1. Các mơ hình dự báo chuỗi thời gian mờ đề xuất.............................................. 86


3.1.1. Mơ hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và PSO
87
3.1.2. Mơ hình chuỗi thời gian mờ hai nhân tố (FTS-2NT) sử dụng FCM và PSO
3.2. .............................................................................................................................
100
3.3. Tổ chức thực nghiệm và đánh giá hiệu quả của các mơ hình dự báo được đề xuất
3.4.
.............................................................................................................................
....105
3.4.1. Đánh giá hiệu quả của mơ hình FTS một nhân tố FTS1NT-CMPSO......106
3.4.1.1 Mô tả các chuỗi dữ liệu thời gian................................................................ 106
3.4.1.2 Thiết lập các tham số của mơ hình FTS1NT-CMPSO cho các tập dữ liệu
3.5.
..................................................................................................................
......106
3.5.1.1 Áp dụng dự báo tuyển sinh đại học của trường đại học Alabama...............107
3.5.1.2 Áp dụng dự báo thị trường chứng khoán Đài Loan TAIFEX......................112
3.5.1.3 Áp dụng dự báo tai nạn ô tô tại Bỉ............................................................... 113
3.5.2. Đánh giá hiệu quả của mơ hình FTS hai nhân tố FTS2NT-CMPSO........114
3.5.2.1 Áp dụng dự báo trên tập dữ liệu nhiệt độ.................................................... 115
3.5.2.2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán............................119
3.6. Kết luận Chương 3.......................................................................................... 121
3.7. KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN...................................................... 122

3.8.......................................................................................................................... DA
NH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN............................................................................................................. 123
3.9. TÀI LIỆU THAM KHẢO.............................................................................. 124


3.10.

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

3.11.
3.12.

Các ký
hiệu:
3.13. 𝒜𝒜
3.14.
3.15. Đại số tuyến tính
3.16. μ(h)
3.18. Độ đo tính mờ của gia tử h
3.17.
3.19. fm(x)
3.21. Độ đo tính mờ của từ ngôn
3.20.
ngữ
3.24. Tập các gia tử dương
3.23.
3.22. H+
3.27. Tập các gia tử âm
3.26.

3.25. H3.29.
3.30. Biến ngôn ngữ
3.28. Ã
3.31. Các chữ
viết tắt:
3.32. TS
3.33. Time series
3.34. Chuỗi thời gian mờ
3.35. FTS
3.36. Fuzzy time series
3.37. Chuỗi thời gian mờ
3.39.
Taiwan
3.41.
3.38. TAIEX
capitalization 3.42. Chỉ số chứng khoán Đài
3.40. weighted stock index
Loan
3.43. TAIFEX 3.44. Taiwan Stock Index
Futures
3.46. PSO
3.47. Particle Swam
3.48. Tối ưu bầy đàn
Optimization
3.49. KM
3.50. K-means clustering
3.51. Phân cụm mờ
3.52. HA
3.53. Hegde Algeras
3.54. Đại số gia tử

3.56. Autoregressive
3.58. Q trình trung bình trượt
3.55. ARIMA
tích
3.57. integrated moving
3.59. hợp tự hồi quy
average
3.60. FCM
3.61. Fuzzy C-Means
3.62. Phân cụm mờ
Clustering
3.64. Mean
Absolute
3.66. Sai số trung bình phần trăm
3.63. MAPE
Percentage
tuyệt
3.65. Error
3.67. đối
3.68. MSE
3.69. Mean square error
3.70. Sai số bình phương trung
bình
3.71. FTS3.73. Chuỗi thời gian mờ một
3.72.
1NT
nhân tố
3.74. FTS3.76. Chuỗi thời gian mờ hai
3.75.
2NT

nhân tố
3.79. Phân cụm Kmeans kết hợp
3.78.
3.77. KMvới
FTS-1NT
3.80. chuỗi thời gian mờ một
nhân tố
3.83. Đại số gia tử kết hợp với
3.82.
3.81. HAchuỗi
FTS-1NT
3.84. thời gian mờ một nhân tố
3.85.
FT
3.88. Chuỗi thời gian mờ một
3.87.
S1NTnhân tố
3.86.
C
3.89. kết hợp giữa FCM và PSO


MPSO
3.90.
FT
S2NT3.91.
C
MPSO
3.95. QHM
3.98. NQHM

3.101.
N
QHM-PTTG

3.92.

3.93. Chuỗi thời gian mờ hai
nhân tố
3.94. kết hợp giữa FCM và PSO

3.96.
3.99.
3.102.

3.97. Quan hệ mờ
3.100.
Nhóm quan hệ mờ
3.103.
Nhóm quan hệ mờ
phụ thuộc thời
3.104.
gian


3.105.

DANH MỤC CÁC BẢNG

3.106........................................................................................................................ Bản
g 1.1: Các nhóm quan hệ mờ từ tập dữ liệu tuyển sinh..................................... 33

3.107........................................................................................................................ Bản
g 1.2: Một số hạn chế của các mơ hình dự báo sử dụng quan hệ mờ................35
3.108........................................................................................................................ B
ảng 2.1: Sự khác nhau giữa nhóm quan hệ mờ đề xuất và nhóm quan hệ trong mơ
hình [10, 13]............................................................................................................ 47
3.109........................................................................................................................ Bản
g 2.2: Dữ liệu tuyển sinh thực tế của trường đại học Alabama.........................49
3.110........................................................................................................................ Bản
g 2.3: Kết quả mờ hóa dữ liệu tuyển sinh thành các tập mờ.............................51
3.111........................................................................................................................Bản
g 2.4: Biểu diễn mối quan hệ mờ bậc 1 và bậc 3 trên tập dữ liệu tuyển sinh....52
3.112........................................................................................................................ Bản
g 2.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 3...............53
3.113........................................................................................................................ Bản
g 2.6: Kết quả dự báo tuyển sinh dựa trên quan hệ mờ bậc 1 và bậc 3.............55
3.114........................................................................................................................B
ảng 2.7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ
01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan.................................................. 57
3.115........................................................................................................................B
ảng 2.8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và nhân
tố thứ hai “mật độ của mây”.................................................................................... 59
3.116........................................................................................................................ Bản
g 2.9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố.............................60
3.117........................................................................................................................ Bản
g 2.10: Kết quả tính tốn giá trị cho mỗi NQHM-PTTG bậc 3.........................61
3.118........................................................................................................................B
ảng 2.11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996 tại
Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3............................61
3.119........................................................................................................................ Bản
g 2.12: Ánh xạ cơ sở......................................................................................... 65

3.120........................................................................................................................ B
ảng 2.13: Các mơ hình FTS sử dụng PSO để phân khoảng kết hợp với các phương
pháp khác................................................................................................................. 66
3.121........................................................................................................................ B
ảng 2.14: Các mơ hình FTS sử dụng FCM để phân khoảng kết hợp với các phương
pháp khác................................................................................................................. 67
3.122........................................................................................................................ Bản
g 2.15: Ưu và nhược điểm chính của các phương pháp phân khoảng...............67
3.123........................................................................................................................ Bản
g 2.16: Kết quả phân cụm trên tập dữ liệu tuyển sinh sử dụng K-means..........68


3.124........................................................................................................................ Bản
g 2.17: Giá trị của các khoảng từ tập dữ liệu tuyển sinh sử dụng K-means......69
3.125........................................................................................................................ Bản
g 2.18: Số lượng hạng từ ngôn ngữ................................................................... 70
3.126........................................................................................................................ B
ảng 2.19: So sánh sai số dự báo MSE giữa mơ hình FTS-1NT với các mơ hình khác
trên cùng 7 khoảng.................................................................................................. 73
3.127........................................................................................................................ B
ảng 2.20: Kết quả và sai số dự báo giữa mơ hình FTS-1NT với các mơ hình khác
trên cùng 14 khoảng................................................................................................ 74
3.128........................................................................................................................ B
ảng 2.21: Kết quả và sai dự báo MSE giữa mơ hình FTS -1NT với các mơ hình khác
dựa trên QHM bậc cao khác nhau với số khoảng chia bằng 14...............................74
3.129........................................................................................................................ B
ảng 2.22: So sánh sai số dự báo MSE của mơ hình đề xuất so với các mơ hình khác
dựa trên QHM bậc cao với số khoảng chia bằng 14................................................ 75
3.130........................................................................................................................ B
ảng 2.23: Kết quả và sai số dự báo của mơ hình FTS-1NT với các mơ hình khác dựa

vào số bậc khác nhau với cùng số khoảng là 16...................................................... 76


3.131........................................................................................................................ B
ảng 2.24: So sánh kết quả và sai số dự báo trong pha kiểm thử giữa mơ hình đề xuất
FTS-1NT với các mơ hình khác dựa trên QHM bậc 5 với 16 khoảng.....................77
3.132........................................................................................................................ B
ảng 2.25: So sánh sai số dự báo MAPE trong tháng 6 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 78
3.133........................................................................................................................ B
ảng 2.26: So sánh sai số dự báo MAPE trong tháng 7 của mô hình đề xuất với các
mơ hình trước.......................................................................................................... 78
3.134........................................................................................................................ B
ảng 2.27: So sánh sai số dự báo MAPE trong tháng 8 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 79
3.135........................................................................................................................ B
ảng 2.28: So sánh sai số dự báo MAPE trong tháng 9 của mơ hình đề xuất với các
mơ hình trước.......................................................................................................... 79
3.136........................................................................................................................ B
ảng 2.29: Kết quả và sai số dự báo của mơ hình FTS-1NT sử dụng các phương pháp
phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia............................. 80
3.137........................................................................................................................ B
ảng 2.30: Sai số dự báo MSE của mơ hình FTS-1NT sử dụng các phương pháp phân
khoảng khác nhau dựa trên QHM cao với 7 khoảng chia........................................80
3.138........................................................................................................................ B
ảng 2.31: Kết quả dự báo của mơ hình FTS-1NT sử dụng phương pháp phân khoảng
HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia...................................... 81
3.139........................................................................................................................ B
ảng 2.32: So sánh sai số dự báo MSE giữa mơ hình đề xuất với các mơ hình khác sử
dụng 7 khoảng chia.................................................................................................. 82

3.140........................................................................................................................ B
ảng 2.33: So sánh sai số dự báo giữa mơ hình đề xuất sử dụng K-means với các mơ
hình khác dựa trên QHM bậc 1 với 14 khoảng chia................................................ 83
3.141........................................................................................................................ Bản
g 3.1: Các cụm và tâm của nó đạt được trên tập dữ liệu tuyển sinh [8]............88
3.142........................................................................................................................ Bản
g 3.2: Các khoảng và điểm giữa của mỗi khoảng............................................. 88
3.143........................................................................................................................ Bản
g 3.3: Kết quả mờ hóa chuỗi dữ liệu tuyển sinh với 7 khoảng chia tập nền......89
3.144........................................................................................................................ Bản
g 3.4: Kết quả biểu thị quan hệ mờ bậc 1 và bậc 2............................................ 90
3.145........................................................................................................................ Bản
g 3.5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 2...............91
3.146........................................................................................................................ Bản
g 3.6: Kết quả dự báo của mơ hình đề xuất với 7 khoảng chia.........................94


3.147........................................................................................................................ Bản
g 3.7: Khởi tạo vị trí của các cá thể.................................................................. 98
3.148........................................................................................................................ Bản
g 3.8: Khởi tạo vận tốc của các cá thể............................................................... 98
3.149........................................................................................................................ Bản
g 3.9: Khởi tạo vị trí tốt nhất _
của các cá thể id...............................98
3.150........................................................................................................................ Bản
g 3.10: Cập nhật vận tốc của các cá thể............................................................ 99
3.151........................................................................................................................ Bản
g 3.11: Cập nhật vị trí thứ hai của các cá thể.................................................... 99
3.152...................................................................................................................... Bảng
3.12: Vị trí pbest cuối cùng được chọn làm 𝒜 𝒜𝒜𝒜𝒜................................100

3.153...................................................................................................................... Bảng
3.13: Kết quả phân cụm trên chuỗi dữ liệu hai nhân tố sử dụng FCM............102
3.154...................................................................................................................... Bảng
3.14: Các khoảng đạt được từ phân cụm FCM............................................... 102
3.155...................................................................................................................... Bảng
3.15: Các tham số của mơ hình FTS1NT-CMPSO cho mỗi tập dữ liệu..........106
3.156......................................................................................................................Bả
ng 3.16: So sánh kết quả và sai số dự báo giữa mơ hình đề xuất FTS1NT- CMPSO
với các mơ hình khác dựa trên QHM bậc 1 với 14 khoảng.................................... 107
3.157......................................................................................................................Bả
ng 3.17: Điểm khác biệt giữa mơ hình FTS1NT-CMPSO với các mơ hình so sánh
trên Bảng 3.16....................................................................................................... 108


3.158............Bảng 3.18: So sánh sai số dự báo MSE giữa mơ hình đề xuất FTS1NTCMPSO với các mơ hình khác dựa trên QHM bậc 1 và các khoảng chia khác nhau
............................................................................................................................... 108
3.159........Bảng 3.19: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS1NTCMPSO với các mơ hình khác dựa trên QHM bậc cao......................................... 109
3.160.. . .Bảng 3.20: So sánh sai số dự báo MSE giữa mô hình FTS1NT-CMPSO với
các mơ hình khác dựa trên QHM bậc cao khác nhau với 7 khoảng.......................111
3.161......Bảng 3.21: So sánh kết quả và sai số dự báo MSE của mơ hình đề xuất với
các mơ hình khác dựa trên QHM bậc cao khác nhau với 16 khoảng chia..............112
3.162....Bảng 3.22: So sánh kết quả dự báo trong giai đoạn kiểm thử dựa trên QHM
bậc 5 với 16 khoảng và sử dụng wh = 3................................................................. 113
3.163.....Bảng 3.23: So sánh kết quả và sai số dự báo RMSE giữa mơ hình FTS1NTCMPSO và các mơ hình trước đây với số khoảng chia và bậc khác nhau.............113
3.164.Bảng 3.24: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự
báo nhiệt độ........................................................................................................... 115
3.165.Bảng 3.25: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự
báo thị trường chứng khoán................................................................................... 115
3.166......Bảng 3.26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài
Loan theo từng tháng từ ngày 01/06/1996 đến 30/09/1996.................................... 116

3.167. Bảng 3.27: Sai số dự báo MAPE (%) trên từng bậc của mơ hình FTS2NTCMPSO
3.168. .............................................................................................................................
....117
3.169........Bảng 3.28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mô hình
FTS2NT- CMPSO và các mơ hình khác dựa trên các bậc khác nhau....................118
3.170.........Bảng 3.29: So sánh sai số dự báo MAPE(%) trong tháng 7 giữa mơ hình
FTS2NT- CMPSO và các mơ hình khác dựa trên các bậc khác nhau....................118
3.171.........Bảng 3.30: So sánh sai số dự báo MAPE(%) trong tháng 8 giữa mơ hình
FTS2NT- CMPSO và các mơ hình khác dựa trên các bậc khác nhau....................118
3.172.........Bảng 3.31: So sánh sai số dự báo MAPE(%) trong tháng 9 giữa mơ hình
FTS2NT- CMPSO và các mơ hình khác dựa trên các bậc khác nhau....................119
3.173. Bảng 3.32: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS2NTCMPSO với các mơ hình khác dựa trên QHM bậc cao với 16 khoảng chia cho
mỗi nhân tố
3.174. .............................................................................................................................
....120


3.175.

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ

3.176........................................................................................................................ Hình
1.1: Cấu trúc tổng quan của luận án.................................................................. 20
3.177........................................................................................................................ Hình
1.2: Chuỗi tỷ giá hối đoái BP / USD hàng tuần [53]......................................... 21
3.178........................................................................................................................ Hì
nh 1.3: Đồ thị của 3 hàm thuộc phổ biến:(a) tam giác, (b) hình thang, (c) Gauss 23
Hình 1.4: Mơ hình dự báo FTS tổng quát................................................................ 26
3.179........................................................................................................................ Hình
1.5: Các thành phần trong giai đoạn huấn luyện............................................... 27

3.180........................................................................................................................ Hình
1.6: Ví dụ phân khoảng tập nền sử dụng các hàm thuộc khác nhau..................28
3.181........................................................................................................................ Hình
1.7: Các thành phần trong giai đoạn kiểm thử.................................................. 30
3.182........................................................................................................................ Hì
nh 1.8: Tóm tắt các bước thực hiện mơ hình dự báo của Chen [10] trên tập dữ liệu
tuyển sinh của trường Đại học Alabama.................................................................. 34
3.183........................................................................................................................ Hình
1.9: Sơ đồ thuật tốn phân cụm k-means.......................................................... 38
3.184........................................................................................................................ Hình
1.10: Sơ đồ thuật tốn phân cụm bằng FCM..................................................... 39
3.185........................................................................................................................ Hình
1.11: Đồ thị minh họa một điểm tìm kiếm bằng PSO.......................................40
3.186........................................................................................................................ Hình
1.12: Biểu diễn sự sắp xếp của các phần tử 𝒜 ∈ 𝒜 , ℎ ∈ 𝒜 , 𝒜 ∈ 𝒜 .........44
3.187........................................................................................................................ Hình
2.1. Minh họa chuỗi thời gian được mờ hóa bới các tập mờ.............................46
3.188........................................................................................................................ Hình
2.2: Các bước của mơ hình dự báo................................................................... 49
3.189........................................................................................................................ Hình
2.3: Biểu diễn dữ liệu tuyển sinh được mờ hóa bởi các tập mờ 𝒜 𝒜...............51
3.190........................................................................................................................ Hình
2.4: Các bước của mơ hình FTS-2NT............................................................... 56
3.191. Hình 2.5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập
mẫu. 63
3.192........................................................................................................................ Hình
2.6: Các phương pháp phân khoảng.................................................................. 63
3.193........................................................................................................................ Hình
2.7: Minh hoạ các khoảng chia liên tiếp có độ dài bằng nhau là 1000..............64
3.194........................................................................................................................ Hình

2.8: Độ thị phân bổ giá trị chênh lệch của chuỗi dữ liệu tuyển sinh.................65
3.195. Hình 2.9: Các phương pháp phân khoảng khác nhau kết hợp với mô hình
FTS-1NT
3.196. .............................................................................................................................


......68
3.197........................................................................................................................ Hình
2.10: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng K-means........69
3.198........................................................................................................................ Hình
2.11: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng HA................72
3.199........................................................................................................................ Hì
nh 2.12: Biểu diễn sai số dự báo MSE giữa hình FTS-1NT với các mơ hình so sánh
dựa trên các bậc khác nhau với 14 khoảng chia....................................................... 75
3.200........................................................................................................................ Hì
nh 2.13: Đồ thị biểu diễn sai số dự báo trong Bảng 2.30 của mơ hình FTS-1NT dựa
trên các phương pháp phân khoảng khác nhau........................................................ 81
3.201........................................................................................................................ Hì
nh 2.14: Đường cong mơ tả kết quả dự báo của mơ hình FTS-1NT sử dụng phương
pháp phân khoảng HA và K-means so với dữ liệu thực tế....................................... 82
3.202........................................................................................................................ Hì
nh 2.15: Đường cong biểu diễn giữa giá trị dự báo của mơ hình KM-FTS-1NT và
các mơ hình khác so với dữ liệu thực tế................................................................... 84
3.203. Hình 2.16: So sánh sai số dự báo MSE giữa mơ hình đề xuất sử dụng phân
khoảng K-means và HA với các mơ hình khác dựa trên QHM bậc cao với 7 khoảng
chia. 84
3.204. Hình 3.1: Cấu trúc và các giai đoạn của mơ hình dự báo đề xuất (FTS1NTCMPSO)
3.205. .............................................................................................................................
......87



3.206........................................................................................................................ Hình
3.2: Cấu trúc khoảng của một cá thể trong PSO............................................... 95
3.207........................................................................................................................ Hình
3.3: Sơ đồ thuật tốn biểu diễn mơ hình FTS1NT-CMPSO.............................. 97
3.208...................................................................................................................... Hình
3.4: Cấu trúc và các giai đoạn của mơ hình đề xuất FTS2NT- CMPSO..........101
3.209...................................................................................................................... Hình
3.5: Biểu diễn các khoảng và bậc của mơ hình theo cá thể i trong PSO.........103
3.210...................................................................................................................... Hình
3.6: Biểu diễn giá trị thực của các chuỗi dữ liệu thời gian..............................106
3.211......................................................................................................................Hìn
h 3.7: Đồ thị biểu diễn sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO và các
mơ hình so sánh trong Bảng 3.18 với số lượng khoảng khác nhau........................109
3.212......................................................................................................................Hìn
h 3.8: Đồ thị biểu diễn sai số dự báo giữa mơ hình đề xuất FTS1NT-CMPSO với
các mơ hình khác trong Bảng 3.20........................................................................ 111
3.213......................................................................................................................Hìn
h 3.9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung bình
hàng ngày trong tháng 6, dựa trên mơ hình FTS2NT-CMPSO bậc 7.....................117
3.214. Hình 3.10: Đồ thị thể hiện thời gian tính tốn và tốc độ hội tụ của mơ hình
3.215...................................................................................................................... FTS2
NT-CMPSO với 150 lần lặp............................................................................ 120


3.216.

MỞ ĐẦU

Những thành tựu đạt được trong các hoạt động của con người được

đặc trưng bởi các quá trình ra quyết định hiệu quả của họ. Để giúp quá trình ra
quyết định được chính xác, tiết kiệm được thời gian và giảm các chi phí khơng cần
thiết thì bài tốn dự báo đóng vai trị rất quan trọng. Dự báo là một công cụ trợ giúp
cần thiết cho việc ra quyết định và lập kế hoạch để quản lý hiệu quả các tổ chức
hiện đại. Ví dụ, dự báo bán hàng ln đóng một vai trị nổi bật trong hoạt động kinh
doanh. Nó cung cấp cho các doanh nghiệp những chỉ dẫn đáng tin cậy về chi phí
cơng việc và phân bổ ngân sách cho một khoảng thời gian sắp tới. Các nhà khoa
học cũng phải đối mặt với thách thức quan trọng trong việc dự báo các sự kiện xảy
ra trong tương lai như nhiệt độ, lượng mưa, tăng trưởng nền kinh tế, ... Để dự báo
các sự kiện này với độ chính xác 100% là khơng thể, nhưng rất nhiều lợi ích có thể
thu được từ kết quả dự báo cũng như một bức tranh về tương lai đó. Một trong các
hướng nghiên cứu nâng cao độ chính xác của các bài toán dự báo là nghiên cứu dữ
liệu chuỗi thời gian. Chuỗi thời gian (TS – time series) là một chuỗi các giá trị số
hoặc chuỗi các từ trong ngôn ngữ tự nhiên được ghi lại tại các thời điểm liên tiếp
trong một khoảng thời gian, thường được đo cách nhau tại các thời điểm thống
nhất: hàng ngày, hàng tuần, hàng tháng, hàng quý hoặc hàng năm. Nói một cách
đơn giản, một chuỗi thời gian là một chuỗi dữ liệu lịch sử được thu thập một cách
đều đặn.
3.217.

Phân tích chuỗi thời gian để xây dựng các mơ hình dự báo chuỗi thời
gian hiệu quả là một trong các khâu quan trọng trong việc tạo ra các công cụ dự báo
tốt nhằm giải quyết các bài toán thực tế. Một loạt các phương pháp đã được đề xuất
để giải quyết những bài tốn này, thơng dụng hơn cả là mơ hình tự hồi quy
(autoregression model - AR), trung bình trượt (moving average - MA) và kết hợp
của chúng thành mơ hình ARMA và ARIMA do Box và Jenkins [1] phát triển năm
1976. Các mơ hình dự báo nêu trên được xây dựng cho chuỗi thời gian tuyến tính
và dừng. Bên cạnh các mơ hình chuỗi thời gian dừng thì các mơ hình ARCH [2]
(Autoregressive Conditionally Hestoroscedastic) và GARCH [3] (Generalize
Autoregressive Conditionally Hestoroscedastic) được xây dựng để giải quyết các

chuỗi thời gian khơng dừng hay chuỗi thời gian có phương sai thay đổi. Để áp dụng
các mơ hình dự báo chuỗi thời gian trên với độ chính xác khả quan đòi hỏi một số
ràng buộc chặt chẽ như: chuỗi thời gian phải là tuyến tính hay cần một số lượng dữ
liệu lớn. Trong thực tế, việc đòi hỏi các chuỗi thời gian là dừng và tuyến tính khơng
phải lúc nào cũng đáp ứng được, thậm chí chúng cịn mang tính khơng chắc chắn
và biến thiên mạnh.
3.218.


Việc áp dụng các mơ hình nêu trên đối với chuỗi dữ liệu thời gian
ngắn hay phi tuyến là không phù hợp và kết quả dự báo đạt được chưa cao. Để khắc
phục các hạn chế đó, một số tác giả đã sử dụng mạng nơron để xây dựng mô hình
dự báo chuỗi
3.219.

thời gian dựa trên tính phi tuyến và linh hoạt của chúng. Donaldson và
công sự [4] đã đề xuất mơ hình chuỗi thời gian sử dụng mạng nơron nhân tạo
(Artificial Neural Network – ANN) để dự báo sự biến động của thị trường chứng
khoán Mỹ, Canada, Nhật Bản và Anh. Hansen và Nelson [5] cũng sử dụng mạng
nơron để xây dựng mơ hình dự báo doanh thu từ thuế. Quan sát thấy rằng, phương
pháp sử dụng mạng nơron đạt được độ chính xác cao hơn so với các mơ hình truyền
thống. Mặt khác, một số nghiên cứu đã sử dụng suy luận mờ dựa trên mạng nơron
[6] (Adaptive Neuro-Fuzzy Inference System-ANFIS) để nâng cao độ chính xác dự
báo của mơ hình chuỗi thời gian. Khác so với mạng ANN, hệ này có khả năng thích
nghi với mơi trường cao hơn trong q trình huấn luyện. Do đó, đã có nhiều cơng
trình áp dụng hệ ANFIS trong sự báo TS và thu được những kết quả nhất định. Tuy
nhiên, các mơ hình tiên tiến sử dụng mạng nơron đơn lẻ vẫn phải đối mặt với một
số vấn đề như cần giả định một số lượng dữ liệu lớn trong quá trình huấn luyện
mạng, phụ thuộc vào kinh nghiệm trong việc chọn nút mạng và khơng có phương
pháp rõ ràng để phân tích mối quan hệ giữa đầu vào và đầu ra trong mạng.

3.220.

Hơn nữa, trong cuộc sống hàng ngày, con người thường quan sát,
phân tích các sự vật, hiện tượng và các sự kiện xảy ra trong thế giới thực và đưa ra
các quyết định của mình dưới dạng ngơn ngữ tự nhiên. Với bài tốn dự báo chuỗi
thời gian, dữ liệu có thể được biểu diễn dưới dạng các từ trong ngôn ngữ tự nhiên
và dễ dàng mô tả cách con người thực hiện quá trình dự báo dưới dạng ngôn ngữ
trong thực tế. Thật vậy, khi con người quan sát dữ liệu chuỗi thời gian, họ nhanh
chóng chuyển các biến động của chuỗi thời gian sang dạng ngôn ngữ và lập luận
trong suy nghĩ theo một cách nào đó dựa trên quan hệ giữa các hạng từ trong chuỗi
thời gian để ước lượng kết quả dự báo dưới dạng ngôn ngữ. Trong ngữ cảnh như
vậy, các phương pháp thống kê nêu trên chỉ được sử dụng để giải quyết chuỗi thời
gian số (Numerical time series - NTS) mà không thể sử dụng để giải quyết một
cách hiệu quả các bài tốn ra quyết định như vậy. Vì vậy, chuỗi thời gian mờ ra đời
nhằm giải quyết các bài toán dự báo với chuỗi số liệu được biểu diễn dưới dạng
ngôn ngữ. Chuỗi thời gian mờ (Fuzzy time series - FTS) được Song và Chissom
giới thiệu lần đầu tiên vào năm 1993, dựa trên lý thuyết tập mờ của Zadeh [7],
trong đó các tập mờ được xem như là ngữ nghĩa của các hạng từ ngôn ngữ. Theo
cách tiếp cận này, Song và Chissom đã đề xuất hai mơ hình FTS [8, 9] để dự báo số
3.221.


lượng sinh viên nhập học của trường Đại học Alabama. Tuy nhiên, mơ hình của
Song và Chissom cịn tồn tại một số hạn chế như mất nhiều thời gian tính toán do
thực hiện phép hợp thành max – min phức tạp đối với ma trận quan hệ mờ (

1, 𝒜) lớn và thiếu sự thuyết phục trong việc xác định độ dài của khoảng chia tập
nền. Để khắc phục hạn chế trên, Chen [10] đã đề xuất nhóm quan hệ mờ và sử dụng
các phép toán số học đơn giản trong q trình giải mờ.
Mặc dù các mơ hình này đã chứng tỏ những ưu việt khi áp dụng cho chuỗi

dữ liệu thời gian tổng quát nhưng độ chính xác dự báo còn khá thấp. Đây là cơ sở
để mở ra một hướng nghiên cứu mới và thu hút được nhiều công bố cả về cải tiến
phương pháp luận lẫn nghiên cứu ứng dụng. Vì điểm trên, nhiều nghiên cứu đã cải
tiến mơ hình của Chen nhằm nâng cao độ chính xác của kết quả dự báo theo các
hướng sau: 1) xác định tập nền và tìm độ dài khoảng phù hợp [11- 28]; 2) xây dựng
các mối quan hệ mờ và nhóm quan hệ mờ trên cơ sở dữ liệu được mờ hóa [18, 24,
29-31] và 3) cải tiến các quy tắc giải mờ cho dự báo đầu ra [13, 18, 32-33].
3.222.

Trước hết, việc phân khoảng tập nền: làm thế nào để phân tập nền
chứa dữ liệu lịch sử thành các khoảng với độ dài thích hợp và bao nhiêu khoảng là
phù hợp? Bắt đầu từ cơng trình nền tảng [11], Huarng đã xác định rằng độ dài của
khoảng chia tập nền là một yếu tố quan trọng và ảnh hưởng đáng kể đến độ chính
xác dự báo của mơ hình. Từ quan điểm này, Huarng đã đưa ra hai phương pháp
chọn độ dài khoảng tập nền theo phân bố và độ dài trung bình. Các phương pháp
của Huarng đã đạt được độ chính xác tốt hơn so với một số mơ hình dự báo trước
đó. Yolcu và cộng sự [22] đưa ra một cách tiếp cận mới dựa trên việc tối ưu tỷ lệ để
xác định độ dài của các khoảng chia bằng hàm “fminbnd” trong MATLAB. Trong
những năm gần đây, các kỹ thuật tính tốn mềm và các phương pháp tối ưu tiến hóa
được sử dụng rộng rãi để xác định phân khoảng tối ưu trong mô hình FTS. Chen &
Chung đưa ra hai mơ hình chuỗi thời gian mờ bậc nhất [15] và bậc cao [16] dựa
trên thuật toán di truyền để phân tập nền thành các khoảng có độ dài phù hợp và áp
dụng cho dự báo tuyển sinh tại trường Đại học Alabama. Lee và cộng sự [34] áp
dụng thuật tốn tơi luyện (Simulated Annealing
- SA) để xác định độ dài khoảng thích hợp trong mơ hình FTS bậc cao cho dự báo thị
trường chứng khoán Đài Loan (TAIFEX). Eren Bas và cộng sự [35] đã đề xuất một
thuật toán di truyền cải tiến (MGA) để tránh những phán đoán chủ quan trong việc
xác định độ dài của mỗi khoảng tập nền trong mô hình FTS để dự báo tai nạn xe
hơi ở Bỉ và tuyển sinh vào trường Đại học Alabama. Bên cạnh đó, nhiều thuật tốn
tối ưu được lấy cảm hứng từ các loài sinh vật học cũng được sử dụng cho mục đích

phân khoảng nhằm nâng cao độ chính xác dự báo của mơ hình FTS như: tối ưu bầy
3.223.


đàn (Particle Swarm Optimization - PSO) [14, 18, 30 - 33, 35], tối ưu đàn kiến (Ant
Colony Optimization - ACO) [36] và tối ưu dựa trên sự di chuyển của đàn
ngỗng( Geese Movement Based Optimization- GMBO) [37]. Cùng mục đích sử
dụng PSO để hiệu chỉnh độ dài khoảng tập nền, một số tác giả khác đã đề xuất các
mơ hình FTS dựa trên quan hệ mờ bậc cao [35, 38] và quan hệ mờ hai nhân tố [3941] để áp dụng dự báo các bài tốn khác nhau. Ngồi ra, Chen và cộng sự [42] đã
áp dụng PSO để tối ưu đồng thời các khoảng chia và các trọng số trên mỗi nhóm
quan hệ mờ cho dự báo TAIFEX và tỷ giá NTD / USD. Song song với kỹ thuật tối
ưu, thì các phương
pháp phân cụm như: phân cụm mờ C-mean [28, 43], phân cụm tự động
[17] cũng được sử dụng cho mục đích phân khoảng nhằm giảm thiểu sai số dự báo
trong mơ hình chuỗi thời gian mờ.
3.224.

Thứ hai, việc thiết lập các quan hệ logic mờ hay có thể gọi tắt là
quan hệ mờ (QHM) và nhóm quan hệ mờ (NQHM) có tác động lớn đến độ chính
xác của kết quả dự báo. Do đó, làm cách nào để thiết lập nhóm quan hệ mờ phù hợp
là một trong những yếu tố quan trọng trong mơ hình FTS. Nhận thấy tầm quan
trọng này, nhiều nghiên cứu đã đề xuất các mơ hình FTS khác nhau theo hướng tiếp
cận NQHM. Khái niệm nhóm quan hệ mờ đầu tiên do Chen [10] đề xuất bằng cách
gộp các thành phần bên vế phải của các quan hệ mờ khi chúng có cùng vế trái.
Theo cách này, các nhóm quan hệ mờ được thiết lập giúp cho giai đoạn giải mờ và
tính toán giá trị dự báo rõ một cách dễ dàng hơn. Vì ưu điểm này, nhiều mơ hình dự
báo đã được đề xuất dựa trên NQHM của Chen [10] để giải quyết các bài toán khác
nhau [15-19, 40, 44]. Tuy nhiên, các mơ hình sử dụng nhóm quan hệ này gặp phải
hạn chế do khơng để ý đến tính lặp và vị trí của các quan hệ khi tham gia vào
NQHM. Tình trạng này dẫn đến thiếu thơng tin để dự báo và giảm khả năng giải

thích của mơ hình. Yu [13] đã chỉ ra tầm quan trọng của sự lặp lại các thành phần
trong NQHM và gán các trọng số khác nhau theo vị trí xuất hiện của chúng trong
NQHM. Đây được xem như một đề xuất thứ 2 về NQHM và đã được các nghiên
cứu khác đề xuất sử dụng [45, 46].
3.225.

Thứ ba, thiết lập quy tắc giải mờ để nhận kết quả dự báo rõ là một
bước quan trọng và ảnh hưởng trực tiếp đến kết quả dự báo của mơ hình. Một quy
tắc giải mờ có thể cho kết quả tốt đối với mơ hình chuỗi thời gian mờ bậc nhất
nhưng hạn chế đối với mô hình chuỗi thời gian mờ bậc cao và ngược lại; hoặc có
thể phù hợp với một bài tốn dự báo nhất định nhưng lại khơng phù hợp cho các bài
tốn dự báo khác và ngược lại. Thông thường giá trị dự báo lấy trung bình điểm
giữa của các khoảng liên quan đến từng tập mờ bên vế phải của NQHM [15-18].
3.226.


Tuy nhiên, do có sự đóng góp khác nhau của các thành phần trong vế phải của
NQHM nên nhiều tác giả đã sử dụng trọng số để gán cho từng giá trị điểm giữa [13,
46, 47]. Ngoài điểm giữa của khoảng dự báo, một số kỹ thuật khác được sử dụng để
nâng cao độ chính xác dự báo bằng cách chia khoảng này thành các đoạn con để lấy
thêm thông tin dự báo [32]. Bên cạnh đó, để tính giá trị dự báo khi vế phải của quan
hệ mờ chưa được xác định, nhiều tác giả đã sử dụng phương pháp phiếu bầu
(voting) [18, 33] để gán một trọng số ưu tiên cho thành phần có đóng góp gần nhất
về tương lai.
Vấn đề về bậc của mơ hình và nhân tố ảnh hưởng của chuỗi thời gian
cũng được nhiều tác giả xem xét và giới thiệu đối với từng bài toán dự báo cụ thể.
Đối với vấn đề thứ nhất, đã có một số lượng lớn các nghiên cứu [14, 16, 17, 35, 39,
48] được công bố dựa trên QHM bậc cao nhằm cải thiện hiệu quả dự báo của mơ
hình bậc nhất.
3.227.


Tuy nhiên, các mơ hình bậc cao đã cơng bố trước đây thường chọn bậc với
độ chính xác tốt nhất bằng trực giác hay thử nghiệm một số lần chạy trên mỗi bậc
cho trước. Vậy, có giải pháp hiệu quả nào để xác định bậc của mơ hình với độ
chính xác dự báo tốt nhất một cách tự động? Câu hỏi này, đã được đáp ứng trong
luận án bằng việc sử dụng PSO để tối ưu đồng thời độ dài khoảng và bậc của mơ
hình. Đối với vấn đề thứ hai, thực tế cho thấy đôi khi chuỗi thời gian chính (hay gọi
là nhân tố dự báo) lại bị ảnh hưởng bởi một hay nhiều nhân tố khác, ví dụ: chỉ số
chứng khốn của Nhật bị ảnh hưởng bởi chuỗi chỉ số chứng khốn New-York. Do
đó, để nâng cao hiệu quả dự báo, một số nghiên cứu đã xét thêm các nhân tố phụ để
tăng khả năng dự báo cho nhân tố chính trên từng bài tốn mà các nhân tố này có
mối quan hệ tiềm năng. Điển hình có thể thấy trong các cơng trình [34, 35, 40] đã
đề xuất kết hợp các kỹ thuật khác nhau với mơ hình FTS bậc cao hai nhân tố để giải
quyết dự báo các bài toán khác nhau: như dự báo nhiệt độ trung bình tại Đài Bắc,
Đài Loan [34, 40] với nhân tố thứ hai là độ che phủ của mây; dự báo thị trường
chứng khoán Đài Loan TAIFEX [35, 40] nhận chỉ số TAIEX là nhân tố thứ hai.
3.228.

Như đã phân tích ở trên, dự báo chuỗi thời gian mờ đã thu hút được
nhiều sự quan tâm của các nhà nghiên cứu quốc tế và họ đã có được các thành quả
đáng kể. Tại Việt Nam, lĩnh vực này cũng nhận được sự quan tâm của các nhóm
nghiên cứu tại Viện Công nghệ Thông tin (CNTT) và tại các trường Đại học phía
nam. Điển hình như, nhóm tác giả tại Đại học Cần Thơ đã xây dựng mô hình chuỗi
thời gian mờ với các tập mờ có cấp độ thuộc là một hàm liên tục có chứa tham số
[49]. Các tác giả này đã xây dựng thuật toán để xác định các tham số phù hợp nhất
trên mỗi tập dữ liệu tương ứng, sau đó thực hiện nội suy dữ liệu để có được kết quả
3.229.


dự báo. Các cơng trình [19, 20] đã đề xuất phương pháp phân khoảng dựa trên các

ánh xạ ngữ nghĩa của đại số gia tử [50], từ đó xây dựng mơ hình dự báo tương tự
như mơ hình chuỗi thời gian mờ. Một số tác giả khác đã cố gắng xây dựng mơ hình
dự báo bằng chuỗi ngơn ngữ của đại số gia tử thay vì các tập mờ như trong các
nghiên cứu [51, 52]. Tuy nhiên, các nghiên cứu này mới chỉ tập trung vào việc xây
dựng mơ hình bậc nhất, chưa sử dụng thêm nhân tố phụ vào dự báo nên kết quả dự
báo thu được chưa thực sự tốt cũng như việc sử dụng tập dữ liệu chưa được phong
phú. Mặt khác, để phát triển mơ hình dự báo chuỗi thời gian dựa trên lý thuyết đại
số gia tử rất cần có những mở rộng mới.
Qua phân tích ưu điểm và hạn chế của các cơng trình nghiên cứu
trong và ngồi nước cho thấy mơ hình chuỗi thời gian mờ vẫn cần có những cải tiến
khác nhau để chúng có thể đạt được độ chính xác dự báo tốt hơn cũng như cần các
bước tính tốn hợp lý hơn để có thể ứng dụng rộng rãi trong nhiều lĩnh vực khác
nhau.
3.230.

3.231.

Tính cấp thiết của đề tài luận án:

Khái niệm quan hệ mờ và nhóm quan hệ mờ do Chen đề xuất đóng
vai trị quyết định trong việc phát triển mơ hình dự báo chuỗi thời gian mờ. Nhờ
những khái niệm này, việc tính tốn dự báo đã đơn giản hơn rất nhiều so với mơ
hình của Song và Chissom. Những cơng trình nghiên cứu về chuỗi thời gian mờ đa
số sử dụng mơ hình của Chen để thực hiện dự báo. Tuy nhiên, cấu trúc nhóm quan
hệ mờ của Chen và Yu là cố định đối với từng thời điểm dự báo và có sự bất hợp lý.
Khi lập nhóm quan hệ mờ ở một thời điểm t nào đó thì sẽ xuất hiện những thành
phần khơng xem xét đến lịch sử xuất hiện của các tập mờ bên vế phải của quan hệ
mờ. Điều này dẫn đến việc có thành phần xuất hiện sau thời điểm t mà vẫn được
tham gia dự báo cùng với các thành phần tại thời điểm t hoặc thời điểm trước đó.
Vấn đề này được xem là khơng phù hợp với tính thực tiễn. Để khắc phục điểm này,

nghiên cứu trong luận án đưa ra khái niệm nhóm quan hệ mờ phụ thuộc thời gian
(NQHM-PTTG). Với cách tiếp cận này, tác giả đã chỉ ra rằng việc sử dụng nhóm
NQHM-PTTG có thể cải thiện đáng kể kết quả dự báo và đã được chứng minh là
phù hợp hơn trong thực tế. Đóng góp này của luận án đã được cơng bố trong cơng
trình [P1] và đề xuất mở rộng cũng như được ứng dụng trong các cơng trình [P2P8].
3.232.

Bên cạnh đó, các mơ hình dự báo chuỗi thời gian mờ bao gồm mơ
hình bậc một, mơ hình bậc cao và mơ hình hai hay nhiều nhân tố đã được xem xét
trong một loạt cơng trình nghiên cứu. Do vậy, một vấn đề đặt ra là cần kiểm nghiệm
liệu khái niệm nhóm quan hệ mờ phụ thuộc thời gian mới có thực sự tạo được
3.233.


những lợi thế hay khơng trong các mơ hình trên. Đồng thời trong một số bước của
mơ hình dự báo chuỗi thời gian mờ vẫn tồn tại một số vấn đề cần được cải tiến như
tìm các phương pháp phân khoảng mới dựa trên các kỹ thuật như phân cụm, tối ưu
tiến hóa hay sử dụng đại số gia tử. Trong bước giải mờ cũng cần một số tinh chỉnh
nhằm nâng cao hiệu quả của mơ hình dự báo. Nhìn chung cịn khá nhiều vấn đề có
thể giải quyết được để cải tiến mơ hình dự báo. Đây là những nội dung sẽ được
trình bày trong suốt luận án mà tập trung vào đề xuất khái niệm nhóm quan hệ mờ
mới để kết hợp với các kỹ thuật khác nhau như tối ưu độ dài khoảng chia và kỹ
thuật tối ưu bậc của mơ hình nhằm nâng cao hiệu quả dự báo. Thơng qua đó, luận
án xây dựng các mơ hình dự báo một và hai nhân tố cũng như những mơ hình bậc
cao dựa trên cơ sở các đề xuất mới. Hiệu quả của các mơ hình đề xuất được đánh
giá trên các chuỗi dữ liệu khác nhau và so sánh với các mơ hình dự báo hiện có trên
cùng tiêu chí và cùng tập dữ liệu mẫu.
3.234.

Mục tiêu nghiên cứu của luận án:

- Mở rộng khái niệm nhóm quan hệ mờ trên cơ sở khắc phục các nhược

điểm của khái niệm nhóm quan hệ mờ hiện có nhằm xây dựng các mơ
hình dự
3.235. báo chuỗi thời gian mờ hiệu quả trong việc giải quyết các bài toán dự

báo thực tế.
- Nghiên cứu xây dựng các mơ hình dự báo chuỗi thời gian mờ hiệu quả trên

cơ sở áp dụng các kỹ thuật tính tốn mềm và các luật giải mờ mới.
3.236.

Đối tượng và giới hạn phạm vi nghiên cứu:

Đối tượng nghiên cứu của luận án là chuỗi thời gian mờ, nhóm quan
hệ mờ và các kỹ thuật tính tốn mềm.
3.237.

Giới hạn: Tập trung vào việc xây dựng mơ hình và kiểm chứng mơ
hình dự báo dựa trên lý thuyết then chốt là chuỗi thời gian mờ và nhóm quan hệ mờ
phụ thuộc thời gian. Thêm nữa, luận án còn đề cập đến các kỹ thuật phân khoảng
dựa trên Đại số gia tử và các phương pháp tính tốn mềm như: phương pháp phân
cụm, thuật toán tối ưu trong việc lựa chọn khoảng chia và bậc nhằm nâng cao hiệu
quả dự báo của mơ hình được đề xuất.
3.238.

3.239.

Với mục tiêu và phạm vi nghiên cứu đặt ra, những đóng góp của luận án


là:
 Đề xuất khái niệm NQHM-PTTG dựa trên lý thuyết về chuỗi thời gian mờ và

xây dựng thuật tốn nhóm các quan hệ mờ. Đây là một khái niệm mới làm


×