Tải bản đầy đủ (.docx) (133 trang)

Một số phương pháp nâng cao độ chính xác dự báo trong mô hình chuỗi thời gian mờ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.83 MB, 133 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-----------------------------

MỘT SỐ PHƯƠNG PHÁP NÂNG CAO ĐỘ CHÍNH XÁC DỰ
BÁO TRONG MƠ HÌNH CHUỖI THỜI GIAN MỜ

LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH

HÀ NỘI – 2022


BỘ GIÁO DỤC VÀ ĐÀO TẠO

VIỆN HÀN LÂM KHOA HỌC

V
N
N
HỌC
VIỆN
KHOA
HỌC VÀ
CƠNG
NGHỆ

-



MỘT SỐ PHƯƠNG
PHÁP NÂNG CAO
ĐỘ CHÍNH XÁC DỰ
BÁO TRONG
MƠ HÌNH
CHUỖI THỜI
GIAN MỜ

LUẬN
ÁN
TIẾN SĨ


NGÀNH MÁY TÍNH
Chun ngành: Khoa
học máy tính
Mã số: 9 48
01 01

Người hướng dẫn khoa
học:

Hà Nội –
2022


1
LỜI CAM ĐOAN
Tác giả xin cam đoan luận án “Một số phương pháp nâng cao độ chính xác dự

báo trong mơ hình chuỗi thời gian mờ” là cơng trình nghiên cứu của bản thân tác giả
Ngoại trừ các trích dẫn từ tài liệu tham khảo được ghi rõ trong luận án, các kết quả
nghiên cứu và các kết luận nêu trong luận án là hoàn toàn trung thực, chưa từng được
cơng bố trong các cơng trình nào khác Những đóng góp của luận án đã được cơng
bố trên các tạp chí khoa học chuyên ngành và các hội thảo với sự đồng ý của các đồng
tác giả trước khi đưa vào luận án Những số liệu trong các bảng biểu và hình vẽ phục
vụ cho việc phân tích, so sánh, đánh giá do chính tác giả thu thập từ các thử nghiệm
Tác giả của luận án


2
LỜI CẢM ƠN
Luận án của tác giả được thực hiện tại Học viện Khoa học và Công nghệ - Viện
Hàn lâm Khoa học và Công nghệ Việt Nam, dưới sự hướng dẫn tận tình của thầy TS
Lời đầu tiên cho phép tơi được bày
tỏ lịng kính trọng và biết ơn sâu sắc đến hai Thầy về định hướng khoa học, người đã
động viên, trao đổi nhiều kiến thức và hướng dẫn tơi vượt qua những khó khăn để
hồn thành luận án
Tôi cũng xin gửi lời cảm ơn chân thành đến các nhà khoa học, tác giả của các
cơng trình cơng bố đã được trích dẫn trong luận án, đây là những tư liệu quý báu, kiến
thức liên quan làm nền tảng giúp tơi hồn thành luận án
Tơi xin chân thành gửi lời cảm ơn đến các thầy PGS TSKH
và các thầy cơ trong nhóm Đại số gia tử đã có
nhiều ý kiến góp ý về nội dung liên quan đến luận án thông qua các buổi seminar và
học thuật chuyên môn
Tôi xin chân thành cảm ơn đến Ban lãnh đạo Học viện Khoa học và Công nghệ,
Viện Công nghệ Thông tin, Khoa “Cơng nghệ thơng tin và Viễn thơng”, Phịng “Đào
tạo sau đại học” đã tạo điều kiện thuận lợi trong q trình học tập, nghiên cứu và hồn
thành luận án
Xin trân thành cảm ơn Ban giám hiệu trường Đại học Kỹ thuật công nghiệp –

ĐH Thái Nguyên, Khoa Điện tử, Bộ môn Tin học Công nghiệp và các đồng nghiệp
đã giúp đỡ và tạo điều kiện thuận lợi để tơi có thể thực hiện kế hoạch nghiên cứu,
hồn thành luận án
Tơi xin được bày tỏ tình cảm và lịng biết ơn vơ hạn tới những người thân trong
Gia đình, những người ln dành cho tơi sự động viên, khích lệ, sẻ chia, giúp đỡ trong
những lúc khó khăn


3

MỤC LỤC
LỜI CAM ĐOAN

1

LỜI CẢM ƠN

2

DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT

6

DANH MỤC CÁC BẢNG

7

DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ

10


MỞ ĐẦU

12

CHƯƠNG 1 NHỮNG KIẾN THỨC LIÊN QUAN

20

1 1 Các khái niêm về chuỗi thời gian

21

1 1 1 Chuỗi thời gian

21

1 1 2 Bài toán dự báo chuỗi thời gian

22

1 2 Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ

22

1 2 1 Một số khái niệm về tập mờ

22

1 2 2 Chuỗi thời gian mờ và các định nghĩa liên quan


24

1 2 3 Các thành phần của mơ hình dự báo FTS

26

1 2 3 1 Giai đoạn huấn luyện (Xây dựng mô hình dự báo)

27

1 2 3 2 Giai đoạn kiểm thử (Giai đoạn dự báo)

30

1 2 4 Một số mơ hình chuỗi thời gian mờ cơ bản

30

1 2 4 1 Mô hình dự báo của Song và Chissom [8,9]

31

1 2 4 2 Mơ hình dự báo của Chen [10]

31

1 2 4 3 Mơ hình dự báo của Yu [13]

34


1 2 5 Tiêu chuẩn đánh giá độ chính xác của các mơ hình dự báo
1 3 Một số phương pháp liên quan đến phân khoảng tập nền

36
36

1 3 1 Thuật toán phân cụm K-means

37

1 3 2 Thuật toán phân cụm mờ Fuzzy C-means

38

1 3 3 Thuật toán tối ưu bầy đàn (PSO)

39

1 3 4 Đại số gia tử

42

1 4 Kết luận Chương 1

44

CHƯƠNG 2 XÂY DỰNG CÁC MƠ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ
VỚI NHÓM QUAN HỆ MỜ PHỤ THUỘC THỜI GIAN


45

2 1 Nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG)

45

2 1 1 Các định nghĩa về nhóm quan hệ mờ phụ thuộc thời gian

45


4
2 1 2 Thuật toán tạo NQHM-PTTG bậc m

48

2 2 Các mơ hình chuỗi thời gian mờ một nhân tố và hai nhân tố đề xuất

49

2 2 1 Mơ hình dự báo chuỗi thời gian mờ một nhân tố (FTS-1NT)

49

2 2 2 Mơ hình dự báo chuỗi thời gian mờ hai nhân tố (FTS-2NT)

56

2 3 Các phương pháp phân khoảng dữ liệu trong tập nền


62

2 3 1 Phân khoảng dữ liệu

62

2 3 2 Các phương pháp phân khoảng dữ liệu

63

2 3 2 1 Phân khoảng với độ dài bằng nhau

63

2 3 2 2 Phân khoảng với độ dài khác nhau

64

2 3 3 Các phương pháp phân khoảng đề xuất

67

2 3 3 1 Phân khoảng sử dụng phân cụm K-means

68

2 3 3 2 Phân khoảng sử dụng Đại số gia tử

69


2 4 Tổ chức thực nghiệm và so sánh đánh giá cho các mơ hình FTS đề xuất và các
phương pháp phân khoảng

72

2 4 1 Mô tả dữ liệu

72

2 4 2 Kết quả thực nghiệm của mơ hình FTS một nhân tố (FTS-1NT)

73

2 4 2 1 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu tuyển sinh
73
2 4 2 2 Kết quả thực nghiệm của mơ hình FTS-1NT trên tập dữ liệu thị trường
chứng khoán (TAIFEX)
2 4 3 Kết quả thử nghiệm của mơ hình FTS hai nhân tố (FTS-2NT)

76
78

2 4 4 Kết quả thực nghiệm trên mô hình FTS-1NT sử dụng hai phương pháp phân
khoảng HA và K-means

79

2 4 4 1 So sánh đánh giá giữa hai phương pháp phân khoảng HA và K-means
với các phương pháp phân khoảng khác trên cùng mơ hình FTS-1NT


80

2 4 4 2 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân khoảng
HA và K-means với các mơ hình dự báo khác dựa trên QHM bậc 1

82

2 4 4 3 So sánh đánh giá mơ hình FTS-1NT sử dụng phương pháp phân khoảng
HA và K-means với các mơ hình dự báo khác dựa trên QHM bậc cao
2 5 Kết luận Chương 2

84
85

CHƯƠNG 3 NÂNG CAO HIỆU QUẢ CỦA MÔ HÌNH DỰ BÁO SỬ DỤNG CÁC
KỸ THUẬT TÍNH TỐN MỀM

86

3 1 Các mơ hình dự báo chuỗi thời gian mờ đề xuất

86


5
3 1 1 Mơ hình chuỗi thời gian mờ một nhân tố (FTS-1NT) kết hợp giữa FCM và
PSO

87


3 1 2 Mơ hình chuỗi thời gian mờ hai nhân tố (FTS-2NT) sử dụng FCM và PSO
100
3 2 Tổ chức thực nghiệm và đánh giá hiệu quả của các mơ hình dự báo được đề xuất
105
3 2 1 Đánh giá hiệu quả của mơ hình FTS một nhân tố FTS1NT-CMPSO
3 2 1 1 Mô tả các chuỗi dữ liệu thời gian

106
106

3 2 1 2 Thiết lập các tham số của mơ hình FTS1NT-CMPSO cho các tập dữ liệu
106
3 2 1 3 Áp dụng dự báo tuyển sinh đại học của trường đại học Alabama

107

3 2 1 4 Áp dụng dự báo thị trường chứng khoán Đài Loan TAIFEX

112

3 2 1 5 Áp dụng dự báo tai nạn ô tô tại Bỉ

113

3 2 2 Đánh giá hiệu quả của mơ hình FTS hai nhân tố FTS2NT-CMPSO

114

3 2 2 1 Áp dụng dự báo trên tập dữ liệu nhiệt độ


115

3 2 2 2 Áp dụng dự báo trên tập dữ liệu thị trường chứng khoán

119

3 3 Kết luận Chương 3

121

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

122

DANH MỤC CÁC CƠNG TRÌNH KHOA HỌC CỦA TÁC GIẢ LIÊN QUAN ĐẾN
LUẬN ÁN

123

TÀI LIỆU THAM KHẢO

124


6
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Các ký hiệu:
𝒜𝒜

Đại số tuyến tính


μ(h)

Độ đo tính mờ của gia tử h

fm(x)
H

Độ đo tính mờ của từ ngơn ngữ

+

Tập các gia tử dương

-

Tập các gia tử âm

H
A

Biến ngôn ngữ
Các chữ viết tắt:

TS

Time series

Chuỗi thời gian mờ


Fuzzy time series

Chuỗi thời gian mờ

TAIEX

Taiwan
capitalization
weighted stock index

Chỉ số chứng khoán Đài Loan

TAIFEX

Taiwan Stock Index Futures

PSO

Particle Swam Optimization

Tối ưu bầy đàn

KM

K-means clustering

Phân cụm mờ

HA


Hegde Algeras

Đại số gia tử

ARIMA

Autoregressive
integrated moving average

Q trình trung bình trượt tích
hợp tự hồi quy

FCM

Fuzzy C-Means Clustering

Phân cụm mờ

MAPE

Mean Absolute Percentage
Error

Sai số trung bình phần trăm tuyệt
đối

Mean square error

Sai số bình phương trung bình


FTS

MSE
FTS-1NT

Chuỗi thời gian mờ một nhân tố

FTS-2NT

Chuỗi thời gian mờ hai nhân tố

KM-FTS-1NT

Phân cụm Kmeans kết hợp với
chuỗi thời gian mờ một nhân tố

HA-FTS-1NT

Đại số gia tử kết hợp với chuỗi
thời gian mờ một nhân tố

FTS1NTCMPSO

Chuỗi thời gian mờ một nhân tố
kết hợp giữa FCM và PSO

FTS2NTCMPSO

Chuỗi thời gian mờ hai nhân tố
kết hợp giữa FCM và PSO


QHM
NQHM
NQHM-PTTG

Quan hệ mờ
Nhóm quan hệ mờ
Nhóm quan hệ mờ phụ thuộc thời
gian


7
DANH MỤC CÁC BẢNG
Bảng 1 1: Các nhóm quan hệ mờ từ tập dữ liệu tuyển sinh
Bảng 1 2: Một số hạn chế của các mơ hình dự báo sử dụng quan hệ mờ

33
35

Bảng 2 1: Sự khác nhau giữa nhóm quan hệ mờ đề xuất và nhóm quan hệ trong mơ
hình [10, 13]

47

Bảng 2 2: Dữ liệu tuyển sinh thực tế của trường đại học Alabama

49

Bảng 2 3: Kết quả mờ hóa dữ liệu tuyển sinh thành các tập mờ


51

Bảng 2 4: Biểu diễn mối quan hệ mờ bậc 1 và bậc 3 trên tập dữ liệu tuyển sinh

52

Bảng 2 5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 3

53

Bảng 2 6: Kết quả dự báo tuyển sinh dựa trên quan hệ mờ bậc 1 và bậc 3

55

Bảng 2 7: Dữ liệu lịch sử về nhiệt độ trung bình hàng ngày và mật độ của mây từ
01/06/1996 đến 30/09/1996 tại Đài Bắc, Đài Loan

57

Bảng 2 8: Kết quả mờ hóa của nhân tố chính “nhiệt độ trung bình hàng ngày” và
nhân tố thứ hai “mật độ của mây”

59

Bảng 2 9: Kết quả biểu diễn mối quan hệ mờ bậc 3 hai nhân tố

60

Bảng 2 10: Kết quả tính tốn giá trị cho mỗi NQHM-PTTG bậc 3


61

Bảng 2 11: Kết quả dự báo nhiệt độ trung bình hàng ngày trong tháng 6 năm 1996
tại Đài Bắc Đài Loan dựa vào chuỗi thời gian mờ hai nhân tố bậc 3

61

Bảng 2 12: Ánh xạ cơ sở

65

Bảng 2 13: Các mơ hình FTS sử dụng PSO để phân khoảng kết hợp với các phương
pháp khác

66

Bảng 2 14: Các mơ hình FTS sử dụng FCM để phân khoảng kết hợp với các
phương pháp khác

67

Bảng 2 15: Ưu và nhược điểm chính của các phương pháp phân khoảng

67

Bảng 2 16: Kết quả phân cụm trên tập dữ liệu tuyển sinh sử dụng K-means

68

Bảng 2 17: Giá trị của các khoảng từ tập dữ liệu tuyển sinh sử dụng K-means


69

Bảng 2 18: Số lượng hạng từ ngôn ngữ

70

Bảng 2 19: So sánh sai số dự báo MSE giữa mô hình FTS-1NT với các mơ hình
khác trên cùng 7 khoảng

73

Bảng 2 20: Kết quả và sai số dự báo giữa mơ hình FTS-1NT với các mơ hình khác
trên cùng 14 khoảng

74

Bảng 2 21: Kết quả và sai dự báo MSE giữa mơ hình FTS -1NT với các mơ hình
khác dựa trên QHM bậc cao khác nhau với số khoảng chia bằng 14

74

Bảng 2 22: So sánh sai số dự báo MSE của mơ hình đề xuất so với các mơ hình khác
dựa trên QHM bậc cao với số khoảng chia bằng 14

75

Bảng 2 23: Kết quả và sai số dự báo của mơ hình FTS-1NT với các mơ hình khác
dựa vào số bậc khác nhau với cùng số khoảng là 16


76


8
Bảng 2 24: So sánh kết quả và sai số dự báo trong pha kiểm thử giữa mơ hình đề
xuất FTS-1NT với các mơ hình khác dựa trên QHM bậc 5 với 16 khoảng

77

Bảng 2 25: So sánh sai số dự báo MAPE trong tháng 6 của mơ hình đề xuất với các
mơ hình trước

78

Bảng 2 26: So sánh sai số dự báo MAPE trong tháng 7 của mơ hình đề xuất với các
mơ hình trước

78

Bảng 2 27: So sánh sai số dự báo MAPE trong tháng 8 của mô hình đề xuất với các
mơ hình trước

79

Bảng 2 28: So sánh sai số dự báo MAPE trong tháng 9 của mơ hình đề xuất với các
mơ hình trước

79

Bảng 2 29: Kết quả và sai số dự báo của mơ hình FTS-1NT sử dụng các phương

pháp phân khoảng khác nhau dựa trên QHM bậc 1 với 7 khoảng chia

80

Bảng 2 30: Sai số dự báo MSE của mơ hình FTS-1NT sử dụng các phương pháp
phân khoảng khác nhau dựa trên QHM cao với 7 khoảng chia

80

Bảng 2 31: Kết quả dự báo của mơ hình FTS-1NT sử dụng phương pháp phân
khoảng HA và K-means dựa trên QHM bậc 1 với 14 khoảng chia

81

Bảng 2 32: So sánh sai số dự báo MSE giữa mơ hình đề xuất với các mơ hình khác
sử dụng 7 khoảng chia

82

Bảng 2 33: So sánh sai số dự báo giữa mơ hình đề xuất sử dụng K-means với các
mơ hình khác dựa trên QHM bậc 1 với 14 khoảng chia

83

Bảng 3 1: Các cụm và tâm của nó đạt được trên tập dữ liệu tuyển sinh [8]

88

Bảng 3 2: Các khoảng và điểm giữa của mỗi khoảng


88

Bảng 3 3: Kết quả mờ hóa chuỗi dữ liệu tuyển sinh với 7 khoảng chia tập nền

89

Bảng 3 4: Kết quả biểu thị quan hệ mờ bậc 1 và bậc 2

90

Bảng 3 5: Kết quả nhóm quan hệ mờ phụ thuộc thời gian bậc 1 và bậc 2

91

Bảng 3 6: Kết quả dự báo của mơ hình đề xuất với 7 khoảng chia

94

Bảng 3 7: Khởi tạo vị trí của các cá thể

98

Bảng 3 8: Khởi tạo vận tốc của các cá thể

98

Bảng 3 9: Khởi tạo vị trí tốt nhất 𝒜𝒜𝒜𝒜𝒜_𝒜𝒜 của các cá thể id

98


Bảng 3 10: Cập nhật vận tốc của các cá thể

99

Bảng 3 11: Cập nhật vị trí thứ hai của các cá thể

99

Bảng 3 12: Vị trí pbest cuối cùng được chọn làm 𝒜𝒜𝒜𝒜𝒜

100

Bảng 3 13: Kết quả phân cụm trên chuỗi dữ liệu hai nhân tố sử dụng FCM

102

Bảng 3 14: Các khoảng đạt được từ phân cụm FCM

102

Bảng 3 15: Các tham số của mơ hình FTS1NT-CMPSO cho mỗi tập dữ liệu

106

Bảng 3 16: So sánh kết quả và sai số dự báo giữa mơ hình đề xuất FTS1NTCMPSO với các mơ hình khác dựa trên QHM bậc 1 với 14 khoảng

107

Bảng 3 17: Điểm khác biệt giữa mơ hình FTS1NT-CMPSO với các mơ hình so sánh
trên Bảng 3 16


108


9
Bảng 3 18: So sánh sai số dự báo MSE giữa mơ hình đề xuất FTS1NT-CMPSO với
các mơ hình khác dựa trên QHM bậc 1 và các khoảng chia khác nhau

108

Bảng 3 19: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao

109

Bảng 3 20: So sánh sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 7 khoảng

111

Bảng 3 21: So sánh kết quả và sai số dự báo MSE của mơ hình đề xuất với các mơ
hình khác dựa trên QHM bậc cao khác nhau với 16 khoảng chia

112

Bảng 3 22: So sánh kết quả dự báo trong giai đoạn kiểm thử dựa trên QHM bậc 5
với 16 khoảng và sử dụng wh = 3

113


Bảng 3 23: So sánh kết quả và sai số dự báo RMSE giữa mơ hình FTS1NT-CMPSO
và các mơ hình trước đây với số khoảng chia và bậc khác nhau

113

Bảng 3 24: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự báo
nhiệt độ

115

Bảng 3 25: Các tham số của mơ hình FTS2NT-CMPSO được thiết lập cho dự báo
thị trường chứng khoán

115

Bảng 3 26: Kết quả dự báo nhiệt độ trung bình hàng ngày tại Đài Bắc, Đài Loan
theo từng tháng từ ngày 01/06/1996 đến 30/09/1996

116

Bảng 3 27: Sai số dự báo MAPE (%) trên từng bậc của mơ hình FTS2NT-CMPSO
117
Bảng 3 28: So sánh sai số dự báo MAPE (%) trong tháng 6 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau

118

Bảng 3 29: So sánh sai số dự báo MAPE(%) trong tháng 7 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau

118


Bảng 3 30: So sánh sai số dự báo MAPE(%) trong tháng 8 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau

118

Bảng 3 31: So sánh sai số dự báo MAPE(%) trong tháng 9 giữa mơ hình FTS2NTCMPSO và các mơ hình khác dựa trên các bậc khác nhau

119

Bảng 3 32: So sánh kết quả và sai số dự báo MSE giữa mơ hình FTS2NT-CMPSO
với các mơ hình khác dựa trên QHM bậc cao với 16 khoảng chia cho mỗi nhân tố
120


10
DANH MỤC CÁC HÌNH VẼ VÀ ĐỒ THỊ
Hình 1 1: Cấu trúc tổng quan của luận án
Hình 1 2: Chuỗi tỷ giá hối đối BP / USD hàng tuần [53]

20
21

Hình 1 3: Đồ thị của 3 hàm thuộc phổ biến:(a) tam giác, (b) hình thang, (c) Gauss 23
Hình 1 4: Mơ hình dự báo FTS tổng qt

26

Hình 1 5: Các thành phần trong giai đoạn huấn luyện

27


Hình 1 6: Ví dụ phân khoảng tập nền sử dụng các hàm thuộc khác nhau

28

Hình 1 7: Các thành phần trong giai đoạn kiểm thử

30

Hình 1 8: Tóm tắt các bước thực hiện mơ hình dự báo của Chen [10] trên tập dữ liệu
tuyển sinh của trường Đại học Alabama

34

Hình 1 9: Sơ đồ thuật tốn phân cụm k-means

38

Hình 1 10: Sơ đồ thuật tốn phân cụm bằng FCM

39

Hình 1 11: Đồ thị minh họa một điểm tìm kiếm bằng PSO

40

Hình 1 12: Biểu diễn sự sắp xếp của các phần tử 𝒜 ∈ 𝒜, ℎ ∈ 𝒜 , 𝒜 ∈

44

Hình 2 1 Minh họa chuỗi thời gian được mờ hóa bới các tập mờ


46

Hình 2 2: Các bước của mơ hình dự báo

49

Hình 2 3: Biểu diễn dữ liệu tuyển sinh được mờ hóa bởi các tập mờ 𝒜 𝒜

51

Hình 2 4: Các bước của mơ hình FTS-2NT

56

Hình 2 5: Minh hoạ các phương pháp phân khoảng khác nhau trên cùng tập mẫu 63
Hình 2 6: Các phương pháp phân khoảng

63

Hình 2 7: Minh hoạ các khoảng chia liên tiếp có độ dài bằng nhau là 1000

64

Hình 2 8: Độ thị phân bổ giá trị chênh lệch của chuỗi dữ liệu tuyển sinh

65

Hình 2 9: Các phương pháp phân khoảng khác nhau kết hợp với mơ hình FTS-1NT
68

Hình 2 10: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng K-means

69

Hình 2 11: Minh hoạ các khoảng trên tập dữ liệu tuyển sinh sử dụng HA

72

Hình 2 12: Biểu diễn sai số dự báo MSE giữa hình FTS-1NT với các mơ hình so
sánh dựa trên các bậc khác nhau với 14 khoảng chia

75

Hình 2 13: Đồ thị biểu diễn sai số dự báo trong Bảng 2 30 của mơ hình FTS-1NT
dựa trên các phương pháp phân khoảng khác nhau

81

Hình 2 14: Đường cong mô tả kết quả dự báo của mơ hình FTS-1NT sử dụng
phương pháp phân khoảng HA và K-means so với dữ liệu thực tế

82

Hình 2 15: Đường cong biểu diễn giữa giá trị dự báo của mô hình KM-FTS-1NT và
các mơ hình khác so với dữ liệu thực tế

84

Hình 2 16: So sánh sai số dự báo MSE giữa mơ hình đề xuất sử dụng phân khoảng
K-means và HA với các mơ hình khác dựa trên QHM bậc cao với 7 khoảng chia 84

Hình 3 1: Cấu trúc và các giai đoạn của mơ hình dự báo đề xuất (FTS1NT-CMPSO)
87


11
Hình 3 2: Cấu trúc khoảng của một cá thể trong PSO

95

Hình 3 3: Sơ đồ thuật tốn biểu diễn mơ hình FTS1NT-CMPSO

97

Hình 3 4: Cấu trúc và các giai đoạn của mơ hình đề xuất FTS2NT- CMPSO

101

Hình 3 5: Biểu diễn các khoảng và bậc của mơ hình theo cá thể i trong PSO

103

Hình 3 6: Biểu diễn giá trị thực của các chuỗi dữ liệu thời gian

106

Hình 3 7: Đồ thị biểu diễn sai số dự báo MSE giữa mơ hình FTS1NT-CMPSO và
các mơ hình so sánh trong Bảng 3 18 với số lượng khoảng khác nhau

109


Hình 3 8: Đồ thị biểu diễn sai số dự báo giữa mơ hình đề xuất FTS1NT-CMPSO
với các mơ hình khác trong Bảng 3 20

111

Hình 3 9: Đường cong biểu diễn giữa giá trị thực tế và giá trị dự báo nhiệt độ trung
bình hàng ngày trong tháng 6, dựa trên mơ hình FTS2NT-CMPSO bậc 7

117

Hình 3 10: Đồ thị thể hiện thời gian tính tốn và tốc độ hội tụ của mơ hình
FTS2NT-CMPSO với 150 lần lặp

120


12
MỞ ĐẦU
Những thành tựu đạt được trong các hoạt động của con người được đặc trưng
bởi các quá trình ra quyết định hiệu quả của họ Để giúp quá trình ra quyết định được
chính xác, tiết kiệm được thời gian và giảm các chi phí khơng cần thiết thì bài tốn
dự báo đóng vai trị rất quan trọng Dự báo là một công cụ trợ giúp cần thiết cho việc
ra quyết định và lập kế hoạch để quản lý hiệu quả các tổ chức hiện đại Ví dụ, dự báo
bán hàng ln đóng một vai trị nổi bật trong hoạt động kinh doanh Nó cung cấp cho
các doanh nghiệp những chỉ dẫn đáng tin cậy về chi phí cơng việc và phân bổ ngân
sách cho một khoảng thời gian sắp tới Các nhà khoa học cũng phải đối mặt với thách
thức quan trọng trong việc dự báo các sự kiện xảy ra trong tương lai như nhiệt độ,
lượng mưa, tăng trưởng nền kinh tế,

Để dự báo các sự kiện này với độ chính xác


100% là khơng thể, nhưng rất nhiều lợi ích có thể thu được từ kết quả dự báo cũng
như một bức tranh về tương lai đó Một trong các hướng nghiên cứu nâng cao độ
chính xác của các bài toán dự báo là nghiên cứu dữ liệu chuỗi thời gian Chuỗi thời
gian (TS – time series) là một chuỗi các giá trị số hoặc chuỗi các từ trong ngôn ngữ
tự nhiên được ghi lại tại các thời điểm liên tiếp trong một khoảng thời gian, thường
được đo cách nhau tại các thời điểm thống nhất: hàng ngày, hàng tuần, hàng tháng,
hàng quý hoặc hàng năm Nói một cách đơn giản, một chuỗi thời gian là một chuỗi
dữ liệu lịch sử được thu thập một cách đều đặn
Phân tích chuỗi thời gian để xây dựng các mơ hình dự báo chuỗi thời gian hiệu
quả là một trong các khâu quan trọng trong việc tạo ra các công cụ dự báo tốt nhằm
giải quyết các bài toán thực tế Một loạt các phương pháp đã được đề xuất để giải
quyết những bài tốn này, thơng dụng hơn cả là mơ hình tự hồi quy (autoregression
model - AR), trung bình trượt (moving average - MA) và kết hợp của chúng thành
mơ hình ARMA và ARIMA do Box và Jenkins [1] phát triển năm 1976 Các mơ hình
dự báo nêu trên được xây dựng cho chuỗi thời gian tuyến tính và dừng Bên cạnh các
mơ hình chuỗi thời gian dừng thì các mơ hình ARCH [2] (Autoregressive
Conditionally Hestoroscedastic) và GARCH [3] (Generalize Autoregressive
Conditionally Hestoroscedastic) được xây dựng để giải quyết các chuỗi thời gian
khơng dừng hay chuỗi thời gian có phương sai thay đổi Để áp dụng các mơ hình dự
báo chuỗi thời gian trên với độ chính xác khả quan đòi hỏi một số ràng buộc chặt chẽ
như: chuỗi thời gian phải là tuyến tính hay cần một số lượng dữ liệu lớn Trong thực
tế, việc đòi hỏi các chuỗi thời gian là dừng và tuyến tính khơng phải lúc nào cũng đáp
ứng được, thậm chí chúng cịn mang tính không chắc chắn và biến thiên mạnh
Việc áp dụng các mơ hình nêu trên đối với chuỗi dữ liệu thời gian ngắn hay
phi tuyến là không phù hợp và kết quả dự báo đạt được chưa cao Để khắc phục các
hạn chế đó, một số tác giả đã sử dụng mạng nơron để xây dựng mơ hình dự báo chuỗi


13

thời gian dựa trên tính phi tuyến và linh hoạt của chúng Donaldson và công sự [4]
đã đề xuất mô hình chuỗi thời gian sử dụng mạng nơron nhân tạo (Artificial Neural
Network – ANN) để dự báo sự biến động của thị trường chứng khoán Mỹ, Canada,
Nhật Bản và Anh Hansen và Nelson [5] cũng sử dụng mạng nơron để xây dựng mơ
hình dự báo doanh thu từ thuế Quan sát thấy rằng, phương pháp sử dụng mạng nơron
đạt được độ chính xác cao hơn so với các mơ hình truyền thống Mặt khác, một số
nghiên cứu đã sử dụng suy luận mờ dựa trên mạng nơron [6] (Adaptive Neuro-Fuzzy
Inference System-ANFIS) để nâng cao độ chính xác dự báo của mơ hình chuỗi thời
gian Khác so với mạng ANN, hệ này có khả năng thích nghi với mơi trường cao hơn
trong q trình huấn luyện Do đó, đã có nhiều cơng trình áp dụng hệ ANFIS trong
sự báo TS và thu được những kết quả nhất định Tuy nhiên, các mơ hình tiên tiến sử
dụng mạng nơron đơn lẻ vẫn phải đối mặt với một số vấn đề như cần giả định một số
lượng dữ liệu lớn trong quá trình huấn luyện mạng, phụ thuộc vào kinh nghiệm trong
việc chọn nút mạng và khơng có phương pháp rõ ràng để phân tích mối quan hệ giữa
đầu vào và đầu ra trong mạng
Hơn nữa, trong cuộc sống hàng ngày, con người thường quan sát, phân tích các
sự vật, hiện tượng và các sự kiện xảy ra trong thế giới thực và đưa ra các quyết định
của mình dưới dạng ngơn ngữ tự nhiên Với bài toán dự báo chuỗi thời gian, dữ liệu
có thể được biểu diễn dưới dạng các từ trong ngôn ngữ tự nhiên và dễ dàng mô tả
cách con người thực hiện quá trình dự báo dưới dạng ngôn ngữ trong thực tế Thật
vậy, khi con người quan sát dữ liệu chuỗi thời gian, họ nhanh chóng chuyển các biến
động của chuỗi thời gian sang dạng ngôn ngữ và lập luận trong suy nghĩ theo một
cách nào đó dựa trên quan hệ giữa các hạng từ trong chuỗi thời gian để ước lượng kết
quả dự báo dưới dạng ngôn ngữ Trong ngữ cảnh như vậy, các phương pháp thống kê
nêu trên chỉ được sử dụng để giải quyết chuỗi thời gian số (Numerical time series NTS) mà không thể sử dụng để giải quyết một cách hiệu quả các bài tốn ra quyết
định như vậy Vì vậy, chuỗi thời gian mờ ra đời nhằm giải quyết các bài toán dự báo
với chuỗi số liệu được biểu diễn dưới dạng ngôn ngữ Chuỗi thời gian mờ (Fuzzy
time series - FTS) được Song và Chissom giới thiệu lần đầu tiên vào năm 1993, dựa
trên lý thuyết tập mờ của Zadeh [7], trong đó các tập mờ được xem như là ngữ nghĩa
của các hạng từ ngôn ngữ Theo cách tiếp cận này, Song và Chissom đã đề xuất hai

mơ hình FTS [8, 9] để dự báo số lượng sinh viên nhập học của trường Đại học
Alabama Tuy nhiên, mơ hình của Song và Chissom còn tồn tại một số hạn chế như
mất nhiều thời gian tính tốn do thực hiện phép hợp thành max – min phức tạp đối
với ma trận quan hệ mờ 𝒜 (𝒜 − 1, 𝒜) lớn và thiếu sự thuyết phục trong việc xác định
độ dài của khoảng chia tập nền Để khắc phục hạn chế trên, Chen [10] đã đề xuất
nhóm quan hệ mờ và sử dụng các phép toán số học đơn giản trong quá trình giải mờ


14
Mặc dù các mơ hình này đã chứng tỏ những ưu việt khi áp dụng cho chuỗi dữ liệu
thời gian tổng qt nhưng độ chính xác dự báo cịn khá thấp Đây là cơ sở để mở ra
một hướng nghiên cứu mới và thu hút được nhiều công bố cả về cải tiến phương pháp
luận lẫn nghiên cứu ứng dụng Vì điểm trên, nhiều nghiên cứu đã cải tiến mơ hình
của Chen nhằm nâng cao độ chính xác của kết quả dự báo theo các hướng sau: 1) xác
định tập nền và tìm độ dài khoảng phù hợp [11- 28]; 2) xây dựng các mối quan hệ
mờ và nhóm quan hệ mờ trên cơ sở dữ liệu được mờ hóa [18, 24, 29-31] và 3) cải
tiến các quy tắc giải mờ cho dự báo đầu ra [13, 18, 32-33]
Trước hết, việc phân khoảng tập nền: làm thế nào để phân tập nền chứa dữ liệu
lịch sử thành các khoảng với độ dài thích hợp và bao nhiêu khoảng là phù hợp? Bắt
đầu từ cơng trình nền tảng [11], Huarng đã xác định rằng độ dài của khoảng chia tập
nền là một yếu tố quan trọng và ảnh hưởng đáng kể đến độ chính xác dự báo của mơ
hình Từ quan điểm này, Huarng đã đưa ra hai phương pháp chọn độ dài khoảng tập
nền theo phân bố và độ dài trung bình Các phương pháp của Huarng đã đạt được độ
chính xác tốt hơn so với một số mơ hình dự báo trước đó Yolcu và cộng sự [22] đưa
ra một cách tiếp cận mới dựa trên việc tối ưu tỷ lệ để xác định độ dài của các khoảng
chia bằng hàm “fminbnd” trong MATLAB Trong những năm gần đây, các kỹ thuật
tính tốn mềm và các phương pháp tối ưu tiến hóa được sử dụng rộng rãi để xác định
phân khoảng tối ưu trong mơ hình FTS Chen & Chung đưa ra hai mơ hình chuỗi thời
gian mờ bậc nhất [15] và bậc cao [16] dựa trên thuật toán di truyền để phân tập nền
thành các khoảng có độ dài phù hợp và áp dụng cho dự báo tuyển sinh tại trường Đại

học Alabama Lee và cộng sự [34] áp dụng thuật tốn tơi luyện (Simulated Annealing
- SA) để xác định độ dài khoảng thích hợp trong mơ hình FTS bậc cao cho dự báo thị
trường chứng khoán Đài Loan (TAIFEX) Eren Bas và cộng sự [35] đã đề xuất một
thuật toán di truyền cải tiến (MGA) để tránh những phán đoán chủ quan trong việc
xác định độ dài của mỗi khoảng tập nền trong mơ hình FTS để dự báo tai nạn xe hơi
ở Bỉ và tuyển sinh vào trường Đại học Alabama Bên cạnh đó, nhiều thuật tốn tối ưu
được lấy cảm hứng từ các lồi sinh vật học cũng được sử dụng cho mục đích phân
khoảng nhằm nâng cao độ chính xác dự báo của mơ hình FTS như: tối ưu bầy đàn
(Particle Swarm Optimization - PSO) [14, 18, 30 - 33, 35], tối ưu đàn kiến (Ant
Colony Optimization - ACO) [36] và tối ưu dựa trên sự di chuyển của đàn ngỗng(
Geese Movement Based Optimization- GMBO) [37] Cùng mục đích sử dụng PSO
để hiệu chỉnh độ dài khoảng tập nền, một số tác giả khác đã đề xuất các mơ hình FTS
dựa trên quan hệ mờ bậc cao [35, 38] và quan hệ mờ hai nhân tố [39-41] để áp dụng
dự báo các bài toán khác nhau Ngoài ra, Chen và cộng sự [42] đã áp dụng PSO để
tối ưu đồng thời các khoảng chia và các trọng số trên mỗi nhóm quan hệ mờ cho dự
báo TAIFEX và tỷ giá NTD / USD Song song với kỹ thuật tối ưu, thì các phương


15
pháp phân cụm như: phân cụm mờ C-mean [28, 43], phân cụm tự động [17] cũng
được sử dụng cho mục đích phân khoảng nhằm giảm thiểu sai số dự báo trong mơ
hình chuỗi thời gian mờ
Thứ hai, việc thiết lập các quan hệ logic mờ hay có thể gọi tắt là quan hệ mờ
(QHM) và nhóm quan hệ mờ (NQHM) có tác động lớn đến độ chính xác của kết quả
dự báo Do đó, làm cách nào để thiết lập nhóm quan hệ mờ phù hợp là một trong
những yếu tố quan trọng trong mơ hình FTS Nhận thấy tầm quan trọng này, nhiều
nghiên cứu đã đề xuất các mô hình FTS khác nhau theo hướng tiếp cận NQHM Khái
niệm nhóm quan hệ mờ đầu tiên do Chen [10] đề xuất bằng cách gộp các thành phần
bên vế phải của các quan hệ mờ khi chúng có cùng vế trái Theo cách này, các nhóm
quan hệ mờ được thiết lập giúp cho giai đoạn giải mờ và tính tốn giá trị dự báo rõ

một cách dễ dàng hơn Vì ưu điểm này, nhiều mơ hình dự báo đã được đề xuất dựa
trên NQHM của Chen [10] để giải quyết các bài tốn khác nhau [15-19, 40, 44] Tuy
nhiên, các mơ hình sử dụng nhóm quan hệ này gặp phải hạn chế do khơng để ý đến
tính lặp và vị trí của các quan hệ khi tham gia vào NQHM Tình trạng này dẫn đến
thiếu thông tin để dự báo và giảm khả năng giải thích của mơ hình Yu [13] đã chỉ ra
tầm quan trọng của sự lặp lại các thành phần trong NQHM và gán các trọng số khác
nhau theo vị trí xuất hiện của chúng trong NQHM Đây được xem như một đề xuất
thứ 2 về NQHM và đã được các nghiên cứu khác đề xuất sử dụng [45, 46]
Thứ ba, thiết lập quy tắc giải mờ để nhận kết quả dự báo rõ là một bước quan
trọng và ảnh hưởng trực tiếp đến kết quả dự báo của mơ hình Một quy tắc giải mờ
có thể cho kết quả tốt đối với mơ hình chuỗi thời gian mờ bậc nhất nhưng hạn chế đối
với mơ hình chuỗi thời gian mờ bậc cao và ngược lại; hoặc có thể phù hợp với một
bài toán dự báo nhất định nhưng lại khơng phù hợp cho các bài tốn dự báo khác và
ngược lại Thông thường giá trị dự báo lấy trung bình điểm giữa của các khoảng liên
quan đến từng tập mờ bên vế phải của NQHM [15-18] Tuy nhiên, do có sự đóng góp
khác nhau của các thành phần trong vế phải của NQHM nên nhiều tác giả đã sử dụng
trọng số để gán cho từng giá trị điểm giữa [13, 46, 47] Ngoài điểm giữa của khoảng
dự báo, một số kỹ thuật khác được sử dụng để nâng cao độ chính xác dự báo bằng
cách chia khoảng này thành các đoạn con để lấy thêm thông tin dự báo [32] Bên cạnh
đó, để tính giá trị dự báo khi vế phải của quan hệ mờ chưa được xác định, nhiều tác
giả đã sử dụng phương pháp phiếu bầu (voting) [18, 33] để gán một trọng số ưu tiên
cho thành phần có đóng góp gần nhất về tương lai
Vấn đề về bậc của mơ hình và nhân tố ảnh hưởng của chuỗi thời gian cũng
được nhiều tác giả xem xét và giới thiệu đối với từng bài toán dự báo cụ thể Đối với
vấn đề thứ nhất, đã có một số lượng lớn các nghiên cứu [14, 16, 17, 35, 39, 48] được
công bố dựa trên QHM bậc cao nhằm cải thiện hiệu quả dự báo của mô hình bậc nhất


16
Tuy nhiên, các mơ hình bậc cao đã cơng bố trước đây thường chọn bậc với độ chính

xác tốt nhất bằng trực giác hay thử nghiệm một số lần chạy trên mỗi bậc cho trước
Vậy, có giải pháp hiệu quả nào để xác định bậc của mơ hình với độ chính xác dự báo
tốt nhất một cách tự động? Câu hỏi này, đã được đáp ứng trong luận án bằng việc sử
dụng PSO để tối ưu đồng thời độ dài khoảng và bậc của mơ hình Đối với vấn đề thứ
hai, thực tế cho thấy đôi khi chuỗi thời gian chính (hay gọi là nhân tố dự báo) lại bị
ảnh hưởng bởi một hay nhiều nhân tố khác, ví dụ: chỉ số chứng khoán của Nhật bị
ảnh hưởng bởi chuỗi chỉ số chứng khốn New-York Do đó, để nâng cao hiệu quả dự
báo, một số nghiên cứu đã xét thêm các nhân tố phụ để tăng khả năng dự báo cho
nhân tố chính trên từng bài tốn mà các nhân tố này có mối quan hệ tiềm năng Điển
hình có thể thấy trong các cơng trình [34, 35, 40] đã đề xuất kết hợp các kỹ thuật khác
nhau với mô hình FTS bậc cao hai nhân tố để giải quyết dự báo các bài toán khác
nhau: như dự báo nhiệt độ trung bình tại Đài Bắc, Đài Loan [34, 40] với nhân tố thứ
hai là độ che phủ của mây; dự báo thị trường chứng khoán Đài Loan TAIFEX [35,
40] nhận chỉ số TAIEX là nhân tố thứ hai
Như đã phân tích ở trên, dự báo chuỗi thời gian mờ đã thu hút được nhiều sự
quan tâm của các nhà nghiên cứu quốc tế và họ đã có được các thành quả đáng kể
Tại Việt Nam, lĩnh vực này cũng nhận được sự quan tâm của các nhóm nghiên cứu
tại Viện Công nghệ Thông tin (CNTT) và tại các trường Đại học phía nam Điển hình
như, nhóm tác giả tại Đại học Cần Thơ đã xây dựng mơ hình chuỗi thời gian mờ với
các tập mờ có cấp độ thuộc là một hàm liên tục có chứa tham số [49] Các tác giả này
đã xây dựng thuật toán để xác định các tham số phù hợp nhất trên mỗi tập dữ liệu
tương ứng, sau đó thực hiện nội suy dữ liệu để có được kết quả dự báo Các cơng
trình [19, 20] đã đề xuất phương pháp phân khoảng dựa trên các ánh xạ ngữ nghĩa
của đại số gia tử [50], từ đó xây dựng mơ hình dự báo tương tự như mơ hình chuỗi
thời gian mờ Một số tác giả khác đã cố gắng xây dựng mơ hình dự báo bằng chuỗi
ngôn ngữ của đại số gia tử thay vì các tập mờ như trong các nghiên cứu [51, 52] Tuy
nhiên, các nghiên cứu này mới chỉ tập trung vào việc xây dựng mơ hình bậc nhất,
chưa sử dụng thêm nhân tố phụ vào dự báo nên kết quả dự báo thu được chưa thực
sự tốt cũng như việc sử dụng tập dữ liệu chưa được phong phú Mặt khác, để phát
triển mơ hình dự báo chuỗi thời gian dựa trên lý thuyết đại số gia tử rất cần có những

mở rộng mới
Qua phân tích ưu điểm và hạn chế của các cơng trình nghiên cứu trong và ngồi
nước cho thấy mơ hình chuỗi thời gian mờ vẫn cần có những cải tiến khác nhau để
chúng có thể đạt được độ chính xác dự báo tốt hơn cũng như cần các bước tính tốn
hợp lý hơn để có thể ứng dụng rộng rãi trong nhiều lĩnh vực khác nhau
Tính cấp thiết của đề tài luận án:


17
Khái niệm quan hệ mờ và nhóm quan hệ mờ do Chen đề xuất đóng vai trị
quyết định trong việc phát triển mơ hình dự báo chuỗi thời gian mờ Nhờ những khái
niệm này, việc tính tốn dự báo đã đơn giản hơn rất nhiều so với mơ hình của Song
và Chissom Những cơng trình nghiên cứu về chuỗi thời gian mờ đa số sử dụng mơ
hình của Chen để thực hiện dự báo Tuy nhiên, cấu trúc nhóm quan hệ mờ của Chen
và Yu là cố định đối với từng thời điểm dự báo và có sự bất hợp lý Khi lập nhóm
quan hệ mờ ở một thời điểm t nào đó thì sẽ xuất hiện những thành phần không xem
xét đến lịch sử xuất hiện của các tập mờ bên vế phải của quan hệ mờ Điều này dẫn
đến việc có thành phần xuất hiện sau thời điểm t mà vẫn được tham gia dự báo cùng
với các thành phần tại thời điểm t hoặc thời điểm trước đó Vấn đề này được xem là
khơng phù hợp với tính thực tiễn Để khắc phục điểm này, nghiên cứu trong luận án
đưa ra khái niệm nhóm quan hệ mờ phụ thuộc thời gian (NQHM-PTTG) Với cách
tiếp cận này, tác giả đã chỉ ra rằng việc sử dụng nhóm NQHM-PTTG có thể cải thiện
đáng kể kết quả dự báo và đã được chứng minh là phù hợp hơn trong thực tế Đóng
góp này của luận án đã được cơng bố trong cơng trình [P1] và đề xuất mở rộng cũng
như được ứng dụng trong các cơng trình [P2-P8]
Bên cạnh đó, các mơ hình dự báo chuỗi thời gian mờ bao gồm mơ hình bậc
một, mơ hình bậc cao và mơ hình hai hay nhiều nhân tố đã được xem xét trong một
loạt cơng trình nghiên cứu Do vậy, một vấn đề đặt ra là cần kiểm nghiệm liệu khái
niệm nhóm quan hệ mờ phụ thuộc thời gian mới có thực sự tạo được những lợi thế
hay không trong các mô hình trên Đồng thời trong một số bước của mơ hình dự báo

chuỗi thời gian mờ vẫn tồn tại một số vấn đề cần được cải tiến như tìm các phương
pháp phân khoảng mới dựa trên các kỹ thuật như phân cụm, tối ưu tiến hóa hay sử
dụng đại số gia tử Trong bước giải mờ cũng cần một số tinh chỉnh nhằm nâng cao
hiệu quả của mơ hình dự báo Nhìn chung cịn khá nhiều vấn đề có thể giải quyết
được để cải tiến mơ hình dự báo Đây là những nội dung sẽ được trình bày trong suốt
luận án mà tập trung vào đề xuất khái niệm nhóm quan hệ mờ mới để kết hợp với các
kỹ thuật khác nhau như tối ưu độ dài khoảng chia và kỹ thuật tối ưu bậc của mơ hình
nhằm nâng cao hiệu quả dự báo Thơng qua đó, luận án xây dựng các mơ hình dự báo
một và hai nhân tố cũng như những mơ hình bậc cao dựa trên cơ sở các đề xuất mới
Hiệu quả của các mơ hình đề xuất được đánh giá trên các chuỗi dữ liệu khác nhau và
so sánh với các mơ hình dự báo hiện có trên cùng tiêu chí và cùng tập dữ liệu mẫu
Mục tiêu nghiên cứu của luận án:
- Mở rộng khái niệm nhóm quan hệ mờ trên cơ sở khắc phục các nhược điểm
của khái niệm nhóm quan hệ mờ hiện có nhằm xây dựng các mơ hình dự


18
báo chuỗi thời gian mờ hiệu quả trong việc giải quyết các bài toán dự báo
thực tế
- Nghiên cứu xây dựng các mơ hình dự báo chuỗi thời gian mờ hiệu quả trên
cơ sở áp dụng các kỹ thuật tính toán mềm và các luật giải mờ mới
Đối tượng và giới hạn phạm vi nghiên cứu:
Đối tượng nghiên cứu của luận án là chuỗi thời gian mờ, nhóm quan hệ mờ và
các kỹ thuật tính tốn mềm
Giới hạn: Tập trung vào việc xây dựng mơ hình và kiểm chứng mơ hình dự
báo dựa trên lý thuyết then chốt là chuỗi thời gian mờ và nhóm quan hệ mờ phụ thuộc
thời gian Thêm nữa, luận án còn đề cập đến các kỹ thuật phân khoảng dựa trên Đại
số gia tử và các phương pháp tính tốn mềm như: phương pháp phân cụm, thuật toán
tối ưu trong việc lựa chọn khoảng chia và bậc nhằm nâng cao hiệu quả dự báo của
mô hình được đề xuất

Với mục tiêu và phạm vi nghiên cứu đặt ra, những đóng góp của luận án là:
✓ Đề xuất khái niệm NQHM-PTTG dựa trên lý thuyết về chuỗi thời gian mờ và
xây dựng thuật tốn nhóm các quan hệ mờ Đây là một khái niệm mới làm nền
tảng để kết hợp các kỹ thuật khác nhau nhằm nâng cao hiệu quả dự báo của mơ
hình Đóng góp này của luận án đã được công bố ở Kỷ yếu Hội nghị Quốc gia
lần thứ VI về Nghiên cứu cơ bản và ứng dụng Công nghệ thông tin (FAIR’9)
năm 2016 (cơng trình [P1]) và tạp chí ứng dụng tốn học (cơng trình [P2])
✓ Xây dựng mơ hình dự báo chuỗi thời gian mờ bậc cao để giải quyết bài toán
dự báo khác nhau dựa vào NQHM-PTTG Kết quả này được cơng bố trên tạp
chí International Journal of Computational Intelligence and ApplicationsESCI/Scopus Q3 năm 2018 (cơng trình [ P4])
✓ Đề xuất các phương pháp phân khoảng dựa trên phân cụm K-means và đại số
gia tử Các đóng góp này được cơng bố trên các tạp chí tạp chí khoa học và
cơng nghệ Đà Nẵng năm 2017 trong cơng trình [P3] và Advances in Science
Technology and Engineering Systems Journal năm 2021 (cơng trình [ P8])
✓ Xây dựng mơ hình chuỗi thời gian mờ bậc cao hai nhân tố sử dụng phân cụm
FCM và PSO để xác định độ dài khoảng và bậc tối ưu một cách đồng thời Các
đóng góp này trong luận án đã được cơng bố trong cơng trình [P5]
✓ Đề xuất, sử dụng kỹ thuật phân cụm FCM với tối ưu PSO trong việc xác định
khoảng chia tập nền và các quy tắc giả mờ mới nhằm tăng độ chính xác dự báo
của mơ hình FTS bậc 1 và bậc cao Các đóng góp này được cơng bố trên tạp
chí Tin học và Điều khiển năm 2019, đưa ra trong cơng trình [P7]


19
Các nội dung và kết quả nghiên cứu trình bày trong luận án đã được cơng bố
trong 8 cơng trình khoa học, bao gồm: 02 bài báo trên tạp chí quốc tế uy tín (trong đó
01 bài báo thuộc danh mục ESCI); 01 bài báo ở Tạp chí Tin học và Điều khiển; 01
bài báo ở Tạp chí Khoa học và Công nghệ Đà Nẵng, 01 bài báo ở Tạp chí Ứng dụng
Tốn học; 03 báo cáo trong kỷ yếu hội thảo quốc gia có phản biện Một số kết quả
của luận án cũng được báo cáo trong nhóm Đại số gia tử tại Viện CNTT

Cấu trúc của luận án
Luận án được trình bày với cấu trúc gồm các phần chính dưới đây và được tóm
tắt như Hình 1 1
Mở đầu
Trình bày tổng quan về nội dung nghiên cứu của đề tài, lý do chọn đề tài, mục
đích nghiên cứu, những đóng góp mới của luận án, đối tượng và phạm vi nghiên cứu
Chương 1: Những kiến thức liên quan
Trình bày tổng quan về chuỗi thời gian, chuỗi thời gian mờ và các khái niệm
cùng với các thuật toán liên quan Chương này cũng mô tả các giai đoạn của mơ hình
FTS nói chung và ứng dụng của nó trên các bài toán thực tế Các kiến thức cơ sở
trong chương này làm nền tảng để phát triển và xây dựng mơ hình dự báo chuỗi thời
gian mờ được trình bày trong các chương tiếp theo
Chương 2: Xây dựng các mơ hình dự báo chuỗi thời gian mờ với
NQHM_PTTG và ứng dụng
Chương 2 đưa ra đề xuất NQHM-PTTG và xây dựng các mơ hình dự báo chuỗi
thời gian mờ một nhân tố và hai nhân tố Chương này cũng trình bày và phân tích ưu
điểm và hạn chế của từng phương pháp chia khoảng được sử dụng trong mơ hình dự
báo, đồng thời đề xuất các phương pháp chia khoảng và thử nghiệm trên bài toán cụ
thể Kết quả dự báo trên các tập dữ liệu khác nhau của mô hình được đề xuất đưa ra
so sánh với kết quả thu được từ các mơ hình khác trong luận án Đồng thời đưa ra các
phân tích về hạn chế của các mơ hình trước đây cũng như sự phù hợp của mơ hình
được đề xuất dựa trên kết quả thực nghiệm
Chương 3: Nâng cao hiệu quả của mơ hình dự báo sử dụng các kỹ thuật
tính tốn mềm
Chương này trình bày các mơ hình dự báo FTS cải tiến bằng việc kết hợp kỹ
thuật phân cụm, kỹ thuật tối ưu với mơ hình chuỗi thời gian mờ một nhân tố và hai
nhân tố ở Chương 2 nhằm nâng cao độ chính xác của kết quả dự báo Các kết quả
thực nghiệm từ mơ hình được đề xuất trên các tập dữ liệu khác nhau được so sánh
với các mơ hình dự báo trước đây được luận án tham chiếu
Kết luận và hướng phát triển



20
Tóm tắt các kết quả chính của luận án, những đóng góp mới của luận án về
phương pháp luận và ứng dụng thực tiễn Kiến nghị về các định hướng nghiên cứu
Danh mục các cơng trình khoa học của tác giả liên quan đến luận án
Tài liệu tham khảo

Hình 1 1: Cấu trúc tổng quan của luận án


21
CHƯƠNG 1 NHỮNG KIẾN THỨC LIÊN QUAN
Nội dung chương này trình bày tổng quan về ứng dụng của lý thuyết tập mờ,
các khái niệm về chuỗi thời gian cũng như chuỗi thời gian mờ trong các bài toán dự
báo và các thuật tốn liên quan Chương này cũng trình bày các bước trong từng giai
đoạn thực hiện của mơ hình chuỗi thời gian mờ tổng qt và các mơ hình chuỗi thời
gian mờ cơ bản Các nội dung này được xem là cơ sở nền tảng để phát triển các đề
xuất mới trong các chương tiếp theo của luận án
1 1 Các khái niêm về chuỗi thời gian
1 1 1 Chuỗi thời gian
Chuỗi thời gian x(t) là một tập hợp các quan sát được diễn biến và ghi lại theo
thời gian t Trong đó t đại diện cho thời gian, x(t) được coi là biến ngẫu nhiên [53]
Chuỗi thời gian có thể liên tục hoặc rời rạc Khi các quan sát được thực hiện tại các
khoảng thời gian cố định, được gọi là một chuỗi thời gian rời rạc Nếu các quan sát
được ghi lại liên tục trong một khoảng thời gian, thì được gọi là chuỗi thời gian liên
tục Ví dụ, các chỉ số về nhiệt độ, dịng chảy của sơng, nồng độ của một q trình hóa
học, v v có thể được ghi lại thành một chuỗi thời gian liên tục Mặt khác, dân số của
một thành phố, sản lượng hàng hố của một cơng ty, tỷ giá hối đối giữa hai loại tiền
tệ khác nhau có thể đại diện cho chuỗi thời gian rời rạc Thông thường trong một

chuỗi thời gian rời rạc, các quan sát liên tiếp được ghi lại ở các khoảng thời gian cách
đều nhau như khoảng thời gian hàng giờ, hàng ngày, hàng tuần, hàng tháng hoặc hàng
năm Những dữ liệu quan sát liên tục cho một hiện tượng (vật lý, kinh tế ) trong
một khoảng thời gian sẽ tạo nên một chuỗi thời gian liên tục Ví dụ, doanh số của
cơng ty trong 20 năm gần đây, hoặc nhiệt độ ghi nhận tại một trạm quan trắc khí
tượng, hoặc cơng suất điện năng tiêu thụ trong một nhà máy, đó là các ví dụ điển hình
cho một chuỗi thời gian Dưới đây là ví dụ điển hình thể hiện chuỗi thời gian được
minh họa bởi Hình 1 2:

Hình 1 2: Chuỗi tỷ giá hối đoái BP / USD hàng tuần [53]


22
1 1 2 Bài toán dự báo chuỗi thời gian
Đầu vào của bài toán dự báo là một chuỗi thời gian gồm n giá trị quan sát xuất
hiện theo thứ tự thời gian, đầu ra của bài toán là giá trị của �(t) tại thời điểm
� �+1 trở đi Dạng tổng quát của chuỗi thời gian thường được biểu diễn bởi một mặt
phẳng với trục hoành biểu thị thời gian và trục tung đặc trưng cho giá trị quan sát
𝒜
y=𝒜(t)

𝒜1

𝒜2



𝒜𝒜

𝒜𝒜+1


�(�1)

�(�2)



�(�� )

?

Trong đó: 𝒜� , � = 1,2,

, n chỉ mốc thời gian thứ �; và 𝒜(𝒜𝒜 ) là giá trị quan sát

tương ứng với thời gian thứ 𝒜
Về cơ bản, mục tiêu của dự báo chuỗi thời gian là ước tính một số giá trị trong
tương lai dựa vào mẫu dữ liệu trong quá khứ và hiện tại Về mặt tốn học có thể biểu
diễn như sau:
𝒜̂(�+��) = f(𝒜(𝒜−𝒜𝒜1), 𝒜(𝒜−𝒜𝒜2), 𝒜(𝒜−𝒜𝒜3), …, 𝒜(𝒜−𝒜� �))
Trong đó, 𝒜̂(𝒜+𝒜𝒜) là giá trị dự đoán tại mốc thời gian (� + ∆𝒜) của một chuỗi
thời gian rời rạc x
1 2 Chuỗi thời gian mờ và các mơ hình dự báo chuỗi thời gian mờ
1 2 1 Một số khái niệm về tập mờ
Trong thực tế, thông tin mờ luôn tồn tại trong suy luận và cách diễn đạt của
con người Có thể quan sát các từ như “nóng”, “khá nóng”, “rất nóng”, “lạnh”, “rất
lạnh”, … chúng chứa đựng những khái niệm trừu tượng về ngữ nghĩa của thông tin
mờ, không rõ ràng, không chắc chắn mà chỉ mang tính định tính Những khái niệm
chứa đựng thơng tin khơng chính xác, mơ hồ như vậy được gọi chung là các khái
niệm “mờ”

Lý thuyết tập mờ lần đầu được Zadeh giới thiệu trong cơng trình nghiên cứu
[7] vào năm 1965, mở rộng khái niệm tập hợp kinh điển, nhằm biểu diễn mức độ
thuộc của các phần tử vào một tập hợp trong tập nền nào đó
Định nghĩa 1 1: Định nghĩa tập mờ
Cho tập nền � Tập mờ � xác định trên � là một tập mà mỗi phần tử của nó
được biểu diễn bởi một cặp giá trị (𝒜, µ� (𝒜)) Trong đó 𝒜 ∈ � và hàm µ𝒜: � → [0, 1]
là hàm thuộc với giá trị µ𝒜 (𝒜) biểu diễn mức độ thuộc của x vào A
Ví du 1 1: Gọi U = {𝒜1, 𝒜2, 𝒜3, 𝒜4, 𝒜5} là tập gồm 5 người tương ứng với các
tuổi là 10, 20, 50, 55, 70 Gọi A là tập hợp các người “Trẻ” Khi đó có thể xây dựng
hàm thuộc với cấp độ là: µ��ẻ(10) = 0 95, µ𝒜𝒜ẻ(20) = 0 8, µ𝒜𝒜ẻ(50) = 0 4,

µ��ẻ(55) = 0 35, µ𝒜𝒜ẻ(70) = 0 15 và tập mờ A là: � =

0 95
�1

+

08
�2

+…+

0 15
�5


×