NGUYỄN XUÂN THỊNH – NGÀNH CÔNG NGHỆ THÔNG TIN – KHÓA 2003
..
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------------------
LUẬN VĂN THẠC SỸ KHOA HỌC
XÂY DỰNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ
MẠNG THÍCH NGHI
NGÀNH: CƠNG NGHỆ THÔNG TIN
NGUYỄN XUÂN THỊNH
HÀ NỘI - 2005
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------------------
LUẬN VĂN THẠC SỸ KHOA HỌC
XÂY DỰNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ
MẠNG THÍCH NGHI
NGÀNH: CƠNG NGHỆ THƠNG TIN
NGUYỄN XUÂN THỊNH
Người hướng dẫn khoa học: TS.TRẦN ĐÌNH KHANG
HÀ NỘI - 2005
LỜI CẢM ƠN
Trước tiên, em xin chân thành cảm ơn Ban giám hiệu, các thầy cô trường
ĐHBK Hà Nội, đặc biệt các thầy cô khoa Công Nghệ Thông Tin và Trung tâm đào
tạo sau đại học đã tận tình dạy dỗ và giúp đỡ chúng em trong suốt những năm học
qua.
Tiếp đến, em xin gửi lời cảm ơn chân thành nhất đến thầy giáo, Ts. Trần
Đình Khang. Thầy đã cho em một định hướng đúng đắn cho đề tài của mình và
ln tận tình theo dõi, hướng dẫn em trong quá trình thực hiện đề tài.
Cuối cùng, em xin gửi lời cảm ơn sâu sắc tới gia đình, người thân, bạn bè,
những người đã luôn ủng hộ và tạo mọi điều kiện cho em hoàn thành luận văn này.
Hà Nội, tháng 11/2005
Học viên
Nguyễn Xuân Thịnh
2
MỤC LỤC
LỜI CẢM ƠN ..........................................................................................................1
MỤC LỤC................................................................................................................2
DANH MỤC BẢNG ................................................................................................3
DANH MỤC HÌNH VẼ ..........................................................................................3
MỞ ĐẦU .................................................................................................................5
CHƯƠNG I – TỔNG QUAN VỀ HỆ MỜ ............................................................8
1.1 Lịch sử phát triển ..........................................................................................8
1.2 Các khái niệm cơ bản dùng trong logic mờ ...................................................9
1.2.1 Định nghĩa tập mờ ......................................................................................9
1.2.2 Các phép toán đại số trên tập mờ .............................................................10
1.2.3 Biểu diễn các hàm thuộc ..........................................................................11
1.2.4. Các phép toán mở rộng của tập mờ.........................................................13
1.2.5 Số mờ ......................................................................................................15
1.2.6 Nguyên lý suy rộng của Zadeh ................................................................15
1.3 Suy luận xấp xỉ .............................................................................................16
1.3.1 Biến ngôn ngữ ..........................................................................................16
1.3.2 Luật mờ IF-THEN....................................................................................17
1.3.3 Giải mờ .....................................................................................................18
1.4 Hệ suy diễn mờ ..............................................................................................20
1.4.1
Hệ suy diễn mờ Mamdani ...................................................................24
1.4.2
Hệ suy diễn mờ Tsukamoto ................................................................25
1.4.3
Hệ suy diễn mờ Takagi-Sugeno ..........................................................26
1.4.4
Đặc tính và phạm vi ứng dụng ............................................................28
1.5 Kết luận ......................................................................................................29
CHƯƠNG II - MẠNG NƠNRON NHÂN TẠO ................................................30
2.1 Mạng nơron ..................................................................................................30
2.1.1
Mơ hình một nơron sinh học ...............................................................31
2.1.2
Mơ hình một nơron nhân tạo...............................................................32
2.2 Mạng nơron nhân tạo ....................................................................................34
2.2.1
Lớp mạng ............................................................................................34
2.2.2
Cấu trúc của mạng nơron nhân tạo .....................................................35
2.2.3
Thủ tục học của mạng .........................................................................37
2.3 Sức mạnh của mơ hình mạng nơron...............................................................40
2.4 Các phạm vi ứng dụng ...................................................................................40
2.5 Mạng thích nghi..........................................................................................41
2.5.1 Kiến trúc và luật học cơ sở.......................................................................42
2.5.2 Luật học lai - Học gián tiếp (Off-Line Learning ) ...................................44
2.5.3 Luật học lai - Học trực tiếp (On-Line Learning) .....................................48
2.6 Kết luận ........................................................................................................48
CHƯƠNG III – TÍCH HỢP MẠNG NƠRON VÀ HỆ MỜ..............................50
3.1 So sánh hệ mờ và mạng nơron, lý do tích hợp ................................................50
3
3.2 Các hướng tiếp cận kết hợp mạng nơron với hệ mờ ......................................52
3.2.1
Mạng nơron mờ...................................................................................53
3.2.2
Mơ hình nơron-mờ hợp tác .................................................................57
3.2.3
Mơ hình nơron-mờ lai .........................................................................58
3.3 Mơ hình nơron-mờ trên cơ sở hệ suy diễn mờ. ..........................................60
3.3.1 Hệ nơron-mờ trên cơ sở hệ suy diễn mờ Mamdani ................................60
3.3.2 Hệ nơron-mờ trên cơ sở hệ suy diễn mờ Takegi-Sugeno .......................62
3.4 Mạng ANFIS ..............................................................................................63
3.4.1
Kiến trúc hệ suy diễn mờ dựa trên mạng thích nghi ...........................64
3.4.2
Thuật tốn học lai................................................................................68
3.4.3
Xác định các tham số học thích nghi ..................................................70
3.5 Kết luận ...........................................................................................................71
CHƯƠNG IV - ỨNG DỤNG HỆ SUY DIỄN MỜ TRÊN CƠ SỞ MẠNG
THÍCH NGHI TRONG BÀI TỐN PHÂN LỚP..............................................72
4.1 Phát biểu bài tốn ............................................................................................72
4.2 Ứng dụng hệ ANFIS trong bài toán phân lớp. ................................................75
4.2.2 Giới thiệu chương trình mơ phỏng hệ ANFIS .........................................76
4.2.3 Xây dựng hệ thống ...................................................................................80
4.2.4 Kết quả thử nghiệm ..................................................................................81
4.2.5 Đánh giá hệ thống ....................................................................................83
4.3 Kết luận ...........................................................................................................84
KẾT LUẬN ............................................................................................................85
TÀI LIỆU THAM KHẢO ....................................................................................87
DANH MỤC BẢNG
Bảng 3.1 So sánh hệ mờ và mạng nơron ...................................................................51
Bảng 3.2 Hai pha trong thủ tục học lai cho hệ ANFIS. ...........................................69
DANH MỤC HÌNH VẼ
Hình 1.1 Hàm thuộc: (a) Tam giác, (b) Hình thang ..................................................11
Hình 1.2 Hàm thuộc hình chng .............................................................................12
Hình 1.3: Các tập mờ điển hình dùng để định nghĩa biến ngơn ngữ tuổi đời ...........17
Hình 1.4
Phương pháp giải mờ điểm cực đại ....................................................19
Hình 1.5 Phương pháp giải mờ điểm trọng tâm ........................................................19
Hình 1.6: Hệ suy diễn mờ .........................................................................................20
Hình 1.7: Sơ đồ hoạt động suy diễn của một hệ suy diễn mờ...................................22
Hình 1.8: Hệ suy diễn mờ điển hình sử dụng min và max lần lượt cho các phép
tốn AND và OR mờ .........................................................................................23
Hình 1.9: Hệ suy diễn mờ sử dụng phép hợp thành Product-Max lần lượt cho phép
tốn AND và OR mờ .........................................................................................24
Hình 1.10: Hệ suy diễn mờ Tsukamoto ....................................................................25
Hình 1.11: Hệ suy diễn mờ Takagi - Sugeno ............................................................26
Hình 1.12: Sử dụng các luật mờ if-then và kỹ thuật suy luận mờ ............................27
4
Hình 2.1 Cấu tạo của một nơron sinh học ................................................................31
Hình 2.2 Một nơron nhân tạo .................................................................................32
Hình 2.3: Ví dụ về một lớp có 5 nơron .....................................................................35
Hình 2.4: Mạng nơron nhiều lớp ...............................................................................35
Hình 2.5 Mạng hồi quy ............................................................................................36
Hình 2.6: Sơ đồ học có giám sát ...............................................................................38
Hình 2.7: Sơ đồ học tăng cường................................................................................39
Hình 2.8: Sơ đồ học khơng có giám sát ....................................................................39
Hình 2.9: Mạng thích nghi ........................................................................................42
Hình 3.1 Cấu trúc hệ nơron-mờ Mamdani ..............................................................60
Hình 3.2 Cấu trúc hệ nơron-mờ Takegi-Sugeno .......................................................62
Hình 3.3: Lập luận mờ ..............................................................................................65
Hình 3.4: Kiến trúc hệ ANFIS ..................................................................................65
Hình 3.5 (a) Mạng ANFIS với 9 luật; (b) Tương ứng với khơng gian mờ ...............68
Hình 3.6: Hai luật heuristic cho cập nhật kích thước k .............................................70
Hình 4.1: Lược đồ chung của mơ hình nhận dạng ....................................................73
Hình 4.2: Hộp thoại cho phép mơ tả hệ ANFIS ........................................................77
Hình 4.3: Kết quả phân lớp của hệ ANFIS ...............................................................78
Hình 4.4: Hộp thoại cho phép ta lựa chọn số hàm thuộc, loại hàm thuộc cho các
biến ....................................................................................................................78
Hình 4.5: Cấu trúc của một hệ ANFIS ......................................................................79
Hình 4.6: Cấu trúc các luật của một hệ ANFIS ........................................................79
Hình 4.7: Biểu diễn các tập mờ của biến đầu vào .....................................................79
Hình 4.8: Kết quả phân lớp bộ số liệu IRIS ..............................................................82
Hình 4.9: Kết quả phân loại bộ số liệu WBC............................................................83
5
MỞ ĐẦU
Chúng ta đều biết rằng bộ não con người là một sản phẩm hồn hảo của tạo
hóa, nó có khả năng tư duy và sáng tạo cao. Hiện nay con người đang cố gắng tiếp
cận bộ não của mình theo nhiều phương pháp khác nhau. Để mô phỏng khả năng
học, người ta đưa ra mơ hình mạng nơron nhân tạo (nghiên cứu về mặt số học – chỉ
các đặc tính sinh lý của bộ não). Nhằm diễn tả khả năng tư duy của bộ não, người ta
sử dụng các hệ mờ trên cơ sở logic mờ để suy diễn (tìm hiểu việc sử dụng ngơn ngữ
tự nhiên - chỉ các đặc tính tâm lý của bộ não).
Từ hai thập kỷ gần đây, lý thuyết mờ và mạng nơron nhân tạo đã phát triển rất
nhanh và đa dạng. Công nghệ mờ và công nghệ mạng nơron đã cung cấp những giải
pháp mới cho các ngành công nghiệp làm ra nhiều sản phẩm thông minh, đáp ứng
nhu cầu thị trường cần có những bộ điều khiển linh hoạt hơn, những thiết bị “biết”
làm việc với những bài tốn khó, phải xử lý nhiều thơng tin mập mờ, khơng đầy đủ,
thiếu chính xác và là hai trụ cột chính của cơng nghệ tính tốn mềm.
Cả hai kỹ thuật này đều có những ưu điểm và nhược điểm riêng, do đó một
cách tiếp cận đầy hứa hẹn sẽ thu được nhiều ưu điểm của các hệ mờ và mạng nơron
là kết hợp chúng lại thành một hệ tích hợp. Có nhiều cách tiếp cận để tích hợp mạng
nơron với hệ mờ, tùy thuộc vào từng ứng dụng và quan điểm của các chuyên gia –
điều này vẫn chưa được thống nhất với nhau. Nhưng về cơ bản sự hợp nhất của hai
kỹ thuật này có thể thực hiện theo ba hướng chính sau:
Các hệ mờ nơron (Neural fuzzy systems): Mục đích của các hệ này hướng
vào việc cung cấp cho hệ mờ các khả năng điều chỉnh tự động. Mạng nơron
dùng để học và điều chỉnh các tham số (luật, trọng số luật, các hàm thuộc)
của hệ mờ. Kỹ thuật học mạng nơron làm giảm đáng kể thời gian và chi phí
phát triển của hệ mờ, đồng thời làm tăng hiệu năng của hệ mờ.
Mạng nơron mờ (Fuzzy neural networks): Là mơ hình sử dụng các phương
thức mờ để tăng cường khả năng học và hiệu suất của mạng nơron. Thực
chất, mạng nơron mờ là một mạng nơron được mờ hóa. Mỗi phần của mạng
6
nơron (các hàm kích hoạt, hàm kết hợp, các trọng số, dữ liệu vào ra..), mỗi
mơ hình mạng nơron, và các giải thuật học mạng nơron đều có thể được mờ
hóa. Trong mạng nơron mờ các tham số điều khiển và các trọng số liên kết
có thể được thay thế bằng các tham số mờ. Mạng nơron mờ có tốc độ huấn
luyện cao hơn, và mạnh mẽ hơn mạng nơron thông thường.
Các hệ nơron-mờ lai (Hybrid neuro-fuzzy systems): Đây là kiến trúc mới
trong đó mạng nơron và hệ mờ được kết hợp trong một kiến trúc thuần nhất.
Kiến trúc này có nhiều mơ hình khác nhau. Một số mơ hình dùng kiểu học
tăng cường (reinfocement learning), thích hợp cho các nhiệm vụ điều khiển.
Một số khác dùng giải thuật học có giám sát (supervised learning), thích hợp
cho các bài tốn phân tích dữ liệu.
Các nghiên cứu về sự tích hợp mạng nơron với hệ mờ vẫn còn là một vấn đề
mở và thời sự. Vì vậy luận văn đi vào tìm hiểu, nghiên cứu các hướng kết hợp chính
giữa hai cơng nghệ. Trong đó tập trung đi sâu nghiên cứu, phân tích những ưu điểm
và hạn chế của hệ suy diễn mờ và mạng thích nghi làm cơ sở để xây dựng hệ suy
diễn mờ trên cơ sở mạng thích nghi. Phần cuối trình bày một ứng dụng của hệ suy
mờ trên cơ sở mạng thích nghi trong bài tốn phân lớp .
Báo cáo sẽ được trình bày trong 4 chương như sau:
Chương I - Tổng quan về hệ mờ.
Chương này sẽ giới thiệu những kiến thức cơ bản về lý thuyết tập mờ và đi
sâu tìm hiểu hệ suy diễn mờ cùng các đặc tính và ứng dụng của hệ.
Chương II - Mạng nơ ron nhân tạo
Hệ thống lại những kiến thức cơ bản về mạng nơron, các kiến trúc, thuộc
tính, khả năng học và các ứng dụng của mạng cùng các thuật tốn học. Trong
đó, chúng ta tập trung vào mô tả cấu trúc và các thuật tốn học của mạng
thích nghi.
• Chương III – Tích hợp mạng nơron và hệ mờ
7
Chương này ta sẽ phân tích các ưu, nhược điểm của hệ mờ và mạng nơron, lý
do tích hợp, giới thiệu một số mơ hình nơron-mờ: mạng nơơrron mờ, hệ
nơron- mờ hợp tác, hệ nơron-mờ lai. Trọng tâm chính của chương là nghiên
cứu xây dựng hệ suy diễn mờ trên cơ sở mạng thích nghi cùng thuật tốn học
lai của hệ.
• Chương IV - Ứng dụng hệ suy diễn mờ trên cơ sở mạng thích nghi trong
bài tốn phân lớp
Chương này sẽ đi tập trung vào việc mô tả một ứng dụng của hệ suy diễn mờ
trên cơ sở mạng thích nghi trong việc giải quyết bài tốn phân lớp dữ liệu.
Luận văn tốt nghiệp
8
Chương I: Tổng quan về hệ mờ
CHƯƠNG I – TỔNG QUAN VỀ HỆ MỜ
Chương này nhằm hệ thống lại một số kiến thức về lý thuyết tập mờ, trong
đó, đi sâu tìm hiểu hệ suy diễn mờ. Những kiến thức này được sử dụng trong
chương III của luận văn tốt nghiệp và có thể tìm thấy trong các tài liệu về hệ mờ
[1], [2], [5].
1.1
Lịch sử phát triển
Năm 1965, Lotfi Zadeh, giáo sư về lý thuyết hệ thống, trường Đại học
Berkeley, bang California công bố bài báo đầu tiên về Logic mờ ở Mỹ. Từ đó lịch
sử phát triển của lý thuyết mờ theo trình tự phát minh ở Mỹ, xây dựng và hoàn
chỉnh ở châu Âu và ứng dụng vào thị trường Nhật Bản.
Các ứng dụng của logic mờ trong công nghiệp đầu tiên ở châu Âu. Năm
1970, ở Anh, Ebrahim Mamdani sử dụng logic mờ điều khiển máy phát chạy bằng
hơi nước, mà trước đây không thể điều khiển bằng phương pháp kinh điển được. Ở
Đức, Hans Zimmerman bắt đầu sử dụng logic mờ trong các hệ thống hỗ trợ ra quyết
định. Năm 1980, lý thuyết mờ được ứng dụng nhiều trong phân tích dữ liệu và hỗ
trợ ra quyết định ở châu Âu.
Dù châu Âu có những ứng dụng lý thuyết mờ đầu tiên, nhưng người Nhật lại
dẫn đầu về thương mại hoá các ứng dụng lý thuyết mờ, đặc biệt là trong lĩnh vực kỹ
thuật điều khiển kể từ năm 1980. Năm 1983, công ty Fuji Electric ứng dụng lý
thuyết mờ trong nhà máy xử lý nước. Năm 1987, công ty Hitachi ứng dụng trong hệ
thống xe điện ngầm. Lý thuyết mờ phát triển mạnh ở Nhật vì lý thuyết này hỗ trợ
việc tạo ra các mơ hình ngun mẫu nhanh, dễ dàng tối ưu hoá, hệ thống mờ đơn
giản, dễ hiểu, hơn nữa lại được sự quan tâm hỗ trợ của Chính phủ. Với các kết quả
nghiên cứu ứng dụng, lý thuyết mờ được sử dụng trong mọi lĩnh vực về xử lý số
liệu, điều khiển thông minh, trong các hệ thống hỗ trợ ra quyết định.
Các nghiên cứu gần đây về việc kết hợp giữa mạng nơron và logic mờ là
bước phát triển tiếp theo của công nghệ này và mở ra nhiều ứng dụng.
Luận văn tốt nghiệp
1.2
9
Chương I: Tổng quan về hệ mờ
Các khái niệm cơ bản dùng trong logic mờ
1.2.1 Định nghĩa tập mờ
Trong mục này chúng tôi sẽ giới thiệu những khái niệm cơ bản và các ký
hiệu toán học của lý thuyết tập mờ. Trước hết ta hãy quan niệm rằng những tập mờ
như là một sự tổng quát hoá những tập rõ cổ điển bằng cách chuyển miền giá trị của
hàm thuộc từ {0,1} thành đoạn đơn vị [0,1].
Một tập (rõ) cổ điển là một tập hợp các đối tượng riêng biệt. Nó được định
nghĩa theo cách chia đơi các phần tử của một không gian nền cho trước thành hai
nhóm: nhóm thành viên và nhóm khơng thành viên. Từ đó, một tập hợp rõ có thể
được định nghĩa bởi một hàm đặc trưng của tập hợp đó.
Gọi U là khơng gian nền. Hàm đặc trưng µ A (x) của một tập hợp rõ A trên U
nhận giá trị 0 hoặc 1, nó nhận giá trị 1 nếu x là một phần tử của A ( x ∈ A ) và nhận
giá trị 0 trong trường hợp ngược lại. Nghĩa là:
1
0
µ A ( x) =
if
if
x∈ A
x∉ A
(1.1)
Như vậy biên của một tập hợp rõ là hoàn toàn xác định khi chúng ta định
nghĩa nó, và khơng gian nền U luôn là một tập rõ.
Một tập mờ, trái lại, biểu diễn sự mập mờ bằng cách thay thế biên xác định
của tập hợp rõ (ranh giới phân tách giữa nhóm thành viên và nhóm khơng thành
viên). Vì thế sự chuyển tiếp giữa tính chất thành viên và khơng thành viên khơng
phải đột ngột mà biến đổi từ từ. Chính vì vậy mà tập mờ có thể được xem như là
một sự mở rộng những ý tưởng cơ bản của tập hợp rõ.
Định nghĩa 1.1
Tập mờ A trên không gian nền U nếu A được xác định bởi hàm
µ A : X → [0,1]
µ A gọi là hàm thuộc (membership function) cịn µ A (x) gọi là độ thuộc của x vào
tập mờ A.
Kí hiệu tập mờ A trên khơng gian nền U như sau:
Luận văn tốt nghiệp
Chương I: Tổng quan về hệ mờ
10
A = {( µ A ( x) | x) : x ∈ U }
(1.2)
Ví dụ 1.1:
Gọi khơng gian nền U là tập số thực R và A là tập các số thực lớn hơn hoặc bằng 5,
A là một tập hợp rõ. Khi đó chúng ta có:
A = {( µ A ( x) | x) : x ∈ U },
trong đó hàm đặc trưng là:
0
1
µ A ( x) =
x<5
x≥5
B là tập các số thực gần 5, B là một tập mờ. Khi đó chúng ta có:
B = {( µ B ( x) | x) : x ∈ U }
trong đó hàm liên thuộc là:
µ B ( x) =
1
1 + 10( x − 5) 2
1.2.2 Các phép toán đại số trên tập mờ
Định nghĩa 1.2: Cho A và B là hai tập mờ trên khơng gian nền U, có các hàm thuộc
µ A , µ B . Khi đó phép hợp A∪ B , phép giao A∩ B là hai tập mờ với các hàm thuộc
Phép hợp:
µ A ∪ B ( x) = max { µ A ( x), µ B ( x)} = µ A ( x) ∨ µ B ( x)
ở đây
(1.3)
là kí hiệu phép tốn max, và ta có:
Phép giao:
µ A ∩ B ( x) = min { µ A ( x), µ B ( x)}= µ A ( x) ∧ µ B ( x)
ở đây
(1.4)
là kí hiệu phép tốn min, và ta có:
Phép lấy phần bù A C là tập mờ với hàm thuộc:
µ A ( x) =1 − µ A ( x)
(1.5)
C
Phép tương đương:
và
là tương đương khi và chỉ khi
Luận văn tốt nghiệp
11
Chương I: Tổng quan về hệ mờ
(1.6)
Tập con: A là tập con của B, kí hiệu A ⊆ B khi và chỉ khi
(1.7)
1.2.3 Biểu diễn các hàm thuộc
Để biểu diễn các hàm thuộc chúng ta có thể sử dụng các hàm tham số sau:
- Hàm thuộc dạng tam giác: Hàm thuộc dạng tam giác là một hàm thuộc với ba
tham số định nghĩa bởi
Hình 1.1(a) là hàm thuộc dạng tam giác với các tham số (x,20,60,80)
- Hàm thuộc dạng hình thang: Hàm thuộc dạng hình thang là hàm với bốn tham
số được định nghĩa bởi
Hình 1.1(b) là hàm thuộc dạng hình thang với các tham số (x,10,20,60,95)
Theo hình vẽ này chúng ta có thể thấy hàm thuộc dạng tam giác là một dạng đặc
biệt của hàm thuộc dạng hình thang, cả hai hàm thuộc dạng này đều hay được sử
dụng trong thực tế
Hình 1.1 Hàm thuộc: (a) Tam giác, (b) Hình thang
- Hàm thuộc Gauss: Hàm thuộc Gauss là hàm thuộc với 2 tham số được định nghĩa
bởi:
Luận văn tốt nghiệp
ở đây
là tâm và
12
Chương I: Tổng quan về hệ mờ
là trọng số của hàm thuộc
- Hàm thuộc hình chng: Hàm thuộc hình chng là hàm với hai tham số định
nghĩa bởi:
ở đây tham số b thường là dương. Giá trị của tất cả các tham số được miêu tả trong
hình 1.2
Hình 1.2 Hàm thuộc hình chng
- Hàm thuộc sigmoid: Hàm thuộc sigmoid là một hàm với hai tham số được định
nghĩa bởi:
ở đây tham số a>0 hàm được mở sang bên phải, mặt khác nếu a<0 hàm lại được mở
sang bên trái, do vậy hàm này có thể được dùng để miêu tả các khái niệm như “rất
to” hoặc “rất nhỏ”. Hàm sigmoid thường được sử dụng trong mạng nơron như hàm
cập nhật.
Tiếp theo ta sẽ đề cập đến một số phép toán mở rộng của tập mờ.
Luận văn tốt nghiệp
13
Chương I: Tổng quan về hệ mờ
1.2.4. Các phép toán mở rộng của tập mờ
Phần này chúng ta sẽ nghiên cứu hai phép toán mở rộng là phép hội và phép
tuyển của hai tập mờ và thường được gọi là triagular norms (t-norm) và triagular
conorms (t-conorm)
• Phép hội
Phép hội (hay phép AND - conjunction) là một trong các phép tốn logic cơ
bản nhất. Nó cũng là cơ sở để định nghĩa phép giao của hai tập mờ.
Để diễn đạt phép hội mờ (fuzzy conjunction) như một hàm T:[0,1]2→[0,1]
thì chúng ta định nghĩa như sau:
Định nghĩa 1.3
Hàm T: [0,1]2 → [0,1] là một t-chuẩn (chuẩn tam giác hay t-norm) nếu thỏa
mãn các điều kiện sau:
a) T (1, x) = x , với mọi 0 ≤ x ≤ 1
b) T có tính giao hốn, tức là T (x, y) = T (y, x), với mọi 0 ≤ x, y ≤ 1
c) T không giảm theo nghĩa T (x, y) ≤ T (u, v), với mọi x ≤ u, y ≤ v
d) T có tính kết hợp: T (x, T (y,z)) =T (T(x,y), z), 0 ≤ x, y , z ≤ 1
Ví dụ 1.2:
a) Dạng min (Zadeh, 1965), T(x,y) = min(x,y)
b) Dạng tích, T(x,y) = xy
c) t- chuẩn Lukasiewicz, T(x,y) = max{x+y-1,0)
min( x, y ) khi m ax( x, y ) = 1,
khi max( x, y ) < 1
0
d) t-chuẩn yếu nhất, Z ( x, y ) =
Khơng khó khăn để chứng minh được rằng với mỗi t- chuẩn T thì
Z(x,y) ≤ T(x,Y) ≤ min(x,y), với mọi x, y ∈ [0,1]
Định nghĩa tổng quát phép giao của hai tập mờ
Cho hai tập mờ A, B trên cùng không gian nền X với hàm thuộc
µ A ( x), µ B ( x) . Cho T là một t- chuẩn.
Định nghĩa 1.4:
Luận văn tốt nghiệp
14
Chương I: Tổng quan về hệ mờ
Ứng với t- chuẩn T, tập giao (tổng quát) của tập mờ A, B là một tập mờ
( A ∩T B ) trên X với hàm thuộc cho bởi cơng thức:
µ A∩ B ( x) = T ( µ A ( x), µ B ( x)) ,
T
(1.8)
với mọi x ∈ X
Việc lựa chọn phép giao nào, tức là chọn t-chuẩn nào để làm việc và tính
tốn hồn tồn phụ thuộc vào từng bài tốn cụ thể mà chúng ta quan tâm.
• Phép tuyển
Giống như phép hội, phép tuyển cũng là cơ sở để định nghĩa phép hợp của
hai tập mờ. Để diễn đạt phép tuyển hay toán tử logic OR (disjunction) thông
thường cần thoả mãn các tiên đề sau:
Định nghĩa 1.5:
Hàm S: [0,1]2 → [0,1] gọi là phép tuyển (OR suy rộng) hay là t-đối chuẩn (tconorm) nếu thỏa mãn các tiên đề sau:
a) S(0, x) = x với mọi 0 ≤ x, y ≤ 1
b) S có tính giao hốn: S(x, y) = S(y, x), với 0 ≤ x, y ≤ 1
c) S không giảm : S(x, y) ≤ S(u, v), 0 ≤ x ≤ u ≤ 1 và 0 ≤ y ≤ v ≤ 1
d) S có tính kết hợp: S(x, S(y, z)) =S(S(x, y), z), với mọi 0 ≤ x, y , z ≤ 1
Định nghĩa tổng quát phép hợp của hai mệnh để
Định nghĩa 1.6
Cho X là không gian nền, A, B là hai tập mờ trên X với hàm thuộc
µ A ( x), µ B ( x) . S là t-đối chuẩn, phép hợp ( A ∪ S B ) trên X của hai tập mờ là
một tập mờ với hàm thuộc:
µ A∪ B ( x) = S ( µ A ( x), µ B ( x)) ,
S
(1.9)
với mọi x ∈ X.
Việc lựa chọn phép nào, tức là chọn t-đối chuẩn nào để xác định hàm thuộc
tương ứng phụ thuộc vào bài toán đang nghiên cứu.
Nếu chúng ta giả sử rằng T là tích đại số, S là tổng đại số chúng ta có thể
định nghĩa trường hợp đặc biệt cho hai phép toán trong (1.8) và (1.9):
Luận văn tốt nghiệp
15
Chương I: Tổng quan về hệ mờ
Và nếu T là phép toán min, S là phép toán max thì ta có:
1.2.5 Số mờ
Số mờ hay khoảng mờ dùng diễn tả khái niệm một số hay một khoảng xấp xỉ
hay gần bằng một số thực hay một khoảng số thực cho trước. Số mờ hay khoảng mờ
là tập mờ xác định trên tập số thực, ta sẽ dùng các số mờ theo định nghĩa sau:
Định nghĩa 1.7
Tập mờ M trên đường thẳng số thực R1 là một số mờ nếu:
a) M chuẩn hóa, tức là có điểm x’ sao cho µ M ( x' ) = 1
b) Ứng với mỗi α ∈ R 1 , tập mức {x : µ M ( x) ≥ α } là đoạn đóng trên R 1 .
Người ta thường dùng các số mờ dạng tam giác, hình thang và dạng hàm Gauss.
1.2.6 Nguyên lý suy rộng của Zadeh
Để làm việc với hệ thống nhiều biến vào, nguyên lý suy rộng sau đây của
Zadeh là rất quan trọng.
Định nghĩa 1.8:
Cho Ai là tập mờ với hàm thuộc µ A trên khơng gian nền X i với (i = 1, 2,…n).
Khi ấy tích A = A1 × ...× An là tập mờ trên khơng gian nền X = X 1 × ...× X n với hàm
thuộc µ A ( x) = min {µ A ( x1 ), ...., µ A ( x n ) } trong đó x = ( x1 , x 2 ,......, x n )
1
n
Xét hệ thống như hình vẽ sau:
x1 là A1
x n là A n
f
y là B
Luận văn tốt nghiệp
16
Chương I: Tổng quan về hệ mờ
Nguyên lý suy rộng của Zadeh:
Giả sử mỗi biến vào x i lấy giá trị là A i (i=1,..n) với A i là tập mờ trong không
gian X i với hàm thuộc µ A (x) . Hàm f: X → Y chuyển các giá trị đầu vào A i thành
giá trị đầu ra B. Khi đó B sẽ là tập mờ trên Y với hàm thuộc µ B (x) được tính theo
cơng thức sau:
max{min(µ A1 ( x),..., µ An ( x n )) : x ∈ f
µ B ( x) =
0
−1
( y )}
if f −1 ( y ) ≠ φ
if f −1 ( y ) = φ
(1.10)
trong đó
f
1.3
−1
( y ) = { x = ( x1 , x 2 ,..., x n ) ∈ X : f ( x) = y}
(1.11)
Suy luận xấp xỉ
Suy luận xấp xỉ là quá trình suy ra những kết luận mờ dưới dạng các mệnh
đề mờ trong điều kiện các quy tắc, các luật, các dữ liệu đầu vào cho trước cũng
khơng hồn tồn xác định. Chúng ta sẽ lần lượt nghiên cứu các khái niệm dùng
trong suy luận xấp xỉ.
1.3.1 Biến ngôn ngữ
Một khái niệm cơ bản được đưa ra là biến ngôn ngữ (linguistic variables).
Biến ngôn ngữ là biến nhận các giá trị ngôn ngữ chẳng hạn như “già”, “trẻ”,
“trung niên”, trong đó, mỗi giá trị ngơn ngữ thực chất là một tập mờ xác định bởi
một hàm thuộc và khoảng giá trị số tương ứng, chẳng hạn giá trị ngôn ngữ “trung
niên” là một tập mờ có hàm thuộc dạng hình thang cân xác định trong khoảng độ
tuổi [30,60]. Logic mờ cho phép các tập này có thể xếp phủ lên nhau (chẳng hạn,
một người ở tuổi 58 có thể trực thuộc cả tập mờ “trung niên” lẫn tập mờ “già”, với
mức độ trực thuộc với mỗi tập là khác nhau). Hình 1.3 minh hoạ biến ngơn ngữ tuổi
đời định nghĩa bởi các giá trị ngôn ngữ thành phần là “rất trẻ”(very young),” trẻ”
(young),” trung niên” (Middle-aged),” già”(old) và “rất già” (very old).
Luận văn tốt nghiệp
17
Chương I: Tổng quan về hệ mờ
Hình 1.3: Các tập mờ điển hình dùng để định nghĩa biến ngôn ngữ tuổi đời
Một dạng suy rộng khác trong cơ sở tri thức của nhiều hệ mờ thực tiễn (ví dụ
trong các hệ điều khiển mờ) có thể được phát biểu như sau:
Cho x1 , x 2 ,..., x m là các biến vào của hệ thống, y là biến ra. Các tập
Aij , B j với i = 1, 2 ,..., m ,
j = 1,...., n là các tập mờ trong các không gian nền tương
ứng của các biến vào và các biến ra. R j là các suy diễn mờ (các luật mờ) dạng “ If
… then…”
R1 : If x1 is A1,1 and ... and x m is Am ,1 then y is B1
R2 : If x1 is A1, 2 and ... and x m is Am , 2 then y is B2
…..
Rn : If x1 is A1,n and ... and x m is Am ,n then y is Bn
Bài tốn:
Cho :
Tính :
If x1 is e1* and ... and x m is em*
Giá trị y is u *
Chúng ta có thể nhận thấy rằng cốt lõi của nhiều hệ mờ cho bởi cơ sở tri thức
dạng R = {các luật Ri} là các cơ chế suy diễn cài đặt trong mô tơ suy diễn.
1.3.2 Luật mờ IF-THEN
Luật mờ if-then hay trạng thái điều kiện mờ được diễn tả theo dạng IF A
THEN B ở đây A và B là các nhãn nếu các tập mờ đặc trưng bởi các hàm thuộc xấp
xỉ. Do đó, đây là dạng viết tắt của chúng, luật mờ if-then thường được dùng để diễn
Luận văn tốt nghiệp
18
Chương I: Tổng quan về hệ mờ
tả những lập luận mơ hồ và đưa ra những quyết định trong môi trường không chắc
chắn và mập mờ như khả năng suy luận của con người. Ví dụ:
If “chiều dài là lớn” then “diện tích là rộng”
Ở đây chiều dài và diện tích là các biến ngơn ngữ, lớn và rộng là các giá trị
ngôn ngữ hoặc nhãn được đặc trưng bởi hàm thuộc.
Một dạng khác của luật mờ if-then được Takagi và Sugenno đưa ra là các tập
mờ chỉ liên quan đến phần đầu (giả thiết). Bằng việc sử dụng luật mờ if-then của
Takagi và Sugeno, chúng ta có thể mơ tả một ví dụ sau:
ở đây high trong phần giả thiết là một nhãn ngôn ngữ đặc trưng bởi một hàm thuộc.
Tuy nhiên phần hậu luật được mơ tả một phương trình khơng mờ của biến đầu ra.
Cả hai loại luật mờ này đều được sử dụng rộng rãi trong các mơ hình và điều
khiển. Đây là thành phần chính trong các hệ suy diễn mờ sẽ được trình bày chi tiết
trong chương III của luận văn.
1.3.3 Giải mờ
Sau khi thực hiện xong việc tính giá trị luật hợp thành, chúng ta thu được kết
quả là tập mờ. Kết quả đó có nhiều lúc chưa phải là một giá trị thích hợp. Chẳng
hạn trong bài tốn điều khiển xe máy, tuy rằng đã xác định được kết quả của luật
điều khiển là một tập mờ nhưng ta vẫn không biết được phải điều chỉnh tay ga như
thế nào, nói cách khác ta vẫn chưa biết được phải quay tay ga một góc là bao nhiêu.
Cơng việc xác định một góc mở cụ thể, hay nói một cách tổng quát, việc xác
định một giá trị rõ y0 từ một tập mờ µ R ( y ) , được gọi là giải mờ. Giá trị rõ tìm được
có thể xem như "phần tử đại diện xứng đáng" cho tập mờ.
Căn cứ theo những quan điểm khác nhau về phần tử đại diện xứng đáng mà
ta sẽ có các phương pháp giải mờ khác nhau. Trong điều khiển người ta thường sử
dụng hai phương pháp giải mờ chính, đó là:
• Phương pháp điểm cực đại
• Phương pháp điểm trọng tâm
Luận văn tốt nghiệp
Chương I: Tổng quan về hệ mờ
19
a) Phương pháp điểm cực đại
Tư tưởng của phương pháp giải mờ này là tìm trong tập mờ có hàm thuộc
µ R ( y ) một phần tử y0 có độ thuộc lớn nhất, tức là:
y 0 = arg max µ R ( y )
(1.12)
µ
y
y0
Hình 1.4
Phương pháp giải mờ điểm cực đại
Trong trường hợp phương trình trên có vơ số nghiệm thì tuỳ theo người xử lý
sẽ có các cách giải quyết khác nhau
b) Phương pháp điểm trọng tâm
Phương pháp này sẽ cho ta kết quả y0 là hoành độ của điểm trọng tâm miền
được bao bởi trục hoành và đường µ R ( y ), tức là:
y0 =
∫ yµ
R
( y )dy
S
(1.13)
∫ µ R ( y)dy
S
Với S = supp µ R = { y : µ R ( y ) > 0} là giá của tập mờ R.
µ
y0
y
Hình 1.5 Phương pháp giải mờ điểm trọng tâm
Luận văn tốt nghiệp
20
Chương I: Tổng quan về hệ mờ
Trên đây chúng ta tập trung trình bày những khái niệm cơ bản và các cơng
thức tốn học của tập mờ làm cơ sở cho các nghiên cứu về lý thuyết khả năng, logic
mờ và lập luận xấp xỉ và các hệ điều khiển mờ, suy diễn mờ… Để có cơ sở lý
thuyết nhằm xây dựng hệ mờ suy diễn mờ trên cơ sở mạng thích nghi (ANFIS) là
trọng tâm chính của luận văn sẽ được đề cập chi tiết trong chương III. Trước tiên,
chúng ta sẽ tìm hiểu về hệ suy diễn mờ.
1.4 Hệ suy diễn mờ
Về tổng thể, mỗi hệ thống nói chung đều bao gồm các đầu vào (inputs), đầu
ra (output) cùng với bộ xử lý. Bộ xử lý thực chất là một ánh xạ phản ánh sự phụ
thuộc của biến đầu ra hệ thống với các biến đầu vào. Đối với hệ suy diễn mờ, các
yếu tố đầu vào nhận giá trị số rõ, còn đầu ra có thể là một tập mờ hoặc một giá trị rõ
[7], [10]. Quan hệ ánh xạ của đầu ra đối với các đầu vào của hệ suy diễn mờ được
mô tả bằng một tập luật mờ, thay vì một hàm số tường minh, cụ thể hơn, cấu trúc cơ
bản của một hệ suy diễn mờ gồm năm thành phần chủ đạo:
Hình 1.6: Hệ suy diễn mờ
Hệ suy diễn mờ cũng được xem như một hệ cơ sở luật mờ, mô hình mờ. Cơ
sở của hệ suy diễn mờ bao gồm năm khối chức năng được mơ tả như trong hình 1.6:
• Cơ sở luật (rule base) chứa các luật mờ if-then, thực chất là một tập
các phát biểu hay quy tắc mà con người có thể hiểu được, mơ tả hành
vi của hệ thống, chẳng hạn:
Luận văn tốt nghiệp
21
Chương I: Tổng quan về hệ mờ
“Nếu nhiệt độ là lạnh thì chỉnh nhiễu đầu ra lị sưởi là cao”
Các luật có thể đươc hình thành từ tri thức chuyên gia, con người
hoặc rút ra từ các mẫu thực nghiệm. Cơ sở luật là thành phần quan
trọng nhất của bất kỳ mơ hình mờ nào.
• Bộ tham số quy định hình dạng các hàm thuộc của giá trị ngôn ngữ
được dùng để biểu diễn biến mờ và các luật mờ. Giá trị các tham số có
thể được đánh giá bằng kinh nghiệm của các chuyên gia, con người
hay là kết quả của quá trình khai phá tri thức từ thực nghiệm. Thông
thường, cơ sở luật và bộ tham số mơ hình được gọi chung là cơ sở tri
thức.
•
Cơ chế suy diễn có nhiệm vụ thực hiện thủ tục suy diễn mờ dựa trên
cơ sở tri thức và các giá trị đầu vào để đưa ra một giá trị dự báo ở đầu
ra.
• Giao diện mờ hố thực hiện chuyển đổi các đầu vào rõ thành mức độ
trực thuộc các giá trị ngơn ngữ.
• Giao diện giải mờ thực hiện chuyển đổi kết quả suy diễn mờ thành
giá trị đầu ra rõ.
Thường các luật cơ sở và bộ tham số được kết hợp với nhau như là một cơ sở
tri thức.
Các bước của suy luận mờ được thực hiện bởi các hệ suy diễn mờ bao
gồm:
1. Mờ hoá - Các giá trị rõ đầu vào của hệ suy diễn mờ được dùng làm đối số
cho các hàm thuộc ứng với các giá trị ngôn ngữ tương ứng xuất hiện trong phần giả
thiết mỗi luật mờ if-then. Kết quả, hệ thu được độ thuộc của giá trị rõ đối với mỗi
giá trị ngôn ngữ (mà thực chất là một tập mờ) tương ứng trong phần giả thiết của
mỗi luật. Sau bước này, xét về mặt suy diễn mờ, hệ đã xác định được giá trị chân lý
của các tiên đề nằm trong phần giả thiết của mỗi luật (ứng với bộ số rõ cụ thể đầu
vào). Giá trị chân lý của toàn bộ phần giả thiết mỗi luật được xác định thông qua
phép hội mờ giữa giá trị chân lý của các tiên đề thành phần.
Luận văn tốt nghiệp
22
Chương I: Tổng quan về hệ mờ
2. Suy diễn- Giá trị chân lý của phần giả thiết của mỗi luật được áp dụng lên
phần kết luận của luật đó thơng qua phép kéo theo mờ. Theo đó, với mỗi luật, hệ
thu được ở phần kết luận một tập con mờ. Phép kéo theo mờ thông thường dựa trên
hai toán tử là Min hoặc Product. Khi suy diễn theo toán tử Min, tập mờ kết quả suy
diễn được hình thành từ hàm thuộc của giá trị ngơn ngữ phần kết luận bị cắt bởi một
đường ngang mà độ cao tương ứng với mức chân lý phần giả thiết. Trong khi đó,
với tốn tử Product, tập mờ kết luận suy diễn có hàm thuộc dựa trên hàm thuộc đầu
ra của kết luận được co giãn theo một tỉ lệ ứng với mức chân lý của phần giả thiết.
kÐo theo mờ
luật 1
x là A1
giá trị độ thuộc
w1
y là B1
luật 2
tập con mờ
tập con mờ
giá trị rõ
X
giá trị rõ
mờ hóa
x là A2
w2
y là B2
khử mờ
kết nhập
luật n
tập mờ tổng hợp
x là An
wn
y lµ Bn
tËp con mê
Hình 1.7: Sơ đồ hoạt động suy diễn của một hệ suy diễn mờ
3. Kết nhập - Tất cả các tập con tương ứng với đầu ra của mỗi luật được kết
hợp với nhau (thông qua phép hợp mờ) tạo thành một tập con mờ duy nhất biểu
diễn biến mờ đầu ra của cơ chế suy diễn. Q trình tính tốn kết nhập thơng thường
dựa trên hai toán tử là Max và Sum. Với Max, tập mờ tổng hợp đầu ra có giá trị
hàm thuộc tại mỗi điểm trên tập nền bằng giá trị hàm thuộc lớn nhất của tất cả các
tập con mờ tương ứng ở đầu ra mỗi luật tại điểm đó. Trong khi đó, với Sum, tập mờ
tổng hợp đầu ra có giá trị hàm thuộc tại mỗi điểm trên tập nền bằng tổng giá trị hàm
thuộc của tất cả các tập con mờ tương ứng ở đầu ra mỗi luật tại điểm đó.
Y
Luận văn tốt nghiệp
23
Chương I: Tổng quan về hệ mờ
Hình 1.8 minh hoạ quy trình suy diễn của một hệ mờ với hai luật điển hình
với một đầu ra z và chịu tác động của hai đầu ra rõ x và y với phép kéo theo mờ
Min và phép hợp mờ Max.
Hình 1.8: Hệ suy diễn mờ điển hình sử dụng min và max lần lượt cho các phép toán AND
và OR mờ
4. Khử mờ - Công đoạn này là tuỳ chọn và được sử dụng khi cần chuyển đổi
giá trị biến ngôn ngữ đầu ra thành một giá trị số rõ (điều này thường gặp với các mơ
hình hệ thống điều khiển). Có rất nhiều kỹ thuật khử mờ nhưng phổ biến được sử
dụng là phương pháp xác định điểm trọng tâm và phương pháp xác định vùng cực
đại (đã được trình bày ở phần trên). Ở phương pháp điểm trọng tâm, giá trị rõ của
biến đầu ra được tính tốn bằng cách tìm giá trị trọng tâm hàm thuộc của giá trị mờ.
Cịn đối với phương pháp tìm điểm cực đại, giá trị rõ được chọn là giá trị mà tại đó
tập con mờ đạt giá trị chân lý cực đại. Nói chung, các phương pháp khử mờ này địi
hỏi nhiều chi phí tính tốn và khơng có cách nào để phân tích chúng một cách chính
xác ngoại trừ việc thông qua các nghiên cứu thực nghiệm.
Dựa trên loại cơ chế suy diễn và các dạng luật mờ được sử dụng, phần lớn
các hệ suy diễn mờ có thể được chia thành ba loại sau: