ĐẠI HỌC QUỐC GIA HÀ NỘI
■ • ■
TRƯỜNG ĐẠI HỌC KHOA HỌC Tự NHIÊN
TÊN ĐỂ TÀI
HỆ THỐNG TRỢ GIÚP QUYẾT ĐỊNH
■ ■ ■
TRONG CÔNG TÁC ĐÀO TẠO
■
MÃ SÔ : QG-03-01
CHỦ TRÌ ĐỂ TÀI : PGS. TS. Đ ỗ TRUNG TUẤN
HÀ NỘI, 2005
ĐẠI HỌC QUỐC GIA HÀ NỘI
■ ■ ■
TRƯỜNG ĐẠI HỌC KHOA HỌC Tự NHIÉN
HỆ THỐNG TRỢ GIÚP QUYẾT ĐỊNH
■ ■ ■
TRONG CÕNG TÁC ĐÀO TẠO
■
MÃ SÔ : QG-03-01
CHỦ TRÌ ĐỂ TÀI : PGS. TS. Đ ỗ TRUNG TUẤN
THAM GIA ĐỂ TÀI :
• Ths. Vũ Văn Tới, Bộ Công an
• Vũ Văn Nam, Trường Công nghệ, Đại học Quốc gia Hà nội
• Lê Thị Yên, Trường đại học dân lập Đông đô
• Nguyền Văn Đỏng, Ban chỉ huy quán sự, quân khu 3
• Ths. Dương Anh Tuấn, trường Đại học Khoa học Tự nhiên, Đại học
Quốc gia Hà nội
• Ths. Lương Xuân Cương, Học viện kĩ thuật quán sự
r ữAl HGC QUOC GIA HÀ NÔĨ
WUNG TÂM t h c n g jin thư viên
Lpĩ/ 3 ^ 4
HÀ NỘI, 2005
QG-03-01. Trang 2
LỜI CÁM ƠN
Đê tài QG-03-01 hệ thống trợ giúp quyết định trong công tác đào tạo được sự hồ
trợ nhiêu của Ban khoa học công nghệ, Đại học Quốc gia Hà nội, quản lí phòng khoa
học, trường Đại học Khoa học Tự nhiên và các đơn vị quân lí trong công tác nghiên
cứu tài liệu, thực nghiệm phần mém.
Trong báo cáo này, xin chán thành cám ơn
■ Ban Khao học công nghệ, Đại học Quốc gia Hà nội đã cho phép đề tài triển
khai,
■ Khoa Toán Cơ Tin học đã tạo điều kiện để đê tài được thực hiện,
■ Phòng Khoa học công nghệ, phòng tài vụ, trường Đại học Khoa học Tự nhiên,
đã giúp dỡ dê tài trong việc hoàn thành các thủ tục kết thúc đê tài.
■ Các cán bộ khoa học và các học viên, sinh viên công nghệ thõng tin, đã cùng
thực hiện và đóng góp vào kết quả của đẻ tài.
BÁO CÁO TÓM TẮT VỀ ĐỂ TÀI
TÊN ĐỂ TÀI
Hệ ihống trợ giúp quyết định trong công tác đào tạo
CHỦ TRÌ ĐỂ TÀI
PGS. TS. Đỗ Trung Tuấn, trường Đại học Khoa học Tự nhiên, Đại học Quốc gia
Hà nội
CÁC CÁN BỘ THAM GIA
• Ths. Vũ Văn Tới, Bộ Công an
• Vũ Văn Nam, Trường Công nghệ, Đại học Quốc gia Hà nội
• Lê Thị Yên, Trường đại học dán lập Đóng đô
• Nguyễn Văn Đóng, Ban chỉ huy quân sự, quân khu 3
• Ths. Dương Anh Tuấn, trường Đại học Khoa học Tự nhiên, Đại học
Quốc gia Hà nội
MỤC TIÊU VÀ NỘI DUNG NGHIÊN c ứ u
Mục tiêu : nghiên cứu về phương pháp và qui trình xây dựng hệ thống trợ giúp
quyết định, cho phép dùng trong công tác đánh giá kết quả học tập.
Nội dung :
1. Nghiên cứu về dữ liệu không chắc chắn, xử lí thông tin không chắc chắn,
nhầm áp dụng trong hệ thống trợ giúp quyết định;
2. Tổng thuật các vấn đe liên quan đến xây dựng hệ thống trợ giúp quyết
định, nhằm cung cấp tài liệu cho sinh viên đại học, học viên cao học trong
việc tham khảo, phát triển hệ thống;
3. Xây dựng phấn mềm thử nghiệm về hệ thống trợ giúp quyết định.
CÁC KẾT QUẢ ĐẠT ĐƯỢC
Đé tài đã thực hiện các nội dung dăng kí, với các kết quả sau
2G-03-0I. Trang 3
• Các kết quả nghiên cứu được thể hiện dưới dạng các bài trinh bày trong
sinh hoạt khoa học của đề tài. Tài liệu về “lí thuyết chắc chắn” được sử
dụng như tài liệu tham chiếu, huấn luyện;
• Bài báo đãng tạp chí:
• Bài báo tham gia Hội thảo về công nghệ thông tin :
• Bài báo tham gia Hội nghị khoa học :
• Các luận văn tốt nghiệp cao học về công nghệ thông tin :
• Các luận vãn tốt nghiệp đại học và các bài tập lớn về công nghệ thông tin :
• Tài liệu “Hệ thống trợ giúp quyết định” dùng trong công tác dẩo tạo bặc
đại học và sau đại học về công nghệ thông tin.
• Phần mềm Irợ giúp quyết định trong công tác quản lí điểm sinh viên, phần
mềm được viết trên nền VISUAL BASIC, truy cập cơ sở dữ liệu với hệ
quản trị SQL SERVER.
KINH PHÍ ĐỂ TÀI
Đề tài được cấp kinh phí hai năm, 2002- 2004, mỗi năm 30 triệu đồng; tổng cộng
60 triệu dồng.
Đề tài đã thực hiện các thủ tục thanh quyết toán tài chính tại trường Đại học Khoa
học Tự nhiên.
KHOA OUẢN LÍ
Chủ nhiêm Khoa Toán Cơ Tin học
CHÚ TRÌ ĐỂ TÀI
Đỗ Trung Tuấn
ABSTRACT
PROJECT
Decision Support System for training purpose
MANAGER
Do Trung Tuan, Ass. Prof., PhD.
MEMBERS
• Vu Van Toi, MA.;
• Vu Van Nam, Eng.;
• Le Thi Yen, Eng.;
• Nguyen Van Dong, Eng.,
• Duong Anh Tuan, MA.
• Luong Xuan Cuong, MA.
PROJECT OBJECTIF AND CONTENT
• Objectif : propose research results, methodology and procedure allowing
building a decision support systems for training puipose, particularly for
evaluating to student capacities.
• Content:
• Research on un-certaint data, manipulating un-certaint information
using in a decision support system;
■ Summary about aspects concerning decision support systems; a
material for information technology students at the under-graduated
and graduated level;
■ Software for practicing a decision support system.
RESULTS
The project achieved some rulsults as followings :
■ Reports in scientific seminar. The “certaint theory” is using as training
document, reference material;
è tài QG -03-01. Trang 5
Articles published in journals;
Reports in information technology conferences in Vietnam;
Master thesis on information technology;
Bachelor thesis on information technology and reports of students;
Training course “Decision support systems” for under-graduated and
graduated level;
Software for training support. The software is based on VISUAL BASIC and
access to database management system SQL SERVER.
MỤC LỤC
Lời giới thiệu 8
Tài liệu 1 .Tiếp cận Bayes đối với lập luận không chính xác 9
Tài liệu 2. Lí thuyết chắc chắn 26
Các bài dăng tại tạp chí, hội thảo khoa học 44
Các luận vãn tốt nghiệp 45
Tài liệu về hệ thống trợ giúp quyết định 46
Phần mồm trợ giúp quyết định. Các trang màn hình và cấu trúc bảng 58
Kết luận 71
Tài liệu tham khảo 72
Phụ lục 73
Tóm tắt công trình của chủ nhiệm đề tài 89
Scientific project 90
Phiếu đãng kí kết quả khoa học-công nghệ 91
li QG-03-01. Trang 7
LỜI GIỚI THIỆU
Đề tài cấp Đại học Quốc gia Hà nội, mã số QG-03-01 có mục đích nghiên cứu
một số phương pháp xử lí dữ liệu sử dụng trong hệ thống trợ giúp quyết định. Việc xử lí
dữ liệu không đầy đủ, không chăc chắn thường gặp trong các bài toán thực tế, đặc biệt
trong các bài toán quản lí, cần ra các quyết định dựa vào dữ liệu định lượng lẫn dữ liệu
định tính.
Trong các năm qua, việc nghiên cứu về hệ thống trợ giúp quyết định đã được triển
khai ở mức sinh hoạt khoa học, giảng dạy tại bậc cao học về công nghệ thông tin, và ứng
dụng trong các hệ thống loại nhỏ. Hệ thống trợ giúp quyết định thường được bao gồm đủ
các thành phẩn về quản lí giao diện người dùng, quản trị dữ liệu và tri thức, và quản trị mô
hình. Việc nhận xct và ứng dụng hệ thống loại này đòi hỏi kiến thức cả về xử lí dữ liệu lẫn
xử lí tri thức. Đôi khi hệ thống trở nên phức tạp như hệ chuyên gia.
Đề tài QG-03-01 tiếp tục nghiên cứu về hệ thống trợ giúp quyết định, tập trung
vào việc xử lí dữ liệu không chắc chắn, thử nghiệm hệ thống trợ giúp quyết định trong
cổng tác quản lí đào tạo và chuẩn bị giáo trình phục vụ đào tạo bậc đại học và cao học
ngành công nghệ thông tin.
Các kết quả đạt được của đề tài là
• Bài viết về lí thuyết chắc chắn;
• Một số bài nghiên cứu trình bày tại hội thảo khoa học, dăng tạp chí khoa học;
• Tài liệu dùng cho công tác đào tạo;
• Phần mềm trợ giúp quyết định trong công tác quản lí đào tạo.
ìi QG-03-01. Trang 8
TÀI LIỆU 1.
TIẾP CẬN BAYES ĐỐI VỚI LẬP LUẬN KHÔNG CHÍNH XÁC
Phần này đề cập tiếp cận Bayes đối với lập luận không chính xác. Phần đầu là các
nguyên tắc cơ bản của lí thuyết xác suất để giới thiệu định lí Bayes. Phần tiếp theo hỗ trợ
người phát triển hệ chuyên gia theo tiếp cận Bayes để quản lý tốt hơn các vấn đề của thế
giới thực. Các trợ giúp xuất hiện trong một vài hệ thống, chảng hạn trong hệ chuyên gia
PROSPECTOR. Phần cuối giới thiệu các đặc tính cần thiết cần trang bị để sử dụng hiệu
quả kĩ thuật Bayes trong các hệ chuyên gia.
I. LÍ THUYẾT XÁC SUẤT
Thông tin không chính xác là đối tượng của lí thuyết xác suất. Xác suất là tiếp cận
toán học dể xử lý thông tin không chắc chắn, có nguồn gốc từ các trò cá cược từ thế kỉ 17.
Năm 1654 Pascal và Fermat đã phát triển lí thuyết xác suất cổ điển để rút ra phép suy
luận số học từ các dữ liệu.
Lí thuyết xác suất giả sử có số p(E) gọi là xác suất, là khả năng xảy ra sự kiện E
trong số các thực nghiệm ngẫu nhiên. Đó là khi với số lần thử khá lớn thì tỉ lệ số lẩn xảy
ra E xấp xỉ bằng p(E). Tập tất củ các dầu ra có thể có của thực nghiệm được gọi là không
gian mẫu, kí hiệu là s.
1.1. Không gian m ẩu rời rạc
Nhiều thực nghiệm có kết quả ra rời rạc. Chảng hạn với việc gieo súc sắc thì s =
11, 2, 3, 4, 5, 6). Mỗi sự kiện trong s là kết quả mà phép thử có thể nhận được. Nếu sau N
lần thử, sự kiện E xảy ra W(E) thì p(E) = W(E)/ N. Hình thức hơn, khi số lần xuất hiện E
là f(E) thì p(E) = limN_>oof(E)/ N.
' f(E) là tần số xuất hiện của sự kiện E đối với N xuất hiện quan sát được. Loại xác
suất này được biết như là xác suất sau (posteriori probability), có nghĩa ”sau sự kiện”.
Xác suất là số đoán khả năng có thể xảy ra của sự kiện; nó tuân theo ràng buộc
sau :
0 < p(E) < 1,
1 p(E,) = 1 với i = l n và n là tất cả các sự kiện.
p(E) + p(~E) = 1, trong đó ~E là sự kiện không là E, là phần bù của E.
1.2. Không gian m ẫu liên tục
G-03-01. Trang 9
Khi các sự kiện hay các phương án có giá trị khoảng chứ không rời rạc, người ta
dùng hàm phân bố xác suất. Chẳng hạn hàm phân bố tần suất về độ cao. Hàm này được
dùng để dự đoán khả năng xảy ra của việc chọn ngẫu nhiên một người có độ cao cần thiết
trong một đám người. Xác suất chọn được người cao lm70 là p(lm70) = 0.25.
Hình. Phân bố tần suất về chiều cao
Người ta thường muốn hỏi câu hỏi phức tạp hơn về khả năng của tình trạng tham
gia vào nhiều phân bố. Chảng hạn khả nãng chọn được người cao lm70 và nặng 80 cân.
Đổ trả lời, người ta cần dùng các luật cơ bản về các phép toán xác suất.
1.3. Các xác suất tổ hợp
Thực tế cho thấy có nhiều tình trạng là tổ hợp của nhiều sự kiện. Chảng hạn người
ta muốn biết xác suất xảy ra hai suy luận khác nhau.
1.3.1. Phép giao
. Đối với vấn đề liên quan đến nhiều sự kiện, người ta xét giao của không gian mẫu.
Chẳng hạn xác suất xảy ra của hai sự kiện A và B độc lập là p(A và B) được tính theo :
p(AnB) = <số các phấn tử trong s dùng chung cho A và B> / <số các phần tử của
s> = P(A) * P(B).
Thí dụ
Trong trò tung súc sắc, nếu A = {1, 3, 5}, B = {3, 6} thì AnB = {3}. Không gian mẫu s = {1,
2, 3, 4, 5, 6}. Các xác suất riêng cho A, cho B là
p(A) = n(A)/ n(S) = 1/ 2;
p(B) = n(B)/ n(S) = 1/ 3, trong đó n(X) là sô’phẩn tử của X.
Một mặt p(AnB) - n(AnB)/ n(S) = 1/ 6, mặt khác p(A) * p(B) = 1/ 2 * 1/ 3 = 1/ 6.
QG-03-01. Trang 1 0
1.3.2. Phép hơp
Khi cân biêt khả năng xảy ra một hay nhiều sự kiện, người ta dùng xác suất xảy ra A
hoặc B, kí hiệu là p(A^B). Nó được tính theo công thức
p(AuB) = p(A) + p(B) - p(AnB)
Chảng hạn theo như thí dụ trên thì:
AuB = {1, 3, 5, 6} và p(AuB) = p(A) + p(B) - p(AnB) = 2/ 3.
I.4. Các xác suất có điểu kiện
Các sự kiện vừa nêu là độc lập, tức việc xảy ra sự kiện này không tác dộng đến
việc xảy ra sự kiện kia. Chảng hạn việc có các con súc sắc lẻ không tác động đến việc có
con súc sắc chia hết cho 3. Trong thực nghiệm khác, khi việc xảy ra sự kiện này gây ảnh
hưởng đến việc xảy ra của sự kiện kia thì chúng phụ thuộc, tức là các sự kiện loại trừ lẫn
nhau. Xác suấl xảy ra A khi B đã xảy ra được gọi là xác suất có diều kiện p(AIB) =
p(AnB)/ p(B).
Thí dụ
Xác suất xảy ra sự kiện A, tức gieo được mặt 3 của súc sắc là p({3}) = 1/ 6.
Tuy nhiên nếu đã gieo được mặt chia hết cho 3, tức đã có sự kiện B = {3, 6} thi xác
suất chỉ là 1/ 2
P(A I B) = [n(AnB)/ n(S)] / [n(B)/ n(S)] = n(AnB)/ n(B) = (1/ 6) / (2/ 6) = 1/ 2
II. LÍ THUYẾT BAYES
Xác suất p(AIB) cho người ta khả năng về sự kiện A khi sự kiện B dã xảy ra. Xác
suất này được xem như xác suất sau. Chẳng hạn người ta quan sát tinh trạng hỏng hóc
máy A và chẩn đoán lại liên quan đến sự kiện B xảy ra trước đó. Vấn đề bây giờ là liệu có
thể biết được khả nãng A đó nếu B sẽ xảy ra sau.
II.l. Đ ịnh lí Bayes
Định lí Bayes giải quyết câu hỏi nêu trên, do nhà toán học thế kỉ 18 Thomas Bayes
đưa ra. Định lí cho biết xác suất về giả thuyết H khi đã có sự kiện E.
p(HIE) = (p(H)*p(EIH)) / p(E),
trong dó p(H) là xác suất để H là đúng, p(HIE) là xác suất đế H đúng khi đã có E,
P(EIH) là xác suất thấy E khi H đúng, và p(E) là xác suất xảy ra E.
Riêng về p(E), người ta thày nó bằng tổng cùa xác suất khi giả thuyết H là đúng
và khi H là không đúng, lức là p(E) = p(EIH) + p(EI~H).
tài QG-03-01. Trang 11
Khi thiết kế hệ chuyên gia, người ta thể hiện định lí Bayes thông qua cấu trúc của
luật IF E THEN H. Định lí xác suất có thể được dùng để cung cấp xác suất về giả thuyết
H khi có sự kiện E. Định lí này cũng được dùng để quản lí xâu suy diễn có dạng :
IF X THEN E -» IF E THEN H
Người ta có thể dùng định lí Bayes dưới dạng xác suất phủ định H, tức là p(~HIE).
p(~HIE) = (p(~H)*p(EI~H))/p(E)
và tính được tỉ lệ giữa khả năng ủng hộ giả thuyết và khả nãng phủ định giả thuyết
khi có sự kiện E :
P(HIE)/ P(HIE) = (P(H) * P(EIH)) / (p(~H) * p(EI~H))
II.2. Thí dụ
Khi đau ngực, người ta thường đi điện tám đồ. Kết quả xét nghiệm được phân
thành hai loại là dương tính (d) ứng với việc đau tim (+t) hoặc âm tính (a) ứng với việc
không dau tim (-t). Trong trường hợp này người ta không quan tâm đến xác suất sau là
p(dl+t).
Giả sử ông Mỗ có kết quả dương tính và muốn biết khả năng tim đau, tức p(+tld).
Chảng hạn có các mẫu về đau ngực :
• p(+t) = 0.1; 10 người trên 100 ngưòi bị đau tim.
• p(-t) = 0.9; 90 người trên 100 không bị đau. p(+t) = 1 - p(-t)
• p(d I +t) = 0.9; trong số 100 người đau tim có 90 có kết quả dương tính
trên điện tâm đồ.
• p(a I -t) = 0.95; trong sô’ 100 người lành có 95 có kỏt quả âm tính.
• p(d I -t) = 1 - p(a I -t).
. Do đó p(+t I d) = (0.9*0.1)/ (0.9*0.1 + 0.05*0.9) = 0.67
III. CÁC BIẾN THỂ CỦA ĐỊNH LÍ BAYES
Trong các ứng dụng của hệ chuyên gia, những người phát triển hệ thống dùng một
biến thể của định lí Bayes. Người ta đưa ra hai thuật ngữ mới, là thuận trước (prior odds)
của H và thuận sau (posterior odds) của H.
O(H) = p(H)/ p(~H) = p(H)/ (1 - p(H));
0(H I E) = p(H I E)/ p(~H I E) = p(H I E)/ (1 - p(H I E))
III.1. Khả năng đủ
ài QG-03-01. Trang 1 2
Người ta dùng khái niệm khả năng đủ để xảy ra, hay gọi là khả năng đù LS
(likelihood of sufficiency) trợ giúp cho giả thuyết H khi có sự kiện E. LS được gọi là khả
năng đủ bởi lẽ giá trị của nó cho biết cẩn cố gắng để tin vào giả thuyết H ra sao để thấy
được sự kiện E.
LS = P(EIH) / p(EI~H)
Do p(~HIE) = (p(~H) * p(EI~H)) / p(E) nên từ đảng thức trên suy được O(HIE) =
LS * 0(H). Biểu thức này được gọi là dạng khả năng thuận lợi của định lí Baves. Nếu LS
lớn thì nó sẽ chuyển thuận trước trên H, tức 0(H) sang giá trị lớn của thuận sau trên H,
tức O(HIE). Thực tế thì khi LS tiến đến vô hạn, O(HIE) cũng tiến đến vô hạn; và do
O(HIE) = p(HIE)/ p(~HIE) = P(HIE)/ (1 - p(HIE)) nên :
p(H I E) = 1 và p(~H I E) = 0.
LS có thể được khai triển :
LS = 0(H I E)/ 0(H) = p(E I H)/ p(E I ~H) = (p(H I E)/ p(~H I E)) / (p(H)/ p(~H))
111.2. Khả năng cần thiết
Người ta gọi LN (likelihood of necessity) là khá năng cần thiết, cho phép do sự
không till vào giả thuyết H nếu không có sự kiện E. Nó dược gọi như vậy do giá trị của nó
thể hiện sự cố gắng đế phát hiện sự kiện vắng mật.
LN = 0(HI~E)/ 0(H) = p(~EIH)/ p(~EI~H) = (p(HI~E)/ p(~HI~E))/ p(H)/ p(~H))
Hay 0(HI~E) = LN * 0(H).
Nếu LN = 0 thì p(HI~E) = 0, có nghĩa H cần sai khi ~E đúng. Nếu không có E thì
cắn kết luận rằng H là sai, hay nói khác “E là cần thiết cho H”.
111.3. Cấu trúc của luật
Dùng LS và LN người ta có thể phát triển các luật IF E THEN H (LS, LN). Luật
này cho rằng sự kiện E giả thiết có giả thuyết H với độ xác định theo nhân tố LS và LN.
Cá hai nhân tố đéu do các chuyên gia cung cấp, dùns để tính thuận sau cho giả thuyết
O(HIE). Chúng đéu lấy các giá trị trong khoảng (0, co).
Giá tri
Tác dộng lên già thuyết
Giá trị Túc động lén già thuyết
ị
của LS
của LN
-
-
.
-
-
—
-
-
1
li QG-03-01. Trang 13
0
H là sai khi E đúng, hay
~E là cần thiết để kết luận
H
0
H là sai khi vắng E, hay E là cần
thiết để kết luận H
Nhỏ
E không thuận lợi để kết
luận H
Nhỏ
~E không thuận lợi để kết luận
H
1
E không ảnh hưởng đối với
việc kết luận H
1
Việc vắng E không tác động lên
H
Lớn
E thuân lơi để kết luân H
Lớn
Vắng E là thuận lợi cho H
Về logic thì E đủ cho H,
hay việc thấy sự kiện E có
nghĩa H cần phải đúng
00
Vế logic, vắng E là đủ đổ kết
luận H
Hình. Tác động của LS và LN lên giả thuyết
Hai đảng thức vé LS và LN tuân theo các ràng bưộc sau :
• khi LS>1 thì LN<1;
• khi LS<1 thì LN>1;
• khi LS = 1 thì LN = 1.
Tuy các điều kiện này thể hiện ràng buộc toán học nhưng không dùng trong nhiểu bài
toán thực tế. Chảng hạn chuyên gia có thổ nói rằng có vài sự kiện quan trọng, dó là LS>1,
nhưng vắng sự kiện đó không quan trọng, tức LN = 1.
III.4. Không chắc chắn vể sự kiện hiến nhiên
Trong cấu trúc IF E THEN H (LS, LN), người ta dùng p(E) để chỉ xác suất xảy ra
E để hỗ trợ giả thuyết H. Việc thiết lập p(E) có thể khó khăn dối với nhiều bài toán, bởi
người dùng không biết chắc chắn về sự kiện hiển nhiên E, hay dấu hiệu E.
Tổng quát hơn, người ta có thể nói rằng dấu hiệu E phụ thuộc vào E', là điều hiển
nhiên quan sát. Điều này được thể hiện qua p(EIE’). Nhân tố E’ thể hiện sự tin tưởng về E.
Nếu người ta biết về E đầy đủ thì E = E’ và p(EIE’) = p(E).
N(iười ta có thể bổ sung vào xác suất một kháng định vé độ không chắc chán của
sự kiện hiên nhiên. Với E’ là sự kiện tin cậy thì
p(HIE’) = p(HIE)*p(EIE’) + p(HI~E)*p(~EIE’).
Đán” thức này chính xác hóa tiếp cận Baycs thuán tuý và cho phép thiết lặp các
quan hệ sau :
>c tài QG-03-01. Trang 14
IF p(E I E’) = p(E) THEN p(H I E’) = p(H)
IF E là đúng THEN p(E IE’) = 1 AND p(H I E’) = p(H I E)
IF E là sai THEN p(~E I E’) = 1 AND p(H I E’) = p(H I ~E)
Các quan hệ này xác định quan hệ tuyến tính giữa p(HIE’) đối với p(EIE’).
Biểu thức về p(HIE’) vừa nêu xảy ra đối với bài toán thực khi p(EIE’) = p(E), lúc
dấu hiệu E’ hỗ trợ toàn bộ cho E. Biểu thức được viết lại là
p(H I E’) = p(H I E)*p(E) + p(H I ~E)*p(~E) (a),
hay p(H I E’) = p(H) (b).
Đôi với vài bài toán, chuyên gia có thổ nói một vài sự kiện là quan trọng, tức LS>1,
nhưng việc nó vắng cũng không quan trọng, tức LN = 1, tức vi phạm các quan hệ giữa hai
nhân tô" này.
Hinh. Quan hệ Bayes giữa p(HIE’) và p(EIE’)
Nếu LS>1 và LN = 1 thì từ biểu thức định nghĩa LN có 0(H I ~E) = LN*0(H) = O(H). Do
biểu thức định nghĩa của 0(H), 0(H) = p(H)/ (l-p(H)) nên p(H I E’) = p(H). Dùng biểu thức
này trong biểu thức (a) :
p(H I E’) = p(H I E)*p(E) + p(H I ~E)*p(~E)
= p(H I E)*p(E) + p(H I ~E)*(1 - p(E))
• = p(H) + p(H I E)*p(E) - p(H)*p(E)
Do LS >1 nên 0(HIE)> 0(H), hay p(HIE) > p(H). Do vậy trong biểu thức vừa viết
cần có p(HIE)*p(E) - p(H)*p(E) >0 và cũng trên bieu thức này với LS>1 và LN = 1 có thể
rút ra p(HIE’) > p(H). Điểu này trái với (b) là p(HIE’) = p(H). Theo điều kiện này (tức xác
suất sau của H theo dấu hiệu E’ lớn boll giá trị cấn có) và để thuận với quan hệ cứng nhắc
giữa LS và LN, chuyên gia cần theo mô hình Bayes chính xác. Người ta cần bổ sung tiếp
cận Baycs thuần tuý để xử lý được các vấn đổ trong thế giới thực.
Bổ sung cho tính /ỉ/lông chắc chan
Để giải quyết vấn để không bổn vững của quan hệ giữa LS và LN, năm 1976 Dudu
đã dề ra phương pháp liên quan đến giả thiốt phu. Già thiết thêm rằng p(HIE’) và p(EIE’)
lài QG-03-01. Trang 15
tuyên tính từng đoạn. Tiếp cận này không tuân theo lí thuyết xác suất truyền thông, nhưng
đã ứng dụng tốt cho hệ chuyên gia PROSPECTOR.
Hình. Hàm từng đoạn đối với sự kiện hiển nhiên riêng
Hàm p(HIE’) được chia thành hai hàm đơn giản là tiện cho xử lý và tránh được vấn
đề đã đề cập.
• ĐỐI với 0 < p(E I E’) < p(E) thì p(H I E’) = p(H I ~E) + (p(E I E’)/ p(E)) * (p(H) -p(H I ~E)).
. Còn p(E) < p(E I E’) < 1 thì p(H I E’) = [(p(H) - p(H I E)*p(E))/ (1- p(E))] + [p(E I E’) *
(p(H|E)-p(H))/(l-p(E)].
Hai biểu thức này đảm bảo khi LS>1 và LN = 1 thì p(HIE’) van giữ nguyên nếu
p(EIE’) < p(E) và tăng nếu p(EIE’) > p(E).
IV. HỆ CHUYÊN GIA PROSPECTOR
PROSPECTOR, do Duda đưa ra 1979 là một trong những ứng dụng hệ chuyên gia
được biết, đã ra quyết định theo lí thuyết Baves. Hệ chưyên gia này trợ giúp các nhà địa
chất trong việc khai thác một số loại mỏ. Hệ thống đã mã hóa các tri thức chuyên gia của
các nhà địa chất về các mỏ khác nhau vào mô hình để xác dịnh khả năng có mỏ tại một
vài nơi theo các quan sát. Hệ chuyên gia cũns trợ giúp trong việc xác định khoan thăm
dò.
IV. 1. Mạng suy luận PROSPECTOR
Mỗi mỏ hình xử lý tri thức được thể hiện trong hộ thống PROSPECTOR theo một
mạng suy luận riêng. Mỗi mạng là tập các nút ứng với giả thuyết hay sự kiện hiển nhiên,
dược liên kết bàng quan hệ không chắc chắn. Một nút sơ khới, hay nút mang các thõng tin
do tương tác với người dùng curm cấp, thổ hiện dấu hiệu mà người dùng nhập vào. Chảng
hạn “tin cậy bao nhiên về khả năng có chất X tại via đất Y ?”. Thõng tin của các nút này
lại được dùng dè’ xác định độ tin cậy của các nút trung gian khác.
Đồ tài QG-03-01. Trang 1 6
Hình. Mạng suy luận PROSPECTOR
rv.2. Các luật PROSPECTOR
Trong mạng của hệ thống PROSPECTOR có các liên kết với LS và LN. Quan hệ
liên kết dược cấu trúc theo luật IF E THEN H (LS, LN). Thuật ngữ E ứng với nút thể hiện
dấu hiệu và được nối với nút H ứng với giả thuyết. Liên kết này là không chắc chắn và
được diễn tả bằng LS và LN. Các chuyên gia địa chất curm cấp thõng tin về các nút trong
mạng. Theo như trong hình thì người ta đã dùng các luật:
IF kết cấu vỉa là aplitic THEN vỉa là thuận lợi dối với loại mỏ porphyry [68, 0.2],
xác suất trước p(E) = 0.001, p(H) = 0.002.
Nếu E là núl sơ khởi thì người dùng cung cấp dộ tin cậy vào E. Giá trị này dùng
đế xác định giá trị liên kết LS và LN, cũng như để tạo mức tin cậy vào két luận. Mức độ
tin cậy về giả thuyết H lại dưọc dùng với các thông till tại các nút khác để xác dinh mức
dộ tin cậy của các nút trung gian, tlico cơ chế truyền trong toàn mạng.
tài QG-03-01. Trang 1 7
ĐAI HGC e
11- MA Nc
TiVjhG TÁM \rjĨHƯvtFN
'.r
pT
/ 3 4
Ỷ
PROSPECTOR dùng tiếp cận Bayes để truyền xác suất trong mạng suy luận. Hình
dạng của mạng do các nhà địa chất thiết lập.
IV.3. Các luật nhiều giả thiết
Khi xác định xác suất gắn với một nút, mạng đã dùng thông tin từ nhiều nút. Thực
ra phải khẳng định từ trước về tính độc lập có điều kiện của các thông tin này. Đày là
cách đơn giản cho phép tính xác suất sau của giả thuyết. Nếu ghép các thõng tin tại các
nút, người ta thu được một giả thiết chung, gộp của các giả thiết do thông tin tại các nút
cung cấp. Khi gộp, người ta có thể thực hiện Ihco chuẩn AND hoặc chuẩn OR.
IV.3.1. Các luât theo chuẩn AND
Dạng chung của chuẩn AND đối với các luật là IF E, AND E2 AND En THEN
H. Vậy để kết luận được H thì các dấu hiệu E, phải đúng. Mỗi E, lại dựa vào dấu hiệu E'j.
Đổ lan truyền xác suất trong mạng, nhóm PROSPECTOR dùng xấp xỉ mờ p(EIE’)
= mill{pCE.IE'i)}. Khi tính được giá trị này, người ta tính p(HIE’). Tiếp cận này là đơn
giản. Tuy nhiên nó có nhược điểm là không thể hiện được tính nhạy cảm cùa p(EIE’) đối
với các thay đổi của p(E,IE'i), trừ trường hợp dối với E, đạt min.
IV.3.2. Các luât theo chuân OR
Dạng chung của luật theo chuẩn OR là IF E, OR E2 OR En THEN H. Người ta
lại dùng xấp xỉ mờ p(EIE’) = max{p(E,IE'1)}. Ưu nhược diem trong việc sử dụng các luật
theo chuẩn OR này cũng như ưu nhược điểm theo chuẩn AND.
IV.4. Cập nh ật các điểu thuận
PROSPECTOR thay đổi điều thuận của giả thuyết mỗi khi có dấu hiệu được bổ
sung vào hệ thống. Đối với trường hợp dùng luật một giả thiết, điều thuận đối với H trước
E’ được tính là O(HIE’) = p(HIE’)/ (l-p(HIE’)).
Giả sử các E, là độc lập điều kiện thì trong trường hợp dùng luật đa giả thiết người
ta có 0(HIE',, E'j,— E'n) = n LS, * O(H), i = l n. LS, ờ đây là tỉ lệ xảy ra khả năng đúng
LS'j = O(HIE’)/ 0(H) = P(E,IH) / p(E,l~H).
Tương tự, nếu tất cả dấu hiệu dùng cho H là sai thì
0(HI~E'„ ~E'2,.~ ~E'n) = n LN, * 0(H), i = l n, và
LN', = 0(H I ~E',)/ 0(H) = p(~E, I H) / p(~E, I ~H).
IV.5. Dộ do chắc chắn
lài QG-03-01. Trang 1 8
PROSPECTOR cho phép người ta nhập độ tin cậy về các phần sự kiện hiển nhiên.
Thay vì p(EIE’), người ta đưa ra thuật ngữ độ đo chắc chán c(EIE’). Lí do chỉ mang nghĩa
tám lí; nhiều người cảm thấy không thuận khi đánh giá các xác suất của sự kiện hiển
nhiên, nhưng lại rất muốn thể hiện sự chắc chắn về sự kiện là đúng hay sai. Chảng hạn
người ta thường nói “tỏi tin chắc rằng đã cảm lạnh” hơn là nói “xác suất tôi cảm lạnh là
90%”.
Trong PROSPECTOR, người ta dùng c(EIE’) là độ chắc chắn về E khi có dấu hiệu
quan sát được E’. Giá trị này thuộc [-5, +5]; -5 ứng với E chắc chắn sai, +5 chắc chắn
đúng và 0 ứng với “không biết”. Vậy nên câu “tôi tin chắc rằng đã cảm lạnh” dược gán
giá trị c(EIE’) = 4.5.
Người ta có thể ánh xạ giá trị đo chắc chắn sang xác suất của sự kiện theo
IF c(E I E’) = -5 THEN p(E IE’) = 0;
IF c(E I E’) = 0 THEN p(E I E’) = p(E);
IF c(E I E’) = +5 THEN p(E I E’) = 1.
Để thể hiện quan hệ các đoạn tuyến tính giữa p(HIE’) và p(EIE’), người ta chi tiết
hóa như sau :
• Đôi với 0 < p(E I E’) < p(E) thì c(E I E’) = 5 *
(p(E I E’) - p(E)) / p(E); và
• Đôi với p(E) < p(E I E’) < 1 thì c(E I E’) - 5 *
(p(E I E’) - p(E)) / (1- p(E)).
Hai đáng thức này có thể xác định p(EIE’) dựa theo tin tường do người dùng cung
cấp về dấu hiệu c(EIE’). Nếu c(E!E’) > 0 thì p(EIE’) = [c(EIE’) * (l-p(E)) + 5* p(E)] / 5
và ngược lại thì p(EIE’) = [c(EIE’) * p(E) + 5* p(E)] / 5.
. Xác suất sau của H khi đã có E có thể được đánh giá theo LS và xác suất trước về
H là p(HIE) = LS * 0(H) / (1 + LS* 0(H)). Tương tự p(HI~E) = LN * 0(H) / (1 + LN*
0(H)).
Ngưòi ta ưóc lượng nhân tố chắc chắn được cập nhật với các giả thuyết vừa néu
theo cách sau :
■ Nếu 0 < p(E I E’tủ-ng) < p(E) thì c(H IE’) = 5 * (p(H I E’tỏne) - p(E)) / p(E); và
", 1
1 lỏ ng /
Nếu p(E) < p(E I E’lỏnB) < 1 thì c(H I E’) = 5 * (p(H I E’t6nB) - p(E)) / (1- p(E));
trong dỏ p(HIE’uSng) = 0(HIE',. E'J/ (1 + 0(HIE',, E'2, E'J).
V. THÍ DỤ DÙNG PROSPECTOR
■
3G-03-01. Trang 1 9
Tiêp theo cóng việc của PROSPECTOR, nãm 1981 Reboh đã phát triển ngôn ngữ
công nghệ tri thức gọi là KAS. Ngôn ngữ này có hệ thống khung về cơ bủn như
PROSPECTOR, nhưng không giữ các tri thức về địa lí.
Thí dụ người ta cần quyết định xem có mua ỏ tỏ không. Chảng hạn có giả thuyết
“không mua”.
Mạng suy luận sử dụng các luật :
1. Rl. IF điểu kiện xe tồi (kí hiệu là sự kiện Ej) OR giá cao (kí hiệu là sự kiện E2)
THEN không mua xe (kí hiệu là giả thuyết Hị)
2. R2. Xe đi quá 100.000 dặm (E3) AND xe chỉ đi trong thành phô (E4) AND thân xe
xấu (E5) t h e n điều kiện xe là tồi (E[)
3. R3. IF xe bị lõm (E6) THEN thân xe xấu (E5) (LS = 1000, LN = 0.001).
4. R4. IF xe gỉ (E7) THEN thán xe xấu (E5) (LS = 100, LN = 1).
Hai luật R3, R4 cùng kết luận nhưng giá trị LS, LN khác nhau. Theo R3 thì “xe bị
lõm” rất thuận lợi dê’ kết luận “xc xấu” và việc không quan tâm đến vết lõm là rất có lợi
dế ủn11 hò kết luân. Còn R4 thì “xe gi” là tạm thuận lợi cho kết luận và khóng thấy gỉ
cũng không ảnh hướng gì máy.
v .l. Tương tác hệ thống với người dùng
tài QG-03-01. Trang 2 0
Giả sử các chuyên gia đã cho các xác suất trước của các dấu hiệu là 0.1, tức p(E)
= 0.1. Phiên tương tác hỏi đáp như sau:
• Hệ thông : Với giả thuyêt xe chạy trôn 100.000 dặm, thì mức độ tin là bao nhiêu
? (E3).
• Người dùng : 5
• Hộ thông : Mức dộ tin về giả thuyết xe chạy trong thành phô’ thì hợp ? (E.ị).
• Người dùng : 5
• Hệ thông : Mức độ tin vào việc xe bị lõm là phù hợp? (E0)
• Ngưòi dùng : 4
• Hệ thông : Mức độ tin vào việc xe gỉ là phù hợp ? (E7).
• Người dùng : -1
• Hộ thông : Mức độ tin vào việc giá xe cao là phù hợp ? (E2).
• Ngưòi dùng : 1
• Kêt luận : Điều chắc chắn của tôi trong việc không mua xe là 3.97.
V.2. Truyền bá giá tri xác suất
Bên trong hệ thống là thao tác truyền bá các giá trị xác suất. Kết quả của công
việc này cho biết dộ chắc chắn vào giả thuyết là 3.97.
1. c(E,IE'3) = c(E4IE'4) = 5; người dùng quan sát thấy E', và E'4 là toàn bộ chắc chắn
cho E3 và E4.
2. Người ta cần tìm sự chắc chắn vào E5. E5 được E'6 và E'7 hỗ trợ. Vậy cần tìm
c(E5IE'6, E'7) theo các bước nhỏ sau đây :
2.1. 0(E5) được tính 0(E5) = p(E5)/ (l-p(E5)) = 0.111
2.2. p (E5 I Eg) và p(~E5 I E6) có thể được tính với
LS = 1000 và LN = 0.001 trong EG—>E5.
p(E5 I Ec) = LS*0(E5)/ (1+LS*0(E5)) = 0.9911
p(E5|~Eg) = LN*0(E5)/(1+ l n *0(E5)) = 1.11-'
2.3. Tương tự, p(E5 I E7) = 0.9174; p(E51 ~E7) = 0.1.
2.4. Người dùng xác định c(EG I E'e) = 4. Do giá trị này dương nên
p(Ec I E'g) = [c(Eg I E'6) * (1-p (E6)) + 5* p(E6)] / 5 = 0.82.
2.5. Người dùng xác định c(E71 E'7). Giá trị này âm nên
p(E71 E'7) = [c(E7 I E'7) *p(E7) + 5* p (E7)] / 5 = 0.08.
2.6. Do 0.1 = p(Etí) < p(E0 I E'g) = 0.82 nên người ta tìm p(E31 E'c) :
p(E51 E'c) = [(p(E,)-p (E5 I E0)*p(Ec))/
/ (l-p(Eo))] + [p(E01 E’o)* (p(Es I Eo)- p(Es))/ (l-p(Ec))]
= 0.8129
lài QG-03-01. Trang 21
2.7. Do 0.08 - p(E7 I E'7) < p(E7) = 0.1 nên người ta tính p(E51 E'7) theo :
p(E51 E'7)
= p(E5 I ~e 7) + (p(E7 I E'7)/ p(E7))* (p (E5)- p(E5 I E'7» = 0.1
2.8. Các giá trị thuận được cập nhật:
0(E51 E'c) = p (E5 I E'g)/ (1- p(E5 I E'c)) = 4.34;
0(E6|E'7) = = 0.111
2.9. Giá trị thuận tổng cộng trên E5 theo quan sát E'G và E'7> và lưu ý rằng vì LN
= 1 nên trả lòi ảm tính đôi với E7 không làm giảm các giá trị thuận cập nhật.
0(E8|E'6l E'7) = [0(E5|E'g)/
/ 0(E6)] * [0(E5| E'v)/ 0(E5)] * 0(E5) = 4.379
2.10. Tiếp theo là p(E5 I E'UJ = 0(E51 E'G, E'?) / (1 + 0(E51 E'c, E'7)) = 0.814
2.11. Do 0.814 = p(E5| > p(E5) = 0.1 nên cuối cùng người ta tìm được độ tin
cậy vào E5 theo quan sát E'c và E'7 theo :
c(E5 I E'6i E'7) = 5 * (p(E6 I E’tóng)- p(E5)) / (1- p(E5)) = 3.97
3. Người ta xác định độ tin tưởng vào Eị theo luật 2 :
c(E,) = min (5,5,3.97} =3.97
4. Độ tin tưởng vào Hị theo luật 1 theo chuẩn OR : c(Hj) = max {3.97, 0.1 } = 3.97.
V.3. Khẳng định lại kết quả
Kết quả c(Hj) thể hiện độ chắc chắn vào giả thuyết “không mua xe” dựa trên các
thông tin nhập vào. Giá trị tin cậy 3.97 đo trong [-5, +5] có nghĩa “thành thật khuyên rằng
không nên mua xe”. Sau các khâu tương tác với người dùng, truyền bá giá trị xác suất, hệ
thống cần khảng định lại kết quả đưa ra. Việc khẳng dịnh này sẽ làm người ta tin tướng
hơn vào kết luận của hệ thống.
Có hai nhân tố dẫn đến kết luận này. Thứ nhất từ phía chuyên gia, khi họ cho biết
11S lớn và LN nhỏ đỏì với dấu hiệu “bị lõm” và “bị gỉ”. Nhân tố thứ hai là người dùng đã
tin tưởng cao vào việc quan sát dấu hiệu “bị lõm”, tức c(Efi = “lõm”l E'fi = “thấy lõm”) =
Đc nhận xét chung, người ta thấy cho dù mô hình PROSPECTOR thực hiện một
số giả thiết tạo nên mô hình, nhưng kết quả khuyến cáo đối với thí dụ nhỏ cho thấy kết
luận là thông minh.
VI. KẾT QUẢ XÁC SUẤT QUAN TRỌNG
Lí thuyết xác suất là kĩ thuật mạnh dối với thông tin không chính xác hay ngẫu
nhiên. Kĩ thuật này có the dược ciùrm cho dự báo thời tiết, lên kế hoạch tài chính, khai
i QG-03-01. Trang 2 2
thác mỏ. Tuy nhiên tiếp cận này đúng là kĩ thuật để quản lý lập luận không chính xác
trong hệ chuyên gia với một vài điều kiện.
1. Cần biết trước xác suất trước
Việc dùng lí thuyết xác suất ngầm một ý cơ bản là không gian mẫu được xác dịnh
tốt và xác suất của mỗi sự kiện có thể thu được nhờ tập dữ liệu quá khứ. Chảng hạn tiếp
cận Bayes trong bài toán chẩn đoán y học sẽ xác định xác suất về căn bệnh D từ dấu hiệu
E có thể được Iheo đảng thức p(DIE) = p(D)*p(EID)/ p(E).
Đảm bảo được các xác suất một cách tin cậy thường là khó hay phức tạp đến mức
không thể có, vì người ta xem xét đồng thời nhiều căn bệnh và các triệu chứng. Nói chung
đối với nhiều bài toán trong thế giới thực thì thõng tin thống kê tin cậy là không sán sàng
và các giả thiết có thể không bền trong tiếp cận Bayes.
2. Cẩn cảp nhảt xác suất
Một vài bài toán yêu cấu dữ liệu được thường xuyên thay đổi. Với các sự kiện này
thì kĩ thuật lập luận không chính xác dựa trên lí thuyết Bayes đòi hòi người ta tính toán lại
tất cả các nhân tô xác suất. Việc này cũng tiêu tốn thời gian và yêu cầu nhiều hơn đối với
công tác bảo trì.
3. Tông xác suảt
Vấn đề khác thường xảy ra với tiếp cận xác suất chặt chẽ liên quan đến quan hệ
giữa xác suất thuận và nghịch đối với giả thuyết đã cho. Người ta mong rằng p(HIE) +
p(HI~E) = 1, có Iighĩa đối với giả thuyết thì tổng xác suất thuận và nghịch phải bàng 1.
Tuy nhiên không phải bất kì bài toán nào cũng tuân theo điều này, chảng hạn như trích
dản nêu trong tài liệu của Shortliffe và Buchanan năm 1975 về MYCIN. Xét luật :
IF vết thương trong cơ thể là dương tính AND hình thái của bộ phận là khuẩn AND
thể thức phát triển theo chuỗi
THEN có dấu hiệu chỉ định khuẩn chuỗi 0.7.
Luật này phản ánh mức tin của chuyên gia trong kết luận của luật với các dấu hiệu
như trong phđn giả thiết. Độ tin cậy trong quan hệ được đánh giá bàng số 0.7, trong [-1,
+ 1], trong đó -1 ứng với sai và +1 ứng với đúng.
Nếu theo quan diểm tổng xác suất bàng 1 thì việc vắng các dấu hiệu mà phần giả
thiết ncu lên cũng kết luận được với tin cậy 0.3. Tuy nhiên theo báo cáo của Shortliffe thi
chuyên gia không hài lòng dưa ra nhận xét này.
Vấn đề cần quan tàm trong thí dụ trên không phái là tính chật chẽ của lí thuyết
hay ý kiến của chuyên gia mà là tìm cách đổ tiếp cận Baycs giải quyct dược loại bai toán
C tài QG-03-01. Trang 2 3
này. Vấn đề cơ bản là trong khi p(HIE) ngầm định quan hệ nhân quả giữa E và H. không
có gì đảm bảo là có quan hệ giữa E và ~H. Độ tin cậy được lập ra dựa trẽn quan hệ của
các luật phản ánh sự tin tưởng có kiểm chứng của chuyên gia về quan hệ giữa giả thiết và
kết luận của luật; và không luật nào đáp ứng chặt chẽ ràng buộc xác suất.
4. Cần thiết của dộc láp diêu kiên
Việc dùng tiếp cận Bayes cũng đòi hỏi giả thiết khác đế đơn giản hóa tiếp cận đối
với bài toán thế giới thực. PROSPECTOR đã giả thiết có độc lập điều kiện về dấu hiệu để
đơn giản hóa định lí Bayes. Nếu để nguyên thì định lí này khó áp dụng cho một số bài
toán. Chảng hạn người ta có thể hỏi về họng đau và sốt cao của bệnh nhân để suy luận ra
viêm họng. Tất nhiên triệu chứng họng đau và sốt cao có thể không độc lập.
Giả thiết về độc lập điều kiện của dấu hiệu cũng được dùng trong PROSPECTOR
để tạo độ tin cậy vào giả thuyết viết theo các luật chuẩn AND hay chuán OR. Đối với luật
chuẩn AND như IF E, AND E2 AND AND En THEN H thì c(H) = min{pCE.IE',)}.
Tiếp cận này tốt bới lẽ nó đơn giản nhưng không tốt vì không nhạy với thay đổi
của piEjlE'j). Với luật chuẩn OR, người ta có nhận xét tương tự.
5. Kết luân vê các ràng buộc
Lí thuyết xác suất là thú tục tốt đối với thông tin không chính xác, nhưng cần đám
bảo một vài điểu kiện tiên quyết và các giả thiết. Một vài điếm đáng lưu ý khi đàm bảo
thông tin là :
• Dữ liệu trước vê các sự kiện của lĩnh vực cần sẵn sàng.
• Dữ liệu này cần được cập nhật để mô hình xác suất có thê đáp ứng được bất kì thay
đổi trong lĩnh vực.
• Tổng các xác suất thuận và nghịch đôì VỚI giả thuyết trên sự kiện đã cho cần bằng 1.
• Độc lập điểu kiện của dữ liệu cần được tính đên.
VII. KẾT LUẬN VỂ TIẾP CẬN BAYES
vể nguyên tắc, kĩ thuật Bayes và các biến thê của nó dùng đê quản lý lập luận
không chính xác trong hệ chuyên gia. Khi thoá mãn một số điều kiện, tiếp cận này cung
cấp cho người dùng một phương pháp đúng.
Tuy nhiên trong nhiều hệ chuyên gia, người ta khòng có dữ liệu quá khứ hay mỏ
hình để chính xác hóa các câu về xác suất. Thực tế cho thấy việc thiếu các dữ liệu khỏng
phù hợp với tiếp cận xác suất cổ điển, nhưng vẫn có cách giải quyết. Có hai tiếp cận chính
dùng để xử lý thông tin không chính xác, là tiếp cận khỏng chắc chắn và tiếp cận mờ.
Tài liệu này với nhan đế “tiếp cận Bayes đôi VỚI lập luận không chính xác” đã trình bày
■C tài Q G -03-01. Trang 2 4