ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
KHOA CÔNG NGHỆ THÔNG TIN
Tel. (84-511) 736 949, Website: itf.ud.edu.vn, E-mail:
BÁO CÁO TIỂU LUẬN MÔN HỌC
CÔNG NGHỆ TRI THỨC NÂNG CAO
NGÀNH KHOA HỌC MÁY TÍNH
ĐỀ TÀI :
KHAI PHÁ TRI THỨC
VÀ BÀI TẬP CHÚ LỪA TRONG CÁI GIẾNG
Nhóm HV : 1. DƯƠNG MINH HUY
Lớp Cao học KHMT Khóa 36 (2017 2019)
ĐÀ NẴNG, 03/2018
LỜI CẢM ƠN
Chúng em xin chân thành cảm ơn thầy PGS.TS Phan Huy Khánh đã tận tâm
hướng dẫn, giảng dạy để chúng em có những kiến thức quý báu và định hướng giúp
chúng em thực hiện tiểu luận này!
Nhóm học viên thực hiện
Dương Minh Huy
Công nghệ tri thức nâng cao
Trang 2
MỤC LỤC
CHƯƠNG 1 : CƠ SỞ LÝ THUYẾT..............................................................1
1.1. Giới thiệu chung về khai phá tri thức......................................................................1
1.2. Tổng quan về khai phá tri thức................................................................................1
1.2.1. Định nghĩa khai phá tri thức........................................................................1
1.2.2. Sự cần thiết của khai phá tri thức.................................................................2
1.2.3. Khai phá tri thức và lĩnh vực liên quan........................................................2
1.3. Nghiên cứu quy trình khai phá tri thức....................................................................3
1.3.1. Các giai đoạn của quy trình khai phá tri thức..............................................3
1.3.2. Nhiệm vụ của quá trình khai phá tri thức.....................................................4
1.3.3. Quy trình khai phá tri thức...........................................................................6
1.3.4. Ứng dụng của khai phá tri thức....................................................................7
CHƯƠNG 2 : BÀI TẬP THỰC HÀNH.........................................................8
2.1. Đề bài : Chú lừa trong cái giếng..............................................................................8
2.2. Xây dựng cơ sở luật và sự kiện................................................................................8
2.3. Xây dựng câu hỏi truy vấn.....................................................................................11
2.3.1. Câu hỏi có không........................................................................................11
2.3.2. Câu hỏi tình huống......................................................................................11
2.3.3. Câu hỏi điền chỗ trống................................................................................12
KẾT LUẬN .................................................................................................13
TÀI LIỆU THAM KHẢO.............................................................................14
Đề tài: Khai phá tri thức
CHƯƠNG 1 : CƠ SỞ LÝ THUYẾT
1.1. Giới thiệu chung về khai phá tri thức
Sự phát triển của công nghệ thông tin đã mang lại cho nhân loại nhiều tiện lợi
và giúp giải quyết các công việc tưởng chừng như con người không thể giải quyết
được. Trong đó, khai phá tri thức đang là một xu hướng quan trọng của nền Công
nghệ thông tin thế giới. Nó có khả năng ứng dụng vào rất nhiều lớp bài toán thực tế
khác nhau. Bước quan trọng nhất của quá trình này là khai phá tri thức từ dữ liệu, giúp
con người thu được những tri thức từ dữ liệu hoặc các nguồn dữ liệu khổng lồ khác.
Một số ít ngân hàng thương mại, doanh nghiệp và tổ chức trên thế giới đã ứng dụng
ký thuật khai phá tri thức từ dữ liệu vào các hoạt động tín dụng để phát triển sản xuất
và kinh doanh, đã và đang thu được những lợi ích to lớn.
Bản chất của khám phá tri thức chính là việc áp dụng một loạt các bước phân
tích và xử lý dữ liệu nhằm tìm ra các thông tin có ích, các quy luật tiềm ẩn, các mẫu
mới trong CSDL. Thường thì kỹ thuật Khám phá tri thức – Khai phá dữ liệu được áp
dụng trên các CSDL lớn, một trong các dạng đó là CSDL chuỗi thời gian. Vì vậy việc
nghiên cứu quy trình Khám phá tri thức áp dụng trong CSDL chuỗi thời gian sẽ có
một ý nghĩa nhất định trong thời đại ngày nay nhất là ở Việt nam khi kỹ thuật này
đang còn rất là mới mẻ. Vì vậy việc đầu tư nghiên cứu một cách tỉ mỉ nhằm nắm rõ
được bản chất của Khám phá tri thức là gì là rất cần thiết đối với những người muốn
tìm hiểu lĩnh vực mới mẻ này nói riêng và các nhà phát triển công nghệ thông tin Việt
Nam nói chung.
1.2. Tổng quan về khai phá tri thức
1.2.1.
Định nghĩa khai phá tri thức
Thực chất đó là quá trình tìm kiếm những thông tin có trong cơ sở dữ liệu
nhưng bị che giấu trong các khối dữ liệu.
Tri thức ở đây có thể được hiểu là một biểu thức trong một ngôn ngữ. Các ngôn
ngữ thường dùng để diễn tả tri thức trong việc biểu diễn tri thức trong quá trình phát
hiện tri thức từ cơ sở dữ liệu là các khung (frames), các cây và đồ thị, cá luật, các công
thức trong logic mệnh đề hoặc logic tân từ cấp một…
Việc khai phá tri thức thường được áp dụng để giải quyết một loạt những yêu
cầu phục vụ những mục đích nhất định. Vì vậy, quá trình phát hiện tri thức là một hoạt
động tương tác giữa một người sử dụng hoặc một chuyên gia phân tích với các công
cụ tin học.
Công nghệ tri thức nâng cao
Trang 1
Đề tài: Khai phá tri thức
1.2.2.
Sự cần thiết của khai phá tri thức
Có rất nhiều lý do để giải thích cho sự cần thiết của việc Khai phá tri thức, điển
hình là:
-
Con người lưu trữ dữ liệu bởi vì họ cho rằng một số giá trị hữu ích được mã
-
hoá hoàn toàn trong dữ liệu.
Chỉ có một phần nhỏ của dữ liệu ( khoảng 5-10%) là luôn được phân tích.
Sự gia tăng của dữ liệu cản trở các phương pháp phân tích truyền thống.
Giá trị dữ liệu là quá lớn đối với cách thức phân tích cổ điển, chúng ta có
thể không bao giờ nhìn thấy chúng một cách trọn vẹn hoặc không thể lưu
-
dữ trong bộ nhớ.
Không thể tối ưu hoá thông qua truy vấn.
Không có nhiều thông tin trong các trường cơ sở dữ liệu hoặc trong các
-
phương pháp thống kê cổ điển.
Cùng với viẹc lớn lên của cơ sở dữ liệu, khả năng để đưa ra quyết định và
hỗ trợ phân tích là không thể thực hiện được với truy vấn truyền thống
-
(SQL).
Rất nhiều kiểu câu truy vấn mà con người quan tâm là rất khó thực hiện hay
-
miêu tả trong ngôn ngữ vấn tin, đại loại như:
Tìm tất cả các bản ghi nghi là gian lận.
Tìm tất cả các bản ghi tương tự như các bản ghi trong bảng X.
Một số vấn đề với dạng truy vấn:
1.2.3.
Khai phá tri thức và lĩnh vực liên quan
-
Khai phá tri thức là một lĩnh vực khoa học liên quan tới nhiều lĩnh vực khác
như: Khoa học thống kê, Máy học, Cơ sở dữ liệu, thuật toán, trực quan hoá,
thực thi cao và tính toán song song. Nhưng mục đích chung nhất là chiết
-
xuất ra các tri thức từ dữ liệu xem xét trong trường hợp cơ sở dữ liệu lớn.
Khai phá tri thức cũng có nhiều điểm chung với khoa học thống kê, đặc biệt
-
là việc phân tích dữ liệu khám phá (EDA – Exploratory Data Analysis).
Trọng tâm Khai phá tri thức là mở rộng về lý thuyết và các thuật toán đối
với vấn đề tìm kiếm ra các mẫu đặc trưng trong một tập rộng lớn của thế
-
giới dữ liệu thực.
Bên cạnh đó Khai phá tri thức cũng liên quan mật thiết với lĩnh vực khoa
học Kho dữ liệu (Data Warehousing).
Công nghệ tri thức nâng cao
Trang 2
Đề tài: Khai phá tri thức
1.3. Nghiên cứu quy trình khai phá tri thức
1.3.1.
Các giai đoạn của quy trình khai phá tri thức
Quá trình khai phá tri thức, từ những cơ sở dữ liệu thực tế sau một hoặc một số
bước của quá trình sẽ rút ra được những tri thức mới. Các bước trong quá trình này
có thể lặp đi lặp lại nhiều lần và được mô tả theo hình sau:
Hình thành và xác
định vấn đề
1
Thu thập và tiền xử
lý dữ liệu
2
Khai phá dữ liệu, rút
ra các tri thức
3
Giải thích kết quả và
đánh giá
4
Sử dụng các tri thức
5
phát hiện được
Hình 3.1 Các giai đoạn của quá trình khám phá tri thức
- Giai đoạn thứ nhất: Tìm hiểu lĩnh vực ứng dụng và phát biểu vấn đề của bài
toán. Giai đoạn này là điều kiện tiên quyết cho việc trích xuất tri thức và lựa chọn
phương pháp khai phá dữ liệu thích hợp với mục đích của ứng dụng và bản chất của
dữ liệu.
- Giai đoạn thứ hai: Thu thập và tiền xử lý dữ liệu. Giai đoạn này có nhiệm vụ
Công nghệ tri thức nâng cao
Trang 3
Đề tài: Khai phá tri thức
thu thập và tiền xử lý dữ liệu, bao gồm việc lựa chọn dữ liệu nguồn, loại bỏ các nhiễu
hay phân tích dữ liệu, xử lý dữ liệu lỗi, chuyển đổi và rút gọn dữ liệu (nếu cần thiết).
Giai đoạn này thường chiếm nhiều thời gian nhất trong toàn bộ quá trình Khai phá tri
thức.
- Giai đoạn thứ ba: Khai phá dữ liệu, trích xuất tri thức. Giai đoạn này sử dụng
các kỹ thuật khai phá dữ liệu để trích xuấ ra các mẫu, mô hình ẩn dấu trong dữ liệu
hoặc tích luỹ các thông tin thông kê có ích dựa trên các thuật toán phân loại rồi sử
dụng chúng để thu nhận được các thông tin có ích dưới một dạng nào đó.
- Giai đoạn thứ tư: Phân tích và kiểm định kết quả. Giai đoạn này nhằm làm sáng
tỏ các tri thức, đặc biệt là việc làm sáng tỏ phạm vi của mô tả và dự báo – hai đích
chính của hệ thống khám phá trong thực tế.
- Giai đoạn cuối cùng: Sử dụng các tri thức được khai phá vào úng dụng thực tế.
Trong một số trường hợp, giai đoạn này có thể sử dụng tri thức khám phá được mà
không nhúng vào hệ thống máy tính. Về mặt khác, người sử dụng có thể trông chờ vào
tri thức được khám phá trên máy tính hay khai thác bởi một số chương trình. Việc đưa
kết quả vào ứng dụng thực tế là đích cuối cùng của quá trình Khai phá tri thức.
Chú ý rằng, không gian của các mẫu là vô hạn và việc liệt kê các mẫu đòi hỏi
một số dạng thức của việc tìm kiếm trong không gian này, khả năng của máy điện toán
hạn chế vị trí hạn hẹp giới hạn của không gian con có thể được khám phá bởi các thuật
toán. Thành phần khai phá dữ liệu của quá trình Khai phá tri thức có liên quan mật
thiết với ý nghĩa của các mẫu được trích xuất và liệt kê từ dữ liệu. Khai phá tri thức
bao gồm sự ước lượng và sự giải thích sáng tỏ các khuôn mẫu để đưa ra quyết định cái
gì cấu thành tri thức, cái gì không cấu thành tri thức. Nó cũng bao gồm cách mã hoá,
tiền xử lý, lấy mẫu và phép chiếu của dữ liệu trước các bước khai phá dữ liệu.
1.3.2.
Nhiệm vụ của quá trình khai phá tri thức
Như trên đã nghiên cứu, các giai đoạn của quá trình Khai phá tri thức và trên
thực tế mỗi giai đoạn rất phức tạp. Để hiểu rõ hơn quá trình Khai phá tri thức cần
phài làm những việc gì, chúng ta hãy xem xét những nhiệm vụ mà một quá trình
Khai phá tri thức sẽ làm trong hình sau:
Công nghệ tri thức nâng cao
Trang 4
Đề tài: Khai phá tri thức
Hình 3.2 Các nhiệm vụ của quá trình Khai phá tri thức
-
Tích hợp dữ liệu: thu thập dữ liệu từ các nguồn khác nhau.
-
Tạo ra tập dữ liệu mục tiêu: lựa chọn một tập dữ liệu, tập trung vào một tập
con các biến hoặc các mẫu dữ liệu, trên tập dữ liệu mục tiêu đó, việc khám
phá sẽ được thực hiện.
-
Tiền xử lý và làm sạch dữ liệu: ở đây bao gồm các thao tác cơ bản như loại
bỏ các nhiễu, các giá trị bất thường không hợp lí.
-
Khai phá dữ liệu để trích xuất các khuôn mẫu/mô hình: tìm kiếm các khuôn
mẫu liên quan đến dạng thức đặc biệt hoặc một tập các đặc trưng như: luật
phân lớp, cây quyết định, hồi quy,...
-
Giải thích và ước lượng các khuôn mẫu/mô hình.
- Củng cố, thống nhất tri thức khám phá: hợp nhất các tri thức này vào trong hệ
thống thực thi hoặc đơn giản là đưa ra các tài liệu báo cáo. Điều này bao gồm
việc kiểm tra và giải quyết các xung đột với các tri thức trước đó.
Công nghệ tri thức nâng cao
Trang 5
Đề tài: Khai phá tri thức
1.3.3.
Quy trình khai phá tri thức
Rõ ràng nhiệm vụ của quá trình Khai phá tri thức là rất nặng nề và liên quan đến
nhiều vấn đề, nếu lĩnh vực ứng dụng hay bài toán đặt ra đã được xác định trên các
tập dữ liệu lớn như kho dữ liệu, cơ sở dữ liệu,... cụ thể, thì một quy trình Khai phá
tri thức có thể được thực hiện theo 5 bước như hình sau:
Hình 3.3 Quy trình khai phá tri thức
-
Bước thứ nhất: trích chọn dữ liệu (Data selection) chọn ra những tập dữ liệu
cần được khai phá từ các tập dữ liệu lớn (Databases, data warehouse, data
repositories) theo một số tiêu chí nhất định phục vụ cho mục đích, yêu cầu
mà ứng dụng đặt ra.
-
Bước thứ hai: Tiền xử lý dữ liệu (Data preprocessing) làm sạch dữ liệu, rút
gọn dữ liệu, rời rạc hoá dữ liệu (dựa vào histograms, entropy, phân khoảng,
…). Sau bước này, dữ liệu sẽ nhất quán, đầy đủ, được rút gọn và được rời rạc
hoá.
-
Bước thứ ba: biến đổi – chuyển dạng dữ liệu (Data transformation) nếu cần,
chuẩn hoá và làm mịn dữ liệu để đưa dữ liệu về dạng thuận lợi nhất nhằm
phục vụ cho các kỹ thuật khai phá ở bước sau.
-
Bước thứ tư: khai phá dữ liệu (Data mining) đây là bước quan trọng và tốn
nhiều thời gian nhất của quá trình khai phá tri thức, áp dụng các kỹ thuật khai
phá (phần lớn là các kỹ thuật của machine learning) để khai phá, trích chọn
được các mẫu (patterns) thông tin, các mối liên hệ đặc biệt trong dữ liệu.
-
Bước thứ năm: Biểu diễn và dánh giá tri thức (Knowledge presentation &
evaluation) dùng các kỹ thuật hiển thị dữ liệu để trình bày các mẫu hoặc mô
hình thông tin (tri thức) và mối liên hệ đặc biệt trong dữ liệu đã được khai
thác ở bước trên biểu diễn theo dạng gần gũi với người sử dụng như đồ thị,
Công nghệ tri thức nâng cao
Trang 6
Đề tài: Khai phá tri thức
cây, bảng biểu, luật,… Đồng thời bước này cũng đánh giá những tri thức
khám phá được theo những tiêu chí nhất định.
1.3.4.
Ứng dụng của khai phá tri thức
Khai phá tri thức liên quan đến nhiều ngành nghề, nhiều lĩnh vực khác nhau
như: Thống kê, Trí tuệ nhân tạo, Hệ chuyên gia, Cơ sở dữ liệu, Thuật toán, Tính toán
song song,… Đặc biệt Khai phá tri thức (Knowledge discovery) rất gần gũi với lĩnh
vực thống kê, sử dụng các phương pháp thống kê để mô hình dữ liệu và phát hiện
mẫu, luật,… Các cơ sở dữ liệu lớn và các công cụ phân tích trực tuyến (OLAP) cũng
liên quan rất chặt chẽ với công cụ Khai phá tri thức.
Một hệ thống Khai phá tri thức điển hình bao gồm các phương thức, thuật toán,
kỹ thuật từ nhiều lĩnh vực khác nhau, điểm chung giữa các hệ thống này là chúng đều
trích xuất từ các kho dữ liệu có kích thước khổng lồ.
Khai phá tri thức được sử dụng rất nhiều trong các lĩnh vực khoa học, kinh doanh,…
đặc biệt trong các ngành có cơ sở dữ liệu lớn, phức tạp, chứa đựng nhiều tri thức như:
Bảo hiểm, tài chính và thị trường chứng khoán: ở đây khai phá tri thức có
nhiệm vụ phân tích tình hìn htài chính và dự báo giá, chỉ cố của các loại cố phiếu trên
thị trường chứng khoán. Danh mục vốn, lãi suất, dữ liệu thẻ tín dụng, phát hiện các
giao dịch gian lận,…
Thống kê, phân tích dữ liệu và hỗ trợ ra quyết định: dựa vào dữ liệu có sẵn,
phân tích dự liệu để đưa ra những quyết định có lợi nhất.
Điều trị y học và chăm sóc y tế: một số thông tin về chẩn đoán bệnh lưu trong các hệ
thống quản lý bệnh viện, từ đó phân tích các mối liên hệ giữa triệu chứng bệnh, chẩn
đoán và phương pháp điều trị hợp lí.
Quản trị mạng và phát hiện các truy cập bất thường: phân tích các dữ liệu truy
cập để phát hiện ra các truy cập bất thường hay có mục đích xấu.
Lĩnh vực khoa học: quan sát thiên văn, dữ liệu gene, dữ liệu sinh vật, tìm kiếm,
so sánh hệ gene và thông tin di truyền đã được mã hoá, mối liên hệ gene với một số
bệnh di truyền.
Mạng viễn thông: phân tích các cuộc gọi điện thoại và hệ thống giám sát lỗi, sự
cố, chất lượng dịch vụ.
Text mining và web mining: phân lớp văn bản và các trang web, tóm tắt nội
dung văn bản, từ đó có thể nhóm các văn bản, trang web theo các chủ đề, lọc bỏ các
trang web độc hại.
Công nghệ tri thức nâng cao
Trang 7
Đề tài: Khai phá tri thức
CHƯƠNG 2 : BÀI TẬP THỰC HÀNH
2.1.Đề bài : Chú lừa trong cái giếng
Một ngày nọ, con lừa của một ông chủ trang trại sảy chân rơi xuống một cái
giếng. Lừa kêu la tội nghiệp hàng giờ liền.
Người chủ trang trại cố nghĩ xem nên làm gì. Cuối cùng ông quyết định: con
lừa đã già, dù sao thì cái giếng cũng cần được lấp lại và không ích lợi gì trong việc
cứu con lừa lên cả. Ông nhờ vài người hàng xóm sang giúp mình.
Họ xúc đất và đổ vào giếng. Ngay từ đầu, lừa đã hiểu chuyện gì đang xảy ra và
nó kêu la thảm thiết. Nhưng sau đó lừa trở nên im lặng. Sau một vài xẻng đất, ông chủ
trang trại nhìn xuống giếng và vô cùng sửng sốt.
Mỗi khi bị một xẻng đất đổ lên lưng, lừa lắc mình cho đất rơi xuống và bước
chân lên trên. Cứ như vậy, đất đổ xuống, lừa lại bước lên cao hơn.
Chỉ một lúc sau mọi người nhìn thấy chú lừa xuất hiện trên miệng giếng và lóc
cóc chạy ra ngoài.
2.2.Xây dựng cơ sở luật và sự kiện
- Một ngày nọ, con lừa của một ông chủ trang trại sảy chân rơi xuống một cái
giếng.
Sự kiện:
sảy_chân(con_lừa)
rớt_xuống(con_lừa, giếng)
gia_súc(con_lừa, ông_chủ)
Luật:
Nếu X sảy chân thì X rớt xuống giếng Y
sảy_chân(X) AND cái_giếng(Y) rớt_xuống (X, Y)
- Lừa kêu la tội nghiệp hàng giờ liền.
Sự kiện:
kêu_la(con_lừa)
Luật:
Nếu X rớt xuống Y trong nhiều giờ thì X kêu la
Công nghệ tri thức nâng cao
Trang 8
Đề tài: Khai phá tri thức
rớt_xuống(X,Y,nhiều_giờ) kêu_la(X)
- Người chủ trang trại cố nghĩ xem nên làm gì.
Sự kiện:
suy_nghĩ(ông_chủ)
nên_làm_gì(ông_chủ)
Luật:
Nếu Z suy nghĩ thì Z nên làm gì
suy_nghĩ(Z) nên_làm_gì (Z)
- Cuối cùng ông quyết định: con lừa đã già, dù sao thì cái giếng cũng cần được
lấp lại và không ích lợi gì trong việc cứu con lừa lên cả.
Sự kiện:
quyết_định(ông_chủ)
già(con_lừa)
lấp_lại(giếng)
lợi_ích(con_lừa, ông_chủ)
cứu(ông_chủ, con_lừa)
Luật:
Nếu Z quyết định X già và lấp lại Y và không lợi ích thì không cứu X
quyết_định(Z) AND già(X) AND lấp_lại(Y) AND NOT lợi_ích(X,Z)
NOT cứu(Z,X)
- Ông nhờ vài người hàng xóm sang giúp mình.
Sự kiện:
bạn(ông_chủ, hàng_xóm)
giúp_đỡ(ông_chủ, hàng_xóm)
Luật:
Nếu Z lấp lại Y và không đủ sức và A là bạn của Z thì Z nhờ A lấp lại Y
không_đủ_sức(Z) AND lấp lại(Y) AND bạn(A,Z) giúp_đỡ(A,Z,Y)
- Họ xúc đất và đổ vào giếng.
Sự kiện:
làm_việc(ông_chủ, hàng_xóm)
đổ_đất_vào(ông_chủ, hàng_xóm, giếng)
Luật:
Nếu Z và A cùng làm việc thì Z và A đổ đất vào Y
Công nghệ tri thức nâng cao
Trang 9
Đề tài: Khai phá tri thức
làm_việc(Z,A) đổ_đất_vào (A,Z,Y)
- Ngay từ đầu, lừa đã hiểu chuyện gì đang xảy ra và nó kêu la thảm thiết.
Sự kiện:
hiểu_chuyện(con_lừa)
kêu_la_thảm_thiết
Luật:
Nếu X hiểu chuyện Z và A đổ đất vào Y ngay từ đầu thì X kêu la thảm thiết
đổ_đất_vào (A,Z,Y) AND hiểu_chuyện(X, từ_đầu) kêu_la_thảm_thiết(X)
- Nhưng sau đó lừa trở nên im lặng.
Sự kiện:
im_lặng(con_lừa)
thông_minh(con_lừa)
Luật:
Nếu X thông minh thì X im lặng ngay sau đó
thông_minh(X) im_lặng(X, sau_đó)
- Sau một vài xẻng đất, ông chủ trang trại nhìn xuống giếng và vô cùng sửng sốt.
Sự kiện:
nhìn_xuống(ông_chủ, giếng)
sửng_sốt(ông_chủ)
Luật:
Nếu Z nhìn xuống Y thì Z sửng sốt
nhìn_xuống(Z,Y) sửng_sốt(Z)
- Mỗi khi bị một xẻng đất đổ lên lưng, lừa lắc mình cho đất rơi xuống và bước
chân lên trên.
Sự kiện:
đổ_đất_lên_lưng(con_lừa)
lắc_mình_cho_đất_rơi(con_lừa)
bước_lên(con_lừa, đất)
Luật:
Nếu X bị đổ đất lên lưng thì X lắc mình cho đất rơi và bước lên
đổ_đất_lên_lưng(X) lắc_mình_cho_đất_rơi(X) AND bước_lên(X, đất)
- Cứ như vậy, đất đổ xuống, lừa lại bước lên cao hơn.
Sự kiện:
Công nghệ tri thức nâng cao
Trang 10
Đề tài: Khai phá tri thức
đổ_xuống(đất)
bước_lên_cao_hơn(con_lừa)
Luật:
Nếu B đổ xuống thì X bước lên cao hơn
đổ_xuống(B) bước_lên_cao_hơn(X)
- Chỉ một lúc sau mọi người nhìn thấy chú lừa xuất hiện trên miệng giếng và lóc
cóc chạy ra ngoài.
Sự kiện:
nhìn(ông_chủ, hàng_xóm)
xuất_hiện(con_lừa, miệng_giếng)
chạy_ra_ngoài(con_lừa)
thoát_khỏi(con_lừa, giếng)
Luật:
Nếu A,Z nhìn thấy X xuất hiện trên miệng giếng và X chạy ra ngoài thì X thoát
khỏi Y
nhìn(Z,A) AND xuất_hiện(X, miệng_giếng) AND chạy_ra_ngoài(X)
thoát_khỏi(X,Y)
2.3.Xây dựng câu hỏi truy vấn
2.3.1. Câu hỏi có không
- Con lừa có bị gãy chân sau khi rớt xuống giếng không ?
- Ông chủ trang trại vô tâm với con lừa không ?
- Con lừa có thông minh không ?
- Nếu đổ nhiều đất vào thì con lừa có chết không ?
- Sau khi lên trên thì ông chủ có bắt lại con lừa không ?
- Con lừa có giận ông chủ mình không ?
- Sau khi thoát khỏi thì con lừa còn sống không ?
2.3.2. Câu hỏi tình huống
- Con lừa rơi xuống chỗ nào ?
Công nghệ tri thức nâng cao
Trang 11
Đề tài: Khai phá tri thức
- Vì sao con lừa lại kêu la thảm thiết ?
- Ai đã giúp đỡ ông chủ ?
- Vì sao ông chủ sửng sốt ?
- Mọi người dùng gì để đổ đất vào giếng ?
- Con lừa lên trên bằng cách nào ?
2.3.3. Câu hỏi điền chỗ trống
- Con lừa rớt xuống …
- Ông chủ quyết định rằng cứu con lừa không mang lại …
- Ông chủ nhờ … giúp mình đổ đất
- Lúc đầu con lừa kêu la thảm thiết nhưng sau đó nó …
- Khi đất đổ xuống thì con lừa …
- Ngay sau khi vừa lên trên miệng giếng thì con lừa …
Công nghệ tri thức nâng cao
Trang 12
Đề tài: Khai phá tri thức
KẾT LUẬN
Về mặt lý thuyết, chúng em đã nghiên cứu, tìm hiểu về Khai phá tri thức, bài
tiểu luận đã trình bày những vấn đề cơ bản nhất về khai phá tri thức, nghiên cứu
những bước cơ bản của một quy trình khai phá tri thức. Đồng thời trong tiểu luận cũng
so sánh tổng thể lợi ích khi sử dụng khai phá tri thức với những phương pháp cổ điển
khi giải quyết các bài toán trên các hệ CSDL lớn và những thành tựu đạt được khi áp
dụng khai phá tri thức.
Về mặt thực tiễn, chúng em đã áp dụng lý thuyết về biểu diễn tri thức, sử dụng
lôgic vị từ xây dựng cơ sở luật để đặt câu hỏi truy vấn cho một câu chuyện được chọn.
Công nghệ tri thức nâng cao
Trang 13
Đề tài: Khai phá tri thức
TÀI LIỆU THAM KHẢO
[1] Nguyen Tran Sy: Ứng dụng khai phá tri thức xây dựng hệ thống trợ giúp thẩm
định vay vốn tại ngân hàng Vietcombank Quảng Bình.
[2] Bao Ho Tu (1998), Introduction to Knowledge Discovery and Data mining,
Institute of Information Technology National Center for Natural Science and
Technology.
[3] M. Goebel, L. Gruenwald (1999), “A Survey Of Data Mining And Knowledge
Discovery Software Tools”, SIGKDD Explorations, Vo1. I, No. 1, P. 20-33.
[4] U.M. Fayyad (1998), “Mining Databases: Towards Algorithms for Knowledge
Discovery”, Bulletin of the IEEE Computer Society Technical Committee on Data
Engineering, Vo1. 21, No. 1, P. 39-48.
Công nghệ tri thức nâng cao
Trang 14