Tải bản đầy đủ (.pdf) (23 trang)

CÁC NGÔN NGỮ SEMANTIC WEB

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (582.44 KB, 23 trang )

LỜI CẢM ƠN
Xin gửi lời cảm ơn chân thành đến Phó Giáo sư Tiến sĩ Đỗ Văn Nhơn đã hướng dẫn,
giảng dạy tận tụy giúp tôi có thêm kiến thức trong môn học Biểu diễn tri thức và ứng
dụng.
Qua đây, tôi đã thu hoạch được nhiều kiến thức bổ ích, củng cố cho sự hiểu biết của bản
thân về chuyên ngành khoa học máy tính nói chung, và nội dung biểu diễn tri thức nói
riêng.
TÓM TẮT
Web ngữ nghĩa là thế hệ Web mới, đang được phát triển và sẽ xuất hiện trong tương lai
gần. Hệ thống Web mới này sẽ dần thay thế Web hiện tại song không có nghĩa là hoàn
toàn khác hệ thống Web hiện tại. Web ngữ nghĩa được phát triển trên hệ thống Web hiện
tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy tính có thể hiểu
và tăng khả năng xử lý tự động.
Tim Berners-Lee đã đưa ra hai vấn đề của web ngữ nghĩa, đó là tạo cho Web một môi
trường cộng tác tốt hơn và vấn đề thứ hai là máy có thể hiểu và xử lý tự động các thông
tin trên Web.
Trang 2
Mục lục
PHẦN 1. TỔNG QUAN VỀ SEMANTIC WEB 3
CHƯƠNG 1. GIỚI THIỆU VỀ SEMANTIC WEB 3
1. Semantic web là gì? 3
2. Phân biệt Semanic web với Web hiện nay: 4
3. Một ví dụ đơn giản về Semantic Web: 5
CHƯƠNG 2. GIỚI THIỆU SƠ LƯỢC VỀ ONTOLOGY 6
1. Định nghĩa Ontology: 6
2. Các lĩnh vực ứng dụng Web ngữ nghĩa: 7
3. Ontology và Semantic Web: 10
4. Onto Web mang lại gì? 11
5. Một số công cụ hỗ trợ xây dựng Ontology: 12
CHƯƠNG 3. KIẾN TRÚC CỦA SEMANTIC WEB 13
Mô hình kiến trúc: 13


1. Lớp Unicode & URI: 14
2. Lớp XML: 14
3. Lớp RDF [RDF] và RDFSchema [RDFS]: 14
4. Lớp Ontology 14
5. Lớp Digital Signature: 15
6. Các lớp Logic, Proof, Trust: 15
CHƯƠNG 4. CÁC NGÔN NGỮ SEMANTIC WEB 15
1. XML: 15
2. DTDs và XML Schemas: 17
3. RDF: 18
4. RDF Schemas: 19
5. OWL: 20
Trang 3
PHẦN 1. TỔNG QUAN VỀ SEMANTIC WEB
CHƯƠNG 1. GIỚI THIỆU VỀ SEMANTIC WEB
1. Semantic web là gì?
Semantic Web không là Web riêng biệt mà là một sự mở rộng của Web hiện tại, theo
cách thông tin được xác định ý nghĩa tốt hơn, nó cho phép máy tính và người cộng tác
với nhau tốt hơn. Semantic Web được hình thành từ ý tưởng của Tim Berners-Lee, người
phát minh ra WWW (World Wide Web), URI (Uniform Resource Identification), HTTP,
và HTML. Semantic Web là một mạng lưới các thông tin được liên kết sao cho chúng có
thể được xử lý dễ dàng bởi các máy tính ở phạm vi toàn cầu. Nó được xem là cách mô tả
thông tin rất hiệu quả trên World Wide Web, và cũng được xem là một cơ sở dữ liệu có
khả năng liên kết toàn cầu. Semantic Web là một phương pháp cho phép định nghĩa và
liên kết dữ liệu một cách có ngữ nghĩa hơn nhằm phục vụ cho máy tính có thể “hiểu”
được. Semantic Web còn cung cấp một môi trường chia sẻ và xử lý dữ liệu tự động bằng
máy tính.
Web ngữ nghĩa là thế hệ Web mới, đang được phát triển và sẽ xuất hiện trong tương lai
gần. Hệ thống Web mới này sẽ dần thay thế Web hiện tại song không có nghĩa là hoàn
toàn khác hệ thống Web hiện tại. Web ngữ nghĩa được phát triển trên hệ thống Web hiện

tại bằng cách bổ sung thêm ngữ nghĩa cho các tài nguyên Web mà máy tính có thể hiểu
và tăng khả năng xử lý tự động.
Tim Berners-Lee đã đưa ra hai vấn đề của web ngữ nghĩa, đó là tạo cho Web một môi
trường cộng tác tốt hơn và vấn đề thứ hai là máy có thể hiểu và xử lý tự động các thông
tin trên Web.
Để có thể tạo ra web có dữ liệu mà máy có thể xử lý được, trước hết phải thay đối mô
hình trong cách chúng ta nghĩ về dữ liệu. Từ trước đến nay, dữ liệu bị khoá ngay trong
các ứng dụng độc quyền. Dữ liệu được coi như thứ yếu để xử lý dữ liệu. Thái độ không
Trang 4
đúng này bộc lộ những sai sót cơ bản trong luận cứ gốc bằng việc thiết lập sự phụ thuộc
giữa xử lý và dữ liệu. Hay nói cách khác, phần mềm tốt thì hoàn toàn phụ thuộc vào dữ
liệu tốt. Với các hệ tính toán chuyên nghiệp thì ngay khi bắt đầu thực hiện, vấn đề dữ liệu
là rất quan trọng, nó phải được xác minh và bảo vệ. Với Web, XML và xu thế Web ngữ
nghĩa đang nổi lên thì có sự thay đổi của sức mạnh đang di chuyển từ các ứng dụng sang
dữ liệu. Vấn đề này cũng cho chúng ta mấu chốt để hiểu Web ngữ nghĩa. Con đường để
máy có thể xử lý dữ liệu chủ yếu là tạo ra dữ liệu thông minh hơn chứ không phải là các
xử lý thông minh.
2. Phân biệt Semanic web với Web hiện nay:
Với nhiều tỷ trang Web phân bố trên hầu hết các quốc gia, World Wide Web (WWW) là
môi trường tốt cho việc biểu diễn và truy cập thông tin dạng số. Tuy nhiên, lượng thông
tin khổng lồ đó cũng tạo ra những khó khăn lớn trong việc tìm kiếm, chia sẻ thông tin
trên WWW. Hiện nay, thông tin trên WWW được biểu diễn chủ yếu dưới dạng ngôn ngữ
tự nhiên (các trang Web trên ngôn ngữ HTML). Cách biểu diễn đó phù hợp với con
người nhưng lại gây ra nhiều khó khăn cho các chương trình làm nhiệm vụ hỗ trợ tìm
kiếm, chia sẻ và trao đổi tin. Chương trình máy tính không “hiểu” được thông tin và dữ
liệu biểu diễn dưới dạng thích hợp với con người. Để giải quyết vấn đề này, nhiều tổ
chức nghiên cứu và kinh doanh đã phối hợp nghiên cứu và phát triển Web có ngữ nghĩa
(Semantic Web). Theo định nghĩa của Tim Berners_Lee giám đốc tổ chức World Wide
Web Consortium (), đồng thời là cha đẻ của WWW, Web có ngữ
nghĩa là sự mở rộng của WWW hiện tại bằng cách thêm vào các mô tả ý nghĩa (hay ngữ

nghĩa) của thông tin dưới dạng mà chương trình máy tính có thể “hiểu” và do vậy cho
phép xử lý thông tin hiệu quả hơn. Như vậy, Web có ngữ nghĩa sẽ bao gồm các thông tin
(trang Web) được biểu diễn theo cách truyền thống cùng với ngữ nghĩa của các thông tin
này được biểu diễn một cách tường minh. Việc thêm phần ngữ nghĩa cung cấp thêm tri
thức cho các chương trình (các agent), giúp nâng cao chất lượng phân loại, tìm kiếm, trao
đổi thông tin. Muốn xây dựng Web có ngữ nghĩa cần có công cụ hỗ trợ.
Trang 5
3. Một ví dụ đơn giản về Semantic Web:
Ví dụ: Giả sử ta cần so sánh giá để chọn mua một bó hoa hay ta cần tra cứu
catalog của các hãng chế tạo xe khác nhau để tìm ra thiết bị thay thế cho các bộ phận bị
hư hỏng của xe Volvo 740. Thông tin mà ta thu được trực tiếp trên Web có thể trả lời các
câu hỏi này nhưng đòi hỏi con người phân tích ý nghĩa của dữ liệu và sự liên quan của nó
với yêu cầu đề ra, không thể xử lý tự động bằng máy tính.
Với Semantic Web ta có thể giải quyết vấn đề này bằng 2 cách:
Thứ nhất: Nó sẽ mô tả chi tiết dữ liệu. Do đó một chương trình xử lý không cần quan tâm
đến các định dạng (format), hình ảnh, quảng cáo trên một trang Web để tìm ra sự liên
quan của thông tin.
Thứ hai: Semantic Web cho phép chúng ta tạo ra một file mô tả mối liên hệ giữa các tập
dữ liệu khác nhau. Ví dụ: Ta có thể tạo một liên kết semantic giữa cột mã quốc gia ‘zip-
code’ trong cơ sở dữ liệu (database) với trường ‘zip’ ở trên giao diện (form) nhập liệu nếu
chúng có chung ý nghĩa. Điều này cho phép máy tính theo các đường kết nối và tích hợp
dữ liệu từ nhiều nguồn khác nhau. Ý tưởng liên kết các nguồn khác nhau (tài liệu, hình
ảnh, con người, khái niệm,…) cho phép chúng ta mở rộng Web thành một môi trường
mới với tập các mối quan hệ mới giữa các nguồn dữ liệu, tạo ra các mối liên hệ ngữ cảnh
(contextual relationship), điều mà Web hiện tại chưa làm được.
Trang 6
CHƯƠNG 2. GIỚI THIỆU SƠ LƯỢC VỀ ONTOLOGY
1. Định nghĩa Ontology:
Trong ngành khoa học máy tính và khoa học thông tin, Ontology mang ý nghĩa là các loại
vật và quan hệ giữa chúng trong một hệ thống hay ngữ cảnh cần quan tâm. Các loại vật

này còn được gọi là khái niệm, thuật ngữ hay từ vựng có thể được sử dụng trong một lĩnh
vực chuyên môn nào đó. Ontology cũng có thể hiểu là một ngôn ngữ hay một tập các quy
tắc được dùng để xây dựng một hệ thống Ontology. Một hệ thống Ontology định nghĩa
một tập các từ vựng mang tính phổ biến trong lĩnh vực chuyên môn nào đó và quan hệ
giữa chúng. Sự định nghĩa này có thể được hiểu bởi cả con người lẫn máy tính. Một cách
khái quát, có thể hiểu Ontology là "một biểu diễn của sự khái niệm hoá chung được chia
sẻ" của một miền hay lĩnh vực nhất định. Nó cung cấp một bộ từ vựng chung bao gồm
các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các thuộc
tính này. Ngoài bộ từ vựng, Ontology còn cung cấp các ràng buộc, đôi khi các ràng buộc
này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ vựng, nó được sử
Trang 7
dụng trong một lĩnh vực mà có thể được giao tiếp giữa người và các hệ thống ứng dụng
phân tán khác.
Ontology được sử dụng trong trí tuệ nhân tạo, công nghệ Web ngữ nghĩa (Semantic
Web), các hệ thống kỹ thuật, kỹ thuật phần mềm, tin học y sinh và kiến trúc thông tin như
là một hình thức biểu diễn tri thức về thế giới hoặc một số lĩnh vực cụ thể. Việc tạo ra các
lĩnh vực về Ontology cũng là cơ sở để định nghĩa và sử dụng của cơ cấu một tổ chức kiến
trúc(an enterprise architecture framework).
2. Các lĩnh vực ứng dụng Web ngữ nghĩa:
Web có ngữ nghĩa cho phép tăng cường chức
năng,
mức độ thông minh và tính tự
động hoá của nhiều
ứng
dụng hiện có. Những lĩnh vực ứng dụng đặc biệt
hứa
hẹn cho
Web có ngữ nghĩa là các dịch vụ Web,
quản
lý tri thức và thương mại điện tử

.
Dịch vụ Web là các chương trình và thiết bị có
thể
truy cập thông qua hạ tầng WWW.
Web có ngữ
ngh
ĩ
a
cung cấp thông tin và tri thức cần thiết cho việc
tìm
kiếm, tương tác,
chia sẻ và kết hợp các dịch vụ
Web.
Quản lý tri thức liên quan đến việc thu thập, lưu
trữ,
tìm kiếm, truy cập và cung
cấp thông tin, tri
thức
trong các tổ chức với mục đích tận dụng tài sản trí
tuệ
của
chính tổ chức đó. Công việc này đòi hỏi một
số
chức năng hoàn chỉnh hơn các hệ
thống quản lý
văn
bản hoặc dữ liệu thông thường như tìm kiếm
thông
minh, tự động
tách thông tin từ văn bản, liên kết cơ

sở
dữ liệu, từ động tổng hợp văn bản. Những
chức
năng
này có thể thực hiện được trên hạ tầng mà Web

ngữ nghĩa cung
cấp.
Sự phát triển mạnh của thương mại điện tử hiện
nay
dẫn đến số lượng khổng lồ các
giao dịch trên
mạng.
Để tự động hoá những giao dịch này, phần mềm
hỗ
trợ cần có
khả năng: chuyển đổi giữa những dạng
văn
bản tồn tại trong giao dịch điện tử, hỗ trợ
ontology

tả hàng hoá và dịch vụ cho phép các agent tìm
kiếm,
phân loại và
thương lượng về hàng
hoá.
- Xây dựng các bộ máy tìm tin
Trang 8
Vấn đề hiện nay là đa số các bộ máy tìm tin đều thực hiện cho phép người sử dụng
có thể tạo các câu truy vấn gồm các từ khóa tìm kiếm để nhận về kết quả mong muốn.

Tuy nhiên, phương pháp này gặp hai vấn đề chính sau đây:
• Mỗi từ khóa có thể có một hay nhiều ý nghĩa tùy theo từng ngữ cảnh và bộ máy
tìm kiếm không thể hiện mối quan hệ giữa các từ khóa với nhau.
• Có thể các thông tin cùng ý nghĩa với thuật ngữ trong biểu thức tìm của người sử
dụng sẽ không tồn tại trong kết quả tìm.
Ví dụ: ta cần tìm thông tin về người trưởng bộ môn công nghệ thông tin của MIT,
ta gõ: “MIT information technology chair” vào Google, nhưng kết quả thu được là không
chính xác. Nguyên nhân của việc tìm kiếm thất bại là do: Từ khoá “MIT” có nhiều ý
nghĩa. Ngoài ra, máy tìm không thể hiểu mối liên hệ giữa các từ khoá: MIT, information
technology và chair. Nếu bộ máy tìm kiếm được tích hợp tri thức để hiểu được ý nghĩa
của các từ, thì rất có thể nó cho ta kết quả chính xác hơn, lúc đó việc tìm kiếm sẽ dựa trên
khái niệm (concept) chứ không phải theo từ khóa (keyword).
- Ứng dụng công nghệ ngữ nghĩa trong thư viện số:
Thư viện số phải thường xuyên xử lý một lượng lớn thông tin từ các dạng tài liệu số.
Phần lớn chúng được rút ra từ thư viện truyền thống, được tập trung biên tập lại thành
nguồn thông tin sẵn dùng cho một nhóm người liên quan bằng cách quét bài báo, sách, tài
liệu… Bằng cách này đã làm hạn chế lợi thế của các hệ thống máy tính hiện đại và gây
khó khăn cho quá trình xử lý sau này. Áp dụng công nghệ semantic web chúng ta có thể
nghiên cứu và phát triển hệ thống thư viện số có thể thực hiện xử lý, lưu trữ, tìm kiếm và
phân tích tất cả các kiểu thông tin số. Công nghệ ngữ nghĩa cho phép miêu tả đối tượng,
thiết lập các lược đồ cần thiết trong các dạng của ontologies cho các định danh của các
đối tượng số. Mục tiêu chính là làm cho thao tác giữa các phần có thể xử lý thông minh,
nhất quán, mạch lạc tương tự các lớp của đối tượng số và các dịch vụ.
Ứng dụng ontologies trong việc mô tả hệ thống thư mục: Thông thường một thư viện số
sử dụng dữ liệu mô tả có cấu trúc để mô tả hệ thống thư mục tuy nhiên các trường trong
Trang 9
dữ liệu mô tả lại không được định nghĩa ngữ nghĩa một cách đầy đủ, việc ứng dụng
ontologies trong thư viện số không những thực hiện lưu trữ dữ liệu mô tả để mô tả hệ
thống thư mục mà còn mô tả được nội dung của nó. Thay vì trong trường hợp một quyển
sách được lưu trữ trong thư viện số chúng ta có thể tách riêng cấu trúc từng chương của

nó, cung cấp mô tả cho mỗi chương và thực hiện lưu trữ mối quan hệ của các chương
khác nhau. Bằng việc sử dụng tư tưởng cấu trúc của ontologies và sử dụng tư tưởng này
trong việc mô tả dữ liệu, chúng ta cung cấp một tầng tổng quát dữ liệu mô tả và nội dung.
Một trong những ứng dụng quan trọng nữa chúng ta có thể thấy hệ thống dữ liệu của thư
viện số rất lớn và đa dạng nó thường phục vụ cho nhiều tổ chức, cá nhân vào nhiều mục
đích khác nhau, trong khi đó dữ liệu chủ yếu thuộc vào hai dạng là dữ liệu có cấu trúc
(trong database) và dữ liệu phi cấu trúc (các nguồn lấy từ web). Một vấn đề dăt ra là làm
thế nào để các ứng dụng sử dụng được đồng thời cả hai loại dữ liệu này, bởi vì trên thưc
tế mỗi ứng dụng chỉ sử dụng một loại dữ liệu có cấu trúc hoặc phi cấu trúc. Chúng ta có
chuẩn chung phục vụ cho hầu hết các loại ứng dụng đó là sử dụng XML (Extensible
Markup Laguage), nó được xem là nền tảng công nghệ của semantic web. Nó sẽ là cầu
nối thực hiện chuẩn hoá các nguồn dữ liệu, từ đó có thể phục vụ cho mọi loại ứng dụng.
- Khung làm việc để quản lý tri thức (Framework for Knowledge Management )
Semantic Web là một hệ nền nhiều hứa hẹn cho việc phát triển các hệ thống quản
lý tri thức. Tuy nhiên, vấn đề ở đây là làm thế nào biểu diễn tri thức ở dạng thức máy có
thể hiểu được, để tri thức cần thiết có thể được tìm thấy bởi các máy tìm (search engine).
Chúng ta sử dụng giải pháp quản lý tri thức dựa trên định dạng tương thích RDF để biểu
diễn các luật và dựa trên một kỹ thuật mới để chú giải các nguồn tri thức bằng cách sử
dụng các câu điều kiện. Giải pháp là dựa trên các công cụ Semantic Web đang tồn tại.
Điểm thuận lợi chính là sự thúc đẩy khả năng tìm kiếm tri thức với độ chính xác cao,
cũng như khả năng truy cập cấu tạo các nguồn tri thức cần thiết cho việc giải quyết một
vấn đề nào đó. Dạng thức này có thể được biểu diễn bằng cách dùng các câu lệnh If–
Then (statement If-Then), được thiết lập theo cách suy diễn (inference) và ủy quyền
(trust) trên Semantic Web. Các statement (câu lệnh) điều kiện có thể được dùng để lập
Trang 10
chỉ mục nội dung các tài nguyên Web một cách nhiều ý nghĩa hơn so với liên kết các từ
khóa, khái niệm hay metadata (siêu dữ liệu). Điều này có thể sẽ hình thành các truy vấn
dựa trên ngữ cảnh hơn, tăng cường độ chính xác trong tìm kiếm tri thức. Ví dụ: Trong
vấn đề định chỉ mục tài liệu, dù có hay không có tài liệu được định chỉ mục bằng từ khóa
aspirin (thuốc aspirin) và headache (bệnh đau đầu), cách aspirin trị headache hay aspirin

gây ra headache đều có thể được giải quyết dễ dàng bằng cách sử dụng các câu điều kiện
định nghĩa trước. Việc xây dựng và quản lý tri thức trên Semantic Web một cách khoa
học cho phép sự chuyển đổi đa dạng trong môi trường phân tán.
3. Ontology và Semantic Web:
Cơ chế cho phép chia sẻ và trao đổi ngữ nghĩa
của
thông tin được biết đến và
sử dụng lâu nhất

ontology. Ontology là bản mô tả một cách tường
minh
các khái
niệm trong một miền ứng dụng nào đó
cùng
với quan hệ giữa những khái niệm
này.
Ontology
cung cấp từ vựng chung cho việc trao đổi thông
tin
giữa các ứng
dụng và dịch vụ Web. Bản thân
phần
ngữ nghĩa của Web có ngữ nghĩa bao gồm
ontology
và giá trị cụ thể của khái niệm định nghĩa
trong
ontology. Để biểu diễn
ontology và dữ liệu cần

ngôn ngữ thích hợp. Trong quá trình hình thành

Web

ngữ nghĩa, nhiều ngôn ngữ như vậy đã được
đề
xuất và phát triển, trong đó được
biết đến nhiều
nhất
là RDF và RDFS, DAML+OIL
.
RDF và RDF Schema. RDF (Resource
Description
Framework) là cơ chế cho phép
mô tả dữ liệu về
dữ
liệu (meta data). RDF coi các đối tượng trên
Web
(trang
Web, đoạn văn, người, các đối tượng
khác.v.v.)
là các tài nguyên. Mỗi tài nguyên
được mô tả bởi
bộ
ba đối tượng - thuộc tính – giá trị. Ví dụ, mệnh
đề
“Phương là tác
giả bài báo tại trang Web nào đó”
sẽ
được mô tả bởi bộ ba: http:// www…, tác
giả,
“Phương”. RDF Schema (RDFS) là một biến thể

đơn
giản sử dụng cơ chế RDF.
RDFS cho phép mô tả
các
thuộc tính đặc thù cho ứng dụng, đồng thời định
ngh
ĩ
a
lớp
các đối tượng có cùng thuộc tính đó. Việc
định
nghĩa lớp đối tượng với thuộc tính
và quan hệ rất
cần
thiết cho việc xây dựng
ontology.
Trang 11
DAML + OIL. RDF và RDF Schema chỉ cho
phép
biểu diễn ngữ nghĩa ở mức độ đơn
giản. Để biểu
diễn
ngữ nghĩa bao gồm nhiều đối tượng có quan hệ
lôgic
phức tạp
với nhau cần các phương tiện biểu
diễn
mạnh hơn. DAML (Darpa Agent Markup
Language)
và OIL (Ontology Interface Layer) là các phương

tiện
như vậy.
DAML+OIL là một mở rộng của
RDFS.
Trong DAML+OIL, ngữ nghĩa được mô
tả thông
qua
lôgic mô tả (descriptive logic) cho phép sử dụng
lôgic
bool khi mô tả
quan hệ giữc các đối tượng và có nhiều kiểu quan hệ cơ sở hơn so với RDFS.
4. Onto Web mang lại gì?
- Máy có thể hiểu được thông tin trên Web
Internet ngày nay dựa hoàn toàn vào nội dung. Web hiện hành chỉ cho con người đọc chứ
không dành cho máy hiểu. Semantic Web sẽ cung cấp ý nghĩa cho máy hiểu.
Ví dụ:
The Beatles là một ban nhạc nổi tiếng của thành phố Liverpool.
John Lennon là một thành viên của The Beatles.
Bản nhạc “Hey Dude” do nhóm The Beatles trình bày.
Những câu như thế này có thể hiểu bởi con người nhưng làm sao chúng có thể được hiểu
bởi máy tính? Semantic Web là tất cả những gì về cách tạo một Web mà cả người và máy
có thể hiểu. Người dùng tin sẽ vẫn có thông tin trình bày theo cách trước đây, nhưng đối
với máy tính, Semantic Web sẽ làm cho máy hiểu được nghĩa và tìm ra thông tin chính
xác hơn Web hiện hành. Bây giờ, máy không phải suy luận dựa vào ngữ pháp và các
ngôn ngữ đánh dấu (Markup Language) nữa vì cấu trúc ngữ nghĩa của văn bản (text) thực
sự đã chứa nó rồi.
- Thông tin được tìm kiếm nhanh chóng và chính xác hơn
Với Semantic Web, việc tìm kiếm sẽ dễ dàng nếu mọi thứ được đặt trong ngữ
cảnh. Ý tưởng chính yếu là toàn bộ ngữ cảnh mà người sử dụng được biết đến. Mục tiêu
của Semantic Weblà phát triển các tiêu chuẩn và kĩ thuật để giúp máy hiểu nhiều thông

Trang 12
tin trên Web, để máy tìm ra các thông tin dồi dào hơn, tích hợp, duyệt dữ liệu, và tự động
hóa các thao tác. Với Semantic Web, chúng ta không những nhận được những thông tin
chính xác hơn khi tìm kiếm thông tin từ máy tính, mà máy tính còn có thể tích hợp thông
tin từ nhiều nguồn khác nhau, biết so sánh các thông tin với nhau.
- Dữ liệu liên kết động
Với Semantic Web, chúng ta có thể kết hợp các thông tin đã được mô tả và giàu
ngữ nghĩa với bất kì nguồn dữ liệu nào. Ví dụ: Bằng cách thêm các metadata (siêu dữ
liệu) cho các tài liệu khi tạo ra nó, chúng ta có thể tìm kiếm các tài liệu mà metadata cho
biết tác giả là Eric Miller. Cũng thế, với metadata chúng ta có thể tìm kiếm chỉ những tài
liệu thuộc loại tài liệu nghiên cứu.
Với Semantic Web, chúng ta không chỉ cung cấp các URI cho tài liệu như đã làm
trong quá khứ mà còn cho con người, các khái niệm, các mối liên hệ. Như trong ví dụ
trên, bằng cách cung cấp những định danh duy nhất cho mỗi con người như vai trò của
‘tác giả’ và khái niệm ‘tài liệu nghiên cứu’, chúng ta đã làm rõ người ở đây là ai và mối
quan hệ tương ứng của người này với một tài liệu nào đó. Ngoài ra, bằng cách làm rõ
người mà chúng ta đang đề cập, chúng ta có thể phân biệt những tài liệu
của Eric Miller với những tài liệu của những người khác. Chúng ta cũng có thể kết hợp
những thông tin đã được mô tả ở nhiều site khác nhau để biết thêm thông tin về người
này ở những ngữ cảnh khác nhau. Ví dụ như vai trò của anh ta ra sao khi anh ta là tác giả,
nhà quản lý, nhà phát triển.
- Hỗ trợ công cụ tự động hóa
Ngoài những lợi ích trên, Semantic Web còn cung cấp các loại dịch vụ tự động từ nhiều
vùng khác nhau: từ gia đình và các thư viện kĩ thuật số cho đến các dịch vụ kinh doanh
điện tử và dịch vụ sức khỏe.v.v. Semantic Web cung cấp phương tiện để thêm các thông
tin chi tiết lên Web nhằm hỗ trợ sự tự động hóa cho các dịch vụ.
5. Một số công cụ hỗ trợ xây dựng Ontology:
Để tạo và sử dụng Web có ngữ nghĩa cần có sự
hỗ
trợ của các loại công cụ

sau.
Trang 13
− Công cụ tạo và liên kết ontology. Các công cụ
này
cho phép tạo ra khái niệm, thuộc
tính của khái
niệm,
quan hệ và phân cấp giữa các khái niệm. Công
cụ
loại này
thường có giao diện đồ hoạ và tuân
theo
chuẩn của ứng dụng Web. Ví dụ điển
hình cho
công
cụ loại này là Protégé
.
− Công cụ chú giải (annotation tools). Công cụ
chú
giải cho phép tạo phần ngữ
nghĩa, tức là giá trị
cụ
thể của khái niệm, thuộc tính và quan hệ từ dữ
liệu
thông
thường phù hợp với một ontology nào đó.
Giá
trị tạo ra có thể được biểu diễn bởi
các ngôn
ngữ

được nhắc tới ở phần trên. Hiện nay đa số công
cụ
chỉ cho phép chú
giải bằng tay, do vậy quá trình
chú
giải thường đòi hỏi nhiều thời gian
.
− Các kho chứa. Sau khi tạo ra, các ontology và
phần
ngữ nghĩa phải được lưu vào
kho chứa. Những
kho
này thực chất là cơ sở dữ liệu cho phép lưu các

tả trên
ngôn ngữ RDFS hay DAML+OIL và
cho
phép biến đổi câu truy vấn trên những
ngôn ngữ
này
thành câu truy vấn SQL. Một trong những kho
chứa
điển hình là
Sesame
.
− Dịch vụ suy diễn. Dịch vụ suy diễn cho phép tìm
ra
giá trị cụ thể của các khái
niệm hoặc thuộc
tính

tương ứng với ontology có trong kho chứa. Một

dụ hệ
thống suy diễn kiểu này là Ontobroker
.
CHƯƠNG 3. KIẾN TRÚC CỦA SEMANTIC WEB
Mô hình kiến trúc:
Semantic Web là một tập hợp/một chồng (stack) các ngôn ngữ. Tất cả các lớp của
Semantic Web được sử dụng để đảm bảo độ an toàn và giá trị thông tin trở nên tốt nhất.
Trang 14
1. Lớp Unicode & URI:
Bảo đảm việc sử dụng tập kí tự quốc tế và cung cấp phương tiện nhằm định danh các đối
tượng trong Semantic Web. URI đơn giản chỉ là một định danh Web giống như các chuỗi
bắt đầu bằng “http” hay “ftp” mà bạn thường xuyên thấy trên mạng (ví
dụ:). Bất kỳ ai cũng có thể tạo một URI, và có quyền sở hữu
chúng. Vì vậy chúng đã hình thành nên một công nghệ nền tảng lý tưởng để xây dựng
một hệ thống mạng toàn cầu thông qua đó.
2. Lớp XML:
Cùng với các định nghĩa về namespace (vùng tên gọi) và schema (lược đồ) bảo đảm rằng
chúng ta có thể tích hợp các định nghĩa Semantic Web với các chuẩn dựa trên XML khác.
3. Lớp RDF [RDF] và RDFSchema [RDFS]:
Ta có thể tạo các câu lệnh (statement) để mô tả các đối tượng với những từ vựng và định
nghĩa của URI, và các đối tượng này có thể được tham chiếu đến bởi những từ vựng và
định nghĩa của URI ở trên. Đây cũng là lớp mà chúng ta có thể gán các kiểu (type) cho
các tài nguyên và liên kết. Và cũng là lớp quan trọng nhất trong kiến trúc Semantic Web .
4. Lớp Ontology:
Trang 15
Hỗ trợ sự tiến hóa của từ vựng vì nó có thể định nghĩa mối liên hệ giữa các khái
niệm khác nhau. Một Ontology (bản thể luận trong logic) định nghĩa một bộ từ vựng
mang tính phổ biến & thông thường, nó cho phép các nhà nghiên cứu chia sẻ thông tin

trong một hay nhiều lĩnh vực.
5. Lớp Digital Signature:
Được dùng để xác định chủ thể của tài liệu (ví dụ: tác giả hay nhan đề của một
loại tài liệu).
6. Các lớp Logic, Proof, Trust:
Lớp logic cho phép viết ra các luật (rule) trong khi lớp proof (thử nghiệm) thi hành
các luật và cùng với lớp trust (chấp nhận) đánh giá nhằm quyết định nên hay không nên
chấp nhận những vấn đề đã thử nghiệm.
CHƯƠNG 4. CÁC NGÔN NGỮ SEMANTIC WEB
1. XML:
XML là một đặc tả cho các tài liệu (document) mà máy tính đọc được. Đánh dấu
(Markup) có nghĩa là các chuỗi ký tự nào đó trong tài liệu có chứa thông tin chỉ ra vai trò
nội dung của tài liệu. Markup mô tả sơ đồ (layout) dữ liệu của tài liệu(document) và cấu
trúc logic. Markup làm thông tin tự mô tả tùy vào cảm nhận.
Markup được mô tả dưới dạng các từ trong dấu ngoặc nhọn hay còn gọi là tag. Ví dụ
<name> hay <h1>
Về khía cạnh này, XML giống như HTML. Tuy nhiên, tính mở rộng của ngôn ngữ chỉ ra
sự khác biệt quan trọng và cũng là đặc điểm chính của XML.
XML thực sự là một siêu ngôn ngữ mô tả dữ liệu (metalanguage), là một cơ cấu cho phép
biểu diễn các ngôn ngữ khác một cách chuẩn hóa. Nói cách khác XML chỉ cung cấp định
dạng dữ liệu cho tài liệu (document) được cấu trúc, không có đặc tả từ vựng(vocabulary)
Trang 16
thực sự. Vì vậy XML phổ biến toàn cầu, chúng ta có thể tạo những ngôn ngữ đánh dấu
(markup) mà chúng tùy ý sử dụng cho các kiểu tài liệu không giới hạn - đây là chuẩn
đang phổ biến. Bên cạnh nhiều ngôn ngữ riêng biệt, một số ngôn ngữ chuẩn được định
nghĩa trong XML (còn gọi là các ứng dụng XML). Ví dụ XHTML là một định nghĩa lại
của HTML 4.0 trong XML.
Các thực thể (entity) markup chính trong XML là các đơn vị (element). Chúng thông
thường bao gồm một tag mở và một tag đóng. Ví dụ <person> và </person>.
Các element có chứa các element khác hay text. Nếu 1 element không có nội dung, nó có

thể được viết ngắn gọn như <person/>. Các element nên được xếp lồng nhau, tag mở và
tag đóng của element con phải nằm trong tag mở và tag đóng của element cha.
Mỗi XML document phải có chính xác một root element.
Các element có thể chứa thuộc tính với giá trị nào đó, có định dạng là: "từ = giá trị" bên
trong tag của một element. Ví dụ <person name="John">. Dưới đây là một đoạn XML:
<?xml version=“1.0”?>
<employees>
List of persons in company:
<person name=“John”>
<phone>47782</phone>
On leave for 2001.
</person>
</employees>
XML không ngụ ý giải thích rõ ràng về dữ liệu. Thông qua tên của tag mà ý nghĩa của
đoạn XML trên trở nên rõ ràng đối với cảm nhận của chúng ta, nhưng nó không được mô
tả một cách hình thức. Chỉ có giải thích hợp lý là mã XML chứa các thực thể (entity), các
Trang 17
thực thể con và giá trị được đặt tên. Mỗi XML document thiết lập một cây có nhãn và thứ
tự. Tóm lại chúng vừa là điểm mạnh vừa là điểm yếu của XML. Chúng ta có thể mã hóa
bất kỳ kiểu cấu trúc dữ liệu nào theo một cú pháp không rõ ràng, nhưng XML không đặc
tả sử dụng dữ liệu và ngữ nghĩa (semantic) của chúng. Các nhà phát triển sử dụng XML
để trao đổi dữ liệu phải thỏa thuận trước về từ vựng, cách sử dụng và ý nghĩa.
2. DTDs và XML Schemas:
DTDs - Document Type Definitions (định nghĩa kiểu tài liệu) và XML Schemas (lược đồ
XML) mô tả tên của các element, attribute (thuộc tính) và việc sử dụng các element &
attribute trong document (tài liệu), dù cả hai không đặc tả ý nghĩa của tài liệu.
Cả hai là cơ cấu để chúng ta đặc tả cấu trúc của các XML document. Chúng ta có thể xác
minh tính hợp lệ của các document đối với cấu trúc được mô tả trước bởi một DTD hay
XML Schema.
Các DTD chỉ cung cấp một luật cấu trúc đơn giản, chúng mô tả các element được phép

xếp lồng vào nhau, các giá trị có thể có của element và những nơi text (văn bản) được
phép. Ví dụ một DTD có thể ra luật mỗi element (đơn vị) Person phải có một attribute
(thuộc tính) name và có thể có một element con được gọi là phone,những nội dung của
chúng phải là dạng text (văn bản). Cú pháp của DTD trông khá bất tiện, nhưng nó thực sự
rất đơn giản.
Các XML Schema là bản nâng cấp của DTD. XML Schema có nhiều thuận lợi hơn DTD.
Trước tiên, cơ cấu XML Schema cung cấp ngữ pháp phong phú cho việc mô tả cấu trúc
các element. Ví dụ, chúng ta có thể đặc tả chính xác các thể hiện của element con, chúng
ta có thể đặc tả giá trị mặc định và đặt các element vào trong một nhóm được lựa chọn,
điều này có nghĩa là một trong các element của nhóm được phép ở tại một nơi cụ thể. Kế
đến XML Schema cung cấp kiểu dữ liệu.
Trang 18
Trong ví dụ ở đoạn trước, chúng ta có thể ra qui định nội dung của element phone là 5 số,
có thể đặt trước 5 số vào giữa ngoặc đơn. Sự thuận tiện ở chổ XML Schema cung cấp cơ
cấu kế thừa và gộp vào, cho phép chúng ta tái sử dụng các định nghĩa (definitions)
element thông thường và mô phỏng theo các định nghĩa đang tồn tại.
Sự khác biệt cuối cùng đối với DTD là các luật XML Schema dùng XML như cú pháp
mã hóa, làm đơn giản hóa các công cụ phát triển vì cả luật cấu trúc (Structure
Prescription) và đặc tả tài liệu (prescribed documents) sử dụng cùng cú pháp. Các nhà
phát triển đặc tả XML Schema tìm thấy điểm này bằng cách sử dụng một tài liệu XML
Schema để định nghĩa lớp (class) của các XML Schema document.
Sau cùng, vì một XML Schema rescription (luật) là một ứng dụng XML, nó phải tuân
theo các luật cho cấu trúc của nó, mà các luật này được định nghĩa bởi một XML Schema
prescription. Tuy nhiên, cách định nghĩa đệ qui này khá rối.
3. RDF:
RDF là nền tảng cho việc biểu diễn dữ liệu trong lĩnh vực Web ngữ nghĩa. Thông
tin biểu diễn theo mô hình RDF là một phát biểu (statement)ở dạng cấu trúc bộ ba
gồm ba thành phần cơ bản là: subject, predicate, object. Trong đó:
• Subject chỉ đối tượng đang được mô tả đóng vai trò là chủ thể.
• Predicate (còn được gọi là property)là kiểu thuộc tính hay quan hệ.

• Object là giá trị thuộc tính hay đối tượng của chủ thể đã nêu. Object có thể là
một giá trị nguyên thủy như số nguyên, chuỗi hoặc cũng có thể là một tài
nguyên.
Ví dụ:
Trang 19
Đây là phát biểu mô tả một chủ thể person-1 có kiểu thuộc tính name với giá trị là
An. Phát biểu có thể được tạm hiểu là: person-1 có tên An.
Có thể liệt kê một số ưu điểm của việc lưu trữ dữ liệu RDF so với dữ liệu truyền
thống là:
• Tổ chức dữ liệu đơn giản, đồng nhất nên thông tin dễ dàng thêm bớt chỉnh
sửa.
• Cấu trúc bộ ba giúp cho thông tin dễ truy xuất bởi các hệ thống suy luận, tìm
kiếm ngữ nghĩa. Cũng nhờ vậy mà những bộ xử lí RDF có thể suy luận ra
những thông tin mới không có trong hệ dữ liệu.
• Chia sẻ dữ liệu trên mạng dễ dàng nhờ sự đồng nhất
Mô hình RDF thể hiện được nhiều ưu điểm trong việc biễu diễn thông tin. Chính vì
vậy cần phải có một cách thức chung để truyền tải dữ liệu RDF trên internet. Đó là
RDF/XML syntax do W3C đưa ra năm 1999. Đây là một ngôn ngữ dựa trên XML,
nó bao gồm một tập các quy tắc và từ vựng để hỗ trợ cho biễu diễn thông tin RDF.
4. RDF Schemas:
RDF-Schema là một ngôn ngữ Ontology cơ bản. Nó được phát triển ở tầng trên của
RDF cho nên bản thân RDF-Schema cũng chính là RDF, nó được mở rộng từ RDF
và bổ sung thêm các tập từ vựng để hỗ trợ cho việc xây dựng các Ontology được dễ
dàng. Như chúng ta đã biết, ngôn ngữ RDF chỉ giúp cho thông tin được thể hiện ở
dạng bộ ba theo đúng mô hình RDF chứ thông tin vẫn chưa thể hiện gì về mặt ngữ
nghĩa. Do đó, xây dựng RDFS là điều cần thiết để hình thành nên ngữ nghĩa cho
Trang 19
Đây là phát biểu mô tả một chủ thể person-1 có kiểu thuộc tính name với giá trị là
An. Phát biểu có thể được tạm hiểu là: person-1 có tên An.
Có thể liệt kê một số ưu điểm của việc lưu trữ dữ liệu RDF so với dữ liệu truyền

thống là:
• Tổ chức dữ liệu đơn giản, đồng nhất nên thông tin dễ dàng thêm bớt chỉnh
sửa.
• Cấu trúc bộ ba giúp cho thông tin dễ truy xuất bởi các hệ thống suy luận, tìm
kiếm ngữ nghĩa. Cũng nhờ vậy mà những bộ xử lí RDF có thể suy luận ra
những thông tin mới không có trong hệ dữ liệu.
• Chia sẻ dữ liệu trên mạng dễ dàng nhờ sự đồng nhất
Mô hình RDF thể hiện được nhiều ưu điểm trong việc biễu diễn thông tin. Chính vì
vậy cần phải có một cách thức chung để truyền tải dữ liệu RDF trên internet. Đó là
RDF/XML syntax do W3C đưa ra năm 1999. Đây là một ngôn ngữ dựa trên XML,
nó bao gồm một tập các quy tắc và từ vựng để hỗ trợ cho biễu diễn thông tin RDF.
4. RDF Schemas:
RDF-Schema là một ngôn ngữ Ontology cơ bản. Nó được phát triển ở tầng trên của
RDF cho nên bản thân RDF-Schema cũng chính là RDF, nó được mở rộng từ RDF
và bổ sung thêm các tập từ vựng để hỗ trợ cho việc xây dựng các Ontology được dễ
dàng. Như chúng ta đã biết, ngôn ngữ RDF chỉ giúp cho thông tin được thể hiện ở
dạng bộ ba theo đúng mô hình RDF chứ thông tin vẫn chưa thể hiện gì về mặt ngữ
nghĩa. Do đó, xây dựng RDFS là điều cần thiết để hình thành nên ngữ nghĩa cho
Trang 19
Đây là phát biểu mô tả một chủ thể person-1 có kiểu thuộc tính name với giá trị là
An. Phát biểu có thể được tạm hiểu là: person-1 có tên An.
Có thể liệt kê một số ưu điểm của việc lưu trữ dữ liệu RDF so với dữ liệu truyền
thống là:
• Tổ chức dữ liệu đơn giản, đồng nhất nên thông tin dễ dàng thêm bớt chỉnh
sửa.
• Cấu trúc bộ ba giúp cho thông tin dễ truy xuất bởi các hệ thống suy luận, tìm
kiếm ngữ nghĩa. Cũng nhờ vậy mà những bộ xử lí RDF có thể suy luận ra
những thông tin mới không có trong hệ dữ liệu.
• Chia sẻ dữ liệu trên mạng dễ dàng nhờ sự đồng nhất
Mô hình RDF thể hiện được nhiều ưu điểm trong việc biễu diễn thông tin. Chính vì

vậy cần phải có một cách thức chung để truyền tải dữ liệu RDF trên internet. Đó là
RDF/XML syntax do W3C đưa ra năm 1999. Đây là một ngôn ngữ dựa trên XML,
nó bao gồm một tập các quy tắc và từ vựng để hỗ trợ cho biễu diễn thông tin RDF.
4. RDF Schemas:
RDF-Schema là một ngôn ngữ Ontology cơ bản. Nó được phát triển ở tầng trên của
RDF cho nên bản thân RDF-Schema cũng chính là RDF, nó được mở rộng từ RDF
và bổ sung thêm các tập từ vựng để hỗ trợ cho việc xây dựng các Ontology được dễ
dàng. Như chúng ta đã biết, ngôn ngữ RDF chỉ giúp cho thông tin được thể hiện ở
dạng bộ ba theo đúng mô hình RDF chứ thông tin vẫn chưa thể hiện gì về mặt ngữ
nghĩa. Do đó, xây dựng RDFS là điều cần thiết để hình thành nên ngữ nghĩa cho
Trang 20
thông tin, là cơ sở để xây dựng các công cụ tìm kiếm ngữ nghĩa. RDFS và RDF có
mối liên hệ tương đối gần gũi nên đôi lúc ta gọi ngôn ngữ này là RDF/RDFS.
Trong hình vẽ chúng ta thấy, ở tầng RDF chỉ biểu diễn được thông tin ở dạng bộ ba.
Đến tầng RDFS, thông tin đã được phân loại rõ ràng. Chẳng hạn như Quan Thanh
Tho có kiểu là Lecturer và Lecturer là lớp con của Academic Staff…
5. OWL:
OWL là ngôn ngữ ontology khá mạnh, nó ra đời sau RDFS nên biết kế thừa những
lợi thế của ngôn ngữ này đồng thời bổ sung thêm nhiều yếu tố giúp khắc phục được
những hạn chế của RDFS. OWL giúp tăng thêm yếu tố logic cho thông tin và khả
năng phân loại, ràng buộc kiểu cũng như số yếu tố tương đối mạnh.
Ta hãy tìm hiểu sơ qua các lớp và thuộc tính của OWL để thấy được những ưu điểm
của OWL so với RDFS.
Classes Properties
owl:AllDifferent owl:allValuesFrom owl:TransitiveProperty
owl:Class owl:backwardCompatibleWith owl:inverseOf
owl:DataRange owl:cardinality owl:maxCardinality
owl:DataTypeProperty owl:complementOf owl:minCardinality
owl:DeprecatedProperty owl:distinctMembers owl:oneOf
Trang 20

thông tin, là cơ sở để xây dựng các công cụ tìm kiếm ngữ nghĩa. RDFS và RDF có
mối liên hệ tương đối gần gũi nên đôi lúc ta gọi ngôn ngữ này là RDF/RDFS.
Trong hình vẽ chúng ta thấy, ở tầng RDF chỉ biểu diễn được thông tin ở dạng bộ ba.
Đến tầng RDFS, thông tin đã được phân loại rõ ràng. Chẳng hạn như Quan Thanh
Tho có kiểu là Lecturer và Lecturer là lớp con của Academic Staff…
5. OWL:
OWL là ngôn ngữ ontology khá mạnh, nó ra đời sau RDFS nên biết kế thừa những
lợi thế của ngôn ngữ này đồng thời bổ sung thêm nhiều yếu tố giúp khắc phục được
những hạn chế của RDFS. OWL giúp tăng thêm yếu tố logic cho thông tin và khả
năng phân loại, ràng buộc kiểu cũng như số yếu tố tương đối mạnh.
Ta hãy tìm hiểu sơ qua các lớp và thuộc tính của OWL để thấy được những ưu điểm
của OWL so với RDFS.
Classes Properties
owl:AllDifferent owl:allValuesFrom owl:TransitiveProperty
owl:Class owl:backwardCompatibleWith owl:inverseOf
owl:DataRange owl:cardinality owl:maxCardinality
owl:DataTypeProperty owl:complementOf owl:minCardinality
owl:DeprecatedProperty owl:distinctMembers owl:oneOf
Trang 20
thông tin, là cơ sở để xây dựng các công cụ tìm kiếm ngữ nghĩa. RDFS và RDF có
mối liên hệ tương đối gần gũi nên đôi lúc ta gọi ngôn ngữ này là RDF/RDFS.
Trong hình vẽ chúng ta thấy, ở tầng RDF chỉ biểu diễn được thông tin ở dạng bộ ba.
Đến tầng RDFS, thông tin đã được phân loại rõ ràng. Chẳng hạn như Quan Thanh
Tho có kiểu là Lecturer và Lecturer là lớp con của Academic Staff…
5. OWL:
OWL là ngôn ngữ ontology khá mạnh, nó ra đời sau RDFS nên biết kế thừa những
lợi thế của ngôn ngữ này đồng thời bổ sung thêm nhiều yếu tố giúp khắc phục được
những hạn chế của RDFS. OWL giúp tăng thêm yếu tố logic cho thông tin và khả
năng phân loại, ràng buộc kiểu cũng như số yếu tố tương đối mạnh.
Ta hãy tìm hiểu sơ qua các lớp và thuộc tính của OWL để thấy được những ưu điểm

của OWL so với RDFS.
Classes Properties
owl:AllDifferent owl:allValuesFrom owl:TransitiveProperty
owl:Class owl:backwardCompatibleWith owl:inverseOf
owl:DataRange owl:cardinality owl:maxCardinality
owl:DataTypeProperty owl:complementOf owl:minCardinality
owl:DeprecatedProperty owl:distinctMembers owl:oneOf
Trang 21
owl:DeprecatedClass owl:differentFrom owl:onProperty
owl:FunctionalProperty owl:disjointWith owl:priorVersion
owl:InverseFunctionalProperty owl:equivalentClass owl:sameAs
owl:Nothing owl:equivalentProperty owl:sameIndividualAs
owl:ObjectProperty owl:hasValue owl:someValuesFrom
owl:Ontology owl:imports owl:subClassOf
owl:Restriction owl:incompatiblewith owl:unionOf
owl:SymmetricProperty owl:intersectionOf owl:versionInfo
Trong OWL có thêm một số thuộc tính hỗ trợ suy luận và ràng buộc.
• Hỗ trợ suy luận:
• Tính chất bắt cầu:
Nếu như chúng ta có một lớp thuộc tính “contain” và gán cho nó thuộc tính
owl:transitivePropertive thì thuộc tính “contain” này sẽ có tính chất bắt cầu. Giả sử
ta có thông tin A contain B và B contain C, thì hệ thống sẽ tự suy luận ra một thông
tin khác là A contain C, và đây là biểu diễn thuộc tính contain trong OWL:
{owl:TransitiveProperty
{rdf:ID,"contain"}
}
• Tính chất đảo ngược:
Nếu A có thuộc tính hasParent là B, thì suy ra B có thuộc tính hasChild là A.
{owl:OjectProperty
{Rdf:ID, „hasChild‟}

{owl:inverseOf, #hasParent}
}
• Hỗ trợ ràng buộc:
• Ràng buộc kiểu:
Giả sử ta đã có lớp Human, thừa kế từ hai lớp này là Man và Woman. Ta muốn một
đối tượng thuộc lớp Man thì không thể thuộc lớp Woman và ngược lại.
{owl :Class
Trang 22
{rdf :about, #Man}
{owl :disjointWith, #Woman}
}
• Ràng buộc số yếu tố:
Ta muốn một người thì chỉ có một cha và một mẹ. Tức thuộc tính hasParent luôn
được gán số yếu tố là 2.
{owl :Restriction
{owl :onProperty, #hasParent}
{owl :cardinality, 2} }
Trên đây là một vài ví dụ mà trong RDFS không thể làm được. Rõ ràng OWL có nhiều
ưu điểm hơn trong việc xây dựng hệ thống ontology thông minh và có phân loại tốt. Với
những đặc điểm đó, OWL ngày nay đã trở thành ngôn ngữ ontology chính thức cho việc
xây dựng và phát triển các hệ thống Semantic Web.
1. DAML + OIL:
DAML + OIL là kết quả từ hai dự án nghiên cứu độc lập với nhau là DAML và OIL
nhằm khắc phục những hạn chế về kiểu dữ liệu trong các ngôn ngữ Ontology trước
đó là RDF, RDFS. DAML + OIL (gọi tắt là DAML)là ngôn ngữ đánh dấu cho các
tài nguyên trên Web, có hỗ trợ suy luận. Ngôn ngữ này được xây dựng có kế thừa
từ các chuẩn của W3C như XML, RDF, RDFS Một số điểm đáng chú ý của ngôn
ngữ này là:
• Cho phép giới hạn các kiểu dữ liệu được định nghĩa trong XML Schema hay
bởi người dùng. Trong DAML, một thuộc tính có thể nhận giá trị trên nhiều

khoảng khác nhau, tạo nên tính uyển chuyển trong việc mô tả dữ liệu.
• Cho phép định nghĩa thuộc tính unique để xác định các đối tượng.
• Cho phép mô tả các quan hệ như hoán đổi và bắc cầu.
DAML sau đó tiếp tục trở thành nền tảng cho một ngôn ngữ Ontology khác là
OWL. DAML về cơ bản rất giống với OWL (ngoại trừ tên một số ít thuật ngữ, cú
pháp được sửa đổi), tuy nhiên khả năng mô tả các ràng buộc kém hơn. Theo thống
Trang 23
kê, đã có khoảng 5 triệu phát biểu DAML từ hơn 20.000 Website trên Internet vào
năm 2002.
Tài liệu tham khảo
1. Kruk Sebastian Ryszard, Decker Stefan, Zieborak Lech. Adding Semantic Web
Technologies to Digital Libraries. - 2005. />2. Nguyễn Văn Triều Dâng. Ứng dụng web ngữ nghĩa vào phân tích trực tuyến: Luận
văn thạc sĩ CNTT. - TP. Hồ Chí Minh: Đại học Công nghệ thông tin, 2006. – 115 tr.
3. Sebastian Ryszard Kruk1, Bernhard Haslhofer, Piotr Piotrowski, Adam Westerski,
Tomasz Woroniecki1 - The Role of Ontologies in Semantic Digital Libraries. -
paper 2007.
4. />5. Tài liệu, bài giảng môn học của PGS. TS. Đỗ Văn Nhơn.

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×