Công nghệ web ngữ nghĩa và ứng dụng tìm kiếm metadata

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.4 MB, 98 trang )

LỜI NÓI ĐẦU
World Wide Web chứa một lượng thông tin khổng lồ, chúng được tạo ra
từ các tổ chức, cộng đồng và cá nhân với nhiều lý do khác nhau. Người dùng dễ
dàng truy cập những thông tin này bằng cách chỉ ra địa chỉ URI (Uniform
Resource Locator) và theo các liên kết để tìm ra tài nguyên liên quan khác.
Tuy nhiên chính sự đơn giản đó đã dẫn đến một số mặt hạn chế. Chẳng
hạn như việc người dùng dễ bị lạc hay phải đối đầu với một lượng thông tin
không hợp lý và không liên quan được trả về từ kết quả tìm kiếm trên Web. Tính
đơn giản của các kỹ thuật xây dựng Web hiện nay đã gây ra hiện tượng thắt cổ
chai, tạo khó khăn trong việc tìm kiếm, rút trích, bảo trì và phát sinh thông tin.
Để khắc phục nhược điểm của Web hiện tại, khái niệm Web ngữ nghĩa đã
ra đời. Có thể hiểu rằng Web ngữ nghĩa là một mạng lưới các thông tin được liên
kết theo một cách thức để máy có thể dễ dàng, cũng có thể hiểu đơn giản về nó
như một cách trình bày dữ liệu.
Với sự lớn mạnh và khả năng lưu trữ thông tin ngữ nghĩa, Web ngữ nghĩa
sẽ trở thành một thế hệ Web cho tương lai - thế hệ mà con người đang chờ đợi.
Chính vì lý do đó mà em đã chọn đề tài “Web ngữ nghĩa” để làm đồ án tốt
nghiệp.
Đồ án bao gồm các chương sau:
Chương 1: Tổng quan về Web ngữ nghĩa
Chương 2: Khung mô tả tài nguyên - RDF
Chương 3: Thực nghiệm thiết kế mô hình dữ liệu
Em đã cố gắng rất nhiều để đồ án đạt được kết quả tốt nhất. Tuy nhiên do
kinh nghiệm còn non trẻ và trong một thời gian ngắn nên những sai sót xảy ra là
điều không thể tránh khỏi. Em xin trân thành cảm ơn và trân trọng tiếp thu tất cả
những ý kiến đóng góp của thầy cô và các bạn để đồ án được hoàn thiện hơn.

1

MỤC LỤC

MỤC LỤC ...................................................................................................................2
CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA ...................................................4

1.1.
Giới thiệu về Web ngữ nghĩa. ............................................................4
1.1.1. Những hạn chế của WWW ..........................................................4
1.1.2. Sự ra đời của Web ngữ nghĩa ......................................................4
1.1.3. Hoạt động của Web ngữ nghĩa ....................................................5
1.1.4. Kiến trúc Web ngữ nghĩa ............................................................7
1.2.
Giới thiệu các ngôn ngữ sử dụng trong Web ngữ nghĩa...................8
1.2.1. XML (eXtensible Markup Language) - Ngôn ngữ đánh dấu mở
rộng
8
1.2.2. DTDs và XMLschema..................................................................9
1.2.3. RDF (Resource Description Framework)-Khung mô tả tài
nguyên 13
1.2.4. OWL (Ontology Web Language)-Ngôn ngữ Web Ontology....14
1.2.4.1. Khái niệm về Ontology .......................................................14
1.2.4.2. Các phần tử trong Ontology...............................................15
1.2.4.3. Ngôn ngữ Web Ontology ....................................................16
1.2.4.4. Các phiên bản......................................................................17
1.3.
Các ứng dụng nổi bật.......................................................................18
CHƯƠNG 2 : KHUNG MÔ TẢ TÀI NGUYÊN - RDF...............................................22

2.1.
Mô hình khung mô tả tài nguyên RDF ...........................................22
2.2.
Một số khái niệm cơ bản..................................................................22

2.2.1. Khái niệm bộ ba .........................................................................22
2.2.2. Khái niệm Qname (Qualified Name).........................................23
2.2.3. Khái niệm Literal.......................................................................24
2.2.4. Dữ liệu có cấu trúc và Blank Node............................................26
2.3.
Đồ thị RDF .......................................................................................29
2.4.
Cú pháp RDF/XML .........................................................................31
2.4.1. Nguyên tắc cơ bản......................................................................31
2.4.2. Cú pháp XML/RDF với dữ liệu kiểu Blank node.....................35
2.4.3.
Cú pháp RDF/XML với phần tử Literal ..................................36
2.5.
RDFSchema - Giản đồ RDF ............................................................37
2.5.1. Giới thiệu ....................................................................................37
2.5.2. Lớp..............................................................................................38
2.5.2.1. Định nghĩa lớp.....................................................................38
2.5.2.2
Cách khai báo......................................................................38
2.5.2.3. Bảng tổng kết các từ khóa ..................................................40
2.5.2.4. Ví dụ ....................................................................................41
2.5.3. Thuộc tính ..................................................................................44
2.5.3.1. Giới thiệu.............................................................................44
2.5.3.2. rdfs:range ............................................................................44
2.5.3.3. rdfs:domain .........................................................................45
2.5.3.4. Bảng các từ khóa.................................................................45
2.5.3.5. Ví dụ ....................................................................................47

2

2.6.
RDF Container-Kho chứa RDF ......................................................50
2.7.
RDF collections – Tập hợp RDF .....................................................56
2.8.
Truy vấn dữ liệu trong RDF............................................................59
2.8.1. Giới thiệu ....................................................................................59
2.8.2. Tạo một truy vấn đơn giản ........................................................60
2.8.3. Cú pháp của câu truy vấn..........................................................61
2.8.4. Những dạng cú pháp khác.........................................................63
2.8.5. Ràng buộc dữ liệu ......................................................................65
2.8.5.1. Thêm vào kiểu Optional .....................................................65
2.8.5.2. Ràng buộc trong khối Optional..........................................67
2.8.5.3. Nhiều khối Optional............................................................67
2.8.5.4. Khối Optional lồng nhau ....................................................69
2.8.6. Các phép toán và điều kiện trên câu truy vấn ..........................70
2.8.6.1. Phép hội...............................................................................70
2.8.6.2. Phép chiếu ...........................................................................71
2.8.6.3. DISTINCT...........................................................................71
2.8.6.4. ORDER BY .........................................................................72
2.8.6.5. LIMIT..................................................................................73
CHƯƠNG 3: THỰC NGHIỆM THIẾT KẾ MÔ HÌNH DỮ LIỆU...............................77

3.1.
Ý tưởng.............................................................................................77
3.2.
Thiết kế mô hình dữ liệu..................................................................77
3.2.1. Giới thiệu bộ từ vựng FOAF .....................................................77
3.2.2. Ví dụ ...........................................................................................81

3.3.
Thiết kế dữ liệu ................................................................................82
3.3.1. Thiết kế ontology PC..................................................................82
3.3.2. Thiết kế dữ liệu mô tả tài nguyên người ...................................86
3.3.2.1. Nội dung file RDF mô tả thông tin về người......................86
3.3.2.2. Nội dung file RDF mô tả thông tin về nhóm người ...........88
3.3.2.3. Nội dung file RDF mô tả thông tin về khả năng ................89
3.3.3. Thiết kế dữ liệu lưu trữ tài nguyên ...........................................90
3.3.3.1. Thiết kế file PersonList.rdf.................................................90
3.3.3.2. Thiết kế file GroupList.rdf .................................................91
3.3.3.3. Thiết kế file CompetenceList.rdf........................................91
3.3.4. Thiết kế dữ liệu lưu trữ các địa chỉ URI của tài nguyên ..........92
3.3.4.1. Thiết kế file Person.rdf .......................................................92
3.3.4.2. Thiết kế file Group.rdf........................................................92
3.3.4.3. Thiết kế file Competence.rdf ..............................................93
PHỤ LỤC A................................................................................................................96
PHỤ LỤC B ...............................................................................................................97
TÀI LIỆU THAM KHẢO .........................................................................................98

3

CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA
1.1.

Giới thiệu về Web ngữ nghĩa.

1.1.1. Những hạn chế của WWW
Hiện tại một trang Web được tạo ra bởi một lập trình viên và đi kèm với
một trình duyệt Web để có thể xem trang Web đó qua mạng Internet. Web chứa

đựng một lượng dữ liệu khổng lồ đã được số hóa, mạng toàn cầu thật sự là một
công cụ có giá trị đối với việc tìm kiếm và phổ biến ý tưởng cũng như kiến thức.
Các công cụ tìm kiếm thường duyệt qua tất cả các nội dung của các trang
Web và tạo một cơ sở dữ liệu để giúp cho người sử dụng có thể dễ dàng tìm kiếm
một số trang Web chứa những từ hoặc cụm từ đang cần tìm kiếm. Tuy nhiên
trong nhiều trường hợp, người sử dụng vẫn phải phân loại các kết quả tìm kiếm
để lấy được các thông tin cần thiết hay lùng sục thật kỹ một trang Web nào đó để
thu được thông tin đặc biệt mà họ cần.
Có một thực tế là thông tin trên mạng vẫn chưa được sử dụng một cách
trực tiếp và có hiệu quả. Những trang Web này được thiết kế dành cho con người
chứ không phải cho máy tính. Vì vậy ý nghĩa của nội dung chứa đựng trong các
trang Web phải được tiếp nhận bởi những người xem chúng, đọc các tài liệu
HTML và nhìn thấy tên của các đường dẫn siêu liên kết
1.1.2. Sự ra đời của Web ngữ nghĩa
Chính vì sự chưa hoàn hảo của Web 2.0 và WWW vẫn là một đám mây
chứa đầy những thông tin vô định hình, mà xuất hiện khái niệm về Web ngữ
nghĩa với cách trình bày dữ liệu mới nhằm khắc phục hạn chế của WWW bằng
cách xóa đi lớp mây ấy bởi một trật tự nhất định.
Web được phát minh vào năm 1989 bởi Tim Berner-Lee một nhà nghiên
cứu về Hệ thống máy tính của viện Massachusetts (Mỹ). Ngay từ khi mới được
tạo ra, Web được dự kiến sẽ dùng các siêu tệp tin để tạo ra khả năng tìm kiếm
chính xác và dễ dàng hơn nhờ có sự hỗ trợ của các tác tử tự động. Viễn cảnh của
Web được mô tả như sau: “Web sẽ được thiết kế tương tự như một không gian
thông tin. Ở mức toàn cầu, Web không chỉ hữu ích đối với sự liên lạc giữa người

4

với người mà ngay cả máy tính cũng có khả năng tham gia và hỗ trợ phần nào”.
Một trong những trở ngại chính của vấn đề này là hầu hết thông tin trên Web

được thiết kế dành cho mục đích sử dụng của con người. Trong khi đó cách tiếp
cận của Web ngữ nghĩa là tạo ra ngôn ngữ phát triển Web nhằm diễn tả thông tin
theo một định dạng mà máy tính có thể hiểu và xử lý được.
Mục tiêu ban đầu của Web ngữ nghĩa là để hỗ trợ người dùng tìm kiếm
thông tin trên mạng một cách nhanh chóng, chuẩn xác và thông minh hơn so với
các công cụ tìm kiếm truyền thống.
Kể từ đó đến nay, các kỹ thuật liên quan đến Web ngữ nghĩa không ngừng
được hoàn thiện, các ứng dụng liên quan đến Web ngữ nghĩa cũng được mở rộng
như: Phát triển các chuẩn công nghệ chung để biểu diễn thông tin và cho phép
máy tính có thể hiểu được một số thông tin trên Web, hỗ trợ tìm kiếm thông minh
hơn, hỗ trợ việc khám phá, tách chiết thông tin, tích hợp dữ liệu và tự động hóa
một số công việc thay cho con người.
Do đó thay vì người sử dụng cố gắng làm việc với một công cụ tìm kiếm
Boolean thông qua những từ khóa, có thể sử dụng một tác tử để tìm kiếm dữ liệu
một cách chính xác. Một tác tử được định nghĩa bởi W3C là một loại “bot” đặc
biệt – là chương trình mô phỏng theo hoạt động của con người. Chương trình này
họat động trên toàn mạng Internet, trong suốt với người sử dụng, tập hợp các
thông tin hữu ích để hiển thị tại nơi yêu cầu.
1.1.3. Hoạt động của Web ngữ nghĩa
Xét về mặt bản chất, Web ngữ nghĩa chỉ là một công cụ để con người cũng
như máy tính sử dụng để biểu diễn thông tin, hay nói chính xác hơn thì Web ngữ
nghĩa chỉ là một dạng dữ liệu trên Web. Khác với các dạng thức dữ liệu được
trình bày trong HTML, dữ liệu trong Web ngữ nghĩa được đánh dấu, phân lớp,
mô hình hóa, được bổ sung thêm các thuộc tính, các mối liên hệ… theo các lĩnh
vực cụ thể, qua đó giúp cho các phần mềm máy tính có thể hiểu được dữ liệu và
tự động xử lý được những dữ liệu đó. Chẳng hạn, với cụm từ “Nguyễn Ngọc
Liên”, trong không gian Web ngữ nghĩa, nó cũng có thể được suy luận tới cái

5

nick của người đó là: "lienngoc_it", với các thuộc tính cụ thể như: năm sinh, địa
chỉ, số điện thoại, email...
Web ngữ nghĩa sẽ phát triển thêm mạng web chứ không thay thế nó. Và
khi trở nên hoàn hảo, Web ngữ nghĩa sẽ giúp các phần mềm định vị thông tin
trong một số trang Web và truy cập trực tiếp vào thông tin đó. Ở một góc độ nào
đó Web ngữ nghĩa sẽ trở thành một loại dữ liệu toàn cầu.
Web ngữ nghĩa đề cập tới 2 vấn đề: Những định dạng chung để trao đổi dữ
liệu và ngôn ngữ để diễn tả mối quan hệ giữa dữ liệu với đối tượng của thế giới
thực. Để thực hiện 2 điều này, Web ngữ nghĩa bổ xung những thẻ chứa thông tin
mô tả để xác định các thành phần của dữ liệu trên những trang Web. Những thẻ
này cũng tương tự như phiếu mượn sách trong thư viện chứa: tên sách, tên tác
giả, nhà xuất bản, mã số, năm xuất bản, thể loại vv… Những thẻ chứa thông tin
mô tả này sẽ được liên kết với nhau theo mô hình khung mô tả tài nguyên RDF
(Resource Description Frameword), nhờ đó máy tính có thể trích xuất ý nghĩa
của các thành phần của dữ liệu trên trang Web một cách dễ dàng, giống như
Internet hiện tại đang liên kết các văn kiện riêng lẻ.
Sở dĩ Web ngữ nghĩa hiện nay chưa được phát triển mạnh là vì bản thân
các lớp ngôn ngữ biểu diễn chúng còn chưa được hoàn thiện, các ứng dụng hỗ trợ
Web ngữ nghĩa còn rất ít và hiện đang được nghiên cứu, phát triển. Có thể hình
dung điều này thông qua ví dụ cụ thể là ngôn ngữ HTML, một ngôn ngữ được
dùng để biểu diễn thông tin trên trang Web hiện tại. Các trang Web sử dụng
HTML đều có thể được đọc và hiển thị trên các chương trình gọi là trình duyệt
(chẳng hạn như IE hay Firefox…), còn các trang Web ngữ nghĩa thì hiện nay
chưa có một chương trình nào cụ thể được gọi là trình duyệt để xử lý nó cả.
Bản thân Web ngữ nghĩa chỉ là một dạng dữ liệu, vì vậy cần phải có các
chương trình máy tính chuyên biệt để xử lý nó. Đó chính là các công cụ cho phép
thu hổi, tách chiết, tìm kiếm, biểu diễn thông tin… trong không gian của Web
ngữ nghĩa. Hiện nay, cùng với việc đề xuất ra các chuẩn ngôn ngữ biểu diễn Web
ngữ nghĩa, các chương trình xử lý Web ngữ nghĩa cũng đang được gấp rút nghiên

cứu và phát triển.

6

1.1.4. Kiến trúc Web ngữ nghĩa
Mô hình của Web ngữ nghĩa được cấu thành từ nhiều tầng khác nhau.
Hiện nay, đã có một số nhà nghiên cứu đưa ra những mô hình khác nhau về Web
ngữ nghĩa dựa trên những cách nhìn nhận khác nhau. Mô hình dưới đây lấy từ
trang web của tổ chức W3C:

Hình 1.1. Kiến trúc Web ngữ nghĩa
Web ngữ nghĩa là một tập hợp/một chồng các ngôn ngữ. Tất cả các lớp của
Web ngữ nghĩa được sử dụng để đảm bảo độ an toàn và giá trị thông tin trở nên
tốt nhất. Trên thực tế thì một số tầng đã được hoàn thiện, có những ứng dụng
rộng rãi và được nhiều người biết đến như Unicode, XML. Bắt đầu từ tầng logic
trở lên, hiện nay các nhà khoa học vẫn đang còn bắt tay vào nghiên cứu.
 Lớp Unicode & URI: Nhằm đảm bảo việc sử dụng tập kí tự quốc tế.
URI (Uniform Resource Identifier)-Định danh tài nguyên dùng để
định danh một tài nguyên trên mạng toàn cầu. Trong Web ngữ nghĩa,
URI được nhắc đến như một khái niệm để chỉ các tài nguyên, nó liên
kết các thành phần của Web ngữ nghĩa lại với nhau.
 Lớp XML Cùng với các định nghĩa về namespace và schema bảo đảm
rằng chúng ta có thể tích hợp các định nghĩa Web ngữ nghĩa với các
chuẩn dựa trên XML khác.
 Lớp RDF và RDFSchema Ta có thể tạo các phát biểu để mô tả các
đối tượng với những từ vựng và định nghĩa của URI và các đối tượng

7

này có thể được tham chiếu đến bởi những từ vựng và định nghĩa của
URI ở trên. Đây cũng là lớp mà chúng ta có thể gán các kiểu cho các
tài nguyên và liên kết và cũng là lớp quan trọng nhất trong kiến trúc
Web ngữ nghĩa.
 Lớp Ontology: Ontology là một tập các khái niệm và quan hệ giữa
các khái niệm được định nghĩa cho một lĩnh vực nào đó nhằm vào việc
biểu diễn và trao đổi thông tin. Ontology định nghĩa một bộ từ vựng
mang tính phổ biến và thông thường nó cho phép các nhà nghiên cứu
chia sẻ thông tin trong một/nhiều lĩnh vực. Tóm lại Ontology bao gồm
các định nghĩa về các khái niệm căn bản trong một lĩnh vực và các
mối liên hệ giữa chúng mà máy có thể hiểu được.
 Lớp Digital Signature Được dùng để xác định chủ thể của tài liệu.
 Lớp Logic Cho phép viết ra các luật, khai báo các nguyên tắc logic và
cho phép máy tính suy diễn bằng cách dùng những nguyên tắc này.
 Lớp Trust Đánh giá nhằm quyết định ứng dụng nên hay không nên
tin tưởng/chấp nhận chứng cớ.
 Lớp Proof Thi hành các luật.

1.2.

Giới thiệu các ngôn ngữ sử dụng trong Web ngữ nghĩa.
Ngôn ngữ biểu diễn dữ liệu và tri thức là một khía cạnh quan trọng của

Web ngữ nghĩa. Có nhiều ngôn ngữ cho Web ngữ nghĩa, hầu hết những ngôn ngữ
này dựa trên XML hay sử dụng XML làm cú pháp. Một số ngôn ngữ sử dụng
RDF và RDF schema.
1.2.1. XML (eXtensible Markup Language) - Ngôn ngữ đánh dấu mở rộng
XML là một đặc tả cho các tài liệu mà máy tính đọc được. Đánh dấu có
nghĩa là các chuỗi ký tự nào đó trong tài liệu có chứa thông tin chỉ ra vai trò nội

dung của tài liệu, mô tả sơ đồ dữ liệu của tài liệu và cấu trúc logic.
Một tài liệu XML bao gồm một tập các thẻ đóng và thẻ mở được lồng vào
nhau, ở đó mỗi thẻ có một cặp các thuộc tính và giá trị. Thành phần chính của tài
liệu là bộ từ vựng của các thẻ và sự kết hợp được cho phép thì không cố định,
nhưng có thể được xác định thông qua mỗi ứng dụng XML.

8

Các thực thể đánh dấu chính trong XML là các đơn vị (element). Chúng
bao gồm một thẻ mở và một thẻ đóng. Ví dụ <author> và </author>. XML không
giải thích rõ ràng về dữ liệu, chỉ thông qua tên của thẻ mà ý nghĩa của đoạn mã
XML trở nên rõ ràng đối với cảm nhận của người đọc
1.2.2. DTDs và XMLschema
DTDs (Document Type Definitions) - định nghĩa kiểu tài liệu và
XMLschemas (lược đồ XML) mô tả tên của các đơn vị (element), thuộc tính
(attribute) và việc sử dụng chúng trong tài liệu dù chúng không đặc tả ý nghĩa
của tài liệu. DTDs và XMLschema có quan hệ mật thiết với nhau, chúng chỉ định
phần tử nào được phép trong tài liệu và cho phép một tài liệu XML hợp khuôn
dạng thành một tài liệu XML hợp lệ.
DTDs
Là một file text định nghĩa cấu trúc của một tài liệu XML, chúng mô tả các
element được phép xếp lồng vào nhau, các giá trị có thể có của element và những
nơi text được phép.
Xét một DTDs tiêu biểu của XML author:
<!ELEMENT DOCUMENT (AUTHOR+)>
state , zip, contrast)>
<!ELEMENT au_id (CDATA)>
<!ELEMENT au_fname (CDATA)>

<!ELEMENT au_lname (CDATA)>
<!ELEMENT phone (CDATA)>
<!ELEMENT dress (CDATA)>
<!ELEMENT city (CDATA)>
<!ELEMENT state (CDATA)>
<!ELEMENT zip (CDATA)>
<!ELEMENT contract (CDATA)>
Đoạn mã trên cho biết tài liệu sẽ có một hay nhiều phần tử AUTHOR.
Dấu “+” ở cuối AUTHOR đặt trưng cho “không hoặc nhiều”. Mỗi phần tử

9

AUTHOR được tạo thành từ 9 phần tử khác, các phần tử phụ chứa dữ liệu kí tự
(CDATA).
XMLschema
Tuy nhiên DTDs không phải là XML vì thế Microsoft đã thay thế nó bởi
khái niệm XMLschema. XMLschema có nhiều thuận lợi hơn DTDs. Cơ cấu
XMLSchema cung cấp ngữ pháp phong phú cho việc mô tả cấu trúc các element,
ta có thể đặc tả chính xác các thể hiện của element con, cũng như các giá trị mặc
định và đặt chúng vào trong một nhóm được lựa chọn. Khi chuyển DTDs trên
thành schema nó sẽ có dạng như sau:
<Schema ID= “Author”>
<Element name = “au_id”/>
<Element name= “au_fname”/>
<Element name= “au_lname”/>
<Element name= “phone”/>
<Element name= “adress”/>
<Element name= “city”/>
<Element name= “state”/>

<Element namr= “zip”/>
<Element name= “contract”/>
</Schema>

10

Nếu muốn thêm kiểu dữ liệu ta có thể làm như sau :
<Schema ID= “Author”>
<Element name = “au_id” type= “string”/>
<Element name = “au_fname” type= “string”/>
<Element name = “au_lname” type = “string”/>
<Element name = “phone” type =“string”/>
<Element name= “address” type= “string”/>
<Element name= “city” type= “string”/>
<Element name= “zip” type= “string”/>
<Element name= “contract” type= “boolean”/>
</Schema>
Giản đồ này cho biết chi tiết cả phần tử và dữ liệu của chúng, CDATA của
DTDs tương đương với một chuỗi, nhưng schema cho phép các kiểu dữ liệu khác
chẳng hạn như trong đoạn mã trên thì contract có kiểu boolean.
Namespace
Một Namespace sẽ chỉ định duy nhất giản đồ mà phần tử thuộc vào. Nó
được thêm vào tài liệu XML bằng cách định nghĩa thuộc tính xmlns trong thẻ gốc
đi kèm với một URI, URI này là một tên duy nhất có thể xác định Namespace.
Trở lại ví dụ trước về phần tử <contract>, phần tử này có khả năng giữ hai loại
giá trị khác nhau. Nếu ta có dữ liệu XML từ hai nguồn khác nhau được kết hợp,
nó có thể như sau:
<Authors>
<Authors>

<au_id>113-402-165</au_id>
<au_lname>Jojo</au_lname>
<au_fname>Bee</au_fname>
<contract>Yes</contract>
<contract>c:/contracts/doan.doc</contract>
</Authors>
</Authors>

11

Như vậy làm cách nào để phân biệt hai phần tử contract? Rõ ràng trong
trường hợp này nên dùng Namespace như sau:
wrox= “ /><Authors>
<au_id>113-402-165</au_id>
<au_lname>Jojo</au_lname>
<au_fname>Bee</au_fname>
Yes</contract>
<wrox:contract>c:/contracts/doan.doc</contract>
</Authors>
</Authors>

Ở đây đã thêm các thuộc tính xmlns để chỉ định hai Namespace cấu trúc
như sau:
Xmlns: short_name=URI
Short_name là tên chúng ta sử dụng trước thẻ thích hợp trong tài liệu
XML để chỉ định Namespace của thẻ đó
Yes</contract>
<wrox:contract>c:/contracts/doan.doc</contract>

Như vậy, phần tử thứ nhất thuộc Namespace là pubs và phần tử thứ hai
thuộc Namespace là wrox. Ngoài ra cũng có thể áp dụng Namespace cho các
thuộc tính:
<Authors xmlns: pubs=“ />xmlns: wrox= “ /><Author>
113-402-165</pubs:au_id>
<au_lname>Jojo</au_lname>
<au_fname>Bee</au_fname>
Yes</contract>

12

<wrox:contract>c:/contracts/doan.doc</contract>
</Author>
</Authors>

Ở đây áp dụng Namespace cho thuộc tính type của phần tử au_id, tách
thuộc tính này ra khỏi thuộc tính khác trong tài liệu không có hay có Namespace
khác. Tóm lại, Namespace bảo đảm dữ liệu được thông dịch chính xác khi các tài
liệu XML dùng chung có trùng phần tử hay thuộc tính.
1.2.3. RDF (Resource Description Framework)-Khung mô tả tài nguyên
RDF là một ngôn ngữ dùng để mô tả các tài nguyên trên World Wide Web.
Đặc biệt nó được sử dụng để mô tả siêu dữ liệu về các tài nguyên của Web, ví dụ
như tiêu đề, tác giả và thời gian thay đổi của trang Web, bản quyền và thông tin
cấp giấy phép của một tài liệu Web hay bản kế hoạch có giá trị cho tài nguyên
được chia sẻ. Tuy nhiên, một cách tổng quát đối với khái niệm “tài nguyên
Web”, RDF thường được dùng để mô tả thông tin về những thứ có thể được nhận
dạng trên Web. Ví dụ các thông tin về mặt hàng nào đó được bày bán online như
các đặc điểm chi tiết, giá cả, trong kho còn mặt hàng đó không?, hay là sự mô tả
về một trang Web được người sử dụng yêu thích để khai thác thông tin trên nó.

RDF được dùng trong tình huống thông tin cần được xử lý bởi các ứng
dụng chứ không chỉ được hiển thị cho con người. RDF cung cấp một khung phổ
biến để mô tả thông tin trao đổi giữa các ứng dụng nhưng không bị mất mát. Từ
khung nền đó, người thiết kế ứng dụng có thể nâng cao lợi ích của các phân tích
cú pháp RDF và các công cụ xử lý. Khả năng trao đổi thông tin giữa các ứng
dụng khác nhau có nghĩa là thông tin có thể được tạo ra từ các ứng dụng có sẵn
khác hơn là các cách thiết lập thông thường.
Nền tảng của RDF dựa trên ý tưởng về các định danh tài nguyên trên Web
(hay còn được gọi là URIs) và mô tả tài nguyên thông qua các phát biểu bao gồm
những tính chất đơn giản và các giá trị của thuộc tính. RDF cho phép trình bày
những phát biểu đơn giản bằng biểu đồ bao gồm các nút và khối hình học tượng
trưng cho tài nguyên cũng như là các thuộc tính và giá trị.

13

RDF cũng cung cấp một cú pháp dựa trên XML (còn được gọi là
RDF/XML) để ghi lại và thay đổi các biểu đồ. RDF/XML sẽ mô tả Eric Miller
như sau:
<?xml verson= “1.0”?>
<rdf:RDF xmlns:rdf=“ />Xmlns:contact=”http//www.w3.org/2000/10/swap/pim/contact#”>
Rdf:about=” /><contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource=”mailto:”/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person>
</rdf:RDF>

Chú ý rằng RDF/XML cũng chứa URIs, thuộc tính và giá trị của thuộc
tính.

Giống như HTML, RDF/XML là máy có thể xử lý và dùng URIs, có thể
liên kết các mảnh thông tin thông qua Web. Tuy nhiên sự khác biệt ở chỗ, RDF
URIs có thể tìm đến bất cứ thông tin nào được định danh, bao gồm cả thông tin
có thể không được lưu trữ trực tiếp trên Web (như người có tên là Eric Miller).
Kết quả nó được thêm vào để mô tả như một thông tin trên Web. Các thuộc tính
riêng biệt trên RDF đều có URIs, định dạng chính xác các mối liên hệ đã tồn tại
để liên kết các thành phần.
1.2.4. OWL (Ontology Web Language)-Ngôn ngữ Web Ontology
1.2.4.1.

Khái niệm về Ontology

Trong khoa học máy tính, một ontology là một mô hình dữ liệu biểu diễn
một lĩnh vực và được sử dụng để suy luận về các đối tượng trong lĩnh vực đó và
mối quan hệ giữa chúng. Ontology cung cấp một bộ từ vựng chung bao gồm các
khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái niệm và các
thuộc tính này. Ngoài bộ từ vựng, ontology còn cung cấp các ràng buộc, đôi khi

14

các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ
từ vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa người và
các hệ thống ứng dụng phân tán hỗn tạp khác.
Các ontology được sử dụng như là một biểu mẫu trình bày tri thức về thế
giới hay một phần của nó. Các ontology thường miêu tả:
 Các cá thể: Các đối tượng cơ bản, nền tảng.
 Các lớp: Các tập hợp, hay kiểu của các đối tượng.
 Các thuộc tính: Thuộc tính, tính năng, đặc điểm, tính cách, hay các
thông số mà các đối tượng có và có thể đem ra chia sẻ.

 Các mối liên hệ: Các con đường mà các đối tượng có thể liên hệ tới
một đối tượng khác.
Bộ từ vựng ontology được xây dựng trên cơ sở tầng RDF và RDFS, cung
cấp khả năng biểu diễn ngữ nghĩa mềm dẻo cho tài nguyên Web và có khả năng
hỗ trợ lập luận.
1.2.4.2.

Các phần tử trong Ontology

Các cá thể (Individuals)
Cá thể là thành phần cơ bản, nền tảng của một ontology. Các cá thể trong
một ontology có thể bao gồm các đối tượng cụ thể như con người, động vật, cái
bàn... hoặc các cá thể trừu tượng như các thành viên hay các từ. Một ontology có
thể không có bất kỳ một cá thể nào, nhưng một trong những mục đích chính của
ontology là để cung cấp một ngữ nghĩa cho việc phân lớp các cá thể, mặc dù các
cá thể này không thực sự là một phần của ontology.
Các lớp (Classes)
Các lớp là các nhóm, tập hợp các đối tượng trừu tượng. Chúng có thể chứa
các cá thể, các lớp khác, hay là sự phối hợp của cả hai.
Các ontology biến đổi tuỳ thuộc vào cấu trúc và nội dung của nó: Một lớp
có thể chứa các lớp con, có thể là một lớp tổng quan (chứa tất cả mọi thứ), có thể
là lớp chỉ chứa những cá thể riêng lẻ. Một lớp có thể xếp gộp vào hoặc bị xếp
gộp vào bởi các lớp khác. Mối quan hệ xếp gộp này được sử dụng để tạo ra một
cấu trúc có thứ bậc các lớp.

15

Các thuộc tính (Properties)
Các đối tượng trong ontology có thể được mô tả thông qua việc khai báo

các thuộc tính của chúng. Mỗi một thuộc tính đều có tên và giá trị của thuộc tính
đó. Các thuộc tính được sử dụng để lưu trữ các thông tin mà đối tượng có thể có.
Ví dụ, đối với một cá nhân có thể có các thuộc tính: Họ_tên, ngày_sinh,
quê_quán, số_cmnd…Giá trị của một thuộc tính có thể có các kiểu dữ liệu phức
tạp.
Các mối quan hệ (Relation)
Một trong những ứng dụng quan trọng của việc sử dụng các thuộc tính là
để mô tả mối liên hệ giữa các đối tượng trong ontology. Một mối quan hệ là một
thuộc tính có giá trị của một đối tượng nào đó trong ontology.
Một kiểu quan hệ quan trọng là kiểu quan hệ xếp gộp (subsumption). Kiểu
quan hệ này mô tả các đối tượng nào là các thành viên của các lớp nào của các
đối tượng.
Hiện tại, việc kết hợp các ontology là một tiến trình được làm phần lớn là
thủ công, do vậy rất tốn thời gian và đắt đỏ. Việc sử dụng các ontology là cơ sở
để cung cấp một định nghĩa thông dụng của các thuật ngữ cốt lõi có thể làm cho
tiến trình này trở nên dễ quản lý hơn. Hiện đang có các nghiên cứu dựa trên các
kỹ thuật sản sinh để nối kết các ontology, tuy nhiên lĩnh vực này mới chỉ hiện
hữu về mặt lý thuyết.
1.2.4.3.

Ngôn ngữ Web Ontology

Web Ontology Language (OWL) là ngôn ngữ đánh dấu được sử dụng để
xuất bản và chia sẻ dữ liệu sử dụng các ontology trên Internet. OWL là một bộ từ
vựng mở rộng của khung mô tả tài nguyên (RDF) và được kế thừa từ ngôn ngữ
DAML+OIL Web ontology – một dự án được hỗ trợ bởi W3C.
OWL biểu diễn ý nghĩa của các thuật ngữ trong các từ vựng và mối liên
hệ giữa các thuật ngữ này để đảm bảo phù hợp với quá trình xử lý bởi các phần
mềm.OWL được xem như là một kỹ thuật trọng yếu để cài đặt cho Web ngữ
nghĩa trong tương lai. OWL được thiết kế đặc biệt để cung cấp một cách thức

thông dụng trong việc xử lý nội dung thông tin của Web. Ngôn ngữ này được kỳ

16

vọng rằng sẽ cho phép các hệ thống máy tính có thể đọc được thay thế cho con
người. Vì OWL được viết bởi XML, các thông tin OWL có thể dễ dàng trao đổi
giữa các kiểu hệ thống máy tính khác nhau, sử dụng các hệ điều hành và các
ngôn ngữ ứng dụng khác nhau. Mục đích chính của OWL là sẽ cung cấp các
chuẩn để tạo ra một nền tảng để quản lý tài sản, tích hợp mức doanh nghiệp và để
chia sẻ cũng như tái sử dụng dữ liệu trên Web. OWL được phát triển bởi nó có
nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa hơn so với XML, RDF và
RDFS, và vì OWL ra đời sau các ngôn ngữ này, nó có khả năng biểu diễn các nội
dung mà máy có thể biểu diễn được trên Web.
1.2.4.4.

Các phiên bản

OWL được chia làm ba phiên bản ngôn ngữ con: OWL Lite, OWL DL, và
OWL Full:
 OWL Lite: hỗ trợ cho những người dùng chủ yếu cần sự phân lớp
theo thứ bậc và các ràng buộc đơn giản. Ví dụ: Trong khi nó hỗ trợ
các ràng buộc về tập hợp, nó chỉ cho phép tập hợp giá trị của 0 hay
1. Điều này cho phép cung cấp các công cụ hỗ trợ OWL Lite dễ
dàng hơn so với các bản khác.
 OWL DL (OWL Description Logic): hỗ trợ cho những người dùng
cần sự diễn cảm tối đa trong khi cần duy trình tính tính toán toàn
vẹn (tất cả các kết luận phải được đảm bảo để tính toán) và tính
quyết định (tất cả các tính toán sẽ kết thúc trong khoảng thời gian
hạn chế). OWL DL bao gồm tất cả các cấu trúc của ngôn ngữ

OWL, nhưng chúng chỉ có thể được sử dụng với những hạn chế
nào đó (Ví dụ: Trong khi một lớp có thể là một lớp con của rất
nhiều lớp, một lớp không thể là một thể hiện của một lớp khác).
OWL DL cũng được chỉ định theo sự tương ứng với logic mô tả,
một lĩnh vực nghiên cứu trong logic đã tạo nên sự thiết lập chính
thức của OWL.
 OWL Full muốn đề cập tới những người dùng cần sự diễn cảm tối
đa và sự tự do của RDF mà không cần đảm bảo sự tính toán của

17

các biểu thức. Ví dụ, trong OWL Full, một lớp có thể được xem xét
đồng thời như là một tập của các cá thể và như là một cá thể trong
chính bản thân nó. OWL Full cho phép một ontology gia cố thêm ý
nghiã của các từ vựng được định nghĩa trước (RDF hoặc OWL).
Các phiên bản này tách biệt về các tiện ích khác nhau, OWL Lite là phiên
bản dễ hiểu nhất và phức tạp nhất là OWL Full.
Mối liên hệ giữa các ngôn ngữ con của OWL:
 Mọi ontology hợp lệ dựa trên OWL Lite đều là ontology hợp lệ
trên OWL DL.
 Mọi ontology hợp lệ dựa trên OWL DL đều là ontology hợp lệ trên
OWL Full.
 Mọi kết luận hợp lệ dựa trên OWL Lite đều là kết luận hợp lệ trên
OWL DL.
 Mọi kết luận hợp lệ dựa trên OWL DL đều là kết luận hợp lệ trên
OWL Full

1.3.

Các ứng dụng nổi bật
Trang công nghệ Semantic cho phép các công ty cung cấp những ngữ

cảnh cụ thể cho dữ liệu, giúp đỡ họ nhận định hay nối kết thông tin từ những
nguồn tách rời.
Không còn nghi ngờ gì về việc Internet giúp cho việc tìm kiếm các thông
tin trờ nên dễ dàng hơn, nhưng dường như vẫn có thể phát triển hơn nữa khi tìm
kiếm được mối liến hệ giữa dữ liệu lưu trữ ở một góc trang web nào đó và những
sự thật trên mạng với những con số ở một nơi nào đó nữa. Đó chính là nơi Web
ngữ nghĩa thực hiện trò ảo thuật của mình. Công nghệ tập trung dữ liệu khiến nó
có thể ghi thêm những đuôi lưu ý, và cung cấp những ngữ cảnh cho vô vàn các
thông tin trực tuyến. Ví dụ như công cụ của Web ngữ nghĩa có thể giúp phân
biệt rõ ràng nhiều nghĩa của một từ, ví như từ “mercury” - vừa là hóa chất, vừa là
hành tinh, là vàng La Mã, hay là tên của một loại xe Ford.
Web ngữ nghĩa được cho rằng đang nắm giữ tiềm năng lớn về việc thay
đổi cách mà các công ty tìm mối tương quan giữa các thông tin rải rác thông qua

18

các cơ sở dữ liệu và các chương trình phần mềm tách rời. Eli Lilly, Citigroup và
Kodak là một trong những công ty đang tham gia vào làn sóng Web ngữ nghĩa
trên.
Hệ thống lọc ảnh (Kodak)
Các nhà khoa học tại viện nghiên cứu Kodak đang cố gắng giúp đỡ những
khách hàng của mình tránh khỏi việc phát triển không ngừng của máy ảnh kĩ
thuật số. Thế nên họ đã thử nghiệm công nghệ Web ngữ nghĩa để sử dụng những
thông tin có được trong lúc chụp ảnh bao gồm có thời gian, ngày tháng, và GPS
và sau đó chuyển sang một ngữ cảnh cụ thể như ”Ngày Quốc tế lao động tại công
viên quốc gia Yosemite” - điều này có thể giúp thợ chụp ảnh tổ chức những bức

ảnh của mình tốt hơn.
Chế tạo thuốc (Eli Lilly)
Với Eli Lilly, để phát triển một loại thuốc mới cần khoảng 1,2 tỷ USD, và
khoảng 15 năm để đưa nó ra thị trường. Mục đích của công ty này là cắt giảm số
tiền chi đó 1/3 và rút ngắn khung thời gian. Để làm được việc đó, nó đã ứng dụng
công nghệ Web ngữ nghĩa để tìm sự liên kết giữa những thông tin đa dạng nhưng
rời rạc để có được những quyết định tốt hơn và sớm hơn trong quá trình phát
minh ra các loại thuốc mới.
Giảm bớt công việc của khách hàng (Citigroup)
Có cả kho thông tin tài chính trên mạng, và Citigroup muốn tìm cách
nhanh nhất và dễ dàng nhất để khai thác cho định hướng của mình. Tên khổng lồ
về dịch vụ tài chính này đã thử nghiệm công nghệ Web ngữ nghĩa để giảm bớt
những công việc của khách hàng và đưa ra những thông tin đầy đủ nhất cho các
nhà kinh doanh và các nhà phân tích tài chính.
"Săn đầu người" Semantic (Countrywide)
Một vài người mới vào của công ty tài chính Countrywide sử dụng
ZoomInfo, một chức năng tìm kiếm có thể đưa ra tên tuổi hơn 34 triệu các
chuyên gia kinh tế và hơn 2 triệu công ty. Chức năng tìm kiếm này sử dụng công
cụ Web ngữ nghĩa để tìm những thông tin kinh doanh từ hàng triệu các nguồn
trực tuyến, như các trang web, các tờ báo điện tử, hay những kho lưu trữ hồ sơ.

19

Nó thật sự hữu dụng để xác định một nhà quản lý bậc trung hay tìm một chuyên
gia giỏi - người có thể đang kiếm một công việc khá hơn.
Tìm kiếm (Yahoo!)
Giống như rất nhiều công ty khác, Yahoo! để những thông tin về các vụ
làm ăn khác nhau của mình một cách riêng biệt, thường không có liên kết với dữ
liệu cơ sở, khiến nó trở nên rất khó khăn để tập trung và chia sẻ những nội dung

thích đáng từ nhiều nguồn khác nhau. Để khắc phục rào cản này, tập đoàn
Yahoo! đã lắp đặt hệ thống của Web ngữ nghĩa. Khi đăng kí vào hệ thống mới
này, Yahoo vào tháng 1/2007 vừa qua đã cho ra trang web về tài chính cá nhân
đưa ra những tin tức tổng hợp về các đối tác như SmartMoneu và The Motley
Fool, cũng như những lời khuyên từ chính tình hình tài chính của Yahoo!
Phục hồi dữ liệu (IBM)
Những nhà nghiên cứu tại trung tâm nghiên cứu IBM Almaden tìm thấy ở
Web ngữ nghĩa khả năng giải quyêt các vấn đề về việc phục hồi thông tin. IBM
đan kết lại chức năng tìm kiếm theo ngữ nghĩa trong phần mềm OmniFind của họ
để giúp cho công nhân có thể tìm dữ liệu dù họ không nhớ đã để nó ở đâu. Công
cụ này cũng có thể phục hồi những nội dung đã bị chôn vùi như tài liệu, thư điện
tử, các nghiên cứu - hay thậm chí là nội dung chat. OmniFind được sử dụng trong
ngành công nghiệp xử lý tự động những phản hồi của khách hàng và dò tìm
những sản phẩm thường xuyên có yêu cầu sửa chữa hoặc đổi lại.
Y tế (Trường đại học Texas)
Trung tâm khoa học sức khỏe tại trường đại học này của Texas vừa tạo ra
một hệ thống dựa trên công nghệ Web ngữ nghĩa để có thể theo dõi cẩn thận sức
khỏe của một cộng đồng lớn. Mục đích: nhanh chóng giảm thiểu những bùng
phát về bệnh truyền nhiễm với những ngăn chặn ngay từ gốc.
Hệ thống này tổng hợp thông tin từ những nguồn rời rạc, như trạm xá,
phòng cấp cứu, các kết quả thử nghiệm y tế, và dữ liệu về các đơn thuốc. Sau cơn
bão Katrina, đội cứu hộ của trường đại học Houston này đã thu thập được những
thông tin về những người tản cư và tập trung những người bị bệnh tại bệnh xá

20

của Houston nhằm ngăn chặn sự lây lan nhanh chóng bệnh truyền nhiễm trong
thành phố.

21

CHƯƠNG 2 : KHUNG MÔ TẢ TÀI NGUYÊN - RDF
2.1.

Mô hình khung mô tả tài nguyên RDF
Nếu như XML cung cấp cú pháp để mã hóa dữ liệu thì RDF lại là một cơ

cấu chỉ ra điều gì đó về dữ liệu. RDF là một mô hình để biểu diễn dữ liệu về các
tài nguyên trong RDF vocabulary. Một mô hình RDF bao gồm:
 Tài nguyên: là mọi dữ liệu có trong trang Web.
 Thuộc tính: là một khía cạnh, tính chất hay mối liên hệ mô tả cho một tài
nguyên.
 Phát biểu: gồm ba thành phần
o Chủ ngữ (Subject) là cái được đề cập trong phát biểu, nó có thể là
một URI hay một blank node.
o Vị ngữ (Predicate) là những nhận dạng hay đặc điểm của chủ ngữ
như tác giả, ngày tháng, ngôn ngữ v.v… thường là một địa chỉ
URI.
o Bổ ngữ (Object) cho biết giá trị của thuộc tính. Có thể là một URI,
literal hay blank node.
Những khái niệm về Literal và blank node sẽ được trình bày ở phần sau.
Ngoài ra người ta còn gọi một phát biểu gồm 3 thành phần: chủ ngữ, vị
ngữ, bổ ngữ là một bộ ba.
Giống như XML, mô hình RDF không định nghĩa miền giá trị áp dụng hay
giả định về một miền giá trị áp dụng cụ thể. Nó chỉ cung cấp một cơ cấu vùng
không có tính chất rõ ràng để mô tả metadata. Để xác định các thuộc tính có
miền giá trị cụ thể và ngữ nghĩa ta cần dùng các công cụ khác.

2.2.

Một số khái niệm cơ bản

2.2.1. Khái niệm bộ ba
Bộ ba là một phát biểu gồm ba thành phần: Chủ ngữ, Vị ngữ, Bổ ngữ.
Xét phát biểu sau:
has a creator whose value is John Smith

22

Thành

Giá trị

URI

phần
Chủ ngữ

/>
/>
index.html
Vị ngữ

Creator

/>
Bổ ngữ

John Smith

/>
Phát biểu trên được biểu diễn dưới dạng 1 bộ ba như sau:
< />< >
< />
2.2.2. Khái niệm Qname (Qualified Name)
Qname là một cách biểu diễn bộ ba ngắn gọn, nó có một tiền tố được gán
trước bởi một URI, tiếp theo là dấu “:” và cuối cùng là tên cục bộ. Ví dụ nếu tiền
tố của Qname là foo được gán cho namespace URI:
http:/www.booksworld.com.vn/art/ thì Qname foo:Van sẽ là tên viết tắt của địa
chỉ URI tham chiếu: />Ví dụ:
Tiền tố rdf:, namespace URI: />Tiền tố rdfs:, namespace URI: />Tiền tố dc:, namespace URI: />Tiền tố owl:, namespace URI: />Tiền tố ex:, namespace URI: (hay
/>Tiền tố xsd:, namespace URI: />Khi đó nếu ta có một bộ ba được phát biểu như sau:

23

< />< />< />< />< "August 16,1999".
< />< "en".

Thì khi biểu diễn dưới dạng QName sẽ là:
ex:index.html
ex:index.html

dc:creator

exterms:creation-date

ex:index.html

dc:language

exstaff:85740.
"August 16, 1999".
"en".

2.2.3. Khái niệm Literal
Literal có thể là chuỗi kí tự hoặc là giá trị của thuộc tính. Trong trường
hợp ví dụ sau:
has a language whose value is eu.

thì Literals là một chuỗi gồm 2 kí tự là tên viết tắt theo chuẩn quốc tế của Tiếng
Anh.
Literals không được dùng làm chủ ngữ hay vị ngữ trong câu phát biểu,
còn trong đồ thị RDF Literals được biểu diễn trong khung hình chữ nhật.
Có 2 loại literals:
 Literals đơn giản:là một chuỗi được kết hợp với một tag tùy ý.

24

Ví dụ:

/>
/>
25
Hình 2.1. Mô tả Literal đơn giản
Ví dụ trên mô tả tuổi của Ms Bee Jojo là 25, đồ thị chỉ biểu diễn

tuổi của Ms Bee là một kiểu literal đơn giản. Giá trị tuổi ở đây chỉ
là một chuỗi gồm 2 kí tự là “2” và “5”. Vì thế nếu muốn biểu diễn
nó là một con số thì ta phải dùng một khái niệm khác là literals
định kiểu.
 Literals định kiểu được hình thành bằng cách kết hợp một chuỗi kí
tự với một địa chỉ URI tham chiếu xác định một kiểu dữ liệu nào
đó. Kết quả trả về là một node trên đồ thị RDF tương tự như một
literal. Kiểu giá trị được biểu diễn bằng literal định kiểu sẽ được
tham chiếu đến kiểu giá trị mà ta đã khai báo thông qua một URI.
Ở ví dụ trên ta có thể khai báo tuổi của Ms Bee như sau:
“25”^^< />Hay cũng có thể dùng Qname thay cho dòng địa chỉ URI:
Exauthor:25283

exterms:age

“25”^^xsd:Integer

Khi đó đồ thị trên có thể được vẽ lại như sau:

25

Công nghệ web ngữ nghĩa và ứng dụng tìm kiếm metadata

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về