HUTECH
B GIÁO DC VÀ ÀO TO
TRNG I HC DÂN LP K THUT CÔNG NGH
KHOA CÔNG NGH THÔNG TIN
B MÔN CÔNG NGH PHN MM
LUN VN TT NGHIP
NGHIÊN CU V ONTOLOGY EDITOR VÀ
NG DNG
GVHD: PGS.TS.Trng M Dung
SVTH : MSSV:
Võ Trng Ngha 10102106
ng i Phúc 10102132
Lê Vn Thy 10102186
TP. H CHÍ MINH, Nm 2006.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 1
LI CM N
Trong sut quá trình hc tp gn nm nm ti Trng HDL K Thut
Công Ngh và thi gian thc hin án tt nghip này, chúng em chân thành
bày t lòng bit n n tt c các quý Thy Cô trong Khoa ã dy d và giúp
chúng em chân tình. c bit chúng em xin cm n sâu sc n Cô Trng
M Dung v s nhit tâm, tn tình hng dn cùng nhng li ng viên, khích
l úng lúc giúp chúng em vt qua các thi im khó khn nht và hoàn thành
c các yêu cu ã ra.
Ngoài ra chúng em cng xin cm n Gia ình, bn bè ã giúp , góp ý
và c v cho chúng em trong sut thi gian thc hin và hoàn thành án tt
nghip.
Tp.H Chí Minh, tháng 01 nm 2006
Nhóm sinh viên thc hin
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 2
MC LC
LI CM N 1
MC LC 2
M U 4
CHNG I. GII THIU TNG QUAN V ONTOLOGY 5
I.1. M! u. 5
I.2. Mt s khái nim c bn c∀a ontology 7
CHNG II. TNG QUAN V XML, RDF VÀ OWL 15
II.1. S lc v XML 15
II.2. S lc v RDF (Resource Description Framework) 23
II.2.1. Cu trúc RDF 23
II.2.2. URI và Namespace t# vng RDF (RDF Vocabulary
URI and Namespace (Normative)) 29
II.2.3. Kiu d liu c tiêu chu∃n hóa (Datatypes (Normative)) .29
II.2.4. Ni dung XML trong th% RDF (XML Content
within an RDF Graph) 30
II.2.5. Cú pháp tr#u tng (Abstract Syntax (Normative)) 33
II.2.6. Khai báo on (Fragment Identifiers) 36
II.3. T ng quan v OWL (Web Ontology Language) 37
II.3.1. Ba ngôn ng con c∀a OWL 38
II.3.2. Bng tóm tc ngôn ng OWL 40
II.3.2.1. Bng tóm tt c∀a OWL Lite 41
II.3.2.2. Bng tóm tt OWL DL và OWL Full 41
II.3.3. Mô t ngôn ng OWL Lite 42
II.3.3.1. Các c tính c∀a OWL Lite và lc RDF 42
II.3.3.2. Tính cân b&ng và không cân b&ng
c∀a OWL Lite (OWL Lite Equality và Inequality) 44
II.3.3.3. Các c tính v thuc tính c∀a OWL Lite 45
II.3.3.4. Các s gii hn v thuc tính c∀a OWL Lite 47
II.3.3.5. S gii hn bn s c∀a OWL Lite
(OWL Lite Restricted Cardinality ) 48
II.3.3.6. OWL Lite Class Intersection 50
I.3.4. Mô t ngôn ng có tính phát trin c∀a OWL DL và OWL
Full (Incremental Language Description of
OWL DL and OWL Full ) 51
II.4. Các thành phn c∀a OWL Ontology 52
II.4.1. Các th hin (Individuals) 53
II.4.2. Các thuc tính (Properties) 53
II.4.3. Các lp (Classes) 54
II.4.4. Các thuc tính c∀a OWL (OWL Properties) 55
II.4.5. Các thuc tính o ngc (Inverse Properties) 56
II.4.6. Các c tính v thuc tính c∀a OWL
(OWL Property Characteristics) 57
II.4.6.1. Các thuc tính Functional 57
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 3
II.4.6.2. Các thuc tính o ngc Functional
(Inverse Functional Properties) 57
II.4.6.3. Các thuc tính bc cu (Transitive Properties) 58
II.4.6.4. Các thuc tính i x∋ng (Symmetric Properties) 58
II.4.7. Các min và các phm vi c∀a thuc tính
(Property Domains and Ranges) 59
CHNG III. GII THIU MT S ONTOLOGY EDITOR 61
III.1. KAON 61
III.1.1. T ng quan 62
III.1.2. Kin trúc c∀a KAON 64
III.1.3. Các thành phn chính c∀a KAON 64
III.1.4. KAON API 69
III.1.5. TextToOnto 73
III.2. Protégé-2000 78
CHNG IV. THIT K ONTOLOGY NEWSPAPER 84
CHNG V: CHNG TRÌNH NG DNG 95
KT LUN VÀ HNG PHÁT TRIN 98
Ph lc A: Mã ngun m Protégé 2000 100
1) To mt d án mu 100
2) Lu tr d án 102
3) To và t tên cho lp (class) 103
4) To và t tên cho các slot 110
5) Nhp vào các thc th (instances) 116
6) Tùy bin mt Form 120
7) To và lu tr mt truy vn 126
Ph lc B: XML, XML Schema, DTDs 131
B.1. Kin trúc XML 131
B.2. Các khái nim m! rng 132
B.2.1 XML Namespaces 132
B.2.2. Xpath 133
B.2.3. Xpointer 134
B.2.4. Ngôn ng liên kt XML (XML Linking Language) 134
B.2.5. The XML Style Language 134
B.2.6. S chuyn i XSL-XSL Transformations (XSLT) 134
B.3. Các tác ng c∀a XML 135
B.4. DTDs 138
B.5. Gin XML (XML Schema) 139
B.5.1. Cu trúc c∀a gin XML 144
Tài liu tham kho 148
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 4
M U
Ngày nay khi kinh t - xã hi ngày càng phát trin thì vic ∋ng d(ng
CNTT vào các l)nh vc khác nhau cng ngày càng tr! thành yêu cu cn thit
không th thiu nh&m nâng cao cht lng, nng sut công vic c thù trong
các l)nh vc ó, em li hiu qu kinh t - xã hi rõ rt.
Ngành CNTT nói chung, l)nh vc công ngh phn mm nói riêng, ang
và s∗ tr! thành l)nh vc c áp d(ng ph bin và ch∀ yu trong vn tin hc
hóa các ngành, góp phn quan trng trong s nghip công nghip hóa – hin
i hóa t nc ! Vit Nam. Nhà nc ta ang i tiên phong trong vic áp
d(ng CNTT nh&m duy trì và phát trin ngành công ngh phn mm, c( th nh
vic tin hc hóa trong mt s c quan nhà nc, mt s ngành ch∀ o nh y
t, ngân hàng, giáo d(c – ào to, giao thông vn ti, du khí – %a cht,
…Song song vi vic tin hc hóa trong các l)nh vc ch∀ o, có quy mô hot
ng ln thì vic áp d(ng tin hc xut bn các trang Web a lên mng
ngày càng phong phú và a dng, s lng các trang Web ngày càng ln trong
khi ó vic s+ d(ng HTML làm cho vic x+ lý d liu trong phm vi rng gp
nhiu khó khn, do vy quá trình tìm kim thông tin trên mng tn nhiu thi
gian và chi phí cng nh công s∋c c∀a con ngi. Semantic Web a ra các
gii pháp cho vn này b&ng cách %nh ngh)a siêu d liu (metadata) có
th d, dàng truy nhp và x+ lý. Lun vn tt nghip này s∗ gii thiu v các
Ontology Editor – công c( to các Ontology - và các k thut xây dng
Ontology, gii thiu ngôn ng ánh du tiên tin (Advanced Makup Language)
(RDF, OWL) nh&m xây dng siêu d liu ch∋a trong Semantic Web.
Nhóm sinh viên thc hin lun vn.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 5
CHNG I. GII THIU TNG QUAN V
ONTOLOGY
I.1. M u
.
World Wide Web (gi tt là Web) ã tr! thành mt kho tàng thông tin
kh ng l c∀a nhân loi và mt môi trng chuyn ti thông tin không th thiu
c trong thi i công ngh thông tin ngày nay. S ph bin và bùng n
thông tin trên Web cng t ra mt thách th∋c mi là làm th nào khai thác
c thông tin trên Web mt cách hiu qu, mà c( th là làm sao máy tính
có th tr giúp x+ lý t ng c chúng. Mun vy, trc ht máy tính phi
hiu c thông tin trên các tài liu Web, trong khi ! th h Web hin ti thông
tin c biu di,n di dng vn bn thô mà ch− con ngi mi c hiu
c.
iu này ã thúc ∃y s ra i c∀a ý t!ng Web có ng ngha (Semantic
Web), mt th h mi c∀a Web, mà l trình phát trin c∀a nó ã c Tim
Berners-Lee, cha . c∀a Web, phác tho ra vào nm 1998. Web có ng ngh)a là
s m! rng c∀a Web hin ti mà trong ó thông tin c %nh ngh)a rõ ràng sao
cho con ngi và máy tính có th cùng làm vic vi nhau mt cách hiu qu
hn. M(c tiêu c∀a Web có ng ngh)a là phát trin các chu∃n chung và công
ngh cho phép máy tính có th hiu c nhiu hn thông tin trên Web, sao
cho chúng có th h tr tt hn vic khám phá thông tin, tích hp d liu, và t
ng hóa các công vic.
Hin ti, các hot ng nghiên c∋u v Web có ng ngh)a ang tp trung
vào ba hng chính sau ây:
- Chu∃n hoá các ngôn ng biu di,n d liu (XML) và siêu d liu
(RDF/OWL) trên Web.
- Chu∃n hoá các ngôn ng biu di,n Ontology cho Web có ng ngh)a.
- Phát trin nâng cao Web có ng ngh)a (Semantic Web Advanced
Development - SWAD).
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 6
Trong ba hng nghiên c∋u nói trên, chúng tôi ngh) r&ng hng th∋ ba
là hng thích hp vi hoàn cnh và iu kin c∀a Vit Nam, vì theo hai hng
u chúng ta khó có th cnh tranh c vi các nhóm nghiên c∋u ln và uy tín
cao trên th gii trong vic ngh% các ngôn ng chu∃n. Hn na, theo hng
th∋ ba chúng ta có th phát trin sm c các ∋ng d(ng thc ti,n c∀a Web có
ng ngh)a ! Vit Nam.
Trong hng th∋ ba v SWAD, mt vn c các nhà khoa hc quan
tâm nht và cng là nn tng nht c∀a Web có ng ngh)a là làm th nào
nhúng ng ngh)a vào các tài liu Web, mà hin nay c vit b&ng ngôn ng t
nhiên và ch− có con ngi mi c hiu c. Hn na vic nhúng ng ngh)a
này phi c thc hin mt cách t ng có th chuyn i hàng t/ các tài
liu Web ã có s0n sang các tài liu tng ∋ng cho Web có ng ngh)a. Mun
vy, vn u tiên cn gii quyt là rút trích t ng ng ngh)a c∀a mi tài
liu Web ri chú thích li ng ngh)a này vào tài liu ó.
Trong mt tài liu, các thc th có tên c cp n to nên phn
quan trng cho ng ngh)a c∀a tài liu ó. Nói cách khác, nm c ng
ngh)a c∀a mt tài liu thì trc ht cn nm c ng ngh)a c∀a các thc th có
tên trong tài liu ó. Thc th có tên là con ngi, t ch∋c, ni chn, và nhng
i tng khác c tham kho b&ng tên. Các thc th có tên khác v bn cht
và ng ngh)a vi các t (Word) ! ch chúng nói v các cá th, trong khi các t#
nói v nhng cái chung nh khái nim, phân loi, quan h, thuc tính. Vic x+
lý các t# do vy ch− òi hi ng ngh)a t# vng và lý l∗ thông thng, trong khi
vic x+ lý các thc th có tên cn n tri th∋c c( th v th gii ang xem xét.
Ng ngh)a c∀a các thc th có tên tuy ch− là mt phn ng ngh)a c∀a
toàn b tài liu, nhng nu có th rút trích và chú thích chúng mt cách t ng
vi chính xác tng i cao thì cng ã có ý ngh)a thc ti,n rt ln. Mt
∋ng d(ng rt rõ ràng là xác %nh và cung cp t ng thông tin v các thc th
có tên trong các trang Web tin t∋c cho ngi c. Các tài liu Web có chú thích
ng ngh)a cho các thc th có tên cng s∗ giúp cho vic tìm kim và khai thác
thông tin trên ó c chính xác và hiu qu hn. Ví d( mt truy vn v thành
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 7
ph Sài Gòn s∗ c tr v các tài liu cp n TP.HCM hoc Sài Gòn nh
mt thành ph, ch∋ không phi các tài liu ch∋a t# “Sài Gòn” nh trong “i
bóng Cng Sài Gòn”, “Xí nghip may Sài Gòn”, hay “Cty Saigon Tourist”.
Vic xác %nh ng ngh)a cho các thc th có tên là không n gin và
không th ch− da vào t# in, vì mt thc th có th có nhiu tên khác nhau,
và các thc th khác nhau có th có cùng tên. Ví d( xác %nh xem thc th
mà tên “Trn Hng o” trong mt tài liu ám ch− n là mt con ngi hay là
mt con ng, và nu là con ng thì là ! Hà Ni hay TP.HCM, cn phi
bit c ng cnh ni tên ó xut hin. Vì vy mt h thng chú thích ng
ngh)a cho các thc th có tên cn có trc ht mt c s! tri th∋c v các thc th
và quan h gia chúng.
I.2. Mt s khái nim c bn ca ontology
- Khái nim ontology:
Trong mt vài nm gn ây, xut hin mt l)nh vc nghiên c∋u mi là
ontology. Mt s nguyên nhân ã thôi thúc vic nghiên c∋u v ontology: Vn
biu di,n tri th∋c c∀a trí tu nhân to (c bit là biu di,n quan h ng
ngh)a), vn sp xp và tìm kim các tài liu tng t nhau (c bit là bài
toán tìm kim trên mng), vn tìm hình th∋c biu di,n mi cho c s! d liu
(s ra i c∀a c s! d liu lai gia quan h và hng i tng)…Tt c các
vn trên ã dn n vic ra i ontology mà m(c tiêu trng tâm là: phân loi
các phm trù, các khái nim c∀a tri th∋c, và biu di,n mi liên h gia các
phm trù ó vi nhau.
T# “ontology” c vay mn t# trit hc và c m! rng trên l)nh
vc Semantic Web nh là c s! tri th∋c. Trong l)nh vc nghiên c∋u Semantic
Web, ontology c mô t nh là mt hình th∋c rõ ràng da trên các khái nim
(conceptualisation) (Gruber, 1993), mt i tng có th c mô t và gii
thích b&ng nhiu lp lun khác nhau, da vào nn kin th∋c c bn, mô hình
quan nim, các phng pháp nhn th∋c và nhiu yu t khác c∀a con ngi
Do ó, rt khó xây dng nên mt kin trúc ontology.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 8
Có nhiu cách khác nhau mô t ontology: cú pháp c bn (syntax-
based) c∀a ngôn ng ontology và biu UML. Nhiu nhóm nghiên c∋u ang
phát trin mt vài ngôn ng ontology khác nhau: RDFS (Brickey & Guha,
2002)); DAML+OIL (Conolly, Harmelen, Horrocks, McGuinness, Patel-
Schneider & Stein, 2001), OWL (Patel-Schneider, Horrocks & Harmelen,
2002) và KAON c phát trin b!i AIFB trong Karlsruhe, trong ó
DAML+OIL và KAON là phn m! rng c∀a RDFS, trong khi OWL là phn
m! rng c∀a DAML+OIL. Biu UML th hin các ontology còn có nhng
hn ch, khó x+ lý c b&ng máy tính (machine) khi nó c mô t trong mt
mô hình ln, trong khi con ngi có th hiu c mt cách d, dàng.
S+ d(ng ontology mô t ng ngh)a trên RDF th hin các mi quan h
gia ch∀ th và khách th thì không khó lm. Sau khi xây dng ontology b&ng
các câu RDF, ni dung c∀a tài liu là:
<?xml version=“1.0” ?>
- <rdf:RDF xmlns:rdf=“
xmlns:xsd=“
xmlns:rdfs=“
xmlns:owl=“ xmlns=“-
ontology.com/unnamed.owl#” xml:base=“-
ontology.com/unnamed.owl”>
<owl:Ontology rdf:about=““ />
<owl:Class rdf:ID=“Shuhua Chen” />
- <owl:Class rdf:ID=“Yimin Wang”>
<rdfs:subClassOf rdf:resource=“ />
- <rdfs:subClassOf>
- <owl:Restriction>
- <owl:onProperty>
<owl:ObjectProperty rdf:ID=“isSonOf” />
</owl:onProperty>
<owl:someValuesFrom rdf:resource=“#Shuhua Chen” />
</owl:Restriction>
</rdfs:subClassOf>
</owl:Class>
</rdf:RDF>
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 9
T# cu trúc c∀a tài liu này, ta d, dàng tìm ra các mi quan h cú pháp gia các
ngôn ng XML, RDF, RDFS và OWL.
- K ngh ontology (Ontology Engineering)
Làm th nào xây dng ontology vi hiu qu và tính dùng li c là
mt mi quan tâm chính trong min (domain) c∀a k ngh ontology. Nh mt
s ontology editor ph bin, các nhà nghiên c∋u ã s+ d(ng Protégé xây
dng ontology và kinh nghim c∀a h ã ch− ra r&ng xây dng ontology b&ng
tay là mt công vic rt cc nhc (labour-intensive work). Nhng ngi s+
d(ng Protégé xây dng ontology phi son tho t#ng khái nim: tên
(names), các chú thích (annotations), chn các thuc tính khác nhau và %nh
ngh)a các ràng buc (restrictions). Nu có hàng nghìn các khái nim (concepts)
trong mt tác v(, thì công vic này s∗ mt rt nhiu thi gian. Nhng nhà
nghiên c∋u rõ ràng không mun tiêu phí thi gian c∀a h cho các công vic lp
i lp li, mà không có s i mi trong công vic.
Tht s là không có nhiu cách tip cn chung xây dng mt
ontology và ch− có mt vài cách là không có ràng buc v phm vi (domain-
free). Có nhiu h phng pháp lun làm nn tng c bn cho các mô t tr#u
tng và các phác tho s lc v cách to ra mt Ontology (Fernandez,
Gomez-Perez, Pazos Sierra, 1999), theo sau ó ã có nhiu d án v k ngh
ontology ã tìm ra c cách thích hp xây dng các ontology.
M(c ích c∀a k ngh ontology là cho phép máy tính xây dng mt s
ontology tha mãn các yêu cu c∀a con ngi (to ra các ontology b&ng tay).
Các thành phn ca mt ontology
Mt Ontology ch∋a ng các mô t các khái nim (concepts) gi là các
lp (classes), các thuc tính (còn gi là slots) c∀a mi khái nim mô t các tính
nng và các thuc tính khác nhau c∀a khái nim ó, và nhng hn ch
(restriction) c∀a các thuc tính ó (ôi khi còn c gi là các s kin).
Các lp là tâm im c∀a hu ht các ontology . Các lp mô t các khái
nim trong mt phm vi (domain).
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 10
Mt Ontology ch∋a ng s mô t hình th∋c (formal) c∀a các khái nim
(concepts) gi là các lp (classes) trong mt phm vi c∀a phn miêu t
(discourse), các thuc tính (properties) còn gi là slots c∀a mi khái nim mô t
các tính nng và thuc tính khác nhau c∀a khái nim, và nhng hn ch
(restriction) trên các thuc tính (facet).
Các lp là trng tâm c∀a hu ht các ontology. Các lp là s mô t các
khái nim trong mt phm vi (domain).
Ví d(: lp ru i din tt c các loi ru còn loi ru c( th chính
là các th hin (instances) c∀a lp này. Các lp con dùng %nh ngh)a rõ hn các
khái nim c∀a lp cha.
Ví d(: chúng ta có th chia lp ru ra hai loi là ru và ru
trng…Hay mt cách khác là chia lp ru thành ru s∀i tm hay ru không
s∀i tm.
S quan trng ca ontology i vi máy tính
Ontology cho thy c s to ln các tim nng phn mm t hiu
qu tt hn, thích ∋ng hn và thông minh hn. Ontology c xem nh mt
bc ngoc ln trong công cuc phát trin phn mm. Ý t!ng v ontology ã
c thai nghén t# rt sm trong trit hc.
Ontology ã c áp d(ng trong khoa hc v y khoa, là các công c( c∀a
các sn ph∃m truyn thông. Hin nay, ontology ang c nghiên cú và phát
phát trin mnh ph(c v( cho các nghành (nói chung), công ngh thông tin
(nói riêng).
Ontology không quá ph∋c tp cho ngi bình thng có th hiu
c. Không có mt chu∃n nào tip cn vi ontology, nhng li có quá
nhiu hng dn ch− mô t cách tip cn mt cách s lc (vn tt).
Hin nay, theo các nghiên c∋u c∀a nhóm W3C, Semantic Web ã c
u tiên phát trin, và ã làm thay i hoàn toàn s nhìn nhn v ontology.
Thông qua kt qu c∀a quá trình phát trin trên, W3C ã cung cp mt chu∃n
ngôn ng ánh du ng ngh)a da trên XML, trên mt h thng qun lý
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 11
ontology (ontology management system) và trên các công c( hu d(ng khác…
Ngoài ra Web cung cp các ∋ng d(ng ph(c v( cho i sng thng nht nh s
tìm kim d liu, xem thông tin qua mng, mua bán hàng hóa qua mng…
Giá tr% ontology th hin trong các ∋ng d(ng quan trng nh là quy trình
tích hp và x+ lý thông tin (process data integration).
S phát trin ca ontology
Ontology giúp cho phn mm tr! nên hiu qu hn, linh ng hn và
thông minh hn b!i vì:
- Chia s. s hiu bit thông tin gia mi ngi hay phn mm.
- Có th s+ d(ng li các phm vi tri th∋c.
- Phân tích phm vi tri th∋c (Analysis of domain knowledge).
Các phng din hot ng ca ontology
Hin nay, ontology hot ng trên hai phng din: công ngh và
thng mi. Các t ch∋c phát trin nên xem xét ng ngh)a (semantic) có th
gii quyt c gì và s∗ mang n li ích nh th nào cho các ∋ng d(ng.
Có rt nhiu nhng vn in hình mà ontology có th gii quyt c
rt tt nh v tích hp thông tin, mô hình chuyn i (model transformation),
d%ch ngh)a (translation), làm sch d liu (data cleansing), tìm kim, %nh
hng, s hiu bit vn bn (text understanding), trình bày vn bn, s nhn
dng ging nói… Ngoài ra nhà phát trin cng phi tìm hiu nhiu sáng kin
trong vic dùng ontology gii quyt vn c∀a h. Mt khi nhà phát trin hài
lòng vi nhng gì mà ontology mang n thì h có th th1ng tin và chn
ontology làm gii pháp. 2 ây có các chu∃n ngôn ng ánh du ng ngh)a
(semantic markup language) mà W3C ã a ra nh RDF, OWL
Cách dùng ontology
T ch∋c W3C ã a ra mt bn t ng kt c∀a vic thc thi các ∋ng d(ng
c lp ra vi khong 25 nhà phát trin h thng (deployed system) c lit
kê. Ví d( sau :
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 12
• Kim soát t# vng (controlled vocabulary).
• H tr %nh v% và t ch∋c t liu hoc trang Web (Web site or document
organization and navigation support).
• H tr trình duyt (browsing support).
• H tr tìm kim (tìm kim ng ngh)a).
• T ng quát hóa và chuyên bit hóa c∀a vic tìm kim (Generalization or
specialization of search)
• H tr ng ngh)a.
• Kim tra tính vng chc (Consistency checking).
• S hoàn thành t ng (Auto-completion).
• H tr hot ng qua li (Interoperability support) (tích hp thông
tin/quy trình).
• H tr kim th+ và ánh giá (Support validation and verification
testing).
• H tr cu hình (Configuration support).
• H tr tìm kim cu trúc, tng i và tùy bin (Support for structured,
comparative, and customized search).
Ontology khác vi nhng h thng chuyên gia và nhng công ngh AI
cho Web ng ngh)a và các công ngh ontology hin ti thc hin
c thì máy tính buc phi truy cp vào tp hp cu trúc thông tin và thit lp
các nguyên tc suy lun (inference rules) máy tính có th t ng hoá iu
khin các lp lun (conduct automated reasoning).
Còn các nhà nghiên c∋u trí tu nhân to thì nghiên cú cách th∋c cho h
thng hc d liu trc khi Web c phát trin. Công ngh này thng c
gi là xây dng c s! tri th∋c, hin ti trí tu nhân to cng c áp d(ng cho
các ∋ng d(ng phát trin c∀a Web: và iu ó cng không tht s là mt ý t!ng
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 13
tt, vn không th thay i c cách biu di,n d liu nh các công ngh
trc.
S khác bit gia ontology và c s d liu
Ontology khác vi c s! d liu (database) ! mt vài im nh sau :
- u tiên là ontology trình bày kiu d liu ! dng meta ch∋ không phi
là d liu thông thng.
- Mt Ontology s∗ miêu t mt giao din vi nó thông qua d liu có th
b% truy nhp trong khi qun lý các th hin d liu hin thi trong các c
s! d liu.
- Khác nhau ! s truy vn có ngh)a là hu ht các câu truy vn trong c s!
d liu là truy l(c các d liu ging nhau nh vic nó c lu tr trc
ó còn các ontology thì suy ra hay các lý do v xác nhn các s vic và
ly ra các s vic mi c bao hàm b!i các s kin ã bit trc.
S khác nhau gia ontology và kiu mô hình hng i tng
.
Mt Ontology khác vi mô hình hng i tng ! mt vài im sau :
- S khác nhau sâu sc nht là lý thuyt công ngh ontology c phát
hin là da da trên tính logic.
- Ontology cho phép t ng hóa suy lun và kt lun còn hng i
tng thì không.
- S khác nhau ! l)nh vc nghiên c∋u thuc tính.
- Trong khi công ngh ontology xem các thuc tính nh các lp thành
phn (first class citizen) còn hng i tng thì không.
- Ontology cho phép th#a k các thuc tính (property).
- Ontology cho phép nhng mi quan h do ngi dùng %nh ngh)a tu3 ý
gia các lp (các kiu c∀a thuc tính). Còn mô hình hng i tng thì
gii hn các kiu dng mi quan h trong vic th#a k các mi quan h
gia lp cha và lp con.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 14
- Công ngh Ontology cho phép thêm vào các c tính cho các mi quan
h nh functional, tính i x∋ng (symmetry), tính bc cu (transitive) và
tính ngh%ch o (inverse) chúng có th c s+ d(ng trong suy lun.
- Mc dù khác nhau nhiu im nhng phn ln mô hình hng i tng
và UML vn c xem nh là mt c t ontology thit thc b!i vì s
tri rng c∀a nó trong nn công nghip và vô s mô hình tn ti b&ng
UML.
Có th thêm tính logic vào các mô hình hng i tng b&ng các ngôn ng
ràng buc (Object Constraint Language).
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 15
CHNG II. TNG QUAN V XML, RDF VÀ OWL
II.1. S l!∀c v# XML
XML c trin khai nh s óng góp c∀a rt nhiu ngi trong mi
nm qua. Ngôn ng ánh du tiêu chu∃n t ng quát (SGML - Standard
Generalized Markup Language), mt ngôn ng biu th% d liu trong nhng
∋ng d(ng x+ lý vn bn a dng và có cu trúc tinh vi. Nhc im c∀a nó là
rt rc ri, khó hc, khó s+ d(ng…
Chính vì l∗ ó vào nm 1990 Tim Berners-Lee ! CERN, ã to ra
HTML (là mt ∋ng d(ng c∀a SGML), mt phn nh c∀a SGML, nhng mi
ngi li rt d, dùng. Không ng s thành công c∀a HTML vt quá s∋c t!ng
tng c∀a chính tác gi.
Nhng ri n mt ngày vào nm 1995 ngi ta bt u thy s gii hn
c∀a HTML, mc dù nó c Netscape, Microsoft c gng thêm tht, b!i s
th%nh hành c∀a Web. Do ó, nhiu ngi có ý %nh quay tr! li SGML, nhng
li ái ngi.
Ðúng lúc ó vào 1996, Jon Bosak ! Sun Microsystem kh!i u nhóm
cng tác W3C SGML, by gi c gi là nhóm XML. M(c ích là n gin
hoá SGML nó d, dùng nh HTML mà ng thi mnh m∗, d, dùng,
Tim Bray và C.M. Sperberg-McQueen vit hu ht Specification (bn iu kin
k thut) nguyên th∀y c∀a XML. Trc ó, Bray ã có kinh nghim nhiu nm
qun lý d án "New Oxford English Dictionary". Ông mun XML hi các iu
kin sau:
Ðn gin ∀ cho lp trình viên áp d(ng
D, cho Search Engine (nh AltaVista, Yahoo, Infoseek, ) phân loi
Không gii hn trong ting Anh c∀a nc M
Chính vì l∗ ó, bn Specification u tiên c∀a XML c ra i vào tháng 11
nm 1996. Tháng 7 nm 1997 Microsoft áp d(ng u tiên c∀a XML, Channel
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 16
Definition Format (CDF). H dùng CDF xut bn các trang Web n
nhng khách ã óng tin tháng (subscribers). CDF là mt phn c∀a Internet
Explorer 4.0. Tháng 5 nm 1997 Microsoft và Inso Corporation xut bn XSL
(eXtensible Style Language) làm Style Sheet di,n t cách trình bày mt
trang XML.
Ðn tháng 1 nm 1998 Microsoft cho ra mt chng trình mi,n phí tên
MSXSL generate mt trang HTML t# mt cp trang XML và XSL. Sau này
thì Internet Explorer 5.0 có th hin th% trc tip mt trang XML (bên trong có
ghi phi tìm trang XSL ! âu), không cn cho thy kt qu trang HTML.
Vào tháng 2 nm 1998 T hp Web toàn cu W3C phê chu∃n cho chính th∋c
thi hành Version 1.0 c∀a XML Specification.
1. Khái nim XML
XML vit tt c∀a ch eXtensible Markup Language (ngôn ng nâng cp
có th m! rng) là mt b qui lut v cách chia mt tài liu ra làm nhiu phn,
ri ánh du và ráp các phn khác nhau li d, nhn din chúng. Ðc ch−
o b!i T hp Web toàn cu (W3C), XML tr! thành mt c im k thut
chính th∋c.
T hp Web toàn cu W3C gi XML là "mt cú pháp thông d(ng cho
vic biu th% cu trúc trong d liu". D liu có cu trúc tham chiu n d liu
c gán nhãn cho ni dung, ý ngh)a, hoc công d(ng.
Ví d( : Trong mt trang Web ta dùng nhng Cp th. (cp nhãn hiu m! óng)
ánh du nh <BODY> và </BODY>. Hãy quan sát mt trang Web di
ây:
<HTML>
<HEAD>
<TITLE>Welcome To Lê Hng</Title>
</HEAD>
<body>
<H1>Ð%nh Ngh)a</H1>
A: "Sao anh li ct dây in ! phòng hp?"<BR>
B: "Vì dây in nhà tôi thiu mt mt khúc".<BR>
A: "Nh vy là ly công làm t!" <BR>
B: "Không, nh vy là ly dài nuôi ngn!" <BR>
</BODY>
</ HTML >
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 17
Trong HTML Web page các Cp th. u c %nh ngh)a trc và không ch∋a
ng ý ngh)a gì v d kin mà chúng k4p bên trong, tr# trng hp cho
TITLE. Thí d( H1 có ngh)a display hàng ch bên trong (Ð%nh Ngh)a) theo c
ln nht, nhng hàng ch y có th là bt c∋ th∋ gì, không nht thit phi là t#
(Ð%nh Ngh)a) ! ây. Còn XML thì cho phép ta t do t tên các Cp th.
dùng khi cn. Nu tính ra, Dynamic HTML có n khong 400 Th. mà nu
mun dùng ta phi nh ht. Trong khi ó, XML không có gii hn v con s
Th. và ta không cn phi nh Th. nào c. Ý ngh)a c∀a các Th. rt linh ng và
ta có th sp xp các th. c∀a XML theo loi cho hp lý. Thí d( mun làm mt
trang XML v môn Vn hc ta cn nhng Th. di,n t nhân vt, ngày sanh,
ngày t+,
2. Tm quan tr∃ng ca XML
Nhng tay thit k Web cho r&ng ni dung là trên ht. Ch1ng may,
thông thng thì ni dung có liên quan cht ch∗ n cách th∋c nó c hin
th%. T# trc n nay ã có bao nhiêu ln bn nhìn thy câu "Best viewed at
800-by-600-pixel resolution" (hin th% tt nht ! phân gii 800x600) khi
duyt qua mt trang Web?
Thay vì phi ch− rõ phng th∋c hin th%, XML s∗ giúp gii quyt vn
ó b!i vì nhng ngi xây dng Web s∗ có kh nng ch− %nh cu trúc c∀a tài
liu. Ví d(, bn có th ch− %nh ta c∀a tài liu, tác gi, mt danh sách các
liên kt có liên quan, Khi ó bt k3 mt thit b% nào vi mt trình duyt XML
u có th th hin mt phiên bn c∀a tài liu c to c trng cho thit b%
ó.
Tuy nhiên, có l∗ tính nng u vit nht c∀a XML ó là kh nng m! rng k
th#a. Các t ch∋c và công ty s∗ có kh nng m! rng XML áp ∋ng nhng
th+ thách và các ∋ng d(ng mi. Mt ngôn ng da trên XML hin ang c
s+ d(ng - CDF c∀a Microsoft - và còn nhiu ngôn ng khác ang trong quá
trình hoàn thin sp c a ra, bao gm Resourse Definition Format (RDF)
và Open Software Description (OSD).
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 18
Vì c tài liu XML u n&m di dng Text String nên nu g!i i xa có
h mt chút −nh, u kia cng oán ra c. Gi d( vào th k/ 23 sau ny có
ai bt c mt tài liu XML c∀a nm 2000, nhng trong ó có vài ch b% m,
h cng oán <FA ILY>Lê Quang Anh Hng <FAM LY> có ngh)a là
<FAMILY>Lê Quang Anh Hng <FAMILY>. Mc du ta nói ai mun t ra
TH5 nào trong XML cng c, nhng thí d( mi ngh nghip nh c khí, y
hc, Tin hc, n %nh mt s TH., mi TH. có ý ngh)a theo s ng ý trc
trong ngh c∀a mình, ngi ta có th dùng XML và Style Sheet quy %nh
cách ch∋a d kin và ngay c cách trình bày cho riêng ngh c∀a mình.
Mt công ty c khí có th dùng mt chng trình chy t ng (Robot) d
giá nhng vt liu t t# các công ty cung cp qua cách dùng XML. ây là kh!i
u cho vic giao d%ch kinh doanh t ng (Business-To-Business hay B2B).
Có mt quy c v cách dùng XML trao i d kin ã c trin khai gi
là "Open Financial Exchange Format (OFX)". Ngi ta thit k OFX cho
các chng trình tài chánh nh Microsoft Money và Quicken trao i d kin
hay g!i các d kin tài chánh n nhà bng,
Vì XML là mt chu∃n công cng, không thuc v mt công ty nào, nên
ngi dùng không s phi (ng chm ai v copyright, hay b% gii hn cách s+
d(ng, Thí d( nh vi XML ta có th tránh phi l thuc hoàn toàn vào
Microsoft Word khi g!i mt tài liu vì s u kia ngi ta không có Microsoft
Word. Mi,n là tt c các Word Processors u c, vit XML c, ta có th
dùng XML làm phng tin trao i các tài liu. Ngi dùng ! mi ni có th
t do chn mt Word Processor theo s! thích.
XML không nhng cho bn %nh ngh)a các phn c∀a tài liu mà còn t qui
c v s liên h c∀a các phn y.
Vào nm 1998 hoc 1999 thì còn quá sm xác %nh c XML s∗ i
n âu. Nhng n thi im hin ti thì XML c th#a nhn là mt chu∃n
giao d%ch thông tin, mt lý do chính hiu ti sao có quá nhiu s xôn xao tp
trung quanh XML. T hp Web toàn cu W3C ã chính th∋c a ra chu∃n
XML ver1.0.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 19
3. Các mi quan h gi%a SGML, HTML và XML
Ngôn ng ánh du tiêu chu∃n t ng quát (SGML - Standard Generalized
Markup Language) là mt phng pháp biu th% d liu trong nhng ∋ng d(ng
x+ lý vn bn. Nó ã tn ti hn mt thp k/ nay; c XML ln HTML u là
nhng %nh dng tài liu có ngun gc t# SGML. Vì vy, tt c chúng u cùng
chia s. mt s c tính ch1ng hn nh mt cú pháp tng t và cách dùng các
nhãn trong du ngoc nhn. Nhng HTML là mt ∋ng d(ng c∀a SGML, trong
khi XML là mt b trình con c∀a SGML.
- S phân bit là rt quan trng. C bn, HTML không th dùng %nh ngh)a
nên các ∋ng d(ng mi trong khi XML có th thc hin c vic này. Ví d(, c
RDF ln CDF u là nhng ∋ng d(ng c %nh ngh)a b&ng XML. XML và
HTML thc s ging nh hai anh em h hn là hai anh em rut:-). T hp Web
toàn cu W3C ã phát trin mt biu ln làm sáng t mi quan h này.
- XML thc s tng thích vi SGML - bt c∋ mt công c( to hoc duyt
SGML nào cng có th c c nhng tài liu XML. Tuy nhiên, XML
ph∋c tp hn SGML, và nó c thit k chy trên mt mng bng tng hu
hn ví d( nh Internet. Theo Tim Bray - ng biên tp viên XML - thì ý t!ng
&ng sau XML là tn d(ng li ích c∀a SGML, loi b nhng phn ph∋c tp,
duy trì tính nh4 nhàng, và làm cho nó hot ng c trên Web.
- HTML, SGML, và XML s∗ tip t(c c s+ d(ng ! nhng v% trí thích hp;
s∗ không có ngôn ng nào trong s chúng th hin bt c∋ tính cht li thi nào
khác. HTML vn duy trì cách th∋c n gin nht phát hành d liu nhanh
chóng trên Web, thng là nhng d kin ngn hn ví d( nh các chng trình
ngh% s hoc các t bm qung cáo. Nu d kin có mt công d(ng dài hn
hn và cn mt cu trúc cht ch∗ hn, thì các nhà xây dng Web s∗ chuyn
sang XML. Không ging nh HTML và XML, SGML có th s∗ ch1ng bao gi
có c s chp nhn ph bin trên Internet, n gin b!i vì nó cha bao gi
c thit k hoc c ti u cho các nhu cu c∀a mt giao th∋c mng. M∋c
ti a, vi nhng ∋ng d(ng phát hành có cu trúc cht ch∗ ! m∋c cao,
SGML s∗ tip t(c phù hp vi mi yêu cu.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 20
4. Cách th&c hin XML
XML c s+ d(ng trong hai cách khác nhau. Mt cho s trao i ln
nhau gia ngi và máy, ví d( nh t# mt máy ch∀ Web n trình duyt c∀a
mt ngi s+ d(ng. Mt cách khác cho s trao i d liu gia các ∋ng d(ng
hoc gia máy vi máy. Trong hai trng hp, dng nh bn s∗ cn n mt
c cu ba tng: mt cn c∋ c s! d liu; mt máy ch∀ tng gia, ni logic
công vic hot ng theo d liu; và máy khách hàng, ni d liu c trình
bày và x+ lý sâu hn. C s! d liu có th nhn thông tin t# nhiu ngun d
liu khác nhau, có l∗ ã c %nh dng XML. Tng gia khi ó có th kéo d
liu li vi nhau và a nó sang tng trình bày cui cùng. Ngày nay, các trang
Web ôi khi c phân phi theo cách này - NEWS.COM c∀a CNET phát
hành t# mt c s! d liu. Nhng vào mt khung duyt mi c∀a mt trang,
ch1ng hn nh tùy chn mi v máy in thân thin c∀a NEWS.COM, thì máy
ch∀ phi phát sinh mt trang mi. Mt tài liu XML c %nh dng hoàn ho
s∗ cho phép ∋ng d(ng máy khách hàng hiu ch−nh li din mo tài liu cho
nhiu phng tin khác nhau, ví d( nh mt máy in.
5. Khái nim ki∋u tài liu (DTD)
Mt %nh ngh)a kiu tài liu (DTD - Document Type Definition) là mt
b nhng qui tc cú pháp cho các nhãn. Nó cho bn bit nhng nhãn nào bn
có th s+ d(ng trong mt tài liu, chúng nên c xp theo th∋ t nào, nhng
nhãn nào có th xut hin bên trong các nhãn khác, nhng nhãn nào có các
thuc tính, Ngun gc c phát trin cho vic s+ d(ng vi SGML, mt
DTD có th là mt b phn c∀a mt lài liu XML, nhng thng nó là mt tài
liu riêng bit hoc mt lot các tài liu.
B!i vì bn thân XML không phi là mt ngôn ng, mà là mt h thng
cho vic %nh ngh)a các ngôn ng, cho nên nó không có mt DTD chung nh
trong HTML. Thay vào ó, mi t ch∋c hoc công ngh mun dùng XML cho
vic trao i d liu u có th %nh ngh)a nên nhng DTD s! hu riêng. Nu
mt t ch∋c dùng XMT gán nhãn các tài liu ch− cho vic s+ d(ng ni b,
thì có th to nên DTD riêng cho mình. Ví d(, bn tp chí tng tác Wall Street
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 21
có mt DTD ch− rõ t#ng bn in, vi nhng thông tin v các trang, các bài báo
nhng bài tóm tt Tp chí này hin ti dùng DTD c∀a SGML (c gi là
ngôn ng nâng cp Dow Jones), nhng hin nó cng ang phát trin mt phiên
bn XML.
Nhng %nh ngh)a DTD không thoát khi s tranh cãi. Trong khi mt s ngi
cm thy chúng làm tng giá tr% thc cht c∀a công vic, thì mt s khác li cho
r&ng chúng kìm hãm s sáng to. Tuy nhiên có mt s ngi ngh) r&ng chúng
có ích không ∀ tin xa hn. Microsoft ang c gng khc ph(c cho trng
hp phàn nàn sau cùng này vi k hoch a ra XML-Data, nhng các nhà phê
bình cho r&ng nhng ci tin này nên c thc hin bên trong bn thân k
thut DTD.
6. Ví d mt trang XML n gin
Mt trang XML n gin nht:
<?xml version="1.0" standalone="yes"?>
<gicungduoc>
Chào XML! Mnh gii?
</gicungduoc>
Bn có th dùng phn mm XML Spy 2.0 vit XML, ti thi im Tôi trình
bày là ã có phiên bn ver 2.0 lâu ri. Bn cng có th dùng Notepad vit
trang trên và ch∋a trong mt file tên là "chaohoi.xml". XML dùng Unicode,
bn nên dùng Notepad c∀a Windows NT/2000 Edit và ch∋a file di dng
Unicode thay vì text. XML có th là Unicode hay mt dng nén c∀a Unicode
gi là UTF-8 (nó dùng 1 byte biu di,n mt mu t nu có th c, nu
không c thì dùng 2 bytes nh bình thng). Nu bn không có ý %nh dùng
ch Vit thì ch− cn dùng ASCII text bình thng cho XML là c ri.
Mi trang XML u bt u b&ng mt "XML processing instruction" (lnh x+
lý XML). Processing instruction bt u vi <? và chm d∋t vi ?>. Ch u
tiên ngay sau <? là lnh x+ lý, trong trng hp ny là "xml".
Trong câu processing instruction nói trên cng có hai Attributes (ph( t#), ó là
"version" (n bn) và "standalone" (∋ng mt mình) . Giá tr% c∀a chúng là "1.0"
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 22
và "yes". 2 ây mun nói r&ng trang XML ny c vit theo úng XML 1.0
Specification và nó có th làm vic mt mình, không cn phi import (kéo
thêm vào) file nào khác.
<gicungduoc> và </gicungduoc> là mt Cp th Nó k4p mt d kin bên
trong. Tht ra ta có th t tên cho Th. ny th∋ gì cng c. T∋c là cùng mt
trang XML nói trên, ta ã có th vit theo mt trong ba cách sau ây:
<?xml version="1.0" standalone="yes"?>
<greeting>
Chào XML! Mnh gii?
</greeting>
hay
<?xml version="1.0" standalone="yes"?>
<chaohoi>
Chào XML! Mnh gii?
</chaohoi>
hay
<?xml version="1.0" standalone="yes"?>
<tailieu>
Chào XML! Mnh gii?
</tailieu>
Mc dù các th. có tên khác nhau, nhng c ba trang XML u có cùng cu trúc
và d liu. Tuy nhiên, nu ã có d kin chúng ta nên chn tên các Th. cho có
ý ngh)a rõ ràng d, trình bày trang XML cách trong sáng sau này.
7. Well-Formed XML
Mc dù bn có th t ra bao nhiêu Th. cng c, nhng mi trang XML cn
phi theo mt s qui lut c xem là Well-Formed (Có u, có uôi).
Nu mt trang XML không Well-Formed thì coi nh xài không uc, không có
chng trình x+ lý nào s∗ ch%u làm vic vi d liu bên trong c∀a nó. Do ó
mt trang XML cn phi theo úng các qui lut sau ây:
Trang XML phi bt u b&ng câu tuyên b XML (XML declaration)
Mi b phn, gi là "element" phi n&m gia mt cp th
Nu Th. nào không ch∋a gì ! gia thì phi chm d∋t b&ng "/>", thí d( nh
<BR/> hay <HR/>.
Mt trang XML phi có mt element c nht ch∋a tt c các elements khác.
ó là root c∀a tree biu di,n trang XML.
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 23
Các cp th. không c xen k. nhau (thí d( nh <name>John
Stanmore<address>25 King Street</name></address> là bt hp l vì
<address> n&m trong cp th. name).
và thêm mt vài qui lut v cách dùng các mu t c bit. Ngoài ra các Cp
th. phi ánh vn úng y nh nhau k c ch hoa, ch thng, (thí d(:
<STUDENT> và </Student> là bt hp l) và tt c giá tr% các Attribute u
phi n&m gia hai ngoc kép (thí d(: standalone=yes là bt hp l, phi dùng
standalone="yes" mi c.)
II.2. S l!∀c v# RDF (Resource Description Framework)
RDF là khung mô t tài nguyên (Resource Description Framework) có
nn tng là XML, RDF c dùng mô t các ngun tài nguyên tn ti trên
Web, intranets, và extranets. RDF c xây dng trên công ngh XML và URI
(Uniform Resource Identifier), s+ d(ng mt URI xác %nh ngun tài nguyên
và khai báo các ngun tài nguyên. Các câu RDF (RDF statement) mô t tài
nguyên, thuc tính c∀a tài nguyên, và các giá tr% c∀a các thuc tính ó. B ba
RDF (triples) gm có mt ch∀ th (subject), mt khách th (object) và mt
mnh (predicate), tng ∋ng vi mt tài nguyên (subject), thuc tính
(predicate), và giá tr% c∀a thuc tính (object).
RDF ch− cung cp các mô hình và cú pháp cho vic mô t tài nguyên mà
RDF không %nh ngh)a các tài nguyên ó. Các công ngh khác nh RDFS s∗
thc hin các nhc im trên.
Lc RDF (RDF Schema) %nh ngh)a các t# vng c∀a RDF trong
mt min riêng. RDFS cho phép %nh ngh)a các thuc tính và các thuc tính
này c s+ d(ng b!i nhng th hin c∀a RDF trên các tài nguyên c∀a mt
min riêng.
RDF và RDFS c hiu b!i máy tính, máy tính có th suy lun logic da trên
các mi quan h gia các tài nguyên.
II.2.1. C(u trúc RDF
Phn này gii thiu s lc v RDF (Resource Description Framework –
Khung mô t tài nguyên) bao gm:
HUTECH
Lun vn tt nghip: Nghiên cu v Ontology Editor và ng dng
GVHD: PGS.TS. Trng M Dung Trang 24
• Mô hình d liu th% (Graph data model)
• T# vng da trên nn URI (URI-based vocabulary)
• Các kiu d liu (Datatypes)
• Các t# (Literals)
• Cú pháp XML (XML serialization syntax)
• Biu di,n mt s kin n gin (Expression of simple facts)
• S k th#a có th∋ t (Entailment)
1) Mô hình d% liu th) (Graph data model)
Cu trúc c bn c∀a mt mô hình RDF là tp hp các b ba (triple) , mi
b ba gm có mt ch∀ th (subject), mt khách th (object) và mt mnh
(predicate). Mt b ba c minh ha b!i các nút và các cung trên th% sau:
Hình 2.1. Cu trúc s RDF
Mi b ba th hin mt mi quan h liên kt gia các nút. Mi b ba gm có:
1. Ch∀ th (subject),
2. Khách th (object),
3. Mnh (còn c gi là thuc tính (property)) nó th hin mt mi
quan h (predicate).
Hng c∀a cung luôn có hng t# ch∀ th n khách th.
Mi nút trên th% có th v#a là ch∀ th, v#a là khách th.
th% RDF thc cht là s trình bày các b ba trên nó, vì th ý ngh)a c∀a b ba
trong th% RDF là s kt ni lôgic AND gia các b ba vi nhau.
2) T∗ v&ng d&a trên n#n URI (URI-based vocabulary)