1
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
Phùng Tuấn Anh
TÌM KIẾM DỮ LIỆU WEB VỚI NGÔN NGỮ XML
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
2
TÓM TẮT LUẬN VĂN
1. Thông tin chung:
Tên đề tài: Tìm kiếm dữ liệu Web với ngôn ngữ XML
Giáo viên hƣớng dẫn: PGS. TS Đỗ Trung Tuấn
Học viên thực hiện: Phùng Tuấn Anh
Lớp: Cao học K9A
Cơ sở đào tạo: Trƣờng Đại học Công nghệ Thông tin và Truyền thông –
Đại học Thái Nguyên
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01.
2. Mục tiêu:
- Tìm hiểu, làm rõ một số nội dung về ngôn ngữ XML và khả năng sử
dụng XML trong việc tìm kiếm dữ liệu.
- Ứng dụng ngôn ngữ XML trong việc tìm kiếm dữ liệu Web phục vụ
công tác Quản lý nhà nƣớc về lĩnh vực công thƣơng.
3. Nội dung chính:
- Nghiên cứu tổng quan về đặc tính XML và các ngôn ngữ truy vấn XML:
Xparth, XQuery, XSL
- Nhu cầu thực tế về tìm kiếm dữ liệu Web hiện nay trên Internet.
- Xây dựng chƣơng trình đề mô, ứng dụng XML để tìm kiếm thông tin
trên Website cho ngƣời sử dụng.
4. Kết quả đạt đƣợc:
Luận văn đã tìm hiểu những vấn đề liên quan đến dữ liệu và cơ sở dữ liệu,
đặc biệt ngôn ngữ XML và cơ sở dữ liệu XML. Trong phần đầu luận văn, một số
nhu cầu về sử dụng dữ liệu XML đƣợc trình bày.
Trong chƣơng hai, luận văn trình bày một số khía cạnh của ngôn ngữ
XML, đặc biệt những cú pháp và tìm kiếm dữ liệu XML. Việc này có ý nghĩa
quan trong trong hệ thống các văn bản Internet đã và đang trở nên thông dụng.
Ngoài những tìm hiểu về hệ thống XML, luận văn đã thử nghiệm với một
vài công việc thực tế tại Sở Công Thƣơng tỉnh Thái Nguyên.
Đã xây dựng chƣơng trình đề mô, ứng dụng XML để tìm kiếm thông tin
trên Website cho ngƣời sử dụng.
3
MỤC LỤC
MỤC LỤC 3
DANH MỤC CÁC TỪ VIẾT TẮT 6
DANH MỤC CÁC HÌNH VẼ 7
LỜI CẢM ƠN 8
LỜI NÓI ĐẦU 9
CHƢƠNG 1 11
DỮ LIỆU VÀ NHU CẦU XỬ LÝ DỮ LIỆU 11
1.1. Nhu cầu về dịch vụ Web 11
1.2. Xử lý dữ liệu nhờ các hệ quản trị cơ sở dữ liệu 17
1.2.1. Giới thiệu 17
1.2.2. Quá trình phát triển của hệ quản trị cơ sở dữ liệu (DBMS). 19
1.3. Nhu cầu về cơ sở dữ liệu XML 22
1.3.1. Lý do cần cơ sở dữ liệu XML 22
1.3.2. Vai trò thay thế các cơ sở dữ liệu quan hệ của XML 23
1.3.3. Các giải pháp sử dụng XML 23
1.3.4. Đánh giá chung và vai trò của XML 24
1.4. Kết luận 25
CHƢƠNG 2 26
XML VÀ NGÔN NGỮ TRUY VẤN DỮ LIỆU 26
2.1. Giới thiệu XML 26
2.1.1. Một số ngôn ngữ đánh dấu 26
2.1.2. Ngôn ngữ đánh dấu mở rộng XML 27
2.1.3 Sự khác nhau giữa XML và HTML 27
2.1.4. Lịch sử hình thành và phát triển XML 28
2.2. Đặc điểm của XML 29
4
2.2.1. Các tệp XML 30
2.2.2. Sử dụng XML 31
2.3. Cấu trúc một tài liệu XML 32
2.3.1.Thí dụ 32
2.3.2. Xem tài liệu XML trên trình duyệt 34
2.3.3. Trích dữ liệu trong tài liệu XML 34
2.4. Tổ chức dữ liệu XML 35
2.4.1. Tạo tài liệu XML đúng khuôn dạng 36
2.4.2. Tạo tài liệu XML hợp lệ 36
2.5. Tạo tài liệu XML 37
2.5.1. Bộ ký tự mã hóa 37
2.5.2. Đánh dấu XML và dữ liệu XML 38
2.5.3. Ký tự trắng và dấu xuống dòng 39
2.5.4. Tạo phần mở đầu 39
2.5.5. Tạo khai báo XML 39
2.5.6. Ghi chú tài liệu 40
2.5.7. Tạo các chỉ thị xử lý 40
2.5.8. Tạo thẻ và phần tử 40
2.5.9. Tạo tài liệu XML hợp khuôn dạng 43
2.5.10. Các ràng buộc hợp khuôn dạng: 46
2.5.11. Sử dụng không gian tên trong XML 48
2.5.12. Không gian tên mặc định 53
2.5.13. Cách ghi chú trong DTD 61
2.6. Các ngôn ngữ truy vấn XML 62
5
2.6.1. XPath 62
2.6.2. XQuery 62
2.6.3. XSL 63
2.7. Kết luận 66
CHƢƠNG 3 67
TÌM KIẾM THÔNG TIN VỚI XML 67
3.1. Nhu cầu tìm kiếm dữ liệu tại Thái Nguyên 67
3.1.1. Đặc điểm công tác của đơn vị 67
3.1.2. Xác định hệ thống thông tin tại cơ quan 67
3.1.3. Mục đích của tìm kiếm dữ liệu Web 67
3.2. Đảm bảo kỹ thuật 68
3.2.1. Thiết kế hệ thống thu thập thông tin 68
3.2.2. Bộ lập chỉ mục 69
3.2.3. Bộ tìm kiếm thông tin 69
3.2.4. Nguyên lý hoạt động của Search Engine 70
3.3. Ứng dụng XML tìm kiếm thông tin web tại đơn vị 70
3.3.1. Tìm kiếm thông tin trên webiste 70
3.3.2. Thiết lập chƣơng trình tìm kiếm sử dụng công cụ robot 73
3.3.2. Chƣơng trình tìm kiếm 77
3.4. Kết luận 78
KẾT LUẬN 79
Kết luận và khuyến nghị 79
Hƣớng phát triển mở rộng 79
TÀI LIỆU THAM KHẢO 80
6
DANH MỤC CÁC TỪ VIẾT TẮT
4th Dimension, ANTs Data Server,
Dataphor, Daffodil database,
FileMaker Pro, Informix, InterBase,
Matisse, Microsoft Access, Mimer
SQL, NonStop SQL, Sand Analytic
Server , SmallSQL, Sybase ASA,
Watcom SQL, Sybase, Sybase IQ,
Teradata, ThinkSQL, VistaDB
Các hệ quản trị cơ sở dữ liệu thƣơng
mại
ASCII
Bộ mã
B2B
Business to business
B2C
Business to customer
Cloudscape, Firebird, HSQLDB,
Ingres, MaxDB, MonetDB,
PostgreSQL, SQLite, tdbengine.
Các hệ quản trị cơ sở dữ liệu mã mở
CNTT
Công nghệ Thông tin
DB2
Hệ quản trị cơ sở dữ liệu của IBM
DBMS
Hệ quản trị cơ sở dữ liệu
DTD
Document Type Definition
ER
Mô hình thực thể quan hệ
GML
Generalized Markup Language
HTML
Hyper Text Markup Language
ICT
Công nghệ Thông tin và Truyền
thông
IP
Giao thức IP
ISO
International Standard Organisation
MVS (Multiple Virtual Storage)
Lƣu trữ ảo
NXD
Native XML database (Cơ sở dữ
liệu XML nguyên gốc)
RDBMS
Hệ quản trị cơ sở dữ liệu quan hệ
RFC
Request for Comments
SGML
Standard Generalized Markup
Language
SQL
Structured Query Language
SQL SERVER
Hệ quản trị cơ sở dữ liệu SQL
SERVER
UCS
Universal Character System
URI
Uniform Resource Identifier
WML
Wireless Markup Language
XML
Ngôn ngữ đánh dấu mở rộng, XML
7
DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Inetrnet giúp truy cập 11
Hình 1.2: Mua bán trên mạng 13
Hình 1.3: Thông tin nội bộ 14
Hình 1.4: Dịch vụ 24/ 24 15
Hình 1.5: Truyền thông linh hoạt 16
Hình 1.6: Ba tầng cơ sở dữ liệu 18
Hình 1.7: Mô hình ER 19
Hình 1.8: SQL SERVER 21
Hình 2.1: Ngôn ngữ HTML 27
Hình 2.2: XML và ngôn ngữ khác 27
Hình 2.3: Sơ đồ SGML 29
Hình 2.4: Mối quan hệ giữa các thành phần trong XML 63
Hình 3.1: Các máy chủ trong kiến trúc C/S 70
Hình 3.2: Một trang web chứa thông tin của sở 71
Hình 3.3: Nội dung trang web dạng xHTML 72
Hình 3.4: Sơ đồ hoạt động của công cụ robot 74
Hình 3.5: Sơ đồ thẻ xHTML tổ chức dƣới dạng cây 76
Hình 3.6: Giao diện trang tìm kiếm 77
Hình 3.7: Giao diện kết quả tìm kiếm 77
8
LỜI CẢM ƠN
Tôi xin chân thành cảm ơn Ban giám hiệu, các Thầy Cô trường Đại học
Công nghệ thông tin và Truyền thông Thái Nguyên, đặc biệt là các thầy cô trong
và ngoài trường đã tận tình giảng dạy, trang bị cho tôi những kiến thức cần thiết
trong suốt những năm học tập tại trường.
Em xin chân thành cảm ơn thầy Đỗ Trung Tuấn đã tận tình quan tâm,
hướng dẫn và giúp đỡ em trong thời gian qua để em có thể hoàn thành tốt luận
văn của mình.
Tôi xin chân thành cảm ơn các anh chị cùng các bạn đã có những nhận
xét, đóng góp ý kiến, động viên, quan tâm và giúp đỡ tôi vượt qua khó khăn.
Cuối cùng, Tôi xin gửi lòng biết ơn sâu sắc đến cha mẹ, gia đình, Lãnh
đạo Sở Công Thương đã tạo mọi điều kiện về thời gian, vật chất, tinh thần động
viên, khích lệ và hỗ trợ tôi trong suốt thời gian qua./.
Thái Nguyên, ngày 12 tháng 9 năm 2012
9
LỜI NÓI ĐẦU
Thế kỷ XXI, thế kỷ của sự bùng nổ công nghệ thông tin, các công nghệ
tiên tiến phát triển nhƣ vũ bão, mang một luồng gió mới thổi vào nhận thức của
mỗi ngƣời. Song song đó, thế giới đang trong xu thế toàn cầu hóa, tất cả đều
mang ý nghĩa hội nhập. Lúc này, các doanh nghiệp và chính phủ không chỉ cạnh
tranh với các doanh nghiệp trong một quốc gia mà còn cạnh tranh với các doanh
nghiệp, chính phủ ở khắp thế giới. Vì thế, để tồn tại và phát triển, mục tiêu mà
các doanh nghiệp hƣớng đến đầu tiên là nâng cao chất lƣợng phục vụ khách
hàng. Khách hàng là yếu tố sống còn của bất kỳ doanh nghiệp nào trong thế kỷ
XXI. Một Chính phủ muốn quốc gia mình phát triển phải xem nhân dân và doanh
nghiệp là khách hàng. Doanh nghiệp nào làm cho khách hàng thỏa mãn, doanh
nghiệp đó sẽ phát triển tốt, Chính phủ nào làm nhân dân hài lòng Chính phủ đó
sẽ vững mạnh.
Trong bối cảnh phát triển mạnh mẽ của Internet, thƣơng mại điện tử,
Chính phủ điện tử đã ra đời và phát triển khá nhanh, điều này không phải là mới
trên thế giới nhƣng vẫn là rất mới đối với Việt Nam. Nhiều vấn đề đặt ra là làm
thế nào để ứng dụng công nghệ thông tin vào đời sống đƣợc hữu dụng nhất.
Chính vì vậy đề tài “Tìm kiếm dữ liệu Web với ngôn ngữ XML” đƣợc đƣa
ra nhằm giúp cho các doanh nghiệp hay các tổ chức nhà nƣớc, hỗ trợ cho ngƣời
dùng đạt hiệu quả. Với luận văn này, tôi mong muốn sẽ xây dựng đƣợc một hệ
thống chƣơng trình phần mền "hệ thống tìm kiếm dữ liệu WEB" để phục vụ cho
việc tra cứu văn bản chuyên ngành của Sở Công Thƣơng Thái Nguyên.
Trong quá trình tìm hiểu và viết về những đặc tính của XML sẽ không
tránh khỏi những sai sót và hạn chế, rất mong đƣợc sự góp ý của Hội đồng và
toàn thể những ai đã đọc luận văn này của tôi, để bản luận văn của tôi đƣợc hoàn
thiện hơn nữa.
10
Luận văn đƣợc chuẩn bị theo các chƣơng :
Chƣơng 1 trình bày nhu cầu xử lý dữ liệu và dẫn đến vai trò của dữ
liệu XML và thông tin trên Internet. Các hệ thống quản trị cơ sở dữ
liệu đƣợc đề cập để thấy đƣợc vai trò của chúng.
Chƣơng 2 trình bày một số khía cạnh của XML và thách thức đối
với bài toán tìm kiếm thông tin trên Web. Những kiến thức tìm hiểu
là cơ sở để phát triển ứng dụng trong chƣơng sau.
Chƣơng 3 trình bày những ứng dụng thử nghiệm tại địa bàn Thái
Nguyên. Một số trang màn hình cho phép thể hiện kết quả thử
nghiệm.
Phần cuối là kết luận, trình bày các kết quả làm đƣợc và định hƣớng
nghiên cứu tiếp.
11
CHƢƠNG 1
DỮ LIỆU VÀ NHU CẦU XỬ LÝ DỮ LIỆU
1.1. Nhu cầu về dịch vụ Web
Để nói đến nhƣ cầu về dịch vụ Web hiện nay chúng ta phải nói đến các
khía cạnh cụ thể nhƣ sau:
1. Thiết lập sự hiện diện: Có gần 300 triệu ngƣời trên thế giới đã truy cập vào
mạng và số lƣợng này không ngừng tăng lên hàng ngày. Việc tiếp cận đƣợc
dù chỉ 1% nhóm khách hàng này cũng là 1 thành công của các doanh nghiệp.
Đó là một phần không nhỏ của cộng đồng xã hội, hãy cho ngƣời ta biết quan
tâm tới việc phục vụ cả cộng đồng này, ngƣời ta cần phải có mặt trên mạng
Internet. Ngƣời ta nên hiểu, đối thủ cạnh tranh của ngƣời ta cũng đang làm
nhƣ vậy.
Hình 1.1: Inetrnet giúp truy cập
2. Tận dụng hoàn toàn những cơ hội tiếp xúc : Nhiều khi công việc kinh
doanh đƣợc hiểu một cách đơn giản là giao tiếp với khách hàng. Mọi doanh
nhân thông minh đều hiểu rằng: "Bí quyết thành công không nằm ở chỗ
những gì ngƣời ta biết mà chính là ở chỗ ngƣời ta biết tới những khách hàng
nào". Các doanh nhân đều muốn tận dụng các cuộc gặp gỡ thông thƣờng
thành công việc kinh doanh có lợi và việc trao danh thiếp là một việc đƣợc
coi trọng trong quá trình này. Nhƣng điều gì sẽ xảy ra khi doanh nghiệp cần
phải gặp gỡ hàng ngàn, thậm chí hàng triệu đối tác làm ăn, liệu các doanh
nghiệp có thể tiếp xúc cùng một lúc với tất cả các khách hàng. Điều này có
12
thể đƣợc giải quyết hết sức đơn giản, tại mọi lúc, mọi nơi, mọi thời điểm
thông qua các trang Website trên mạng Internet.
3. Tạo ra nguồn thông tin sẵn có cho đối tác : Khi ngƣời ta muốn tạo các
trang thông tin, quảng cáo, có thể ngƣời ta sẽ đăng chúng trên mục quảng cáo,
trang vàng, nhƣng thời gian sẽ làm cho ngƣời ta phải tính lại. Vì, làm thế nào
để khách hàng quan tâm có thể liên hệ đƣợc ngay với bạn? Phƣơng thức
thanh toán trong mỗi dịch vụ sẽ nhƣ thế nào? Quảng cáo trang vàng sẽ khó
khăn trong việc này vì đây vẫn chỉ là một loại phƣơng tiện truyền thông có
khoảng cách. Trong thời đại hiện nay, các thông tin đòi hỏi phải nhanh chóng
hơn và mang tính đa chiều hơn. Internet sẽ giúp ngƣời ta làm đƣợc điều đó
thông qua những trang thông tin đƣợc duy trì liên tục 24/24 giờ trong ngày và
07 ngày trong tuần. Khách hàng có thể xem thông tin về doanh nghiệp của
bạn bất kỳ lúc nào họ muốn, thậm chí ngay cả khi bạn đang ngủ.
4. Phục vụ khách hàng thật hiệu quả: Công nghệ Internet sẽ mang lại cho
doanh nghiệp của ngƣời ta nhiều cách hơn để phục vụ khách hàng. Liệu
ngƣời ta có đủ đội ngũ nhân viên trực điện thoại để tiếp nhận các yêu cầu
cung cấp thông tin dịch vụ mà họ cần? Liệu khách hàng có thể tự động tra
cứu vào cơ sở dữ liệu, tìm kiếm các thông tin về dịch vụ ngƣời ta đang tiến
hành mà họ muốn không? Tất cả điều này khách hàng có thể làm đƣợc một
cách đơn giản và nhanh chóng thông qua chính Website của doanh nghiệp bạn.
5. Thu hút sự quan tâm của dân chúng : Ngƣời ta khó mà thuyết phục đƣợc
các tạp chí đăng bài về việc ngƣời ta khai trƣơng một cửa hàng mới nhƣng
ngƣời ta lại có thể thuyết phục đƣợc họ đăng bài nêu tên Website của ngƣời ta
vì trang Web đó mới và có nhiều điều thú vị. Với các thông tin nhƣ vậy, bất
kỳ ngƣời sử dụng Internet nào cũng có thể truy cập vào Website để tìm hiểu
về doanh nghiệp của ngƣời ta và có thể trở thành khách hàng tiềm năng.
6. Công bố thông tin vào bất kỳ thời gian nào : Nếu ngƣời ta cần phải công
bố các tài liệu trƣớc lúc nửa đêm thì sẽ nhƣ thế nào? Giả sử đó là tin khẩn
cấp, công bố các giải thƣởng của chƣơng trình khuyến mại, Nếu ngƣời ta
13
gửi các tin này tới các tòa soạn báo thì ngƣời ta sẽ gặp phải trở ngại về thời
gian: Thông tin của ngƣời ta chỉ đƣợc phát hành cùng với giờ phát hành của
báo và không thể thay đổi sau khi báo đã đƣợc phát hành. Với Internet, ngƣời
ta hoàn toàn có thể thay đổi tin tức mới cho Website của doanh nghiệp trong
vòng vài giây đồng hồ, những thông tin mới nhất sẽ đƣợc cập nhật và sẽ đƣợc
chuyển tới những ngƣời mong đợi mà không phải qua bất kỳ ngƣời đƣa tin nào.
7. Để bán hàng hóa : Internet đem lại cho doanh nghiệp của ngƣời ta một cơ
hội lớn để ngƣời ta có thể bán hàng. Sự phát triển của Internet trên toàn thế
giới kéo theo sự ra đời và mở rộng của một thị trƣờng khách hàng mới đầy
tiềm năng - cộng đồng ngƣời sử dụng Internet. Liệu ngƣời ta có nên chần chừ
khi mà các đối thủ cạnh tranh trong kinh doanh của ngƣời ta đang dần từng
bƣớc thâm nhập và chiếm lĩnh thị phần trên Internet.
Hình 1.2: Mua bán trên mạng
8. Giới thiệu sản phẩm sinh động : Nếu sản phẩm của ngƣời ta là những chiếc
máy thì khách hàng sẽ thực sự bị thuyết phục khi nhìn thấy nó hoạt động ra
sao. Internet mở ra cho ngƣời ta nhiều cách thức để giới thiệu sản phẩm thật
sinh động tới khách hàng thông qua Website bằng hình ảnh, âm thanh, các
đoạn phim ngắn, điều này sẽ khiến các khách hàng tiềm năng sẽ đến với
ngƣời ta nhiều hơn, không một quyển sách giới thiệu nào có thể làm đƣợc
nhƣ vậy.
9. Vƣơn tới một thị trƣờng dân chúng có thu nhập cao : Số lƣợng ngƣời
tham gia vào mạng Internet có thể tạo ra một thị trƣờng sẵn có đông đảo nhất.
Những ngƣời sử dụng Internet thƣờng là những ngƣời có trình độ học vấn, có
14
hiểu biết và địa vị ổn định, thu nhập cao trong xã hội. Chính vì vậy, tiếp cận
đƣợc và chiếm lĩnh thị trƣờng khách hàng này là điều mà bất kỳ doanh nghiệp
kinh doanh nào cũng mong muốn đạt đƣợc.
10. Trả lời các câu hỏi thƣờng gặp : Bất kỳ ngƣời trực điện thoại nào trong
công ty ngƣời ta cũng đều nói rằng họ dùng phần lớn thời gian của mình để
trả lời các câu hỏi gần nhƣ giống nhau. Đó là những câu hỏi mà các khách
hàng muốn hỏi trƣớc khi họ giao dịch với bạn. Đƣa những câu hỏi này lên
Website sẽ giúp ngƣời ta loại bỏ đƣợc những rào chắn đối với công việc kinh
doanh và giải phóng bớt thời gian cho nhân viên trực điện thoại.
11. Giải quyết thông tin nội bộ : Các nhân viên bán hàng lƣu động có thể cần
những thông tin cập nhật từng phút để giúp họ bán hàng cũng nhƣ giúp cho
việc kinh doanh luôn ăn ý. Nếu ngƣời ta biết thông tin gì cần thiết, ngƣời ta
có thể đƣa chúng lên 1 Website riêng. Với một cuộc truy cập Internet thông
qua điện thoại nội hạt, nhân viên bán hàng của doanh nghiệp ngƣời ta ở bất
kỳ nơi đâu trên thế giới sẽ nhận đƣợc những thông tin đầy đủ nhất mà không
phải trả cƣớc phí đƣờng dài và những nhân viên ở văn phòng không bận rộn thêm.
Hình 1.3: Thông tin nội bộ
12. Mở rộng ra thị trƣờng quốc tế : Với việc kinh doanh thông thƣờng ngƣời ta
không thể gửi thƣ, điện thoại hay phổ biến các quy định tới tất cả mọi khách
hàng tiềm năng trên thị trƣờng thế giới, nhƣng với Website ngƣời ta có thể
hội thoại trực tiếp với khách hàng quốc tế nhƣ là với một khách hàng trong
nội hạt. Khi doanh nghiệp của ngƣời ta có các văn phòng đại diện ở nƣớc
15
ngoài, họ sẽ truy cập vào nguồn thông tin của văn phòng trong nƣớc với chi
phí phải trả chỉ bằng một cuộc điện thoại gọi nội hạt.
13. Hình thành dịch vụ 24 giờ : Chúng ta không phải lúc nào cũng có những
công việc cùng chung một lịch trình. Công việc kinh doanh là khắp mọi lúc,
mọi nơi chứ không phải chỉ là thời gian ở công sở. Khi công việc kinh doanh
giữa Châu Âu và Châu Á đang thực hiện thì sự khác biệt về thời gian sẽ là
điều cản trở lớn. Các Website sẽ phục vụ khách hàng và các đối tác của ngƣời
ta 24/24 giờ trong ngày, 07/07 ngày trong tuần. Thông tin có thể đƣợc khách
hàng lựa chọn theo nhu cầu và các thông tin mà họ coi là quan trọng, chính
điều này sẽ đƣa ngƣời ta dẫn đầu trong cuộc cạnh tranh ngay cả khi ngƣời ta
ở ngoài văn phòng làm việc.
Hình 1.4: Dịch vụ 24/ 24
14. Thay đổi thông tin hiện thời một cách nhanh chóng : Có những thông tin
bị thay đổi trƣớc khi nó đƣợc in ra. Và ngƣời ta sẽ có một đống giấy tờ có
cũng nhƣ không có giá trị lẫn lộn nhau. Các ấn phẩm điện tử có thể thay đổi
theo nhu cầu của ngƣời ta mà không cần đến giấy tờ, bút mực hay hóa đơn.
Ngƣời ta còn có thể gắn Website của doanh nghiệp với 1 cơ sở dữ liệu mà
ngƣời ta có thể thay đổi bao nhiêu lần trong 1 ngày cũng đƣợc tùy theo yêu cầu.
Chẳng có giấy tờ nào có thể giúp ngƣời ta thực hiện đƣợc sự năng động đó.
15. Cho phép ngƣời ta tiếp nhận thông tin phản hồi từ phía khách hàng : Với
Website ngƣời ta có thể yêu cầu thông tin phản hồi từ phía khách hàng ngay
lập tức khi họ đang ghé thăm Website của doanh nghiệp bạn. Điều này giúp
ngƣời ta tiết kiệm đƣợc rất nhiều thời gian và tiền bạc để hoạch định các
chiến lƣợc quảng cáo và kinh doanh trên cơ sở những thông tin nắm bắt đƣợc
16
từ phía khách hàng mà không phải mất thêm khoản chi nào nữa. Câu trả lời
của khách hàng đƣợc đƣa lên Website ngay khi khách hàng tìm hiểu sản
phẩm và đƣợc chuyển ngay lập tức tới địa chỉ e-mail của bạn.
16. Thử nghiệm dịch vụ và sản phẩm mới trên thị trƣờng : Khi đƣa ra một
sản phẩm mới trên thị trƣờng, điều mà tất cả các doanh nghiệp phải làm là
quảng cáo và giới thiệu sản phẩm đó. Với các phƣơng pháp quảng cáo truyền
thống, đây sẽ là một công đoạn rất tốn kém và đòi hỏi kinh phí lớn. Nhƣng
nếu ngƣời ta giới thiệu, quảng cáo sản phẩm mới trên Website của doanh
nghiệp bạn, ngƣời ta sẽ biết rằng có thể chờ đợi gì từ những khách hàng truy
cập vào Website, họ chính là thị trƣờng ít tốn kém nhất mà ngƣời ta vƣơn tới.
Họ còn có thể cho ngƣời ta biết họ nghĩ gì về sản phẩm của ngƣời ta một cách
nhanh nhất, dễ dàng nhất với một chi phí ít hơn bất kỳ thị trƣờng nào mà
ngƣời ta vƣơn tới.
17. Phƣơng tiện truyền thông linh hoạt :
Hình 1.5: Truyền thông linh hoạt
Ngày nay, Internet đƣợc đánh giá là hệ thống truyền dẫn chuyên nghiệp nhất
bởi vì sản phẩm chính của nó là các thông tin đƣợc tiếp cận một cách dễ
dàng, nhanh chóng và rẻ tiền. Tất cả các ấn phẩm đƣợc truyền trên Internet
đang ngày càng trở nên phổ biến bởi vì các công việc đều đƣợc thực hiện
trong môi trƣờng kỹ thuật số từ rất nhiều nguồn thông tin cung cấp. Tất cả
những công việc này thực hiện một cách dễ dàng thông qua các trang Web
trên chính Website của doanh nghiệp bạn.
17
18. Tiếp cận một thị trƣờng của giới trẻ và mang tính giáo dục : Ở hầu hết
các trƣờng đại học đều đã cho sinh viên tiếp cận vào Internet, giới học sinh
phổ thông sẽ từng bƣớc làm quen và sử dụng dịch vụ Internet trong nhiều
năm tới. Nhu cầu về sách vở, trang phục thể thao, các khóa học, thời trang trẻ
và rất nhiều thứ khác sẽ trở thành nhu cầu đa dạng của thị trƣờng trên
Internet. Thậm chí ngay cả khi áp dụng dịch vụ thƣơng mại điện tử trên mạng
và tuổi thọ trung bình có phần tăng lên thì sự tăng trƣởng của khu vực thị
trƣờng tuổi dƣới 25 vẫn tiếp tục.
19. Tiếp cận một thị trƣờng có tính chuyên nghiệp : Mạng Internet không đơn
thuần chỉ là những máy tính mà nó còn là nơi mọi ngƣời có thể mua bán, trao
đổi bất kỳ thứ gì từ chiếc bàn chải đánh răng, các tác phẩm nghệ thuật cho
đến các bài học tiếng Anh, Với 70 triệu ngƣời sử dụng thƣờng xuyên và số
lƣợng ngƣời sử dụng tăng lên hàng ngày, thông tin kinh doanh của ngƣời ta
có thể đƣợc giới thiệu cho một số lƣợng ngƣời rất lớn.
20. Phục vụ tại thị trƣờng địa phƣơng : Chúng ta đã nói về sức mạnh của việc
phục vụ nhu cầu trên thị trƣờng quốc tế thông qua Internet, nhƣng còn khu
vực thị trƣờng ở ngay địa phƣơng của ngƣời ta thì sao? Câu trả lời là: chính
khách hàng trong địa phƣơng ngƣời ta thông qua các hoạt động marketing, họ
sẽ biết tới Website, truy cập thông tin trên Internet và mang lại lợi nhuận cho
công ty bạn. Cho nên dù công ty đƣợc đặt ở đâu thì thông qua mạng Internet,
những khách hàng tiềm năng vẫn biết đến ngƣời ta và ngƣời ta cũng sẽ sẵn
sàng phục vụ họ.
1.2. Xử lý dữ liệu nhờ các hệ quản trị cơ sở dữ liệu
1.2.1. Giới thiệu
Thông tin là nguồn tài nguyên quý giá của một tổ chức. Các phần mềm
máy tính là những công cụ hiệu quả để xử lý thông tin và hệ quản trị cơ sở dữ
liệu là công cụ phổ biến cho phép lƣu trữ và rút trích thông tin một cách hiệu
quả. Hệ quản trị cơ sở dữ liệu quan hệ là hệ quản trị cơ sở dữ liệu phổ biến nhất
hiện nay và đƣợc hỗ trợ bởi nhiều nhà cung cấp phần mềm. Tính hiệu quả của
các ứng dụng phụ thuộc vào chất lƣợng của việc tổ chức dữ liệu. Những cải tiến
18
trong kỹ thuật và xử lý cơ sở dữ liệu đƣa đến các cơ hội sử dụng thông tin một
cách linh hoạt và hiệu quả khi dữ liệu đƣợc tổ chức và lƣu trữ trong các cấu trúc
quan hệ. Hệ quản trị cơ sở dữ liệu là một thành công trong lĩnh vực thƣơng mại.
Hình 1.6: Ba tầng cơ sở dữ liệu
Hệ quản trị cơ sở dữ liệu phải đảm bảo các mục tiêu: dữ liệu sẵn dùng,
tính toàn vẹn dữ liệu, an toàn dữ liệu, và độc lập dữ liệu.
Dữ liệu sẵn dùng: dữ liệu đƣợc tổ chức sao cho mọi ngƣời dùng có
thể truy cập dễ dàng theo chức năng và nhiệm vụ của họ.
Tính toàn vẹn dữ liệu: dữ liệu lƣu trữ trong cơ sở dữ liệu là đúng
đắn, đáng tin cậy.
An toàn dữ liệu: Chỉ những ngƣời dùng đƣợc phép mới có thể truy
cập dữ liệu. Nếu nhiều ngƣời dùng truy cập chung một mục dữ liệu
cùng lúc thì hệ quản trị cơ sở dữ liệu không cho phép họ thực hiện
những thay đổi gây mâu thuẫn dữ liệu.
Độc lập dữ liệu: hệ quản trị cơ sở dữ liệu phải cho phép tất cả mọi
ngƣời dùng đƣợc phép lƣu trữ, cập nhật và rút trích dữ liệu hiệu
quả mà không cần nắm chi tiết về cấu trúc của cơ sở dữ liệu đƣợc
biểu diễn và cài đặt.
19
1.2.2. Quá trình phát triển của hệ quản trị cơ sở dữ liệu (DBMS).
Quá trình phát triển của DBMS nhƣ sau: Những năm 60 của thế kỷ trƣớc,
có các tệp đƣợc chƣơng trình truy cập. Sau đó có các cơ sở dữ liệu theo mô hình
(i) phân cấp; (ii) mạng.
Sau năm 1970, đa số các cơ sở dữ liệu theo mô hình dữ liệu quan hệ. Sau
những năm 80, có ba cơ sở dữ liệu tiên tiến (i) cơ sở dữ liệu phân tán; (ii) cơ sở
dữ liệu hƣớng đối tƣợng; và (iii) cơ sở dữ liệu suy diễn.
Hình 1.7: Mô hình ER
1.2.2.1. DB2
DB2 là một trong các dòng phần mềm quản trị cơ sở dữ liệu quan hệ của
IBM. Có nhiều phiên bản khác nhau của DB2 để chạy trên các loại máy tính từ
thiết bị cầm tay đến các máy tính lớn. Ở những công ty nhỏ thƣờng gặp nhất là
phiên bản DB2 Enterprise Server Edition hoặc DB2 Data Warehouse Edition
(DB2 DWE), chạy trên các máy chủ Unix, Windows hoặc Linux. Tuy nhiên khi
nói đến DB2, phần đông ngƣời ta đều nghĩ đến DB2 for Z/OS, phiên bản DB2
nguyên thủy chạy trên máy mainframe IBM đƣợc phát hành từ năm 1982. Trên
các máy nhỏ phần đông ngƣời ta hãy sử dụng RDBMS Oracle vì DB2 chỉ xuất
hiện trên máy nhỏ cuối thập niên 1990.
DB2 sử dụng ngôn ngữ SQL đễ đọc và viết thông tin vào dữ liệu.
20
IBM DB2 Enterprise Server Edition là một hệ quản trị cơ sở dữ liệu quan
hệ đƣợc phát triển bởi IBM. DB2 đƣợc dùng chủ yếu trên Unix (thƣờng gọi
AIX), Linux, IBM i (trƣớc đây là OS/400), z/OS and Windows servers. DB2
cũng hỗ trợ đắc lực IBM InfoSphere Warehouse khác. Song song với DB2 là một
hệ quản trị cơ sở dữ liệu quan hệ khác: Informix, đƣợc IBM phát hành năm 2001.
DB2 có một lịch sử lâu dài, và nhiều ngƣời nghĩ rằng, đây là sản phẩm về
cơ sở dữ liệu sử dụng [SQL] đầu tiên (SQL cũng đƣợc phát triển bởi IBM) mặc
dù Oracle đã phát hành một sản phẩm cơ sở dữ liệu thƣơng mại SQL hơi sớm
hơn so với IBM. Tên DB2 lần đầu tiên đƣợc đặt cho hệ quản trị cơ sở dữ liệu vào
năm 1983 khi IBM phát hành bản DB2 đầu tiên chạy trên nền của mainframe
MVS (Multiple Virtual Storage) nền tảng máy tính lớn. Trƣớc đó, đã có một sản
phẩm tƣơng tự đƣợc đặt tên là SQL/DS chạy trên nền máy ảo. Trên nền System
38 trƣớc đó cũng có một hệ quản trị CSDL quan hệ. Hệ quan hệ, hay System R,
là một nguyên mẫu đƣợc nghiên cứu phát triển trong những năm 1970. Khởi
điểm thứ hai của DB2 bắt đầu lại vào đầu những năm 1970 khi EF Codd, làm
việc cho IBM, đã mô tả lý thuyết về cơ sở dữ liệu quan hệ và trong tháng 6 năm
1970 xuất bản các mô hình thao tác dữ liệu. Để áp dụng mô hình Codd, cần một
ngôn ngữ cơ sở dữ liệu quan hệ mà ông đặt tên Alpha. Vào thời điểm đó IBM đã
không tin tƣởng vào tiềm năng mô hình quan hệ của Codd, để lại công việc cho
một nhóm các lập trình viên không thuộc giám sát của Codd, nhóm này đã vi
phạm một số nguyên tắc cơ bản trong mô hình quan hệ của Codd, kết quả là cho
ra đời ngôn ngữ truy vấn cấu trúc tiếng Anh, hoặc SEQUEL. Khi IBM phát hành
sản phẩm cơ sở dữ liệu quan hệ đầu tiên, họ cũng muốn có một "Siêu ngôn ngữ"
với chất lƣợng thƣơng mại, do đó, nó kiểm tra toàn bộ SEQUEL và đổi tên ngôn
ngữ truy vấn hệ thống (System Query Language) SQL để phân biệt nó với
SEQUEL.
1.2.2.2. Oracle
ORACLE là một bộ phần mềm đƣợc cung cấp bởi công ty ORACLE, nó
bao gồm một bộ xây dựng các ứng dụng và các sản phẩm cuối cùng cho uer
(end_uer product).
21
Oracle cung cấp một hệ quản trị CSDL mềm dẻo nó bao gồm CSDL
Oracle, môi trƣờng cho việc thiết kế các cơ sở dữ liệu (Designer 2000) và các
công cụ phát triển (Developer 2000)
Hệ quản trị CSDL có tính an toàn , bảo mật cao,tính nhất quán và toàn vẹn
dữ liệu, cho phép user truy nhập tới CSDL phân tán nhƣ một khối thống nhất
Vì vậy nó đƣợc đánh giá là ƣu việt nhất hiện nay .
1.2.2.3. MS SQL Server
SQL Server 2005 là một hệ thống quản lý cơ sở dữ liệu, sử dụng giao tác
SQL để trao đổi dữ liệu giữa máy khách và máy chủ SQL Server.
Hình 1.8: SQL SERVER
Một hệ quản trị cơ sở dữ liệu quan hệ (RDBMS) bao gồm cơ sở dữ liệu,
nhân cơ sở dữ liệu và các ứng dụng dùng để quản lý dữ liệu và các bộ phận khác
nhau trong RDBMS. SQL Server 2005 đƣợc tối ƣu để có thể chạy trên môi
trƣờng cơ sở dữ liệu rất lớn lên đến Tera-Byte và có thể phục vụ cùng lúc cho
hàng ngàn user. SQL Server 2005 có thể kết hợp phù hợp với các server khác nhƣ
Microsoft Internet Information Server (IIS), E-Commerce Server, Proxy Server.
1.2.2.4. MySQL
MySQL là hệ quản trị cơ sở dữ liệu mã nguồn mở miễn phí nằm trong
nhóm LAMP (Linux, Apache, MySQL, PHP), vì MySQL đƣợc tích hợp sử dụng
chung với apache, PHP nên nó phổ biến nhất thế giới. Vì MySQL ổn định và dễ
sử dụng, có tính khả chuyển, hoạt động trên nhiều hệ điều hành cung cấp một hệ
thống lớn các hàm tiện ích rất mạnh (vì đƣợc nhiều ngƣời hỗ trợ mã nguồn mở
22
mà) và MySQL cũng có cùng một cách truy xuất và mã lệnh tƣơng tự với ngôn
ngữ SQL chính vì thế nên MySQL đƣợc sử dụng và hỗ trợ của những lập trình
viên yêu thích mã nguồn mở.
1.2.2.5. Một số hệ quản trị cơ sở dữ liệu khác
Có nhiều hệ quản trị cơ sở dữ liệu khác từ có bản quyền đến nguồn mở,
miễn phí. Có thể kể ra đây nhƣ:
Phần mềm có bản quyền: 4th Dimension, ANTs Data Server, Dataphor,
Daffodil database, FileMaker Pro, Informix, InterBase, Matisse, Microsoft
Access, Mimer SQL, NonStop SQL, Sand Analytic Server , SmallSQL,
Sybase ASA (trƣớc đây là Watcom SQL), Sybase, Sybase IQ, Teradata,
ThinkSQL, VistaDB;
Phần mềm miễn phí hoặc nguồn mở: Cloudscape, Firebird, HSQLDB,
Ingres, MaxDB, MonetDB, PostgreSQL, SQLite, tdbengine.
1.3. Nhu cầu về cơ sở dữ liệu XML
1.3.1. Lý do cần cơ sở dữ liệu XML
Các cơ sở dữ liệu thƣờng có thể lƣu trữ cả tài liệu không cấu trúc và có
cấu trúc. Cả hai đều yêu cầu các cấu trúc dữ liệu mà không thƣờng xuyên thay
đổi. Tuy nhiên, điểm yếu của các cơ sở dữ liệu quan hệ là việc lƣu trữ các tài liệu
bán cấu trúc. Không nhƣ các dữ liệu có cấu trúc, các tài liệu bán cấu trúc này có
thể có rất nhiều bậc tự do trong trật tự của các thành phần trong tài liệu và cách
những thành phần đó đƣợc lồng vào nhau. Không nhƣ các tài liệu không có cấu
trúc, các thành phần riêng lẻ có thể đƣợc phân loại bằng cách sử dụng các nhãn
mô tả.
Có thể lƣu trữ dữ liệu bán cấu trúc trong các cấu trúc quan hệ không? Tất
nhiên là ngƣời ta có thể, nhƣng ngƣời ta có thế kết thúc bằng một cấu trúc dữ liệu
cụ thể mà thƣờng xuyên thay đối, một cấu trúc dữ liệu tổng quát hóa mà làm mất
mô tả của các nhãn hoặc một mô hình trừu tƣợng nhƣ là những thứ mà các hệ
thống quản lý nội dung sử dụng, trộn dữ liệu với những thứ mà đáng ra là siêu
dữ liệu.
23
Mặt khác, định dạng XML phù hợp với việc mô tả dữ liệu bán cấu trúc.
Thêm nữa, ngƣời ta có thể duy trì mô hình dữ liệu một cách dễ dàng. Thêm các
tên của thành phần không làm thay đổi cấu trúc dữ liệu, nó luôn giữ cấu trúc cây.
Nó chỉ liên quan đến một sự thay đổi trong lƣợc đồ XML mô tả cách thức mà các
tên của phần tử đƣợc sử dụng và liên kết bên trong cấu trúc cây.
Với các tài liệu nhƣ là các hồ sơ xin việc, các mô tả sản phẩm, và các đơn
hàng của khách hàng, XML có lẽ là định dạng phù hợp. Đồng thời, XML có khả
năng mô tả cả dữ liệu có cấu trúc và dữ liệu không có cấu trúc.
1.3.2. Vai trò thay thế các cơ sở dữ liệu quan hệ của XML
Nếu ngƣời ta có một giải pháp mà cho phép ngƣời ta lƣu trữ dữ liệu bán
cấu trúc, ngƣời ta cũng có thể sử dụng nó để lƣu trữ dữ liệu có cấu trúc và không
có cấu trúc. Việc có tất cả dữ liệu của ngƣời ta trong một giải pháp lƣu trữ đơn lẻ
với khả năng tƣơng kết và tạo ra các truy vấn mà bao trùm mọi thứ trong một lần
thì dễ hơn rất nhiều so với dữ liệu tích hợp từ nhiều nguồn lƣu trữ khác nhau.
Vậy thì làm thế nào để xác định bản chất dữ liệu của bạn? Và ngƣời ta sẽ
phải làm gì nếu khối lƣợng dữ liệu có cấu trúc, bán cấu trúc và không cấu trúc là
tƣơng đƣơng? Trong trƣờng hợp bất định nhƣ vậy, tin tốt lành là các cơ sở dữ
liệu cổ điển là lựa chọn phù hợp để chứa các tài liệu XML hoặc các phân mảnh
của các tài liệu XML vào thời điểm hiện tại. Các cách thức để truy cập những
phân mảnh XML này có lẽ khác nhau giữa các cơ sở dữ liệu. Một điều mà các
bản cài đặt của các cơ sở dữ liệu cùng có là chúng sử dụng bản XQuery 1.0.
1.3.3. Các giải pháp sử dụng XML
Một số sản phẩm trên thị trƣờng cài đặt một cơ sở dữ liệu XML một chiều
hoặc một cơ sở dữ liệu khác, bao gồm Xindice, Tamino, X-Hive, Oracle, và
Microsoft® SQL Server. Tuy nhiên, tôi sẽ không bàn luận về những sản phẩm
này trong bài viết. Một bản so sánh sản phẩm dài và đầy đủ là không khả thi, và
nó có thể không đáng tin khi mà bài viết này đƣợc công bố trên trang của một
nhà cung cấp một giải pháp cơ sở dữ liệu XML. Các tác giả độc lập cũng không
giải quyết hoàn toàn các câu hỏi một cách khách quan.
24
Những gì có thể làm là thảo luận về IBM DB2 Express-C với các tính năng
pureXML và so sánh nó với các tiếp cận của các NXD cổ điển. Với so sánh này, tôi
đã chọn một dự án mã mở tên là eXist-DB. Cả eXist-DB và DB2 Express-C đều
miễn phí và cung cấp rất nhiều chức năng thân thiện với ngƣời dùng.
Nếu ngƣời ta muốn lƣu trữ lƣợng dữ liệu cực lớn, tôi khuyên ngƣời ta mua
một phiên bản thƣơng mại của DB2. Đầu tiên, DB2 có lẽ nghe nhƣ là một cái gì
đó rất nặng nề, nhƣng ngƣời ta có thể cài đặt DB2 Express-C trên một máy để
bàn hoặc máy xách tay để thử nghiệm khả năng pureXML dễ dàng. Mặc dù
không có phiên bản thƣơng mại của eXist, Mark Logic là lựa chọn thay thế xứng
đáng cho eXist khi mà các yêu cầu hiệu suất và tính mở rộng vƣợt quá khả năng.
Ngƣời ta có thể dùng thử Mark Logic bằng cách sử dụng giấy phép dùng thử 30
ngày hoặc một phiên bản cộng đồng mà bị giới hạn lƣu trữ ở mức 100MB.
Có thể tƣởng tƣợng thấy nhu cầu về so sánh sản phẩm giữa các sản phẩm
tƣơng tự nhƣ là DB2 và Orcale. Ngƣời ta có thể tìm thấy một số tranh luận trƣớc
đây trên mạng về hai sản phẩm này. Một thảo luận cơ bản hơn là so sánh các tính
năng của pureXML trong DB2 Express-C và trong eXist-DB. Hoặc, một cách
tƣơng tự, so sánh DB2 với Mark Logic.
1.3.4. Đánh giá chung và vai trò của XML
Mặc dù các tài liệu XML có thể mô tả dữ liệu có cấu trúc, một NXD chứa
nhiều tài liệu XML có lẽ không phải là giải pháp tối ƣu để mô tả các quan hệ
giữa dữ liệu có cấu trúc bị chia nhỏ thành nhiều tài liệu và duy trì tính toàn vẹn
tham chiếu. Nếu nó đã có thể quản lý những mối quan hệ đó (có lẽ sử dụng
XPointer), thì việc sử dụng vẫn chƣa đƣợc chuẩn hóa.
Lời khuyên tốt nhất là sử dụng đúng công cụ cho đúng công việc. Tuy
nhiên, sự song hành của một NXD với một RDBMS tạo ra thách thức cho bảo
toàn dữ liệu. Các đặc tính của pureXML của DB2 kết hợp những cái tốt nhất của
hai bên và cho phép lƣu trữ cả dữ liệu có cấu trúc và dữ liệu bán cấu trúc. Đối
với lƣu trữ dữ liệu không có cấu trúc, cả NXD và RDBMS đều thích hợp.
25
Nếu ngƣời ta thực sự tìm kiếm một kho chứa tài liệu hơn là một cơ sở dữ
liệu, ngƣời ta nên hỏi một câu hỏi khác. Các yêu cầu của ngƣời ta tập trung vào
khả năng máy mặt trƣớc của kho chứa tài liệu hay chúng tập trung vào máy mặt
sau? Nếu ngƣời ta muốn nhiều chức năng cho ngƣời dùng cuối nhƣ là một giao
diện quản trị, dòng làm việc, và trực quan hóa, thì rất nhiều sản phẩm trên thị
trƣờng, nhƣ là Alfresco, cung cấp kiểu hỗ trợ này. Nếu ngƣời ta quan tâm đến
các cơ chế truy vấn mạnh mẽ, nhƣ là XQuery và tìm kiếm văn bản đầy đủ, và lƣu
trữ hiệu quả các tài liệu bán cấu trúc, thì các NXD nhƣ là eXist hoặc Mark Logic
có lẽ là lựa chọn của bạn.
Thế giới của các giải pháp cơ sở dữ liệu bị chi phối bởi một số ít các nhà
cung cấp lớn. IBM là một trong số đó. Các NXD vẫn là một thị trƣờng nhỏ. Các
câu hỏi thƣờng là liệu những ngƣời chơi nhỏ bé có thể sống sót qua sự cạnh tranh
hay không, hay liệu họ sẽ bị mua bởi các tập đoàn lớn hơn (nhƣ là X-Hive bị mua
bởi EMC), hoặc liệu họ sẽ mất thị phần cho các giải pháp lai. Một điều rõ ràng,
các nhà cung cấp RDBMS, sẽ không bằng lòng từ bỏ thị phần cho NXD, cung
cấp các giải pháp XML tích hợp đủ tiêu chuẩn xuất xƣởng nhƣng đƣợc tích hợp
tốt của chính mình để đáp ứng nhu cầu của các khách hàng.
1.4. Kết luận
Chƣơng trên đã trình bày một số vấn đề liên quan đến dữ liệu và nhu cầu
về hệ thống sử dụng XML, vai trò của hệ quản trị cơ sở dữ liệu truyền thống,
cũng nhƣ cơ sở dữ liệu XML trong việc xử lý dữ liệu.