Tải bản đầy đủ (.pdf) (41 trang)

Hướng dẫn SQL & XQuery cho IBM DB2, Phần 7: Giới thiệu về XML và XQuery ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (267.07 KB, 41 trang )

Hướng dẫn SQL & XQuery cho IBM
DB2, Phần 7: Giới thiệu về XML và
XQuery
Cơ sở của XML và truy vấn XML
Jessica Cao, Chuyên viên phát triển các công cụ đào tạo, EMC
Bruce Creighton, Chuyên viên lập kế hoạch các phần kỹ năng, EMC
Pat Moffatt, Giám đốc Chương trình quản lý thông tin, Sáng kiến học đường,
EMC
Tóm tắt: Hướng dẫn này giới thiệu pureXML và XQuery, bắt đầu từ một tổng
quan cơ bản của các đặc trưng và các lợi thế của kiểu dữ liệu XML, sau đó so sánh
nó với các bảng quan hệ tiêu chuẩn. Rồi những người sử dụng được yêu cầu viết
các XQuery để lấy ra các phần tử XML, lọc dữ liệu dựa vào các giá trị XML, biến
đổi đầu ra XML, và sử dụng nhiều mệnh đề khác nhau để lựa chọn dữ liệu chính
xác hơn. Hướng dẫn kết thúc bằng một phần về phối hợp XQuery và SQL. Hướng
dẫn này là Phần 7 của loạt bài hướng dẫn SQL & XQuery cho IBM® DB2® .
(Chú ý: bạn phải cài đặt DB2 9 để làm các bài tập thực hành trong hướng dẫn
này.)
Trước khi bạn bắt đầu
Về loạt bài này
Loạt bài hướng dẫn này dạy các chủ đề SQL từ cơ bản đến nâng cao và các chủ đề
XQuery cơ bản. Nó cũng chỉ ra cách diễn đạt các câu hỏi nghiệp vụ thường gặp
bằng các truy vấn cơ sở dữ liệu sử dụng các câu truy vấn SQL hay các câu truy
vấn XQuery. Những người phát triển ứng dụng và những người quản trị cơ sở dữ
liệu có thể sử dụng hướng dẫn này để nâng cao các kỹ năng truy vấn cơ sở dữ liệu
của mình. Các thành viên tham gia sáng kiến học đường IBM có thể sử dụng loạt
hướng dẫn này như một phần trong chương trình giảng dạy cơ sở dữ liệu của họ.
Tất cả các ví dụ trong bài này là dựa trên Aroma, một cơ sở dữ liệu mẫu chứa các
dữ liệu doanh thu về các sản phẩm cà phê và chè đã bán trong các cửa hàng trên
khắp nước Mỹ. Mỗi ví dụ gồm có ba phần:
 Một câu hỏi kinh doanh dưới dạng ngôn ngữ thường ngày
 Một hoặc nhiều ví dụ truy vấn , được biểu diễn bằng SQL hay Xquery


 Một bảng các kết quả trả về từ cơ sở dữ liệu
Hướng dẫn này được thiết kế để cho phép các học viên học tập ngôn ngữ SQL và
XQuery. Cũng như học bất cứ cái gì khác, việc bổ sung thêm các bài tập thực hành
là rất quan trọng. Dữ liệu và các định nghĩa bảng sẽ tạo điều kiện thuận lợi cho các
bài tập thực hành này.
Đối với các sinh viên sử dụng tài liệu này như một phần của khoá học, hãy nhận từ
thầy hướng dẫn của mình các chỉ dẫn để kết nối tới cơ sở dữ liệu Aroma và tìm
hiểu mọi sự khác biệt giữa hướng dẫn và cài đặt tại máy cục bộ của mình.
Hướng dẫn này được viết cho Express-C 9 DB2 trên nền UNIX®, Linux® và
Windows® (trước đây gọi là Viper).


Về hướng dẫn này
Hướng dẫn này giới thiệu cho người đọc làm quen với pureXML và XQuery. Vị
trí duy nhất nơi XML được sử dụng trong cơ sở dữ liệu Aroma là các cột
Comments. Cột này được đề cập trong Phần 1 của loạt bài này và đó là trọng tâm
của hướng dẫn này, Phần 7.
Hướng dẫn này bắt đầu với một tổng quan cơ bản của các đặc trưng và lợi thế của
kiểu dữ liệu XML, sau đó so sánh nó với các bảng quan hệ tiêu chuẩn. Hướng dẫn
này yêu cầu người đọc viết các XQuery để lấy ra các phần tử XML, lọc dữ liệu
dựa vào các giá trị XML, biến đổi đầu ra XML, và sử dụng nhiều mệnh đề khác
nhau để lựa chọn dữ liệu chính xác hơn. Hướng dẫn này kết thúc bằng một phần
về phối hợp XQuery và SQL và kết hợp sức mạnh của cả hai ngôn ngữ đó.


Kết nối tới một cơ sở dữ liệu
Bạn cần kết nối tới một cơ sở dữ liệu trước khi có thể sử dụng các câu lệnh SQL
để truy vấn hay xử lý dữ liệu. Lệnh CONNECT kết hợp một kết nối cơ sở dữ liệu
với một tên người sử dụng.
Thông qua người hướng dẫn tìm ra tên cơ sở dữ liệu bạn cần nối tới. Đối với loạt

bài này, tên cơ sở dữ liệu là aromadb.
Để kết nối tới cơ sở dữ liệu aromadb, gõ lệnh sau đây vào trong bộ xử lý dòng
lệnh DB2:
CONNECT TO aromadb USER userid USING password

Thay thế "userid" và "password" bằng số ID và mật khẩu của người sử dụng mà
bạn đã nhận được từ thầy hướng dẫn. Nếu máy không hỏi userid và password thì
chỉ cần gõ vào lệnh sau đây:

CONNECT TO aromadb

Thông điệp sau báo cho bạn biết rằng đã tạo kết nối thành công:
Database Connection Information
Database server = DB2/NT 9.0.0
SQL authorization ID = USERID
Local database alias = AROMADB

Khi đã kết nối được, bạn có thể bắt đầu sử dụng cơ sở dữ liệu.
Về XML
XML là gì?
XML
 là chuẩn để trao đổi dữ liệu giữa các hệ thống, các nền tảng, các ứng dụng,
và các tổ chức khác nhau
 độc lập với nhà cung cấp và nền tảng
 có độ linh hoạt cao
 phù hợp với tổ hợp bất kỳ các dữ liệu có cấu trúc, không có cấu trúc và nửa
cấu trúc
 dễ dàng mở rộng có thể định nghĩa các thẻ mới khi cần
 có thể dễ dàng được biến đổi thành XML "khác" và thậm chí thành các định
dạng khác như HTML

 có thể dễ dàng được kiểm tra về sự tuân theo một lược đồ
Tất cả những điều này có thể thực hiện được thông qua nhiều công cụ và tiêu
chuẩn có sẵn, như các bộ phân tách XML, XSLT, và lược đồ XML. Chúng giải
phóng các ứng dụng khỏi gánh nặng giải quyết những nét đặc biệt của các định
dạng dữ liệu độc quyền sở hữu. Trong một thời đại mà các định dạng thông báo,
các biểu mẫu nghiệp vụ và các dịch vụ thường xuyên thay đổi, XML làm giảm chi
phí và thời gian cần thiết để duy trì lôgíc ứng dụng một cách tương ứng.
Ngoài việc sử dụng XML để trao đổi dữ liệu, các doanh nghiệp đang giữ một số
lượng lớn các dữ liệu kinh doanh quan trọng theo định dạng XML. Điều này có
nhiều lý do:
 Một số doanh nghiệp phải giữ lại các tài liệu XML theo định dạng nguyên
bản của chúng để kiểm toán và tuân thủ các quy định, ví dụ các tài liệu tài
chính và tư pháp cũng như eForms (biểu mẫu điện tử), đặc biệt trong khu
vực chính phủ
 XML có thể là một mô hình dữ liệu thích hợp hơn so với một lược đồ quan
hệ. Điều này không chỉ đúng cho các ứng dụng hướng nội dung mà còn cho
cả một số ứng dụng hướng dữ liệu nhất định,
ví dụ, trong các ứng dụng khoa học đời sống, dữ liệu về bản chất có độ
phức tạp và có cấu trúc thứ bậc rất cao và lại còn có thể chứa một lượng
đáng kể các thông tin không có cấu trúc. Hầu hết dữ liệu về hệ gen hiện nay
vẫn còn được lưu giữ theo các định dạng tệp tin phẳng độc quyền sở hữu,
nhưng đang có các nỗ lực để thực hiện chuyển chúng sang XML.
Các cơ sở dữ liệu quan hệ đang tạo cơ hội hỗ trợ về lưu trữ, xử lý, tìm kiếm, và lấy
ra dữ liệu XML. Điều này thường dựa vào việc lưu trữ các tài liệu XML trong các
LOB hoặc chia nhỏ và sắp xếp XML vào một lược đồ quan hệ.
Các giải pháp này có các hạn chế cố hữu về chức năng và hiệu năng. Nói chung,
việc lưu trữ dựa vào LOB cho phép chèn vào và lấy ra toàn bộ tài liệu nhanh
chóng nhưng phải chịu một hiệu năng thấp khi thực hiện tìm kiếm và trích ra, do
phải phân tách XML trong khi thực hiện truy vấn. Điều này có thể được cải thiện
chút ít nếu các chỉ mục được tạo ra khi chèn tài liệu vào cơ sở dữ liệu. Khi việc tạo

chỉ mục đã gánh chịu công việc phân tách XML nói ở trên, nó có thể tăng tốc độ
các truy vấn để tìm kiếm các tài liệu phù hợp với các điều kiện tìm kiếm đã cho.
Tuy vậy, việc trích ra các đoạn tài liệu và việc cập nhật ở mức dưới tài liệu vẫn đòi
hỏi việc phân tách XML tốn kém.
Trong các phần trước của loạt bài hướng dẫn này, bạn đã học về SQL bao gồm
lệnh SELECT và ngôn ngữ định nghĩa dữ liệu (DDL). XML là một cách tổ chức
dữ liệu khác và sử dụng XQuery hay XPath để truy vấn dữ liệu.
Dữ liệu quan hệ được trình bày như là các hàng và các cột dữ liệu theo định dạng
bảng. Dữ liệu XML bao gồm các thẻ và dữ liệu gắn với nhau.


Dữ liệu mẫu
<Comments>
<comment>
<comment_ID>5301</comment_ID>
<customer_info>
<fname>Scott</fname>
<lname>Phillips</lname>

<email></email>
</customer_info>
<feedback>
<type>opinion</type>
<content>Gold Tips was highly
enjoyable!</content>
</feedback>
<store_rating>
<score>5</score>
<out_of>5</out_of>
</store_rating>

<store_response>
<required>no</required>
</store_response>
</comment>
<comment>
<comment_ID>5302</comment_ID>
<customer_info>
<fname>Barbara</fname>
<lname>Adams</lname>
<phone>6138617611</phone>
</customer_info>
<feedback>
<type>question</type>
<content>What are the top teas
brands?</content>
</feedback>
<store_rating>
<score>4</score>
<out_of>5</out_of>
</store_rating>
<store_response>
<required>yes</required>
<completed>yes</completed>
<action>Please see our "All About Tea"

page at www.aroma.com/tea</action>
</store_response>
</comment>
</Comments>


Chỉ dựa vào một mình dữ liệu mẫu, bạn có thể xác định địa chỉ email của Scott
Phillips không? Đơn giản là dò theo các mức phân cấp được tạo ra bởi các thẻ
lồng vào nhau. Vì XML lưu các thẻ và dữ liệu cùng với nhau, nên dữ liệu tự miêu
tả và dễ hiểu.


DB2 9
DB2 9 là máy chủ dữ liệu lai đầu tiên, mức công nghiệp để quản lý dữ liệu theo cả
định dạng quan hệ lẫn định dạng pureXML. DB2 đã có các tính năng cao trong lưu
trữ và truy nhập dữ liệu quan hệ dựa trên SQL tiêu chuẩn và tối ưu lưu trữ dữ liệu,
ví dụ như các kỹ thuật phân vùng dữ liệu, chỉ mục cao cấp và tối ưu hóa truy vấn.
Bây giờ, DB2 đưa vào thêm một cơ chế lưu trữ dữ liệu được tối ưu hóa cho dữ liệu
XML bên cạnh cơ chế quan hệ hiện có.
Những người phát triển ứng dụng bây giờ có thể lưu giữ dữ liệu XML trực tiếp
bên trong một máy chủ DB2 và hưởng các lợi ích về các giao dịch, khả năng phục
hồi nhanh dữ liệu cao cấp, truy nhập an toàn, và tất nhiên là khả năng tìm kiếm
một số lượng lớn dữ liệu XML khi sử dụng XQuery.


Dữ liệu XML so với dữ liệu quan hệ
Ba thuộc tính cơ bản của XML làm cho nó khác với mô hình quan hệ:
 XML là tự mô tả. Các tài liệu chứa đựng không chỉ dữ liệu, mà còn có
siêu dữ liệu cần thiết. Kết quả là, một tài liệu XML có thể được tìm kiếm
hay cập nhật không đòi hỏi một định nghĩa biểu đồ tĩnh. Các mô hình quan
hệ, mặt khác, đòi hỏi các định nghĩa biểu đồ tĩnh hơn. Tất cả các hàng của
một bảng phải có cùng lược đồ.
 XML có phân cấp. Các tài liệu không chỉ trình bày thông tin cơ bản, mà
còn cả thông tin về mối quan hệ của các mục dữ liệu với nhau dưới dạng
phân cấp. Các mô hình quan hệ yêu cầu biểu diễn tất cả thông tin quan hệ
hoặc bằng các mối quan hệ khóa chính hoặc khóa ngoài hay bằng cách trình

bày thông tin đó trong bảng quan hệ khác.
 XML là hướng chuỗi. Thứ tự sắp xếp là quan trọng. Mô hình quan hệ là
hướng tập hợp, thứ tự sắp xếp không quan trọng.
Không cái nào trong số các điểm khác biệt ấy biểu thị rằng XML là tốt hơn hơn
hay xấu hơn so với các mô hình quan hệ thuần túy. Thật ra, XML và mô hình quan
hệ là các giải pháp bổ sung nhau. Một vài dữ liệu vốn đã phân cấp, trong khi dữ
liệu khác lại có sẵn theo bảng; một số dữ liệu có lược đồ cứng, trong khi dữ liệu
khác có lược đồ ít cứng nhắc hơn; một số dữ liệu cần tuân theo một thứ tự định
trước trong khi dữ liệu khác lại không như vậy.


Khi nào sử dụng XML
Việc trình bày dữ liệu XML có ích trong các hoàn cảnh sau:
 Khi lược đồ hay thay đổi.
Nếu lược đồ của dữ liệu thường thay đổi, thì việc trình bày dữ liệu dưới
dạng quan hệ có thể khá phiền hà do các chi phí và khó khăn khi thay đổi
lược đồ quan hệ đi kèm. Bản chất tự mô tả của XML làm cho sự thay đổi
lược đồ đơn giản hơn.
 Khi dữ liệu vốn đã phân cấp.
Một vài dữ liệu có sẵn theo bảng và một mô hình quan hệ làm cho nó có ý
nghĩa hơn. Dữ liệu khác có phân cấp tự nhiên, và XML thường trình bày nó
tốt nhất.
 Khi dữ liệu trình bày các đối tượng nghiệp vụ trong đó các bộ phận hợp
thành không còn có ý nghĩa nữa khi bị loại bỏ khỏi bối cảnh của chúng.
Ví dụ, xem xét mối quan hệ thông thường giữa một nhân viên và số điện
thoại của người đó, trong đó một nhân viên có thể có nhiều số điện thoại:
một cho văn phòng, một cho Fax, một cho nhà, và một cho di động. Nếu
mẫu sử dùng thường xuyên nhất là để lấy ra các số điện thoại trong bối
cảnh của một nhân viên, thì chằng có ý nghĩa gì khi chuẩn hóa dữ liệu và
đưa vào hẳn một bảng để theo dõi vô số các số điện thoại liên quan đến một

nhân viên. Một sự lựa chọn tốt hơn có thể là giữ các số điện thoại ấy trong
bảng nhân viên và trình bày chúng bằng XML.
 Khi các ứng dụng có thuộc tính thưa.
Một số ứng dụng có một số lượng lớn các thuộc tính có khả năng nhưng
hầu hết các thuộc tính đó xuất hiện thưa thớt hay vắng mặt với bất kỳ mục
dữ liệu đã cho nào. Một ví dụ kinh điển là một tài liệu danh mục hàng hóa
của thương gia; số lượng các thuộc tính khác nhau để theo dõi một mục của
tài liệu đã cho là rất lớn, bao gồm kích thước, màu, sắc, kiểu dệt và các yêu
cầu về năng lực và một danh sách gần như vô tận về các khía cạnh khác.
Đối với đối tượng đã cho bất kỳ, chỉ một tập con của các thuộc tính này có
liên quan; kiểu dệt của một áo len làm cho nó có nghĩa nhưng kiểu dệt của
một máy cắt cỏ thì chẳng có nghĩa gì. Việc sử dụng một bảng quan hệ để
mô tả các đặc tính của đối tượng có thể chi phí đắt và quá phức tạp. Việc
trình bày thông tin thuộc tính mô tả ấy như các dữ liệu XML cho phép trình
bày tự nhiên hơn cũng như việc tìm kiếm ít phức tạp và ít tốn kém hơn.
 Khi dữ liệu khối lượng nhỏ nhưng có cấu trúc cao.
Trong nhiều ứng dụng, thông tin có cấu trúc là điều quyết định đối với ứng
dụng nhưng nó tồn tại với số lượng rất nhỏ. Dù cho thông tin đó có thể
được trình bày theo mô hình quan hệ bình thường, cách tiếp cận này có thể
dẫn tới các lược đồ quan hệ cồng kềnh. Việc sử dụng một cột XML với
nhiều khung nhìn có thể làm giảm đáng kể số các đối tượng được quản lý
trong một cơ sở dữ liệu, và như vậy giảm bớt chi phí về quyền sở hữu.
Tạo ra một cơ sở dữ liệu có hỗ trợ XML
Trong Phần 1 của loạt tài liệu này, bạn đã tạo ra cơ sở dữ liệu Aroma của mình
với một tệp tin batch. Vì bạn có thể muốn tạo ra các cơ sở dữ liệu riêng của mình
trong tương lai, phần này hướng dẫn bạn cách tạo ra một cơ sở dữ liệu để hỗ trợ
các đặc tính XML.
Tạo một cơ sở dữ liệu với Trung tâm điều khiển
Trong ứng dụng Trung tâm điều khiển DB2, nhấp chuột phải vào vào thư mục All
Databases . ChọnCreate Databse -> Standard. Cửa sổ Create Database

Wizard sẽ bật lên. Điền vào tên cơ sở dữ liệu của bạn và chọnt Enable database
for XML.

Bộ mã XML

Nhấp Next hai lần để đi tới màn hình Region. Đặt giá trị Country/Region tới giá
trị thích hợp và thay đổi giá trị cài đặt bộ mã thành UTF-8. Nhấp UTF-8. Nhấp
Finish để hoàn thành tạo ra sở dữ liệu của bạn.
Tạo ra một cơ sở dữ liệu với Bộ xử lý dòng lệnh
Để tạo ra cơ sở dữ liệu giống như vậy khi sử dụng CLP DB2, nhập vào mã sau
đây:
db2 create db aromadb using codeset utf-8 territory us

Chú ý chỉ rõ UTF -8 làm bộ mã cho cơ sở dữ liệu. Việc sử dụng các đặc tính XML
chỉ hạn chế cho các cơ sở dữ liệu nào được định nghĩa dùng bộ mã UTF-8 và chỉ
có một phân vùng cơ sở dữ liệu. Khi tạo ra các cơ sở dữ liệu riêng của bạn trong
tương lai, đừng quên tính đến tham số này.
Về cột comments
Trong cơ sở dữ liệu Aroma, bảngSales có một cột được gọi là Comments (các ý
kiến góp ý).
Nó có thông tin sau :
 Mã nhận diện của một góp ý (Comment ID)
 Thông tin khách hàng: tên, thông tin tiếp xúc (điện thoại và/ hoặc email)
 Trả lời của cửa hàng (Nếu yêu cầu)
 Sự phản hồi của khách hàng: có thể hoặc là ý kiến, gợi ý hoặc câu hỏi
 Đánh giá xếp hạng một cửa hàng theo 5 mức
Dữ liệu mẫu
<Comments>
<comment>
<comment_ID>5301</comment_ID>

<customer_info>
<fname>Scott</fname>
<lname>Phillips</lname>
<email></email>
</customer_info>
<feedback>
<type>opinion</type>
<content>Gold Tips was highly enjoyable!</content>
</feedback>
<store_rating>
<score>5</score>
<out_of>5</out_of>
</store_rating>
<store_response>
<required>no</required>
</store_response>
</comment>
<comment>
<comment_ID>5302</comment_ID>
<customer_info>
<fname>Barbara</fname>
<lname>Adams</lname>
<phone>6138617611</phone>
</customer_info>
<feedback>
<type>question</type>
<content>What are the top teas brands?</content>
</feedback>
<store_rating>
<score>4</score>

<out_of>5</out_of>
</store_rating>
<store_response>
<required>yes</required>
<completed>yes</completed>
<action>Please see our "All About Tea" page at
www.aroma.com/tea</action>
</store_response>
</comment>
</Comments>



Tại sao là XML?
Các lợi thế của XML đã được bàn luận trong các phần trước đây, nhưng tại sao
chọn XML trên các cột của bảng quan hệ trong trường hợp cụ thể này?
 Tính linh hoạt:
- các cửa hàng có thể yêu cầu thông tin đa dạng từ các khách hàng
- theo thời gian, các cửa hàng có thể cải tiến phương pháp của họ để nhận
được ý kiến phản hồi, như vậy dẫn đến các kiểu dữ liệu khác nhau
- ví dụ, các khảo sát khuyến mại có thể khác với các khảo sát bán hàng
thông thường; sự thay đổi này có thể dễ dàng được lưu trữ bằng XML chứ
không phải bảng quan hệ
 Sự khéo léo:
- cấu trúc bảng không đòi hỏi thay đổi cùng với dữ liệu
 Tự mô tả:
- giám đốc/nhân viên của cửa hàng có thể hiểu các ý kiến góp ý của khách
hàng dưới dạng XML mà không cần giải thích thêm
 Sự phân cấp:
- dữ liệu có phân cấp tự nhiên

- thông tin khách hàng không có nghĩa nếu làm mất đi bối cảnh của ý kiến
đóng góp


Các câu hỏi ví dụ
 Các ý kiến góp ý được lưu trong cơ sở dữ liệu Aroma là gì?
 Các ý kiến góp ý nhận được tại các cửa hàng New York là gì?
 Các ý kiến góp ý nào yêu cầu cửa hàng trả lời? Những cái nào trong số các
ý kiến này chưa được giải quyết (trả lời) xong ?
 Hiển thị tất cả các ý kiến góp ý chưa được giải quyết trong một danh sách
HTML.
 Hiển thị tất cả các ý kiến góp ý và nhóm chúng lại thành ba loại khác nhau
(bình luận, gợi ý và câu hỏi).
 Đếm và hiển thị số lượng các ý kiến góp ý của mỗi kiểu.
 Tính toán và hiển thị trung bình mức xếp hạng do tất cả ý kiến góp ý đưa
ra.
Các lưu ý về cách dùng
Trong cơ sở dữ liệu Sales, cột comments chỉ có giá trị cho những hàng nào bắt đầu
từ tháng Ba 2006.
Về XQuery
Trong các ví dụ trước đây, lệnh SELECT SQL được dùng để trích ra dữ liệu. Có
thể thực hiện các truy vấn liên quan đến dữ liệu XML bằng ngôn ngữ truy vấn
riêng của nó có tên là XQuery.
XQuery khác với SQL về một số phương diện then chốt, phần lớn là do các ngôn
ngữ này được thiết kế để làm việc với các mô hình dữ liệu khác nhau, mà các mô
hình này có các đặc tính khác nhau. Các tài liệu XML có chứa các mức phân cấp
và sở hữu một thứ tự có sẵn. Các cấu trúc dữ liệu dạng bảng được các DBMS dựa
trên SQL hỗ trợ là phẳng và dựa trên tập hợp; vì thế, các hàng không theo thứ tự.
Các sự khác nhau giữa các mô hình dữ liệu này dẫn đến một số khác biệt cơ bản
trong các ngôn ngữ truy vấn riêng tương ứng của chúng. Bảng ở dưới liệt kê một

vài ví dụ.
XQuery SQL
Hỗ trợ các biểu thức đư
ờng dẫn để cho
phép các lập trình viên dẫn hướng
thông qua cấu trúc phân cấp của XML

Không hỗ trợ các biểu
thức đường dẫn
Hỗ trợ cả hai dữ liệu có định kiểu và
không định kiểu
Luôn luôn được định
nghĩa với một kiểu cụ thể
Không cần các giá trị NULL vì các tài
liệu XML bỏ qua dữ liệu thiếu hoặc
không được biết
Sử dụng các giá trị NULL
đ
ể thể hiện các giá trị thiếu
hoặc không được biết
Trả về các chuỗi dữ liệu XML
Trả về các tập hợp kết quả
của các kiểu dữ liệu SQL
khác nhau
Hai loại biểu thức XQuery
Hướng dẫn này tập trung vào hai loại biểu thức XQuery quan trọng: các biểu thức
"FLWOR" và các biểu thức đường dẫn.
Biểu thức FLWOR giống như một biểu thức SELECT-FROM-WHERE trong
SQL nó được dùng để duyệt qua một danh sách các mục và trả về một vài thứ
được tính toán từ mỗi mục tùy trường hợp. Mặt khác, một biểu thức đường dẫn,

dẫn hướng thông qua hệ phân cấp của các phần tử XML và trả về các phần tử tìm
thấy ở cuối đường dẫn.
Giống như một biểu thức SELECT-FROM-WHERE trong SQL, biểu thức
XQuery FLWOR có thể chứa vài mệnh đề bắt đầu bằng các từ khóa nhất định. Các
từ khóa sau đây được dùng để bắt đầu các mệnh đề trong một biểu thức FLWOR:

1. for
Lặp lại một chuỗi nhập vào, chấp nhận một biến lần lượt cho mỗi danh
mục nhập vào
2. let
Công bố một biến và gán cho nó một giá trị. Giá trị này có thể là một
danh sách có nhiều danh mục
3. where

Chỉ rõ tiêu chuẩn lọc các kết quả truy vấn
4. order
by
Chỉ rõ thứ tự phân loại kết quả
5. return

Định kết quả được trả về
Một biểu thức đường dẫn trong XQuery gồm có một loạt các "bước", phân cách
nhau bằng các ký tự dấu gạch nghiêng. Trong dạng đơn giản nhất của nó, mỗi
bước dẫn hướng xuống dưới trong hệ phân cấp XML để tìm ra phần tử con của các
phần tử do các bước trước trả về. Mỗi bước trong một biểu thức đường dẫn có thể
cũng chứa một thuộc tính để lọc các phần tử do bước đó trả về, chỉ giữ lại các
phần tử thỏa mãn một điều kiện nào đó.
Ví dụ, đối với dữ liệu mẫu cho trong phần trước, giả thiết rằng biến $comments
gắn với một danh sách các tài liệu XML chứa các phần tử <comment> các phần
tử, tiếp theo là biểu thức đường dẫn bốn bước $comments/comment/feedback[type

= "suggestion"]/content sẽ trả về danh sách các nội dung về các ý kiến góp ý loại
"suggestion" (gợi ý).
Trong nhiều trường hợp, có thể sử dụng hoặc một biểu thức FLWOR hoặc một
biểu thức đường dẫn để viết một truy vấn.
Lấy ra các phần tử XML
Câu hỏi
Các ý kiến góp ý nào của khách hàng được lưu giữ trong cơ sở dữ liệu Aroma?
Ví dụ truy vấn FLWOR
xquery for $y in db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')
return $y

Ví dụ truy vấn đường dẫn
xquery
db2-fn:xmlcolumn('AROMA.SALES.COMMENTS')

Hai truy vấn, có cùng kết quả
<Comments>
<comment>
<comment_ID>1</comment_ID>
<customer_info>
<fname>Christopher</fname>
<lname>Davis</lname>
<phone>4147301265</phone>
<email></email>
</customer_info>
<feedback>
<type>opinion</type>
<content>The employee named Heather Gray was very
helpful.</content>

</feedback>
<store_rating>
<score>5</score>
<out_of>5</out_of>
</store_rating>
<store_response>
<required>no</required>
</store_response>
</comment>
</Comments>

<Comments>
<comment>
<comment_ID>101</comment_ID>
<customer_info>
<fname>Cynthia</fname>
<lname>Thomas</lname>
<email></email>
</customer_info>
<feedback>
<type>question</type>
<content>What countries are major tea
consumers?</content>
</feedback>
<store_rating>
<score>4</score>
<out_of>5</out_of>
</store_rating>
<store_response>
<required>yes</required>

<completed>yes</completed>
<action>Please see our "All About Tea" page at
www.aroma.com/tea</action>
</store_response>
</comment>
</Comments>



Chú ý: Kết quả được định dạng lại giúp bạn dễ đọc hơn. Trình soạn thảo lệnh DB2
hiển thị mỗi ý kiến góp ý trên một dòng.

Mách nước: Để giải phóng bộ nhớ cho trình soạn thảo
lệnh, nhấp chuột phải vào trong vùng kết quả và chọn
Clear Results (Xoá các kết quả).


Về các truy vấn
Để thực hiện một XQuery trực tiếp trên DB2 9, bạn phải bắt đầu truy vấn với từ
khóa xquery. Từ khóa này chỉ dẫn cho DB2 triệu gọi bộ phân tách XQuery của nó
để xử lý yêu cầu của bạn.
Chú ý: Bạn chỉ cần làm việc này nếu bạn đang sử dụng XQuery như một ngôn ngữ
bên ngoài nhất (hay ở mức trên nhất). Nếu bạn nhúng các biểu thức XQuery vào
trong SQL, bạn không cần mở đầu chúng bằng từ khóa xquery.
Khi chạy như một ngôn ngữ mức trên nhất, XQuery cần có một nguồn dữ liệu vào.
Một cách để một XQuery có thể nhận được dữ liệu vào là gọi một hàm có tên là
db2-fn:xmlcolumn có một tham số xác định tên bảng và tên cột của một cột XML
trong một bảng DB2.
Hàm db2-fn:xmlcolumn trả về chuỗi các tài liệu XML được lưu giữ trong cột đã
cho. Các ví dụ truy vấn trả về một chuỗi các tài liệu XML có chứa thông tin ý kiến

góp ý của khách hàng.
Chú ý: Cả hai tên cột Comments và tên bảng aroma.sales được chỉ rõ ở đây bằng
chữ hoa. Đó là do chúng được sửa thành dạng chữ hoa trước khi được viết vào tài
liệu danh mục bên trong DB2. Vì XQuery phân biệt dạng chữ, nên các tên bảng và
các tên cột chữ thường không khớp với các tên chữ hoa trong tài liệu DB2.
Lấy ra các phần tử XML cụ thể
Câu hỏi
Các ý kiến góp ý của khách hàng được lưu trong cơ sở dữ liệu Aroma là gì? Chỉ
hiển thị nội dung của các ý kiến đóng góp.
Ví dụ truy vấn FLWOR
xquery for
$y in db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback/c
ontent
return $y

Ví dụ truy vấn đường dẫn
xquery
db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback/c
ontent

Hai truy vấn , có cùng kết quả
<content>The employee named Heather Gray was very
helpful.</content>
<content>What countries are major teas consumers?</content>
<content>Demitasse Ms was highly enjoyable!</content>
<content>Xalapa Lapa was great!</content>
<content>Aroma should consider selling Jamaican Butter
Rum.</content>

<content>Darjeeling Special was not enjoyable at all.</content>
<content>Special Tips is my favorite.</content>




Về các truy vấn
Hai truy vấn, mặc dù đưa ra kết quả như nhau, nhưng được thực hiện hơi khác
nhau một chút.
Đối với truy vấn FLWOR, dòng thứ hai chỉ dẫn cho DB2 để duyệt qua các phần tử
con nội dung của các phần tử <Comments> có trong cột aroma.sales.comments.
Mỗi phần tử nội dung được lần lượt gán cho biến $y. Dòng thứ ba cho biết giá trị
$y được trả về trong mỗi lần lặp. Kết quả là một chuỗi các phần tử XML.
Đối với truy vấn đường dẫn, bước đầu tiên gọi hàm db2-fn:xmlcolumn để nhận
được một danh sách các tài liệu XML từ cột Comments của bảng aroma.sales.
Bước thứ hai trả về tất cả các phần tử<Comments> trong các tài liệu này, bước thứ
ba trả về các phần tử <comment> > nằm trong các phần tử <Comments> này,
bước thứ tư trả về các phần tử <feedback> nằm trong các phần tử <comment> và
bước thứ năm trả về các phần tử <content> nằm trong các phần tử <feedback> .
Hàm text()
Câu hỏi
Các ý kiến góp ý của khách hàng được lưu trong cơ sở dữ liệu Aroma là gì? Hiển
thị nội dung của các ý kiến góp ý dưới dạng văn bản.
Ví dụ truy vấn FLWOR
xquery for
$y in db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback/c
ontent
return $y/text()


Ví dụ truy vấn đường dẫn
xquery
db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback/c
ontent/text()

Hai truy vấn , có cùng kết quả
The employee named Heather Gray was very helpful.
What countries are major teas consumers?
Demitasse Ms was highly enjoyable!
Xalapa Lapa was great!
Aroma should consider selling Jamaican Butter Rum.
Darjeeling Special was not enjoyable at all.
Special Tips is my favorite.


Về các truy vấn
Các truy vấn triệu gọi hàm text() để trả về trình bày dạng văn bản của các giá trị
phần tử XML.
Lọc các giá trị phần tử XML
Câu hỏi
Các gợi ý nào của khách hàng được lưu trong cơ sở dữ liệu Aroma? Hiển thị
chúng dưới dạng văn bản.
Ví dụ truy vấn FLWOR
xquery for
$y in db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback

where $y/type = "suggestion"
return $y/content/text()


Ví dụ truy vấn đường dẫn
xquery
db2-
fn:xmlcolumn('AROMA.SALES.COMMENTS')/Comments/comment/feedback[t
ype =
"suggestion"]/content/text()

Hai truy vấn , có cùng kết quả
Aroma should consider selling Jamaican Butter Rum.

×