Tải bản đầy đủ (.pdf) (80 trang)

NGHIÊN CỨU CÔNG NGHỆ OLAP VÀ ỨNG DỤNG LUẬN VĂN ĐẠI HỌC SƯ PHẠM TPHCM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.47 MB, 80 trang )

 

TR ƯỜ 
ƯỜ NG
NG ĐẠI HỌC SƯ  PH
 PHẠM TP.CM
KHOA TOÁN – TIN HỌC
BỘ MÔN TIN HỌC

Trầần V ĩ 
Tr
V ĩ nh
nh Tiế
Tiến Đứ c – Nguyễ
Nguyễn Phú Thị
Thịnh

NGHIÊN CỨ 
CỨ U CÔNG NGHỆ
NGHỆ OLAP
VÀ Ứ NG
NG DỤ
DỤNG

LUẬ N VĂ N CỬ  NHÂN
 NHÂN CÔNG NGHỆ THÔNG TIN

TP.HCM, Tháng 4-2010


 



 

TR ƯỜ 
ƯỜ NG
NG ĐẠI HỌC SƯ  PH
 PHẠM TP.CM
KHOA TOÁN – TIN HỌC
BỘ MÔN TIN HỌC

Tr ần V ĩ nh
nh Tiến Đức – Nguyễn Phú Thịnh

NGHIÊN CỨ 
CỨ U CÔNG NGHỆ
NGHỆ OLAP
VÀ Ứ NG
NG DỤ
DỤNG

GIÁO VIÊN HƯỚ 
HƯỚ NG
NG DẪ
DẪN: NGUYỄ
NGUYỄN THỊ
THỊ TRÀ LINH

TP.HCM, Tháng 4-2010

1


 


 

 

Lờ i cả
cảm ơ n.
n.
Đầu tiên, chúng em xin gửi l ờ i cảm ơ n sâu sắc đến Cô Nguyễn Thị Trà Linh
và Thầy Tr ần Ngọc Bảo là những ngườ i đã tr ực tiế p hướ ng
ng dẫn để ngày hôm nay
chúng em có thể hoàn thành luận văn này. Chắc chắn r ằng n ếu không có sự dìu dắt
và tận tình giúp đỡ   của Cô và Thầy thì chúng em sẽ  gặ p r ất nhiều khó khăn trong
quá trình nghiên cứu thực hiện luận văn.
K ế  đến, chúng em muốn trân tr ọng cảm ơ n công lao to lớ n của Ba Mẹ,
những đấng sinh thành đã nuôi nấng và dạy d ỗ chúng em nên ngườ i nh ư ngày hôm
nay. Chắc chắn r ằng sau này dù có làm gì, dù có đi đâu, chúng em cũng sẽ không
làm phụ lòng Ba Mẹ.
Cuối cùng, xin gửi lờ i cảm ơ n chân thành đến tr ườ 
ng Đại học Sư  Phạm
ườ ng
Thành Phố  Hồ Chí Minh, nơ i đã dành sự quan tâm r ất lớ n đối vớ i sinh viên công
nghệ  thông tin chúng
chúng em
em trong suốt quá trình học tậ p tại đây.  Đặc biệt  ,,  xin trân
tr ọng cảm ơ n tòan thể các Thầy Cô khoa Toán-Tin. Trên con đườ ng
ng góp nhặt những

kiến thức quý báu của ngày hôm nay, các thầy, các cô, và bạn bè là những ngườ i đã
dạy dỗ, cùng chúng em sát cánh và tr ải nghiệm trong suốt 4 năm đại học.

2


 

 

Mục lụ
lục
 

Lờ ụicclảụmc .....................
............................................
............................................
.............................................
.............................................
...................................
............. 32 
ơ nn.. ......................
M
...........................................
...........................................
...........................................
...........................................
............................................
.......................
Bảng các kí hiệu, chữ viết tắt ...........................................

................................................................
...........................................
.................................
........... 6 
Bảng danh mục các bảng biểu ....................
.........................................
...........................................
............................................
................................
.......... 7 
Bảng danh mục các hình vẽ ...................
.........................................
.............................................
.............................................
...................................
............. 8 
Tóm tắt nội dung luận văn ...........................................
..................................................................
.............................................
.................................
........... 10 
Mở  đầu ...................
........................................
...........................................
............................................
...........................................
.............................................
........................ 11 
Cơ   ssở  lý
 lý thuyết ............................................

..................................................................
.............................................
.............................................
............................
...... 15 
Chươ ng
ng 1  Công nghệ OLAP ............................
..................................................
.............................................
.....................................
.............. 15 
1.1 Giớ i thiệu về Data Warehouse .............................
..................................................
...........................................
............................
...... 15 
 

1.1.1 Định ngh ĩ a........................................
a...............................................................
.............................................
.......................................
................. 15
1.1.2 Ý ngh ĩ a của Data Warehouse......................
...........................................
...........................................
..............................
........ 16 
1.1.3 Đặc điểm của Data Warehouse ......................
.............................................

..............................................
........................... 16 
1.1.4 Cấu trúc của Data Warehouse...................
.........................................
...........................................
...............................
.......... 19 
1.2 Tổng quan về OLAP ......................................
............................................................
............................................
.................................
........... 19 
1.2.1 Giớ i thiệu ........................................
..............................................................
............................................
.........................................
................... 19 
1.2.2 Đặc điểm của OLAP: ..............................
.....................................................
..............................................
................................
......... 21 
1.3 Các mô hình OLAP..............................
OLAP.....................................................
..............................................
..........................................
................... 21 
1.3.1 MOLAP ((Multidimensional
Multidimensional OLAP) ......................
.............................................

........................................
................. 21 
1.3.2 ROLAP (Relational OLAP) ....................
..........................................
............................................
.................................
........... 22 
1.3.3 HOLAP (Hybrid OLAP).....................
...........................................
...........................................
.....................................
................ 25 
1.3.4 So sánh các mô hình .............
....................................
..............................................
..............................................
...........................
.... 26 
Chươ ng
ng 2  OLAP trong MS SQL Server Analysis Service (SSAS) .....................
............................
....... 27 
2.1. Kiến trúc các thành phần OLAP trong SSAS ......
............................
...........................................
..........................
..... 27 
2.1.1 Cube ...................
.........................................
............................................

.............................................
.............................................
.........................
... 27 
2.1.2 Dimension .......
............................
...........................................
...........................................
...........................................
...............................
......... 29 
2.1.3 Measure.....................
..........................................
...........................................
...........................................
..........................................
..................... 31 
2.1.4 Fact table ((Fact)
Fact) ...........
.................................
.............................................
.............................................
.....................................
............... 31 
2.1.5 Slice ......................
............................................
.............................................
.............................................
............................................
...................... 32 

2.1.6 Partition.....................
...........................................
............................................
.............................................
.........................................
.................. 33 

3


 

 

2.1.7 Role ............
..................................
............................................
............................................
.............................................
..................................
........... 33 
2.1.8 Schedule (Lậ p lịch) ......................
............................................
.............................................
............................................
..................... 34 
2.2. Quy trình thiết k ế các đối tượ ng
ng trong SSAS .............................
...................................................
.........................

... 35 
2.2.1 Sơ  l lượ c về quy trình xây dựng Data Warehouse ...............................
...........................................
............ 35 
2.2.1.1 Quy trình chung ............................
..................................................
.............................................
.........................................
.................. 35 
2.2.1.2 Công cụ thực hiện: ............................................
..................................................................
...........................................
..................... 37 
2.2.2 Quy trình tạo Cube: ............................................
..................................................................
...........................................
..................... 3377 
Chươ ng
ng 3  Component Pivot Table trong Excel ..............................
....................................................
...........................
..... 43 
3.1. Pivot Table ......................
............................................
............................................
............................................
.........................................
................... 43 
3.1.1 Giớ i thiệu ........................................
..............................................................

............................................
.........................................
................... 43 
3.1.2 Cách sử dụng ...................
.........................................
.............................................
.............................................
.................................
...........43  
3.2. PivotChart ...................
.........................................
............................................
.............................................
.............................................
...................... 46 
3.3. Giớ i thiệu một số công cụ hỗ tr ợ 
ợ  OLAP
OLAP tươ ng
ng tự như Pivot Table của Excel .... 47 
3.3.1 RadarCube OLAP .....
...........................
............................................
.............................................
.........................................
.................. 47 
3.3.2 Data Dynamics Analysis ....................
...........................................
.............................................
.....................................
............... 48 

3.3.3 ComponentOne OLAP for WinForm ....................................
..........................................................
.......................... 49 
3.3.4 Devexpress ASPxPivotGrid...................
.........................................
.............................................
..................................
........... 49 
3.4 So sánh Pivot Table vớ i các công cụ khác:.....................................
khác:...........................................................
...................... 50 
Ư u điểm: .....................
............................................
.............................................
............................................
.............................................
..........................
... 50 
 Nhượ c điểm: ..........................................
................................................................
............................................
............................................
......................50  
K ết luận:..........................................
................................................................
.............................................
.............................................
............................
...... 51 
Chươ ng

ng 4  Các thư viện lậ p trình liên quan đến SSAS ...................................
................................................
............. 52 
4.1. AMO ..........................
.................................................
.............................................
............................................
.............................................
....................... 52 
4.2. ADOMD.NET............
ADOMD.NET..................................
...........................................
...........................................
............................................
.........................
... 53 
4.3. SMO ......
.............................
.............................................
............................................
.............................................
............................................
..................... 5533 
4.4. MDX ..........................
.................................................
.............................................
............................................
.............................................
....................... 55 
4.4.1 Cấu trúc chung .................

.......................................
............................................
.............................................
..................................
........... 55 
4.4.2 Ví dụ mẫu....................
u..........................................
............................................
.............................................
.......................................
................ 55 
4.4.3 Lưu ý...........................................................
..................................................................................
..............................................
............................
.....56  
Chươ ng
ng 5  Xây dựng công cụ Web hỗ tr ợợ   phân
phân tích dữ liệu cho các ứng dụng OLTP58 
5.1. Phân tích, thiết k ế...................
.........................................
.............................................
.............................................
.................................
........... 58 
5.1.1 Phân tích .....................................
............................................................
.............................................
............................................
...................... 58 

5.1.1.1 Quy trình xử lý nghiệ p vụ: ...................
........................................
...........................................
..................................
............ 58 
5.1.1.2 Yêu cầu chức năng:.............................................
...................................................................
.........................................
................... 60 
5.1.1.3 Mô hình quan niệm dữ liệu:......................
.............................................
.............................................
............................
...... 66 

4


 

 

5.1.2 Thiết k ế .....................
...........................................
............................................
.............................................
.........................................
.................. 72 
5.1.2.1 Dữ liệu: ....................
..........................................

............................................
.............................................
........................................
................. 72 
5.1.2.2 Kiến trúc module: ..................................
..........................................................
...............................................
..............................
....... 79 
5.1.2.3 Hệ thống giao diện: ....................
...........................................
.............................................
...........................................
..................... 80 
5.2. Cài đặt, lậ p trình.........................................
trình...............................................................
.............................................
....................................
............. 88 
..........................................
.............................................
.............................................
.............................
....... 89 
Đánh giá, bàn luận về k ết quả ....................
K ết luận - Hướ ng
ng phát triển ....................
..........................................
...........................................
...........................................

..................................
............ 91 
Các k ết quả đã đạt đượ c ......................
...........................................
...........................................
............................................
..................................
............ 91 
1. Về lý thuyết......................
............................................
.............................................
.............................................
...........................................
..................... 91 
2. Về thực nghiệm ...................
.........................................
...........................................
...........................................
..........................................
.................... 91 
Danh mục tài liệu tham khảo .....................
...........................................
.............................................
.............................................
.............................
....... 93 

5



 

 

hiệu, chữ 
chữ  viế
 viết tắ
tắt
Bảng các kí hiệ
Tiếếng Anh:
Ti


  AMO :

Analysis Management Objects



  BI:

Business Intelligence



  DTS:

Data Transformation Services




  ETL:

Extract – Transform - Load



  HOLAP :

Hybrid OLAP 



  MDX:

Multi-dimensional Expressions



  MOLAP :

Multidimensional OLAP 



  OLAP:

Online Analytical Processing




  ROLAP :

Relational OLAP 

  SMO:
•  SSAS:


SQL Server Management Objects
SQL Server Analysis Services

Tiếếng Việ
Ti
Việt:


  CSDL:

Cơ  s
 sở  d
 dữ liệu

6


 

 


mục các bả
bảng biể
biểu
Bảng danh mụ
Bảng 1: So sánh các mô hình OLAP............................
..........................................
............................
............................
.................
...26 
26 

7


 

 

Bảng danh mụ
mục các hình vẽ
vẽ 
Hình 1: Các dạng cơ  s
 sở  d
 dữ liệu ............
..........................
...........................
...........................
...........................
..........................

.................11
Hình 2: Ví dụ về một mẫu báo cáo cố định ............
.........................
..........................
..........................
........................
...........12
Hình 3: Minh họa vị trí của ứng dụng .........................
......................................
..........................
...........................
....................
......13
Hình 5:
4: Data
......................
...................................
...........................
...........................
...........................
...............
15
Hình
iểm của Data
Warehouse...........................
.....................
..................................
..........................
...........................
.....................

.........17
Đặc đWarehouse
Hình 6: Cấu trúc của Data Warehouse ..............
...........................
...........................
...........................
..........................
................
...19
Hình 7: Vị trí của OLAP ..........................
........................................
...........................
..........................
..........................
.........................
............19
Hình 8: Mô hình dữ liệu MOLAP ..........................
........................................
...........................
...........................
........................
..........22
Hình 9: Mô hình dữ liệu ROLAP.......................
....................................
...........................
...........................
..........................
.................23
Hình 10: Lượ c đồ hình sao.............
..........................

...........................
...........................
..........................
..........................
.....................
........ 24
Hình 11: Lượ c đồ hình bông tuyết ............
.........................
..........................
...........................
...........................
........................
...........24
Hình 12: Mô hình dữ liệu HOLAP ..........................
........................................
...........................
...........................
......................
........25
Hình 13: Ví dụ về Khối (Cube) ............
.........................
..........................
..........................
..........................
..........................
.................
....28
Hình 14: Ví dụ về ô r ỗng trong khối .............
...........................
...........................

..........................
..........................
....................
.......29
Hình 15: Ví dụ về các Dimension (Chiều) khác nhau ...........................
........................................
...................
......30
Hình 16: Fact Table ..................
................................
...........................
...........................
...........................
..........................
...........................
..............31
Hình 17: Slice..............................
...........................................
...........................
...........................
...........................
...........................
........................
...........32
Hình 18: Các đối tượ ng
ng trong SSAS ...............
............................
...........................
............................
............................

.................
...35
Hình 19: Pivot Table .......................
.....................................
............................
...........................
...........................
............................
...................
.....43
Hình 20: PivotChart ............
..........................
...........................
..........................
..........................
..........................
...........................
....................
......46
Hình 21: RadarCube OLAP ...........................
........................................
..........................
...........................
...........................
...................
......47
Hình 22: Data Dynamics Analysis .....
..................
...........................
...........................

..........................
...........................
..................
....48
Hình 23: ComponentOne OLAP for WinForm ...........................
.........................................
............................
................49
Hình 24: Devexpress ASPxPivotGrid ....................
..................................
...........................
...........................
........................
..........50
Hình 25: Mô hình xử lý nghiệ p vụ quản lý template ...............................
.............................................
.................
...59
Hình 26: Sơ  đồ Use-Case mô tả hệ thống chức năng của Administrator .................
.................60
Hình 27: Sơ  đồ Use-Case mô tả hệ thống chức năng của Designer .........................
.........................61
Hình 28: Sơ  đồ User-Case mô tả hệ thống chức năng của Custom User .................
.................61
Hình 30:
29: S
Sơ 
 Use-Case mô
mô ttảả ch
 chứứcc nnăăng

ng phân
quản quy
lý Template
..........................
.............
....................
.......62
62
ơ   đồ
đồ Use-Case
Hình
.....
...................
......................
........
ền Template
........................................
.............63
Hình 31: Sơ  đồ Use-Case mô tả chức năng quản lý Cube ...........................
Hình 32: Sơ  đồ Use-Case mô tả chức năng phân quyền Cube ...........................
.................................
......63
Hình 33: Sơ  đồ Use-Case mô tả chức năng quản lý User .......................
.....................................
..................
....64
Hình 34: Sơ  đồ Use-Case mô tả chức năng quản lý Group ......................................
......................................65
Hình 35: Sơ  đồ Use-Case mô tả chức năng quản lý Profile...........................
Profile......................................

...........65
Hình 36: Sơ  đồ Use-Case mô tả chức năng cấu hình hệ thống .........................
.................................
........66
Hình 37: Mô hình quan niệm dữ liệu hệ thống OLAP........................
.....................................
......................
.........67
Hình 38: Mô hình vật lý .............
..........................
..........................
..........................
...........................
...........................
..........................
.............73
Hình 39: Màn hình chính phân hệ administrator ...........................
.........................................
...........................
.............80
Hình 40: Màn hình chức năng Copy Rights ...........................
.........................................
............................
....................
......81

8


 


 

Hình 41: Màn hình chức năng Active cube ..........................
.......................................
...........................
.......................
.........81
Hình 42: Màn hình chức năng Assign cube to group ...........................
.........................................
....................
......81
Hình 43: Màn hình chức năng Assign user to cube ...........................
.........................................
.......................
.........82
Hình 44: Màn hình chức năng List user ..........
.......................
...........................
...........................
...........................
..................
....82
Hình 45: Màn hình chức năng Assign Groups ...................
.................................
............................
.........................
...........83
Hình 46: Màn hình chức năng Assign Users ..........................
........................................

............................
....................
......83
Hình 48:
47: Màn
Màn hình
hình ch
chứứcc nnăăng
ng Assign
Import cube
............
...........................
...........................
.......................
.........
83
Hình
rights..........................
to profile
...........................
.............
............................
..................
....84
Hình 49: Màn hình chức năng Schedule ..........................
.......................................
...........................
...........................
...............84
Hình 50: Màn hình chức năng Setting Connection ..........

........................
............................
...........................
.............85
Hình 51: Màn hình chính phân hệ designer ..........................
.......................................
..........................
.......................
..........85
Hình 52: Màn hình chức năng Design template ..........................
........................................
............................
................86
Hình 53: Màn hình chức năng Export template ...........................
.........................................
............................
................86
Hình 54: Màn hình chức năng Assign template to user ..........................
........................................
..................
....87
Hình 55: Màn hình chính phân hệ custom user ...........................
........................................
...........................
..................87

9


 


 

nội dung luậ
luận vă
văn
Tóm ttắắt nộ
 

Tìm hiểu tổng quan về công nghệ OLAP

 

Tìm hiểu OLAP trong MS SQL Server Analysis Service (SSAS)

 

Tìm hiểu về component Pivot Table trong Excel

 



  Pivot Table



  PivotChart

Tìm hiểu các thư  viện lậ p trình liên quan đến SSAS: MDX, AMO, SMO,

ADOMD.NET, ...

 

Xây dựng công cụ hỗ tr ợợ  phân
 phân tích dữ liệu cho các ứng dụng OLTP

10


 

 

đầu
u
Mở  đầ
  Giớ i

thiệu sơ  l lượ cc::

 Ngày nay, cách mạng thông tin và sự bùng nổ thông tin trên toàn cầu đã dẫn đến
các thực tr ạng như sau:



 sở  d 
 d ữ
ữ   li 
li ệu khác nhau

  Dữ liệu: Đượ c lưu tr ữ ở  nhi ều d ạng cơ  s

dạạng cơ 
cơ  sở 
 sở  dữ 
 dữ  liệ
 liệu
Hình 1: Các d



   Nhiều hệ thống thông tin đượ c xây dựng gây ra hệ quả:
 

 Những giao diện khác nhau

 

 Những dạng biểu dữ liệu khác nhau

 



Thông tin trùng lặ p và không nhất quán

  Trong khi đó, các phần mềm và hệ  thống báo cáo thườ ng
ng chỉ cung cấ p

một số mẫu báo cáo cố  đị nh

nh.
VD: 

Báo cáo về điểm cuối kì của sinh viên

11


 

 

dụ
ụ v
 vềề m
 mộột mẫ
mẫu báo cáo cố
cố đị
định
nh
Hình 2: Ví d

Vậy tình huống đặt ra là ta sẽ xử lý như thế nào khi ngườ i dùng muốn:
 

Xem thêm thông tin về 1 thành phần nào đó trong CSDL ngoài những
thành phần đã có trên report

 


Xem report theo nhiều hình thức khác nhau, ngoài dạng table đã quá
quen thuộc

  Không

  Ý

còn cách nào khác h ơ n là ta phải tạo thêm 1 report mớ i !!! 

tưở ng,
ng, lí do chọn đề tài:

Từ  thực tr ạng trên, có thể  thấy r ằng nhu cầu phân tích số   li ệu  để  hỗ  tr ợợ   ra
các quyết định chiến lượ c một cách k ị p
 p thờ i đã tr ởở  nên
 nên ngày càng cấ p thiết.

12


 

 

Trong môi tr ườ 
ng kinh doanh hiện đại, các lãnh đạo doanh nghiệ p cần có
ườ ng
những thông tin mang tính qu ản tr ị chính xác, nhanh chóng và ở  nhi
 nhiều góc độ khác
nhau nhằm thực hiện việc ra quyết định kinh doanh hiệu quả.


Vì thế, ý tưở ng
ng của đề  tài là sử  dụng hệ  thống OLAP k ết hợ  p vớ i Data
warehouse để  tạo ra 1 công cụ  giúp ngườ i dùng - đặc biệt là nhà quản lý, những
ngườ i ra quyết định - dễ dàng khai thác, truy xuất đượ c các mẫu dữ liệu mà họ quan
tâm.

Hình 3: Minh họ
vị trí củ
của ứ ng
ng dụ
dụng
họa vị

  Mục

đích đề tài

Xây dựng 1 công cụ phân tích dữ liệu tr ực tuyến trên nền web cho phép:


  Phân tích số liệu dựa trên nhiều chỉ tiêu, yếu tố.

13


 

 




  Có hệ  thống phân quyền chặt chẽ  về  chức năng và dữ  liệu trên ngườ i

dùng lẫn nhóm ngườ i dùng


  Có hệ thống report, chart,... tr ực quan, đa dạng, hỗ tr ợ
 kéo thả 
ợ  kéo



  Có hệ  thống template giúp ngườ i dùng dễ dàng hơ n trong quá trình xem

và phân tích dữ liệu
•  Có chức năng Import, Export template, dữ  liệu,... phục vụ  cho nhu cầu
chuyển đổi giữa các hệ thống khác nhau


  Tùy theo nhu cầu / lựa chọn của ngườ i sử dụng khi phân tích số liệu.



  Độc lậ p vớ i hệ thống cơ  s
 sở  d
 dữ liệu của ngườ i dùng

  Đối


tượ ng
ng và phạm vi nghiên cứ u



  Công nghệ Data Warehouse và OLAP
•  Các mô hình OLAP: MOLAP, ROLAP, HOLAP


  Tìm hiểu OLAP trong MS SQL Server Analysis Service (SSAS)



  Quy trình thiết k ế các đối tượ ng
ng trong SSAS: Data Source, Data Source

View, Cube, Dimension, ...


  Component Pivot Table và PivotChart trong Excel



  Các thư  viện lậ p trình liên quan đến SSAS:

MDX, AMO, SMO,

ADOMD.NET,...



 phân tích dữ liệu cho các ứng dụng OLTP
ợ  phân
  Xây dựng công cụ hỗ tr ợ

14


 

 

 sở  lý
 lý thuyế
thuyết
Cơ  sở 
Chươ ng
Chươ 
ng 1  Công nghệ
nghệ OLAP
1.1 Gi
Giớ 
thiệu về
về Data Warehouse
ớ i thiệ
1.1.1 Định ngh ĩ a

Hình 4: Data Warehouse

 


Kho dữ  liệu (data warehouse), gọi một cách chính xác hơ n là kho thông tin
(information warehouse), là một cơ  s
 sở  d
 dữ liệu hướ ng
ng đối tượ ng
ng đượ c thiết k ế vớ i
việc tiế p cận các ý kiến trong mọi l  ĩ ĩ nh
nh vực kinh doanh. Nó cung cấ p các công cụ 

để đáp ứng thông tin cần thiết cho các nhà quản tr ị kinh doanh tại mọi cấ p độ tổ 
chức - không những chỉ là những yêu cầu dữ liệu phức hợ  p, mà còn là điều kiện
thuận tiện nhất để đạt đượ c việc lấy thông tin nhanh, chính xác.

15


 

 

 

Là một sự pha tr ộn c ủa nhiều công nghệ, bao gồm các cơ   ssở   ddữ liệu đa chiều và
mối quan hệ giữa chúng, kiến trúc chủ khách, giao diện ngườ i dùng đồ họa,...

 

Kho dữ li ệu thườ ng
ng r ất lớ n tớ i hàng tr ăm GB hay thậm chí hàng Terabyte. Kho
dữ liệu đượ c xây dựng để tiện lợ i cho việc truy cậ p theo nhiều nguồn, nhiều kiểu

dữ liệu khác nhau sao cho có thể k ết hợ  p đượ c cả những ứng dụng của các công
nghệ hiện đại và k ế thừa đượ c từ những hệ thống đã có sẵn từ tr ướ 
ướ cc..

1.1.2 Ý ngh ĩ a của Data Warehouse
 

 

 

Truy cậ p dữ liệu một cách thống nhất :


  Thu thậ p và k ết hợ  p thông tin.



  Cung cấ p một khung nhìn tích hợ  p



  Giao diện ngườ i sử dụng không biến đổi



  Hỗ tr ợ
 khả năng chia sẻ.
ợ  kh


Dữ liệu đượ c tích hợ  p và tổ chức:


  Làm cho hệ thống tr ở
 nên dễ hiểu
ở  nên



  Rõ ràng



  Dễ phân tích

Chuyển đổi dữ liệu thành thông tin: cung c ấ p thông tin chính xác đúng thờ i điểm
và đúng định dạng

1.1.3 Đặc điểm của Data Warehouse 

16


 

 

 
Hình 5: Đặc điểm c a Data W rehouse


 

Tích hợ   (Integrat d):
Dữ liệu ậ p hợ  p từ nhiều nguồn khác n au trong

ột tổ chức/công ty à đã đượ c 

đồng nh t, xắ p xế , rút gọn.  
 

ng v  nhất quá
Là một tậ p hợ 
 p th ng tin chí h xác, ch t lượ ng

 

Chuẩn hóa :

  Các qui ướ   tên



  Các thuộc t nh



ng
  Các đơ n vị  o lườ ng




 

ng ứng dụng sang hướ ng
Hướ ng
ng hủ  thể  ( ubject-ori nted): Chuyển từ  h ớ ng
ng h
tr ợ 
ợ  quy
quyế  định

  Đượ c tổ ch c xung q anh các c ủ thể chí h, như kh ch hàng (customer),



s n phẩm ( roduct), b n hàng (s les).

  Tậ p trung vào việc m  hình hó và phân tích dữ  liệ  cho các hà đưa r 



q yết định, mà không tậ p trung vào các h ạt động h ay các xử  lý toàn tác

1


 

 


h ng ngày.

  Cung cấ p



ột khung nhìn đơ n iản và súc tích xung quanh các sự  kiện

c a các chủ thể 
 

Biến th i gian (Ti e-varian ): Các dữ  liệu đượ c định ngh ĩ a vào một thờ i điểm
xác định  và đượ c hi chép l i phục v ụ  cho việc o sánh d liệu theo chiều thờ i
gian

 

êu cầu qu n tr ọng đ i vớ i kho dữ liệu là hạm vi v thờ i gian dài hơ n so



v i các hệ t ống tác n hiệ p :
 
 

Cơ   ssở  d
 dữ li u tác nghiệ p: dữ liệu chỉ có gi tr ị hiện thờ i

ữ li ệu của kho dữ li u: cung c  p thông tin l ịch sử (ví d ụ như,
5-10 năm tr  ớ cc))




ếu tố thờ i gian đượ c lưu tr ữ trong CSDL

 



Cố  định (Non-vol tile ): dữ  liệu có th   đượ c thêm vào nh ng không  đượ c sử
uản lý có  thể  tổng hợ  p công việc kinh

chữa hoặc xóa bỏ. Nhằm giúm nhà
doanh c a toàn tổ  hức/công ty.
 

 

1


 

 

1.1.4 Cấu trúc của Data Warehouse

Hình 6: Cấ
Cấu trúc củ
của Data Warehouse

 

Một Data warehouse đượ c cấu tạo từ  một hay nhiều cube (khái niệm này sẽ  đề 
cậ p ở  ph
 phần sau).

 

Enterprise Data warehouse: tậ p hợ  p toàn b ộ thông tin về các đối tượ ng
ng của toàn
tổ chức/công ty. Ví dụ: sản phẩm, khách hàng, doanh thu …

 

Data mart (kho dữ liệu chủ đề): là một tậ p con của Data warehouse, chỉ tậ p trung
vào những đối tượ ng
ng đượ c chọn. 

1.2 T
Tổổng quan về
về OLAP
1.2.1 Giớ i thiệu

Hình 7: Vị
Vị trí củ
của OLAP

19



 

 

   Nếu

hệ  thống xử lý chuyển giao dữ li
 l iệu OLTP tậ p trung vào việc thu thậ p, lưu

tr ữ và biến đổi dữ liệu một cách chuẩn xác, thì OLAP tậ p trung vào việc sử dụng
các dữ liệu đã đượ c biến đổi vào việc ra quyết định s ản xu ất kinh doanh. OLAP
là một mục trong các phần m ềm c ơ  s
 s ở  d
 d ữ li ệu cung cấ p giao diện qua đó ng ườ i
sử  dụng có thể  biến đổi hoặc giớ i hạn các dữ  liệu sơ  khai
  khai tuỳ theo các hàm đã
a, sau đó nhanh chóng kiểm
định ngh ĩ a hoặc do chính ngườ i sử  dụng định ngh ĩ a,
tra các k ết quả trong các chiều khác nhau của dữ liệu
 

Hệ  thống OLAP là một hệ  thống quản lý dữ  liệu giàu năng lực. Nó cho phép
ngườ i sử  dụng phân tích dữ  liệu qua việc cắt lát (slice) dữ  liệu theo nhiều khía
cạnh khác nhau, khoan xuống (drill down) mức chi tiết hơ n hay cuộn lên (roll
up) mức tổng hợ  p hơ n của dữ  liệu. Bản chất cốt lõi của OLAP là dữ  liệu đượ c
lấy ra từ Data warehouse hoặc từ Datamart sau đó đượ c chuyển thành mô hình

đa chiều và đượ c lưu tr ữ trong một kho dữ liệu đa chiều.
 


Cụ  thể, OLAP là một k ỹ  thuật sử  dụng các thể  hiện dữ  liệu đa chiều gọi là các
khố i  (cube)

nhằm cung cấ p khả  năng truy xuất nhanh đến dữ  liệu của kho dữ 

liệu. Tạo khối cho dữ  liệu trong các bảng chiều (dimension table) và bảng sự 
kiện (fact table) trong kho dữ li ệu để cung cấ p khả n ăng thực hi ện các truy vấn
tinh vi và phân tích cho các ứng dụng client.
 

OLAP cung cấ p nhiều lợ i ích cho ngườ i phân tích, cho ví dụ như:


  Cung cấ p mô hình dữ liệu đa chiều tr ực quan cho phép dễ dàng lựa chọn,

ng và khám phá dữ liệu.
định hướ ng


  Cung cấ p m ột ngôn ngữ truy vấn phân tích, cung cấ p s ức m ạnh để khám

 phá các mối quan hệ trong dữ liệu kinh doanh phức tạ p.


  Dữ  liệu đượ c tính toán tr ướ 
ng xuyên nhằm
ướ c đối vớ i các truy vấn thườ ng

làm cho thờ i gian tr ả lờ i r ất nhanh đối vớ i các truy vấn đặc biệt.


20


 

 



  Cung cấ p các công c ụ mạnh giúp ngườ i dùng tạo các khung nhìn mớ i của

dữ liệu dựa trên một tậ p các hàm tính toán đặc biệt.


  Hỗ  tr ợ
ợ   tạo mô hình chức năng để  dự báo, phân tích xu th ế phát triển và

 phân tích thống kê.


 

  Tìm kiếm và hiển thị dữ liệu dướ i dạng biểu đồ, không gian 2D, 3D, …

OLAP đượ c đặt ra để x ử lý các truy v ấn liên quan đến l ượ ng
ng d ữ li ệu r ất l ớ n mà
nếu cho thực thi các truy vấn này trong hệ thống OLTP sẽ không thể cho k ết quả 
hoặc sẽ mất r ất nhiều thờ i gian.

1.2.2 Đặc điểm của OLAP:

 

Đượ c biết đến như là một phần của kho dữ liệu

 

Cung cấ p các báo cáo, phân tích tiền tính toán, các đồ thị, biểu đồ 

 

Cho phép phân tích tr ực tuyến dữ liệu

 

Thăm dò sự tươ ng
ng tác dữ liệu

 

Cung cấ p các giao diện đa dạng cho ngườ i dùng

 

Cung cấ p khả năng phân tích dữ liệu phức tạ p bằng phươ ng
ng thức đơ n giản 

1.3 Các mô hình OLAP
1.3.1 MOLAP (Multidimen
(Multidimensional
sional OLAP)

 

Mô hình MOLAP lưu tr ữ d ữ li ệu c ơ  s
 s ở  (là
  (là dữ li ệu t ừ các bảng của kho dữ li ệu)
và thông tin tổng hợ  p (là các độ đo đượ c tính toán từ các bảng) trong các khối

21


 

 

 
Hình 8: Mô hình dữ  li
 liệu M LAP

 

Dữ liệu ượ c tìm t ấy tại điể

giao củ  các chiều

 


Dữ liệu rong MO AP cần p ải đượ c process sau một thờ i ian nhất ịnh để cậ p 
nhật lại hững dữ liệu mớ i tr  ng Data




arehouse.

liệu th o thờ i gian dài.
MOLA  thích hợ p cho các truy vấn ổng hợ p ữ   li
 p doanh thu của từng chi nhánh tro g vòng 2 ăm tr ở
Ví d ụ: tổng hợ 
ở   llại.

 

1.3.2 R  LAP ( elational OLAP)
 
 

Mô hìn  OLAP q an hệ  (R  LAP) lư tr ữ  dữ  li u cơ   sở   và thông ti tổng hợ 
 p
trong cá  bảng qu n hệ 

2  


 

 

 
 liệu R  LAP 
Hình 9: Mô hình dữ  li


 

Dữ liệu ượ c tìm t ấy tại điể



Có 2 kiểu mô hình dữ liệu:

giao củ  1 cột và

một hàng

  Lượ c đồ  hì h sao (st r): mỗi một chiều c ỉ  đượ c x y dựng từ  một bảng



c iều

2  


 

 

Lượ 
ượ c đồ
đồ hình
 hình sao

Hình 10: L



  Lượ c đồ hình bông tuyết (snowflake): mỗi chiều đượ c xây dựng từ nhiều

 bảng chiều

Hình 11: L
Lượ 
ượ c đồ
đồ hình
 hình bông tuyế
tuyết
 

ROLAP thích hợ 
hợ p cho các truy vấ
vấn dữ   liliệệu theo thờ 
thờ i gian thự 
thự c  (xảy ra
thườ ng
ng xuyên và đòi hỏi độ chính xác tức thờ ii).
).
Ví d ụ: xem thông tin chứng khoán

24



×