TR ƯỜ
ƯỜ NG
NG ĐẠI HỌC SƯ PH
PHẠM TP.CM
KHOA TOÁN – TIN HỌC
BỘ MÔN TIN HỌC
Trầần V ĩ
Tr
V ĩ nh
nh Tiế
Tiến Đứ c – Nguyễ
Nguyễn Phú Thị
Thịnh
NGHIÊN CỨ
CỨ U CÔNG NGHỆ
NGHỆ OLAP
VÀ Ứ NG
NG DỤ
DỤNG
LUẬ N VĂ N CỬ NHÂN
NHÂN CÔNG NGHỆ THÔNG TIN
TP.HCM, Tháng 4-2010
TR ƯỜ
ƯỜ NG
NG ĐẠI HỌC SƯ PH
PHẠM TP.CM
KHOA TOÁN – TIN HỌC
BỘ MÔN TIN HỌC
Tr ần V ĩ nh
nh Tiến Đức – Nguyễn Phú Thịnh
NGHIÊN CỨ
CỨ U CÔNG NGHỆ
NGHỆ OLAP
VÀ Ứ NG
NG DỤ
DỤNG
GIÁO VIÊN HƯỚ
HƯỚ NG
NG DẪ
DẪN: NGUYỄ
NGUYỄN THỊ
THỊ TRÀ LINH
TP.HCM, Tháng 4-2010
1
Lờ i cả
cảm ơ n.
n.
Đầu tiên, chúng em xin gửi l ờ i cảm ơ n sâu sắc đến Cô Nguyễn Thị Trà Linh
và Thầy Tr ần Ngọc Bảo là những ngườ i đã tr ực tiế p hướ ng
ng dẫn để ngày hôm nay
chúng em có thể hoàn thành luận văn này. Chắc chắn r ằng n ếu không có sự dìu dắt
và tận tình giúp đỡ của Cô và Thầy thì chúng em sẽ gặ p r ất nhiều khó khăn trong
quá trình nghiên cứu thực hiện luận văn.
K ế đến, chúng em muốn trân tr ọng cảm ơ n công lao to lớ n của Ba Mẹ,
những đấng sinh thành đã nuôi nấng và dạy d ỗ chúng em nên ngườ i nh ư ngày hôm
nay. Chắc chắn r ằng sau này dù có làm gì, dù có đi đâu, chúng em cũng sẽ không
làm phụ lòng Ba Mẹ.
Cuối cùng, xin gửi lờ i cảm ơ n chân thành đến tr ườ
ng Đại học Sư Phạm
ườ ng
Thành Phố Hồ Chí Minh, nơ i đã dành sự quan tâm r ất lớ n đối vớ i sinh viên công
nghệ thông tin chúng
chúng em
em trong suốt quá trình học tậ p tại đây. Đặc biệt ,, xin trân
tr ọng cảm ơ n tòan thể các Thầy Cô khoa Toán-Tin. Trên con đườ ng
ng góp nhặt những
kiến thức quý báu của ngày hôm nay, các thầy, các cô, và bạn bè là những ngườ i đã
dạy dỗ, cùng chúng em sát cánh và tr ải nghiệm trong suốt 4 năm đại học.
2
Mục lụ
lục
Lờ ụicclảụmc .....................
............................................
............................................
.............................................
.............................................
...................................
............. 32
ơ nn.. ......................
M
...........................................
...........................................
...........................................
...........................................
............................................
.......................
Bảng các kí hiệu, chữ viết tắt ...........................................
................................................................
...........................................
.................................
........... 6
Bảng danh mục các bảng biểu ....................
.........................................
...........................................
............................................
................................
.......... 7
Bảng danh mục các hình vẽ ...................
.........................................
.............................................
.............................................
...................................
............. 8
Tóm tắt nội dung luận văn ...........................................
..................................................................
.............................................
.................................
........... 10
Mở đầu ...................
........................................
...........................................
............................................
...........................................
.............................................
........................ 11
Cơ ssở lý
lý thuyết ............................................
..................................................................
.............................................
.............................................
............................
...... 15
Chươ ng
ng 1 Công nghệ OLAP ............................
..................................................
.............................................
.....................................
.............. 15
1.1 Giớ i thiệu về Data Warehouse .............................
..................................................
...........................................
............................
...... 15
1.1.1 Định ngh ĩ a........................................
a...............................................................
.............................................
.......................................
................. 15
1.1.2 Ý ngh ĩ a của Data Warehouse......................
...........................................
...........................................
..............................
........ 16
1.1.3 Đặc điểm của Data Warehouse ......................
.............................................
..............................................
........................... 16
1.1.4 Cấu trúc của Data Warehouse...................
.........................................
...........................................
...............................
.......... 19
1.2 Tổng quan về OLAP ......................................
............................................................
............................................
.................................
........... 19
1.2.1 Giớ i thiệu ........................................
..............................................................
............................................
.........................................
................... 19
1.2.2 Đặc điểm của OLAP: ..............................
.....................................................
..............................................
................................
......... 21
1.3 Các mô hình OLAP..............................
OLAP.....................................................
..............................................
..........................................
................... 21
1.3.1 MOLAP ((Multidimensional
Multidimensional OLAP) ......................
.............................................
........................................
................. 21
1.3.2 ROLAP (Relational OLAP) ....................
..........................................
............................................
.................................
........... 22
1.3.3 HOLAP (Hybrid OLAP).....................
...........................................
...........................................
.....................................
................ 25
1.3.4 So sánh các mô hình .............
....................................
..............................................
..............................................
...........................
.... 26
Chươ ng
ng 2 OLAP trong MS SQL Server Analysis Service (SSAS) .....................
............................
....... 27
2.1. Kiến trúc các thành phần OLAP trong SSAS ......
............................
...........................................
..........................
..... 27
2.1.1 Cube ...................
.........................................
............................................
.............................................
.............................................
.........................
... 27
2.1.2 Dimension .......
............................
...........................................
...........................................
...........................................
...............................
......... 29
2.1.3 Measure.....................
..........................................
...........................................
...........................................
..........................................
..................... 31
2.1.4 Fact table ((Fact)
Fact) ...........
.................................
.............................................
.............................................
.....................................
............... 31
2.1.5 Slice ......................
............................................
.............................................
.............................................
............................................
...................... 32
2.1.6 Partition.....................
...........................................
............................................
.............................................
.........................................
.................. 33
3
2.1.7 Role ............
..................................
............................................
............................................
.............................................
..................................
........... 33
2.1.8 Schedule (Lậ p lịch) ......................
............................................
.............................................
............................................
..................... 34
2.2. Quy trình thiết k ế các đối tượ ng
ng trong SSAS .............................
...................................................
.........................
... 35
2.2.1 Sơ l lượ c về quy trình xây dựng Data Warehouse ...............................
...........................................
............ 35
2.2.1.1 Quy trình chung ............................
..................................................
.............................................
.........................................
.................. 35
2.2.1.2 Công cụ thực hiện: ............................................
..................................................................
...........................................
..................... 37
2.2.2 Quy trình tạo Cube: ............................................
..................................................................
...........................................
..................... 3377
Chươ ng
ng 3 Component Pivot Table trong Excel ..............................
....................................................
...........................
..... 43
3.1. Pivot Table ......................
............................................
............................................
............................................
.........................................
................... 43
3.1.1 Giớ i thiệu ........................................
..............................................................
............................................
.........................................
................... 43
3.1.2 Cách sử dụng ...................
.........................................
.............................................
.............................................
.................................
...........43
3.2. PivotChart ...................
.........................................
............................................
.............................................
.............................................
...................... 46
3.3. Giớ i thiệu một số công cụ hỗ tr ợ
ợ OLAP
OLAP tươ ng
ng tự như Pivot Table của Excel .... 47
3.3.1 RadarCube OLAP .....
...........................
............................................
.............................................
.........................................
.................. 47
3.3.2 Data Dynamics Analysis ....................
...........................................
.............................................
.....................................
............... 48
3.3.3 ComponentOne OLAP for WinForm ....................................
..........................................................
.......................... 49
3.3.4 Devexpress ASPxPivotGrid...................
.........................................
.............................................
..................................
........... 49
3.4 So sánh Pivot Table vớ i các công cụ khác:.....................................
khác:...........................................................
...................... 50
Ư u điểm: .....................
............................................
.............................................
............................................
.............................................
..........................
... 50
Nhượ c điểm: ..........................................
................................................................
............................................
............................................
......................50
K ết luận:..........................................
................................................................
.............................................
.............................................
............................
...... 51
Chươ ng
ng 4 Các thư viện lậ p trình liên quan đến SSAS ...................................
................................................
............. 52
4.1. AMO ..........................
.................................................
.............................................
............................................
.............................................
....................... 52
4.2. ADOMD.NET............
ADOMD.NET..................................
...........................................
...........................................
............................................
.........................
... 53
4.3. SMO ......
.............................
.............................................
............................................
.............................................
............................................
..................... 5533
4.4. MDX ..........................
.................................................
.............................................
............................................
.............................................
....................... 55
4.4.1 Cấu trúc chung .................
.......................................
............................................
.............................................
..................................
........... 55
4.4.2 Ví dụ mẫu....................
u..........................................
............................................
.............................................
.......................................
................ 55
4.4.3 Lưu ý...........................................................
..................................................................................
..............................................
............................
.....56
Chươ ng
ng 5 Xây dựng công cụ Web hỗ tr ợợ phân
phân tích dữ liệu cho các ứng dụng OLTP58
5.1. Phân tích, thiết k ế...................
.........................................
.............................................
.............................................
.................................
........... 58
5.1.1 Phân tích .....................................
............................................................
.............................................
............................................
...................... 58
5.1.1.1 Quy trình xử lý nghiệ p vụ: ...................
........................................
...........................................
..................................
............ 58
5.1.1.2 Yêu cầu chức năng:.............................................
...................................................................
.........................................
................... 60
5.1.1.3 Mô hình quan niệm dữ liệu:......................
.............................................
.............................................
............................
...... 66
4
5.1.2 Thiết k ế .....................
...........................................
............................................
.............................................
.........................................
.................. 72
5.1.2.1 Dữ liệu: ....................
..........................................
............................................
.............................................
........................................
................. 72
5.1.2.2 Kiến trúc module: ..................................
..........................................................
...............................................
..............................
....... 79
5.1.2.3 Hệ thống giao diện: ....................
...........................................
.............................................
...........................................
..................... 80
5.2. Cài đặt, lậ p trình.........................................
trình...............................................................
.............................................
....................................
............. 88
..........................................
.............................................
.............................................
.............................
....... 89
Đánh giá, bàn luận về k ết quả ....................
K ết luận - Hướ ng
ng phát triển ....................
..........................................
...........................................
...........................................
..................................
............ 91
Các k ết quả đã đạt đượ c ......................
...........................................
...........................................
............................................
..................................
............ 91
1. Về lý thuyết......................
............................................
.............................................
.............................................
...........................................
..................... 91
2. Về thực nghiệm ...................
.........................................
...........................................
...........................................
..........................................
.................... 91
Danh mục tài liệu tham khảo .....................
...........................................
.............................................
.............................................
.............................
....... 93
5
hiệu, chữ
chữ viế
viết tắ
tắt
Bảng các kí hiệ
Tiếếng Anh:
Ti
•
AMO :
Analysis Management Objects
•
BI:
Business Intelligence
•
DTS:
Data Transformation Services
•
ETL:
Extract – Transform - Load
•
HOLAP :
Hybrid OLAP
•
MDX:
Multi-dimensional Expressions
•
MOLAP :
Multidimensional OLAP
•
OLAP:
Online Analytical Processing
•
ROLAP :
Relational OLAP
SMO:
• SSAS:
•
SQL Server Management Objects
SQL Server Analysis Services
Tiếếng Việ
Ti
Việt:
•
CSDL:
Cơ s
sở d
dữ liệu
6
mục các bả
bảng biể
biểu
Bảng danh mụ
Bảng 1: So sánh các mô hình OLAP............................
..........................................
............................
............................
.................
...26
26
7
Bảng danh mụ
mục các hình vẽ
vẽ
Hình 1: Các dạng cơ s
sở d
dữ liệu ............
..........................
...........................
...........................
...........................
..........................
.................11
Hình 2: Ví dụ về một mẫu báo cáo cố định ............
.........................
..........................
..........................
........................
...........12
Hình 3: Minh họa vị trí của ứng dụng .........................
......................................
..........................
...........................
....................
......13
Hình 5:
4: Data
......................
...................................
...........................
...........................
...........................
...............
15
Hình
iểm của Data
Warehouse...........................
.....................
..................................
..........................
...........................
.....................
.........17
Đặc đWarehouse
Hình 6: Cấu trúc của Data Warehouse ..............
...........................
...........................
...........................
..........................
................
...19
Hình 7: Vị trí của OLAP ..........................
........................................
...........................
..........................
..........................
.........................
............19
Hình 8: Mô hình dữ liệu MOLAP ..........................
........................................
...........................
...........................
........................
..........22
Hình 9: Mô hình dữ liệu ROLAP.......................
....................................
...........................
...........................
..........................
.................23
Hình 10: Lượ c đồ hình sao.............
..........................
...........................
...........................
..........................
..........................
.....................
........ 24
Hình 11: Lượ c đồ hình bông tuyết ............
.........................
..........................
...........................
...........................
........................
...........24
Hình 12: Mô hình dữ liệu HOLAP ..........................
........................................
...........................
...........................
......................
........25
Hình 13: Ví dụ về Khối (Cube) ............
.........................
..........................
..........................
..........................
..........................
.................
....28
Hình 14: Ví dụ về ô r ỗng trong khối .............
...........................
...........................
..........................
..........................
....................
.......29
Hình 15: Ví dụ về các Dimension (Chiều) khác nhau ...........................
........................................
...................
......30
Hình 16: Fact Table ..................
................................
...........................
...........................
...........................
..........................
...........................
..............31
Hình 17: Slice..............................
...........................................
...........................
...........................
...........................
...........................
........................
...........32
Hình 18: Các đối tượ ng
ng trong SSAS ...............
............................
...........................
............................
............................
.................
...35
Hình 19: Pivot Table .......................
.....................................
............................
...........................
...........................
............................
...................
.....43
Hình 20: PivotChart ............
..........................
...........................
..........................
..........................
..........................
...........................
....................
......46
Hình 21: RadarCube OLAP ...........................
........................................
..........................
...........................
...........................
...................
......47
Hình 22: Data Dynamics Analysis .....
..................
...........................
...........................
..........................
...........................
..................
....48
Hình 23: ComponentOne OLAP for WinForm ...........................
.........................................
............................
................49
Hình 24: Devexpress ASPxPivotGrid ....................
..................................
...........................
...........................
........................
..........50
Hình 25: Mô hình xử lý nghiệ p vụ quản lý template ...............................
.............................................
.................
...59
Hình 26: Sơ đồ Use-Case mô tả hệ thống chức năng của Administrator .................
.................60
Hình 27: Sơ đồ Use-Case mô tả hệ thống chức năng của Designer .........................
.........................61
Hình 28: Sơ đồ User-Case mô tả hệ thống chức năng của Custom User .................
.................61
Hình 30:
29: S
Sơ
Use-Case mô
mô ttảả ch
chứứcc nnăăng
ng phân
quản quy
lý Template
..........................
.............
....................
.......62
62
ơ đồ
đồ Use-Case
Hình
.....
...................
......................
........
ền Template
........................................
.............63
Hình 31: Sơ đồ Use-Case mô tả chức năng quản lý Cube ...........................
Hình 32: Sơ đồ Use-Case mô tả chức năng phân quyền Cube ...........................
.................................
......63
Hình 33: Sơ đồ Use-Case mô tả chức năng quản lý User .......................
.....................................
..................
....64
Hình 34: Sơ đồ Use-Case mô tả chức năng quản lý Group ......................................
......................................65
Hình 35: Sơ đồ Use-Case mô tả chức năng quản lý Profile...........................
Profile......................................
...........65
Hình 36: Sơ đồ Use-Case mô tả chức năng cấu hình hệ thống .........................
.................................
........66
Hình 37: Mô hình quan niệm dữ liệu hệ thống OLAP........................
.....................................
......................
.........67
Hình 38: Mô hình vật lý .............
..........................
..........................
..........................
...........................
...........................
..........................
.............73
Hình 39: Màn hình chính phân hệ administrator ...........................
.........................................
...........................
.............80
Hình 40: Màn hình chức năng Copy Rights ...........................
.........................................
............................
....................
......81
8
Hình 41: Màn hình chức năng Active cube ..........................
.......................................
...........................
.......................
.........81
Hình 42: Màn hình chức năng Assign cube to group ...........................
.........................................
....................
......81
Hình 43: Màn hình chức năng Assign user to cube ...........................
.........................................
.......................
.........82
Hình 44: Màn hình chức năng List user ..........
.......................
...........................
...........................
...........................
..................
....82
Hình 45: Màn hình chức năng Assign Groups ...................
.................................
............................
.........................
...........83
Hình 46: Màn hình chức năng Assign Users ..........................
........................................
............................
....................
......83
Hình 48:
47: Màn
Màn hình
hình ch
chứứcc nnăăng
ng Assign
Import cube
............
...........................
...........................
.......................
.........
83
Hình
rights..........................
to profile
...........................
.............
............................
..................
....84
Hình 49: Màn hình chức năng Schedule ..........................
.......................................
...........................
...........................
...............84
Hình 50: Màn hình chức năng Setting Connection ..........
........................
............................
...........................
.............85
Hình 51: Màn hình chính phân hệ designer ..........................
.......................................
..........................
.......................
..........85
Hình 52: Màn hình chức năng Design template ..........................
........................................
............................
................86
Hình 53: Màn hình chức năng Export template ...........................
.........................................
............................
................86
Hình 54: Màn hình chức năng Assign template to user ..........................
........................................
..................
....87
Hình 55: Màn hình chính phân hệ custom user ...........................
........................................
...........................
..................87
9
nội dung luậ
luận vă
văn
Tóm ttắắt nộ
Tìm hiểu tổng quan về công nghệ OLAP
Tìm hiểu OLAP trong MS SQL Server Analysis Service (SSAS)
Tìm hiểu về component Pivot Table trong Excel
•
Pivot Table
•
PivotChart
Tìm hiểu các thư viện lậ p trình liên quan đến SSAS: MDX, AMO, SMO,
ADOMD.NET, ...
Xây dựng công cụ hỗ tr ợợ phân
phân tích dữ liệu cho các ứng dụng OLTP
10
đầu
u
Mở đầ
Giớ i
thiệu sơ l lượ cc::
Ngày nay, cách mạng thông tin và sự bùng nổ thông tin trên toàn cầu đã dẫn đến
các thực tr ạng như sau:
•
sở d
d ữ
ữ li
li ệu khác nhau
Dữ liệu: Đượ c lưu tr ữ ở nhi ều d ạng cơ s
dạạng cơ
cơ sở
sở dữ
dữ liệ
liệu
Hình 1: Các d
•
Nhiều hệ thống thông tin đượ c xây dựng gây ra hệ quả:
Những giao diện khác nhau
Những dạng biểu dữ liệu khác nhau
•
Thông tin trùng lặ p và không nhất quán
Trong khi đó, các phần mềm và hệ thống báo cáo thườ ng
ng chỉ cung cấ p
một số mẫu báo cáo cố đị nh
nh.
VD:
Báo cáo về điểm cuối kì của sinh viên
11
dụ
ụ v
vềề m
mộột mẫ
mẫu báo cáo cố
cố đị
định
nh
Hình 2: Ví d
Vậy tình huống đặt ra là ta sẽ xử lý như thế nào khi ngườ i dùng muốn:
Xem thêm thông tin về 1 thành phần nào đó trong CSDL ngoài những
thành phần đã có trên report
Xem report theo nhiều hình thức khác nhau, ngoài dạng table đã quá
quen thuộc
Không
Ý
còn cách nào khác h ơ n là ta phải tạo thêm 1 report mớ i !!!
tưở ng,
ng, lí do chọn đề tài:
Từ thực tr ạng trên, có thể thấy r ằng nhu cầu phân tích số li ệu để hỗ tr ợợ ra
các quyết định chiến lượ c một cách k ị p
p thờ i đã tr ởở nên
nên ngày càng cấ p thiết.
12
Trong môi tr ườ
ng kinh doanh hiện đại, các lãnh đạo doanh nghiệ p cần có
ườ ng
những thông tin mang tính qu ản tr ị chính xác, nhanh chóng và ở nhi
nhiều góc độ khác
nhau nhằm thực hiện việc ra quyết định kinh doanh hiệu quả.
Vì thế, ý tưở ng
ng của đề tài là sử dụng hệ thống OLAP k ết hợ p vớ i Data
warehouse để tạo ra 1 công cụ giúp ngườ i dùng - đặc biệt là nhà quản lý, những
ngườ i ra quyết định - dễ dàng khai thác, truy xuất đượ c các mẫu dữ liệu mà họ quan
tâm.
Hình 3: Minh họ
vị trí củ
của ứ ng
ng dụ
dụng
họa vị
Mục
đích đề tài
Xây dựng 1 công cụ phân tích dữ liệu tr ực tuyến trên nền web cho phép:
•
Phân tích số liệu dựa trên nhiều chỉ tiêu, yếu tố.
13
•
Có hệ thống phân quyền chặt chẽ về chức năng và dữ liệu trên ngườ i
dùng lẫn nhóm ngườ i dùng
•
Có hệ thống report, chart,... tr ực quan, đa dạng, hỗ tr ợ
kéo thả
ợ kéo
•
Có hệ thống template giúp ngườ i dùng dễ dàng hơ n trong quá trình xem
và phân tích dữ liệu
• Có chức năng Import, Export template, dữ liệu,... phục vụ cho nhu cầu
chuyển đổi giữa các hệ thống khác nhau
•
Tùy theo nhu cầu / lựa chọn của ngườ i sử dụng khi phân tích số liệu.
•
Độc lậ p vớ i hệ thống cơ s
sở d
dữ liệu của ngườ i dùng
Đối
tượ ng
ng và phạm vi nghiên cứ u
•
Công nghệ Data Warehouse và OLAP
• Các mô hình OLAP: MOLAP, ROLAP, HOLAP
•
Tìm hiểu OLAP trong MS SQL Server Analysis Service (SSAS)
•
Quy trình thiết k ế các đối tượ ng
ng trong SSAS: Data Source, Data Source
View, Cube, Dimension, ...
•
Component Pivot Table và PivotChart trong Excel
•
Các thư viện lậ p trình liên quan đến SSAS:
MDX, AMO, SMO,
ADOMD.NET,...
•
phân tích dữ liệu cho các ứng dụng OLTP
ợ phân
Xây dựng công cụ hỗ tr ợ
14
sở lý
lý thuyế
thuyết
Cơ sở
Chươ ng
Chươ
ng 1 Công nghệ
nghệ OLAP
1.1 Gi
Giớ
thiệu về
về Data Warehouse
ớ i thiệ
1.1.1 Định ngh ĩ a
Hình 4: Data Warehouse
Kho dữ liệu (data warehouse), gọi một cách chính xác hơ n là kho thông tin
(information warehouse), là một cơ s
sở d
dữ liệu hướ ng
ng đối tượ ng
ng đượ c thiết k ế vớ i
việc tiế p cận các ý kiến trong mọi l ĩ ĩ nh
nh vực kinh doanh. Nó cung cấ p các công cụ
để đáp ứng thông tin cần thiết cho các nhà quản tr ị kinh doanh tại mọi cấ p độ tổ
chức - không những chỉ là những yêu cầu dữ liệu phức hợ p, mà còn là điều kiện
thuận tiện nhất để đạt đượ c việc lấy thông tin nhanh, chính xác.
15
Là một sự pha tr ộn c ủa nhiều công nghệ, bao gồm các cơ ssở ddữ liệu đa chiều và
mối quan hệ giữa chúng, kiến trúc chủ khách, giao diện ngườ i dùng đồ họa,...
Kho dữ li ệu thườ ng
ng r ất lớ n tớ i hàng tr ăm GB hay thậm chí hàng Terabyte. Kho
dữ liệu đượ c xây dựng để tiện lợ i cho việc truy cậ p theo nhiều nguồn, nhiều kiểu
dữ liệu khác nhau sao cho có thể k ết hợ p đượ c cả những ứng dụng của các công
nghệ hiện đại và k ế thừa đượ c từ những hệ thống đã có sẵn từ tr ướ
ướ cc..
1.1.2 Ý ngh ĩ a của Data Warehouse
Truy cậ p dữ liệu một cách thống nhất :
•
Thu thậ p và k ết hợ p thông tin.
•
Cung cấ p một khung nhìn tích hợ p
•
Giao diện ngườ i sử dụng không biến đổi
•
Hỗ tr ợ
khả năng chia sẻ.
ợ kh
Dữ liệu đượ c tích hợ p và tổ chức:
•
Làm cho hệ thống tr ở
nên dễ hiểu
ở nên
•
Rõ ràng
•
Dễ phân tích
Chuyển đổi dữ liệu thành thông tin: cung c ấ p thông tin chính xác đúng thờ i điểm
và đúng định dạng
1.1.3 Đặc điểm của Data Warehouse
16
Hình 5: Đặc điểm c a Data W rehouse
Tích hợ (Integrat d):
Dữ liệu ậ p hợ p từ nhiều nguồn khác n au trong
ột tổ chức/công ty à đã đượ c
đồng nh t, xắ p xế , rút gọn.
ng v nhất quá
Là một tậ p hợ
p th ng tin chí h xác, ch t lượ ng
Chuẩn hóa :
Các qui ướ tên
•
Các thuộc t nh
•
ng
Các đơ n vị o lườ ng
•
ng ứng dụng sang hướ ng
Hướ ng
ng hủ thể ( ubject-ori nted): Chuyển từ h ớ ng
ng h
tr ợ
ợ quy
quyế định
Đượ c tổ ch c xung q anh các c ủ thể chí h, như kh ch hàng (customer),
•
s n phẩm ( roduct), b n hàng (s les).
Tậ p trung vào việc m hình hó và phân tích dữ liệ cho các hà đưa r
•
q yết định, mà không tậ p trung vào các h ạt động h ay các xử lý toàn tác
1
h ng ngày.
Cung cấ p
•
ột khung nhìn đơ n iản và súc tích xung quanh các sự kiện
c a các chủ thể
Biến th i gian (Ti e-varian ): Các dữ liệu đượ c định ngh ĩ a vào một thờ i điểm
xác định và đượ c hi chép l i phục v ụ cho việc o sánh d liệu theo chiều thờ i
gian
êu cầu qu n tr ọng đ i vớ i kho dữ liệu là hạm vi v thờ i gian dài hơ n so
•
v i các hệ t ống tác n hiệ p :
Cơ ssở d
dữ li u tác nghiệ p: dữ liệu chỉ có gi tr ị hiện thờ i
ữ li ệu của kho dữ li u: cung c p thông tin l ịch sử (ví d ụ như,
5-10 năm tr ớ cc))
•
ếu tố thờ i gian đượ c lưu tr ữ trong CSDL
Cố định (Non-vol tile ): dữ liệu có th đượ c thêm vào nh ng không đượ c sử
uản lý có thể tổng hợ p công việc kinh
chữa hoặc xóa bỏ. Nhằm giúm nhà
doanh c a toàn tổ hức/công ty.
1
1.1.4 Cấu trúc của Data Warehouse
Hình 6: Cấ
Cấu trúc củ
của Data Warehouse
Một Data warehouse đượ c cấu tạo từ một hay nhiều cube (khái niệm này sẽ đề
cậ p ở ph
phần sau).
Enterprise Data warehouse: tậ p hợ p toàn b ộ thông tin về các đối tượ ng
ng của toàn
tổ chức/công ty. Ví dụ: sản phẩm, khách hàng, doanh thu …
Data mart (kho dữ liệu chủ đề): là một tậ p con của Data warehouse, chỉ tậ p trung
vào những đối tượ ng
ng đượ c chọn.
1.2 T
Tổổng quan về
về OLAP
1.2.1 Giớ i thiệu
Hình 7: Vị
Vị trí củ
của OLAP
19
Nếu
hệ thống xử lý chuyển giao dữ li
l iệu OLTP tậ p trung vào việc thu thậ p, lưu
tr ữ và biến đổi dữ liệu một cách chuẩn xác, thì OLAP tậ p trung vào việc sử dụng
các dữ liệu đã đượ c biến đổi vào việc ra quyết định s ản xu ất kinh doanh. OLAP
là một mục trong các phần m ềm c ơ s
s ở d
d ữ li ệu cung cấ p giao diện qua đó ng ườ i
sử dụng có thể biến đổi hoặc giớ i hạn các dữ liệu sơ khai
khai tuỳ theo các hàm đã
a, sau đó nhanh chóng kiểm
định ngh ĩ a hoặc do chính ngườ i sử dụng định ngh ĩ a,
tra các k ết quả trong các chiều khác nhau của dữ liệu
Hệ thống OLAP là một hệ thống quản lý dữ liệu giàu năng lực. Nó cho phép
ngườ i sử dụng phân tích dữ liệu qua việc cắt lát (slice) dữ liệu theo nhiều khía
cạnh khác nhau, khoan xuống (drill down) mức chi tiết hơ n hay cuộn lên (roll
up) mức tổng hợ p hơ n của dữ liệu. Bản chất cốt lõi của OLAP là dữ liệu đượ c
lấy ra từ Data warehouse hoặc từ Datamart sau đó đượ c chuyển thành mô hình
đa chiều và đượ c lưu tr ữ trong một kho dữ liệu đa chiều.
Cụ thể, OLAP là một k ỹ thuật sử dụng các thể hiện dữ liệu đa chiều gọi là các
khố i (cube)
nhằm cung cấ p khả năng truy xuất nhanh đến dữ liệu của kho dữ
liệu. Tạo khối cho dữ liệu trong các bảng chiều (dimension table) và bảng sự
kiện (fact table) trong kho dữ li ệu để cung cấ p khả n ăng thực hi ện các truy vấn
tinh vi và phân tích cho các ứng dụng client.
OLAP cung cấ p nhiều lợ i ích cho ngườ i phân tích, cho ví dụ như:
•
Cung cấ p mô hình dữ liệu đa chiều tr ực quan cho phép dễ dàng lựa chọn,
ng và khám phá dữ liệu.
định hướ ng
•
Cung cấ p m ột ngôn ngữ truy vấn phân tích, cung cấ p s ức m ạnh để khám
phá các mối quan hệ trong dữ liệu kinh doanh phức tạ p.
•
Dữ liệu đượ c tính toán tr ướ
ng xuyên nhằm
ướ c đối vớ i các truy vấn thườ ng
làm cho thờ i gian tr ả lờ i r ất nhanh đối vớ i các truy vấn đặc biệt.
20
•
Cung cấ p các công c ụ mạnh giúp ngườ i dùng tạo các khung nhìn mớ i của
dữ liệu dựa trên một tậ p các hàm tính toán đặc biệt.
•
Hỗ tr ợ
ợ tạo mô hình chức năng để dự báo, phân tích xu th ế phát triển và
phân tích thống kê.
•
Tìm kiếm và hiển thị dữ liệu dướ i dạng biểu đồ, không gian 2D, 3D, …
OLAP đượ c đặt ra để x ử lý các truy v ấn liên quan đến l ượ ng
ng d ữ li ệu r ất l ớ n mà
nếu cho thực thi các truy vấn này trong hệ thống OLTP sẽ không thể cho k ết quả
hoặc sẽ mất r ất nhiều thờ i gian.
1.2.2 Đặc điểm của OLAP:
Đượ c biết đến như là một phần của kho dữ liệu
Cung cấ p các báo cáo, phân tích tiền tính toán, các đồ thị, biểu đồ
Cho phép phân tích tr ực tuyến dữ liệu
Thăm dò sự tươ ng
ng tác dữ liệu
Cung cấ p các giao diện đa dạng cho ngườ i dùng
Cung cấ p khả năng phân tích dữ liệu phức tạ p bằng phươ ng
ng thức đơ n giản
1.3 Các mô hình OLAP
1.3.1 MOLAP (Multidimen
(Multidimensional
sional OLAP)
Mô hình MOLAP lưu tr ữ d ữ li ệu c ơ s
s ở (là
(là dữ li ệu t ừ các bảng của kho dữ li ệu)
và thông tin tổng hợ p (là các độ đo đượ c tính toán từ các bảng) trong các khối
21
Hình 8: Mô hình dữ li
liệu M LAP
Dữ liệu ượ c tìm t ấy tại điể
giao củ các chiều
Dữ liệu rong MO AP cần p ải đượ c process sau một thờ i ian nhất ịnh để cậ p
nhật lại hững dữ liệu mớ i tr ng Data
arehouse.
liệu th o thờ i gian dài.
MOLA thích hợ p cho các truy vấn ổng hợ p ữ li
p doanh thu của từng chi nhánh tro g vòng 2 ăm tr ở
Ví d ụ: tổng hợ
ở llại.
1.3.2 R LAP ( elational OLAP)
Mô hìn OLAP q an hệ (R LAP) lư tr ữ dữ li u cơ sở và thông ti tổng hợ
p
trong cá bảng qu n hệ
2
liệu R LAP
Hình 9: Mô hình dữ li
Dữ liệu ượ c tìm t ấy tại điể
Có 2 kiểu mô hình dữ liệu:
giao củ 1 cột và
một hàng
Lượ c đồ hì h sao (st r): mỗi một chiều c ỉ đượ c x y dựng từ một bảng
•
c iều
2
Lượ
ượ c đồ
đồ hình
hình sao
Hình 10: L
•
Lượ c đồ hình bông tuyết (snowflake): mỗi chiều đượ c xây dựng từ nhiều
bảng chiều
Hình 11: L
Lượ
ượ c đồ
đồ hình
hình bông tuyế
tuyết
ROLAP thích hợ
hợ p cho các truy vấ
vấn dữ liliệệu theo thờ
thờ i gian thự
thự c (xảy ra
thườ ng
ng xuyên và đòi hỏi độ chính xác tức thờ ii).
).
Ví d ụ: xem thông tin chứng khoán
24