Tải bản đầy đủ (.docx) (34 trang)

(Tiểu luận) báo cáo cuối kỳ môn kho dữ liệu xây dựng kho dữ liệu cho bài toán phân tích dữ liệu bán hàng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (824.63 KB, 34 trang )

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &
TRUYỀN THÔNG VIỆT HÀN

Khoa Khoa Học Máy Tính

Báo cáo cuối kỳ mơn Kho dữ liệu

XÂY DỰNG KHO DỮ LIỆU CHO BÀI
TỐN PHÂN TÍCH DỮ LIỆU BÁN
HÀNG
Sinh viên thực hiện:

Đà Nẵng, tháng 5 năm 2023
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN &

i


TRUYỀN THƠNG VIỆT HÀN

Khoa Khoa Học Máy Tính

Báo cáo cuối kỳ mơn Kho dữ liệu

ĐỀ TÀI: QUẢN LÝ BÁN Ơ TÔ

Sinh viên thực hiện:

Đà Nẵng, tháng 5 năm 2023

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN



……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
ii


……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………………………………
……………………………………………

TP.Đà Nẵng, ngày… tháng…
năm…

GIẢNG
DẪN

LỜI CẢM ƠN


iii

VIÊN

HƯỚNG


MỤC LỤC
MỞ ĐẦU..............................................................................................1
1.Giới thiệu................................................................................... 1

2. Mục tiêu của đề tài..................................................................... 1
3. Nội dung thực hiện....................................................................2
4. Bố cục báo cáo..........................................................................3
Chương 1. TỔNG QUAN VỀ ĐỀ TÀI...................................................4
1. Giới thiệu chung về đề tài..........................................................4
2. Giới thiệu về SQL Server management studio.............................5
CHƯƠNG 2. PHÂN TÍCH VÀ THIẾT KẾ KHO DỮ LIỆU....................... 8
1.Khái niệm................................................................................... 8

1.1 Thực thể đo lường và số nguyên................................... 8
1.2 Thứ bậc của kích thước...................................................9
1.3 Sơ đồ mơ hình khái niệm..............................................10
2.Mơ hình logic.............................................................................11
Chương 3. TRIỂN KHAI KHO DỮ LIỆU.............................................20
1.Mơ hình SSIS............................................................................ 20
2.Q trình ETH............................................................................21

KẾT LUẬN.........................................................................................22

1. Kết quả đạt được......................................................................22
2. Các hạn chế.............................................................................23
3. Hướng phát triển......................................................................24

iv


MỞ ĐẦU
1. Giới thiệu
Tôi đang thực hiện nghiên cứu về quản lý bán xe ô tô và xây dựng một
kho dữ liệu liên quan. Đề tài này quan trọng trong ngành ơ tơ vì quản lý bán
xe ơ tơ là một quá trình phức tạp và quan trọng trong việc đảm bảo hoạt động
kinh doanh hiệu quả và cạnh tranh.
Quản lý bán xe ơ tơ địi hỏi khả năng thu thập, quản lý và phân tích
thơng tin khách hàng, quản lý sản phẩm, quản lý đặt hàng, quản lý kho và
nhiều khía cạnh khác. Việc triển khai một hệ thống quản lý bán xe ơ tơ hiệu
quả có thể mang lại nhiều lợi ích cho các doanh nghiệp trong ngành ô tô.
Qua đề tài lần này, chúng tôi mong muốn cung cấp một cái nhìn tổng
quan và chi tiết về cách quản lý bán xe ơ tơ có thể được tối ưu hóa thơng
qua việc sử dụng kho dữ liệu. Sự hiểu biết về các khía cạnh quản lý bán xe ô
tô và triển khai hệ thống quản lý bán xe ô tô hiệu quả sẽ giúp các doanh
nghiệp trong ngành ô tô nắm bắt được xu hướng thị trường và tối ưu hóa
quy trình bán hàng , từ đó tăng cường sự cạnh tranh và nâng cao hiệu quả
kinh doanh.
Trên hành trình tìm hiểu và triển khai quản lý bán xe ơ tơ, chúng tơi đã
nhận thấy rằng có nhiều thách thức phải đối mặt. Một trong những thách thức
đó là quản lý dữ liệu khách hàng phức tạp. Việc thu thập và quản lý thông tin
cá nhân, lịch sử mua hàng, yêu cầu và sở thích cá nhân của khách hàng đòi
hỏi một hệ thống quản lý dữ liệu mạnh mẽ và an toàn để đảm bảo quyền
riêng tư và xử lý thơng tin một cách chính xác.


2. Mục tiêu của đề tài
Mục tiêu của đề tài là cung cấp một cái nhìn tổng quan và chi tiết về
quản lý bán xe ô tô và triển khai hệ thống quản lý hiệu quả. Chúng em muốn
nghiên cứu và đưa ra các phương pháp, quy trình và cơng nghệ phù hợp để
tối ưu hóa quy trình bán hàng ơ tô, từ khâu thu thập thông tin khách hàng đến
quản lý sản phẩm, đặt hàng và
1


quản lý kho. Mục tiêu chính là tăng cường khả năng cạnh tranh và hiệu quả
kinh doanh của các doanh nghiệp ô tô.
Chúng em cũng muốn đề cập đến sự quan trọng của việc xử lý dữ liệu
khách hàng một cách chính xác và an tồn, đồng thời tận dụng thông tin này
để tạo ra các chiến lược tiếp thị và dịch vụ cá nhân hóa cho khách hàng.
Ngồi ra, mục tiêu của chúng tôi là nghiên cứu và đưa ra các phương pháp
phân tích dữ liệu và cung cấp cái nhìn tổng quan về thị trường ơ tơ, từ đó
giúp các doanh nghiệp ơ tơ nắm bắt được xu hướng tiêu dùng và đưa ra
quyết định kinh doanh thông minh.
Cuối cùng, mục tiêu của chúng em là đề xuất và triển khai một hệ
thống quản lý bán xe ô tơ hiệu quả, có khả năng tích hợp với các hệ thống
khác trong doanh nghiệp và cung cấp thông tin và dữ liệu chính xác, đáng tin
cậy và dễ quản lý. Chúng tôi hy vọng rằng đề tài này sẽ đóng góp vào việc
nâng cao quy trình bán hàng ơ tô và đạt được sự cạnh tranh và thành công
bền vững trong ngành ơ tơ.
3. Nội dung thực hiện
Tìm hiểu về quản lý bán xe ô tô:
Nghiên cứu về quy trình bán xe ơ tơ, từ việc tiếp cận khách hàng đến giao
dịch và hậu mãi.
Xác định các yêu cầu và nhu cầu của doanh nghiệp ô tô trong quản lý bán

hàng.
Phân tích và thiết kế kho dữ liệu:
Xác định các thực thể quan trọng trong quản lý bán xe ô tô như khách hàng,
sản phẩm, đơn hàng, kho,..
Thiết kế mơ hình logic và mơ hình vật lý cho kho dữ liệu, bao gồm các bảng,
quan hệ, khóa chính và khóa ngoại.
Xây dựng cơ sở dữ liệu:
Tạo các bảng dữ liệu trong cơ sở dữ liệu sử dụng SQL Server Management
Studio (SSMS).
Định nghĩa kiểu dữ liệu cho các cột trong bảng và thiết lập các ràng buộc dữ
liệu.
Xử lý dữ liệu:
2


Thu thập dữ liệu khách hàng, sản phẩm và đơn hàng từ các nguồn khác
nhau.
Thực hiện các truy vấn SQL để nhập, cập nhật và truy xuất dữ liệu trong cơ
sở dữ liệu.
Tối ưu hóa quy trình bán hàng:
Đề xuất các cải tiến và tối ưu hóa quy trình quản lý bán hàng ơ tơ, bao gồm
quy trình đặt hàng, xử lý đơn hàng, quản lý kho, v.v.
Áp dụng các phương pháp và công nghệ phù hợp để tăng cường hiệu suất
và khả năng cạnh tranh trong quy trình bán hàng.
Đánh giá hiệu quả:
Đánh giá hiệu quả của hệ thống quản lý bán xe ô tô được triển khai, bao gồm
khả năng tăng trưởng doanh số, cải thiện trải nghiệm khách hàng, giảm thiểu
lỗi và sai sót, v.v.
Phân tích dữ liệu và đưa ra nhận xét, kết luận về quy trình quản lý bán hàng
ơ tơ và hiệu quả của hệ thống.


4. Bố cục báo cáo
Sau phần Mở đầu, báo cáo được trình bày trong ba chương, cụ thể như sau:
Chương 1. Tổng quan về đề tài Trong chương này, báo cáo trình bày các
khái niệm, đặc điểm, tổng kết.
Chương 2. Phân tích thiết kế kho dữ liệu.
Chương 3. Triển khai kho dữ liệu.
Cuối cùng là Kết luận, Tài liệu tham khảo và Phụ lục liên quan đến đề tài.

3


Chương 1. TỔNG QUAN VỀ ĐỀ TÀI
1.

Giới thiệu chung về đề tài

1.1.

Mục tiêu đề tài

Mục tiêu chính của báo cáo này là tìm hiểu sâu về quản lý bán xe ô tô
và đưa ra các phương pháp và giải pháp để triển khai một hệ thống quản lý
bán hàng hiệu quả trong ngành ô tô. Báo cáo sẽ nghiên cứu các khía cạnh
chính của quản lý bán hàng ơ tơ, bao gồm thu thập thông tin khách hàng,
quản lý sản phẩm, quản lý đặt hàng và quản lý kho.
Chúng ta sẽ tìm hiểu cách thu thập thơng tin khách hàng một cách
chính xác và hiệu quả, từ việc xác định nhu cầu và ưu tiên của khách hàng
đến việc xây dựng hồ sơ khách hàng chi tiết và theo dõi tương tác với họ.
Quản lý thông tin khách hàng đáng tin cậy sẽ giúp chúng ta xây dựng mối

quan hệ lâu dài và tạo trải nghiệm tốt cho khách hàng.
Cùng với đó, báo cáo sẽ tập trung vào quản lý sản phẩm ô tô, từ việc
xác định và theo dõi danh sách sản phẩm, thơng tin kỹ thuật và tính năng
đến việc quản lý thông tin về giá cả và khuyến mãi.
Quản lý sản phẩm một cách chính xác và hiệu quả sẽ giúp chúng ta đáp
ứng nhu cầu của khách hàng và tối ưu hóa q trình bán hàng.
Ngồi ra, báo cáo sẽ đi sâu vào quản lý đặt hàng và quản lý kho.
Chúng ta sẽ tìm hiểu cách quản lý quá trình đặt hàng từ khách hàng, theo dõi
tình trạng đơn hàng và đảm bảo giao hàng đúng thời hạn. Đồng thời, quản lý
kho đóng vai trị quan trọng trong việc kiểm soát và theo dõi lượng hàng tồn
kho, tối ưu hóa việc quản lý dự trữ và đảm bảo sẵn sàng hàng hóa khi có nhu
cầu.
1.2. Lý do chọn đề tài
Lý do tôi đã chọn đề tài quản lý bán xe ơ tơ là vì sự quan trọng và sự
phát triển mạnh mẽ của ngành ô tô. Ngành ô tô là một trong những ngành
công nghiệp quan trọng và đóng góp lớn vào nền kinh tế của nhiều quốc gia
trên thế giới. Việc quản lý bán hàng ô tô đóng
4


vai trò then chốt trong việc đạt được sự thành công và bền vững trong thị
trường cạnh tranh ngày nay.
Quản lý bán xe ô tô không chỉ đơn thuần là quy trình bán hàng, mà cịn
liên quan đến việc xây dựng mối quan hệ với khách hàng, đáp ứng nhu cầu
và mong muốn của họ, tạo trải nghiệm mua hàng tốt và duy trì sự hài lịng
sau khi mua xe. Quản lý bán hàng ơ tơ địi hỏi sự chun nghiệp, hiệu quả và
sự tinh tế trong việc quản lý thông tin khách hàng, quản lý sản phẩm, quản lý
đặt hàng và quản lý kho.
Bên cạnh sự phát triển của ngành ô tô, việc áp dụng công nghệ thông
tin và hệ thống quản lý hiện đại đã trở thành một yếu tố quyết định để nâng

cao hiệu suất và cạnh tranh trong ngành này. Triển khai một hệ thống quản lý
bán hàng ô tô hiệu quả giúp tăng cường quy trình quản lý, tối ưu hóa việc thu
thập, lưu trữ và xử lý thông tin khách hàng, cũng như tối ưu hóa việc quản lý
sản phẩm, đặt hàng và kho hàng.

Việc nghiên cứu và triển khai một hệ thống quản lý bán hàng ô tô hiệu
quả không chỉ mang lại lợi ích cho doanh nghiệp ơ tơ mà cịn đem lại lợi ích
cho khách hàng. Khách hàng sẽ được trải nghiệm một quy trình mua hàng
sn sẻ, dễ dàng và tận hưởng dịch vụ chăm sóc sau bán hàng tốt. Điều này
tạo ra sự tin tưởng và thúc đẩy khách hàng trung thành, góp phần vào sự
phát triển và tăng trưởng của doanh nghiệp ô tô.

2. Giới thiệu về SQL Server management studio
SQL Server Management Studio (SSMS) là một công cụ quản lý cơ sở
dữ liệu mạnh mẽ được phát triển bởi Microsoft. Được thiết kế đặc biệt để
làm việc với SQL Server, SSMS cung cấp một giao diện đồ họa trực quan và
các tính năng tiện ích cho việc quản lý, phân tích và triển khai cơ sở dữ liệu.
SSMS cho phép quản trị viên cơ sở dữ liệu và nhà phát triển tương tác
với SQL Server một cách dễ dàng và thuận tiện. Dưới đây là một số tính
năng chính của SSMS:
5


Kết nối và quản lý cơ sở dữ liệu: SSMS cho phép bạn kết nối và quản
lý các cơ sở dữ liệu SQL Server từ một giao diện duy nhất. Bạn có thể tạo,
sửa đổi và xóa cơ sở dữ liệu, bảng, trường và ràng buộc. SSMS cung cấp
các công cụ để sao lưu và phục hồi cơ sở dữ liệu, kiểm soát phiên bản và
quản lý quyền truy cập.
Truy vấn và xử lý dữ liệu: SSMS cho phép bạn thực hiện truy vấn dữ
liệu bằng cách sử dụng ngôn ngữ truy vấn SQL. Bạn có thể viết và chạy các

câu lệnh SELECT, INSERT, UPDATE và DELETE để truy xuất và thay đổi dữ
liệu trong cơ sở dữ liệu. SSMS cung cấp chế độ xem kết quả trực quan và
các công cụ xử lý dữ liệu mạnh mẽ như nhập và xuất dữ liệu.
Thiết kế và quản lý các đối tượng cơ sở dữ liệu: SSMS cho phép bạn
thiết kế và quản lý các đối tượng cơ sở dữ liệu như bảng, chế độ xem, thủ
tục lưu trữ và hàm. Bạn có thể tạo mới, sửa đổi và xóa các đối tượng này
một cách dễ dàng. SSMS cung cấp các công cụ để kiểm tra và xử lý các ràng
buộc, quan hệ và chỉ mục của các đối tượng.
Xem và giám sát hoạt động: SSMS cung cấp các báo cáo và công cụ
giám sát cho phép bạn theo dõi và đánh giá hiệu suất hoạt động của SQL
Server. Bạn có thể xem các thông số về tài nguyên hệ thống, các truy vấn
đang chạy, lịch sử hoạt động và các sự kiện.
Xử lý tập tin và dữ liệu: SSMS cung cấp các công cụ cho việc quản lý
tập tin và dữ liệu trong SQL Server. Bạn có thể sao chép, di chuyển và xóa
các tệp tin và thư mục trên máy chủ SQL Server. SSMS cũng hỗ trợ nhập và
xuất dữ liệu từ các định dạng khác nhau như CSV, Excel, và XML.
Lập lịch và tự động hóa: SSMS cho phép bạn lập lịch và tự động hóa
các tác vụ quản lý cơ sở dữ liệu. Bằng cách sử dụng SQL Server Agent, bạn
có thể đặt lịch trình thực thi các cơng việc như sao lưu, kiểm tra tồn vẹn dữ
liệu và xử lý dữ liệu. Điều này giúp giảm thiểu sự can thiệp thủ cơng và tăng
tính tự động trong quản lý cơ sở dữ liệu.
Tích hợp với cơng cụ phát triển ứng dụng: SSMS hỗ trợ tích hợp với
các công cụ phát triển ứng dụng như Visual Studio. Điều này cho phép nhà
phát tiển kết hợp công cụ quản lý cơ sở dữ liệu và công cụ
6


phát triển trong một môi trường duy nhất, giúp tăng cường hiệu suất và hiệu
quả làm việc.
Hỗ trợ kết nối từ xa: SSMS cung cấp khả năng kết nối và quản lý cơ sở

dữ liệu từ xa. Bạn có thể thiết lập kết nối tới máy chủ SQL Server ở xa thông
qua giao thức mạng và quản lý cơ sở dữ liệu từ xa một cách an tồn và
thuận tiện.
Tóm lại, SQL Server Management Studio (SSMS) là một công cụ quản
lý cơ sở dữ liệu mạnh mẽ và đa chức năng. Với giao diện đồ họa trực quan,
SSMS cho phép quản trị viên và nhà phát triển tương tác với SQL Server một
cách dễ dàng và hiệu quả. Tính năng đa dạng của SSMS từ quản lý cơ sở
dữ liệu, truy vấn dữ liệu, thiết kế đối tượng, giám sát hoạt động, xử lý tập tin
và dữ liệu, lập lịch tự động hóa và tích hợp với cơng cụ phát triển ứng dụng
làm cho nó trở thành một cơng cụ khơng thể thiếu cho việc quản lý SQL
Server.

Hình 1.1 : Giao diện SQL Server

7


CHƯƠNG 2. PHÂN TÍCH VÀ THIẾT KẾ
KHO DỮ LIỆU
1.Khái niệm
1.1 Thực thể đo lường và số nguyên
Trong bối cảnh kho dữ liệu và kinh doanh thông minh, "đo lường"
và "thứ ngun" là hai khái niệm cơ bản đóng vai trị quan trọng trong
việc tổ chức và phân tích dữ liệu.
Đo lường: Một thước đo đại diện cho một giá trị số hoặc một thuộc
tính định lượng được sử dụng để phân tích và tính tốn. Các biện pháp
thường là các giá trị mà chúng tơi muốn phân tích, chẳng hạn như doanh
thu bán hàng, số lượng đã bán, lợi nhuận hoặc giá trung bình. Các thước đo
thường được liên kết với các hàm tổng hợp, chẳng hạn như tổng, trung
bình, số đếm hoặc tối đa/tối thiểu, cho phép chúng tôi thực hiện các phép

tính và rút ra thơng tin chi tiết từ dữ liệu.

Ví dụ: trong bối cảnh quản lý doanh số bán ơ tơ, các biện pháp có thể
bao gồm tổng doanh thu được tạo ra, số lượng ô tơ đã bán hoặc giá trung
bình của ơ tơ đã bán. Các biện pháp này cung cấp
8


thơng tin định lượng có thể được tổng hợp và phân tích để hiểu hiệu suất
của quy trình bán hàng.
Thứ ngun: Thứ ngun đại diện cho thuộc tính mơ tả hoặc danh
mục cung cấp ngữ cảnh và thông tin bổ sung về các biện pháp. Thứ nguyên
được sử dụng để cung cấp các khía cạnh "ai, cái gì, khi nào, ở đâu và như
thế nào" của dữ liệu. Chúng giúp tổ chức, lọc và nhóm dữ liệu để phân tích.

Thứ nguyên thường được sử dụng để cắt và chia nhỏ dữ liệu để đạt
được các quan điểm khác nhau. Các kích thước phổ biến bao gồm thời gian,
địa lý, sản phẩm, khách hàng và nhân viên. Ví dụ: trong kịch bản bán ơ tơ,
các thứ ngun có thể bao gồm thứ nguyên thời gian (ví dụ: năm, quý,
tháng), thứ nguyên sản phẩm (ví dụ: hãng xe, kiểu xe), thứ nguyên khách
hàng (ví dụ: tên khách hàng, thơng tin nhân khẩu học), và thứ nguyên vị trí
(ví dụ: thành phố, vùng).
Thứ nguyên cung cấp bối cảnh và mức độ chi tiết để phân tích các
biện pháp. Chúng giúp phân đoạn dữ liệu, đi sâu vào các tập hợp con cụ thể
và lọc dữ liệu dựa trên các tiêu chí khác nhau. Thứ ngun cũng đóng một
vai trị quan trọng trong việc xác định cấu trúc phân cấp, cho phép người
dùng điều hướng qua các cấp độ chi tiết khác nhau trong một thứ nguyên.

Tóm lại, thước đo đại diện cho các giá trị số mà chúng tơi muốn phân
tích, trong khi thứ ngun cung cấp các thuộc tính mơ tả bổ sung ngữ cảnh

và cho phép phân tích từ các quan điểm khác nhau. Sự kết hợp của các
biện pháp và kích thước tạo thành nền tảng cho phân tích và báo cáo đa
chiều trong kho dữ liệu và kinh doanh thông minh.

9


1.2 Thứ bậc của kích thước
Trong bối cảnh lưu trữ dữ liệu và mơ hình hóa thứ ngun, hệ thống
phân cấp thứ nguyên đề cập đến việc tổ chức các thuộc tính thứ ngun
theo cách có cấu trúc và thứ bậc. Thứ nguyên đại diện cho một loại dữ liệu
cung cấp ngữ cảnh bổ sung hoặc thông tin mô tả cho các sự kiện trong kho
dữ liệu. Ví dụ về thứ nguyên bao gồm thời gian, địa lý, sản phẩm và khách
hàng.
Hệ thống phân cấp cho phép nhóm hợp lý và tổ chức các thuộc tính
thứ nguyên dựa trên mức độ chi tiết hoặc mức độ chi tiết của chúng. Chúng
xác định các mối quan hệ và sự phụ thuộc giữa các thuộc tính trong một thứ
nguyên. Một hệ thống phân cấp thường bao gồm nhiều cấp độ, với mỗi cấp
độ đại diện cho một cấp độ chi tiết hoặc tổng hợp khác nhau.

Ví dụ, xem xét một chiều thời gian. Nó có thể có một hệ thống phân
cấp bao gồm các cấp độ như Năm, Quý, Tháng, Tuần và Ngày. Mỗi cấp độ
đại diện cho một mức độ chi tiết thời gian khác nhau, với Năm là cấp độ cao
nhất và Ngày là cấp độ thấp nhất.
Hệ thống phân cấp cung cấp một số lợi ích trong phân tích dữ liệu và
báo cáo:
Truy sâu xuống và cuộn lên: Người dùng có thể điều hướng qua hệ thống
phân cấp để phân tích dữ liệu ở các mức độ chi tiết khác nhau. Họ có thể đi
sâu từ tóm tắt cấp cao hơn đến dữ liệu chi tiết hơn hoặc cuộn lên từ dữ liệu
chi tiết đến tóm tắt cấp cao hơn. Điều này cho phép phân tích linh hoạt và

năng động.
Tổng hợp và tóm tắt: Hệ thống phân cấp cho phép tổng hợp và tóm tắt
dữ liệu ở các cấp độ khác nhau. Người dùng có thể xem dữ liệu ở mức tổng
quan cao hoặc đi sâu vào để kiểm tra các chi tiết cụ thể. Điều này hỗ trợ báo
cáo và phân tích hiệu quả.
Khám phá và điều hướng dữ liệu: Hệ thống phân cấp cung cấp một
cách có cấu trúc và trực quan để khám phá và điều hướng dữ
10


liệu. Người dùng có thể dễ dàng điều hướng qua các cấp để hiểu rõ hơn và
hiểu mối quan hệ giữa các thuộc tính khác nhau.
Tính nhất quán và tiêu chuẩn hóa: Hệ thống phân cấp giúp duy trì tính
nhất quán và tiêu chuẩn hóa trên khắp kho dữ liệu. Bằng cách xác định hệ
thống phân cấp tiêu chuẩn cho thứ nguyên, dữ liệu được tổ chức thống nhất,
đảm bảo phân tích chính xác và nhất quán trên các báo cáo và ứng dụng
khác nhau.
Điều quan trọng là phải thiết kế hệ thống phân cấp một cách cẩn thận
để phù hợp với yêu cầu kinh doanh và nhu cầu của người dùng. Việc lựa
chọn cấp độ và mối quan hệ giữa các thuộc tính phải phản ánh hệ thống
phân cấp tự nhiên trong thứ nguyên và cung cấp các khả năng phân tích có ý
nghĩa. Hệ thống phân cấp được thiết kế tốt góp phần phân tích dữ liệu, báo
cáo và ra quyết định hiệu quả trong môi trường lưu trữ dữ liệu.

1.3 Sơ đồ mơ hình khái niệm
Sơ đồ mơ hình khái niệm, cịn được gọi là sơ đồ mơ hình khái niệm
hoặc mơ hình dữ liệu khái niệm, là một biểu đồ hình ảnh mơ tả các khái
niệm, thực thể, mối quan hệ và thuộc tính cấp cao cần thiết để hiểu một lĩnh
vực hoặc vấn đề cụ thể. Nó được sử dụng để mơ tả cấu trúc tổng thể và tổ
chức của dữ liệu ở mức độ khái niệm, mà không tập trung vào các chi tiết cụ

thể về triển khai hoặc các khía cạnh kỹ thuật.

Mục đích của sơ đồ mơ hình khái niệm là cung cấp một cái nhìn tổng
quan rõ ràng và ngắn gọn về các yếu tố chính và mối quan hệ giữa chúng
trong một hệ thống hoặc ứng dụng. Nó giúp các bên liên quan, như các nhà
phân tích kinh doanh, nhà thiết kế và nhà phát triển, có cùng một hiểu biết về
lĩnh vực đang được mơ hình hóa và các yêu cầu của hệ thống.

Một số loại sơ đồ mô hình khái niệm phổ biến bao gồm:
11


Sơ đồ Thực thể-Mối quan hệ (ERD): ERD biểu thị các thực thể, mối
quan hệ và thuộc tính liên quan trong một hệ thống hoặc lĩnh vực vấn đề.
Chúng miêu tả cấu trúc tổng quan của dữ liệu và cách các thực thể khác
nhau liên quan đến nhau.
Sơ đồ Lớp: Sơ đồ lớp chủ yếu được sử dụng trong lập trình hướng đối
tượng để biểu diễn các lớp, thuộc tính của chúng và mối quan hệ giữa
chúng. Chúng cung cấp một biểu đồ hình ảnh về thiết kế hướng đối tượng
của một hệ thống.
Sơ đồ Ngôn ngữ thống nhất (UML): Sơ đồ UML, chẳng hạn như sơ đồ
lớp, sử dụng một cú pháp chuẩn để biểu diễn các khái niệm, mối quan hệ và
hành vi của một hệ thống. Chúng có thể được sử dụng cho mơ hình hóa khái
niệm trong các lĩnh vực khác.
Sơ đồ Lược đồ quan hệ thực thể (ERD): Sơ đồ ERD giúp mơ hình hóa
cấu trúc của cơ sở dữ liệu quan hệ. Nó biểu diễn các thực thể, mối quan hệ
và các ràng buộc giữa chúng dưới dạng các bảng, khóa chính và khóa ngoại.

Sơ đồ Dự án: Sơ đồ Dự án được sử dụng để biểu diễn cấu trúc tổ
chức của một dự án, bao gồm các thành phần, phụ thuộc và quan hệ giữa

chúng. Nó giúp hiển thị quy trình cơng việc, vai trò và trách nhiệm của các
thành viên trong dự án.
Sơ đồ mơ hình khái niệm đóng vai trị là cơ sở cho các hoạt động phân
tích, thiết kế và triển khai tiếp theo. Nó giúp các bên liên quan xác định các
thực thể và mối quan hệ chính, xác định phạm vi và ranh giới của hệ thống,
và tạo điều kiện cho việc giao tiếp và cộng tác giữa các thành viên trong dự
án.
Lưu ý rằng sơ đồ mô hình khái niệm tập trung vào mức độ trừu tượng
cao của hệ thống và có thể khơng bao gồm tất cả các chi tiết cụ thể hoặc yếu
tố kỹ thuật triển khai. Nó cung cấp một khung cơ

12


bản mà có thể được sử dụng làm cơ sở cho việc mơ hình hóa và phát triển
hệ thống chi tiết hơn.

2.Mơ hình logic
2.1. Fact và dimension table (PK,FK)
- Fact Table:
Fact table có thể được hiểu như là bảng chứa các dữ liệu có tính
chất đo lường (measurement). Một fact (hay còn gọi là measure)
trong data warehouse được dùng để minh họa cho một trường
(昀椀 eld/column) chứa một giá trị đo lường được và đóng một vai trị
quan trọng với business. Trên thực tế, ta hay gặp nhất các fact ở
dạng số (numeric) và có tính chất cộng (additive). Do cấu trúc của
fact table khá đơn giản chỉ chứa duy nhất foreign key và fact, ngồi
ra khơng có bất cứ thông tin nào khác nên tốc độ truy cập bảng khá
nhanh. Một kỹ thuật hay dùng là tạo index cho các foreign key. Một
kỹ thuật nữa là xây dựng sẵn các aggregate tables để tính tốn trước

một đại lượng nào đó dựa trên fact table. Fact grain (độ mịn) là một
khái niệm để xác định mức độ chi tiết của thông tin chứa trong fact
table. Một quy định bắt buộc khi thiết kế fact table là: Tất cả các
record trong fact table phải có cùng độ mịn. Fact Grain là thành tố cơ
bản của fact table. Xác định đúng fact grain là một công tác quan
trọng bậc nhất trong việc xây dựng một mơ hình đa chiều. Đây là
cơng việc đòi hỏi người thiết kế phải là những Data Architect giàu
kinh nghiệm và có hiểu biết sâu sắc về business domain đang làm.
- Dimension table:
Nếu như fact table chứa các FK (foreign key) và measure, thì dimesion
table chứa các thơng tin miêu tả nghiệp vụ. Trong không gian của mô hình đa
chiều, các thơng tin này được gọi là thuộc tính (attribute) của dimension. Cịn
khi được lưu trữ cụ thể trong một cơ sở dữ liệu quan hệ, các thông tin này
chính là các columns của table. Một nguyên tắc thiết kế của data warehouse
là cố gắng đưa càng nhiều thơng tin vào dimension thì càng tốt Dimension
table đóng
13


một vai trò sống còn trong data warehouse. Do chúng chứa các thông tin
miêu tả nghiệp vụ, nên đây là nguồn được dùng để sàng lọc dữ liệu, gộp
nhóm, và tạo các nhãn trình bày. Trong ví dụ ở trên, nếu người dùng muốn
xem tổng số tiền bán hàng theo tuần và loại hàng hóa, hiển nhiên fact table
chỉ có thể cung cấp số liệu về số tiền thu được. Thơng tin về loại hàng hóa
chỉ có thể lấy được từ Product dimension, trong khi thông tin về thời gian
cũng chỉ có thể tìm được trong Date dimension. Nói cách khác, người dùng
tương tác với data warehouse chủ yếu là qua dimension table, còn fact table
chỉ cung cấp các số liệu. Tuỳ theo cách nhìn của người dùng đối với nghiệp
vụ, họ sẽ dùng các attributes của dimension hoặc là để sàng lọc dữ liệu,
hoặc là để tạo ra các kết quả tổng hợp theo nhóm....vv. Các

attributes của dimension table thường chứa dữ liệu dạng text và có tính rời
rạc. Một attribute có thể chứa một miêu tả ngắn (10 - 15 ký tự) hoặc dài (3050 ký tự), tên hàng, tên loại hàng, kiểu đóng gói, kích cỡ... vv. Mặc dù kích
cỡ là một giá trị dạng số và dường như thích hợp cho fact table, nhưng về
bản chất mà nói, nó mang tính miêu tả cho một hàng hóa cụ thể chứ khơng
mang nhiều giá trị đo lường. Các attributes trong một dimesion thường tạo
thành các cây phân cấp (hierarchy). Có thể nói, trong thiết kế dimension
table, ta hy sinh chuẩn 3NF để đổi lấy sự đơn giản và tốc độ. Đây có thể coi
là một nguyên tắc vàng của dimensional modeling.
Có thể chia ra những đặc điểm sau để phân biệt giữa 2 loại
table
Đặc điểm

Fact table

Dimension table

Định nghĩa

Bao gồm các chỉ số đo
lường các hoạt động trong
tổ chức.

Bảng thơng tin các đối
tượng có liên quan tới bảng
Fact.

Thuộc tính

Trung
tâm

trong Star
Nằm xung quanh bảng Fact
schema

Snow 昀氀 aketrong Star schema và
Snow 昀氀 ake Schema.
schema, xung quanh là các
bảng Dim.

Thiết kế

Thiết kế đúng với trọng tâm
của vấn đề hay nhu cầu.

Phải bao quát các thông tin
của một đối tượng. Tránh
nhét vào nhiều thông tin
của nhiều đối tượng cùng
một nơi.

Phục vụ

Một bảng Fact tập hợp các
chỉ số đo lượng có liên
quan tới các bảng Dim,
dùng cho báo cáo, thống
kê.

Thu thập các thông tin liên
quan tới một đối tượng nào

đó trong tổ chức (như
thông tin cửa hàng chẳng
hạn).

14


Kiểu dữ liệu

Bảng Fact chứa các cột dữ
liệu số liên quan tới các cột
đối tượng, khoá ngoại của
bảng Dim.

Mỗi bảng Dim chứa các
thơng tin về một đối tượng.
Ví dụ bảng Product gồm
Product
Id,
Category,
SubCategory…

Khố chính

Khố chính của bảng Fact
là tập hợp khơng lặp lại các
khoá ngoại từ các bảng
Dim.
Được dùng để lưu trữ chỉ
số, đồng thời để lọc kết quả

trên nó dựa theo thơng tin
từ các bảng Dim.
Khơng có

Mỗi bảng Dim đều có một
khố chính để xác định rõ
tính độc nhất của mỗi dòng
trong bảng.
Lưu trữ dữ liệu các đối
tượng một cách chi tiết.

Lưu trữ

Sự phân cấp

Có sự phân cấp: Ví dụ đối
tượng Địa
Điểm có thể
chứa Quốc Gia, Khu vực,
Quận/Huyện, Mã Zip…

2.2. Bắt đầu, bông tuyết và sơ đồ lai
Khi ta liên kết fact table và dimension table lại với nhau dựa trên các
Primary Key của dimension và Foreign Key tương ứng của fact, ta được một
mơ hình dữ liệu dạng hình sao - star schema. Ví dụ như ta có các bảng như
phía dưới:

15



Hình 2.2.1: Sơ Đồ Bơng Tuyết

Hình 2.2.2: Bảng Customer

16



×