ĐẠI HỌC QUỐC GIA TPHCM
TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
KHOA HỆ THỐNG THƠNG TIN
CHUN ĐỀ: PHÂN TÍCH DỮ LIỆU TRONG KINH DOANH
ĐỀ TÀI: PHÂN TÍCH VÀ TRỰC QUAN HĨA
MẪU DỮ LIỆU ‘SALES AND MARKETING’ CỦA MICROSOFT BẰNG
GIẢI PHÁP POWER BI
Giảng viên hướng dẫn: TS. Hồ Trung Thành, Nguyễn Văn Hồ
Thành viên nhóm:
STT
Tên thành viên
MSSV
1.
Võ Đức Viên Khang
K164112445
2.
Nguyễn Quốc Thắng
K164111573
3.
Châu Văn Lợi
K164112451
4.
Trịnh Ngọc Hải
K164112439
5.
Nguyễn Phạm Kim Thoa
K164112459
TPHCM, tháng 05 năm 2020
LỜI CẢM ƠN
Nhóm xin gửi lời cảm ơn chân thành đến TS. Hồ Trung Thành, đã cung cấp những kiến
thức nền tảng vô cùng quý báu ở môn học chuyên đề này. Tuy có nhiều bỡ ngỡ đối với các
kiến thức mới về Bussiness Inteligence, thầy đã cố gắng truyền tải nội dung một cách dễ
hiểu thông qua các mô hình, so sánh, và các ví dụ trong Excel. Và cũng cảm ơn thầy đã
tận tình hướng dẫn cách thực hiện và trình bày đồ án.
Nhóm cũng xin gửi lời cảm ơn chân thành đến anh Nguyễn Văn Hồ - giảng viên trợ giảng
của Thầy. Thông qua các buổi chia sẻ kiến thức thực hành ba công cụ giải pháp BI gồm:
Power Bi, Google Studio, Tableau, đã giúp cho nhóm thể hình dung kiến thức lý thuyết một
cách dễ dàng và sinh động hơn. Và cảm ơn anh Hồ đã rất nhiệt tình hướng dẫn, hỗ trợ,
giải đáp các thắc mắc của nhóm về dữ liệu mẫu để giúp cho nhóm có thể hồn thành đồ
án cuối cùng này.
Cuối cùng, nhóm xin gửi lời cảm ơn đến với các thầy cô giảng viên khoa Hệ thống Thông
tin, cũng như tất cả thầy cô đang giảng dạy và làm việc tại trường.
Nhóm đã rất cố gắng để hồn thành đồ án, tuy nhiên khơng tránh khỏi những sai sót trong
q trình thực hiện. Nhóm rất mong nhận được sự góp ý của thầy và tất cả các bạn.
Trân trọng,
Nhóm ERTeam.
I
GIẢNG VIÊN ĐÁNH GIÁ VÀ NHẬN XÉT
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
................., ngày …… tháng …… năm 2020
Giảng viên
(ký và ghi rõ họ tên)
II
GIẢNG VIÊN TRỢ GIẢNG ĐÁNH GIÁ VÀ NHẬN XÉT
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
...............................................................................................................................................
................., ngày …… tháng …... năm 2020
Giảng viên trợ giảng
(ký và ghi rõ họ tên)
III
MỤC LỤC
LỜI CẢM ƠN ................................................................................................................................. I
GIẢNG VIÊN ĐÁNH GIÁ VÀ NHẬN XÉT ............................................................................. II
GIẢNG VIÊN TRỢ GIẢNG ĐÁNH GIÁ VÀ NHẬN XÉT .................................................... III
MỤC LỤC.................................................................................................................................... IV
DANH MỤC TỪ VIẾT TẮT ..................................................................................................... VI
DANH MỤC HÌNH ẢNH ......................................................................................................... VII
DANH MỤC BẢNG ................................................................................................................. VIII
CHƯƠNG 1. TỔNG QUAN ĐỀ TÀI .......................................................................................... 1
1.1. Lý do chọn đề tài ................................................................................................................ 1
1.2. Mục tiêu đề tài .................................................................................................................... 1
1.3. Đối tượng và phạm vi nghiên cứu của đề tài ................................................................... 2
1.4. Công cụ sử dụng ................................................................................................................. 2
1.5. Ý nghĩa nghiên cứu ............................................................................................................ 2
1.6. Cấu trúc đề tài .................................................................................................................... 2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT ............................................................................................ 3
2.1. Tổng quan về BI ................................................................................................................. 3
2.1.1. Giới thiệu mơ hình và giải pháp BI ............................................................................ 3
2.1.2. Lợi ích của BI trong doanh nghiệp ............................................................................ 4
2.1.3. Quy trình xây dựng bộ giải pháp BI cho doanh nghiệp ........................................... 7
2.2. Phân tích dữ liệu và trực quan hóa ................................................................................. 8
2.2.1. Lý thuyết và các phương pháp trong phân tích dữ liệu ........................................... 8
2.2.2. Trực quan hóa ............................................................................................................ 10
CHƯƠNG 3: PHÂN TÍCH U CẦU NGƯỜI DÙNG VÀ MÔ TẢ DỮ LIỆU................... 13
3.1. Xác định và phân tích yêu cầu người dùng.................................................................... 13
3.2. Tổng quan về cơ sở dữ liệu nguồn .................................................................................. 15
3.2.1. Mô tả dữ liệu nguồn................................................................................................... 15
3.2.2. Lựa chọn và trình bày dữ liệu cần phân tích đối với yêu cầu người dùng ........... 21
CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU VÀ TRỰC QUAN HĨA ............................................ 23
4.1. Giới thiệu giải pháp và công cụ phân tích dữ liệu ......................................................... 23
IV
4.1.1. Tổng quan về Power BI ............................................................................................. 23
4.1.2. Các chức năng chính của Power BI ......................................................................... 24
4.2. Giới thiệu cấu trúc của hệ thống báo cáo ....................................................................... 27
4.3. Phân tích và trực quan hóa dữ liệu ................................................................................ 28
4.4. Thảo luận và đánh giá về kết quả quả phân tích và trực quan hóa dữ liệu ............... 35
CHƯƠNG 5: KẾT LUẬN .......................................................................................................... 43
5.1. Kết quả đạt được .............................................................................................................. 43
5.2. Hướng phát triển đề tài ................................................................................................... 43
TÀI LIỆU THAM KHẢO .......................................................................................................... 44
Sách tham khảo ....................................................................................................................... 44
Các Links tham khảo .............................................................................................................. 45
V
DANH MỤC TỪ VIẾT TẮT
Từ viết tắt
Tiếng Anh
Tiếng Việt
BI
Bussiness Inteligence
Kinh Doanh Thông Minh
VI
DANH MỤC HÌNH ẢNH
Chương 2
Hình 2. 1. Kiến trúc của BI(Chaidez, 2008) ................................................................................................. 3
Hình 2. 2. Xây dựng bộ giải pháp BI cho doanh nghiệp ............................................................................... 7
Hình 2. 3. Kỹ thuật Roll up ........................................................................................................................... 8
Hình 2. 4. Kỹ thuật Drill Down .................................................................................................................... 9
Hình 2. 5. Kỹ thuật Rotate/Pivot ................................................................................................................... 9
Hình 2. 6. Kỹ thuật Dice-Slice .................................................................................................................... 10
Hình 2. 7. Trực quan hóa dữ liệu bằng Google Data Studio ....................................................................... 11
Hình 2. 8. Trực quan hóa dữ liệu bằng phần mềm Power BI desktop ........................................................ 11
Hình 2. 9. Trực quan hóa dữ liệu bằng phần mềm Tableau ........................................................................ 12
Chương 3
Hình 3. 1. Hình ảnh bảng Date trong Power Bi desktop ............................................................................. 15
Hình 3. 2. Hình ảnh bảng Geo trong Power Bi desktop .............................................................................. 16
Hình 3. 3. Hình ảnh bảng Manufacturer trong Power Bi desktop............................................................... 17
Hình 3. 4. Hình ảnh bảng Product trong Power Bi desktop ........................................................................ 17
Hình 3. 5. Hình ảnh bảng SalesFact trong Power Bi desktop ..................................................................... 18
Hình 3. 6. Hình ảnh bảng Sentiment trong Power Bi desktop .................................................................... 19
Hình 3. 7. Mối quan hệ giữa bảng SalesFact và các bảng Dim .................................................................. 20
Hình 3. 8. Mối quan hệ giữa bảng Sentiment và các bảng Dim.................................................................. 20
Chương 4
Hình 4. 1. Tổng quan về Power Bi(Nguồn: Internet).................................................................................. 23
Hình 4. 2. Power Bi có 3 mơi trường làm việc chính(Nguồn: Internet) ..................................................... 24
Hình 4. 3. Power Bi hỗ trợ nạp dữ liệu từ rất nhiều nguồn ......................................................................... 24
Hình 4. 4. Trực quan bảng đồ địa lý tương tác cung cấp bởi Bing(Nguồn: file DataSample Microsoft) ... 25
Hình 4. 5. Đăng tải báo cáo lên Work Space của Power Bi(Nguồn: Internet)............................................ 26
Hình 4. 6. Khả năng phân tích dự đốn thơng qua các cơng cụ hỗ trợ(Nguồn: Internet) ........................... 26
Hình 4. 7. Doanh thu trong 5 năm trở lại đây(Dash board 1) ..................................................................... 28
Hình 4. 8. Xu hướng doanh thu trong 3 năm trở lại đây(Dash board 2) ..................................................... 28
Hình 4. 9. Doanh số và tỷ lệ doanh số theo các nhà sản xuất năm 2014(Dash board 3)............................. 29
Hình 4. 10. Tăng trưởng doanh số và tăng trưởng % năm 2014 so với năm 2013(Dash board 4) ............. 30
Hình 4. 11. Doanh số từng loại hàng và tăng trưởng doanh số của 2014 so với năm 2013(Dashboard 5) . 31
Hình 4. 12. Doanh số và thị phần của VanArsdel ở các bang(Dash board 6) ............................................. 32
Hình 4. 13. Tăng trưởng doanh số và tỷ lệ tăng trưởng năm 2014 so với năm 2013(Dash board 7) .......... 33
VII
Hình 4. 14. Hiệu quả marketing theo nhà sản xuất trong năm 2014(Dashboard 8) .................................... 34
Hình 4. 15. Dash board 1 ............................................................................................................................ 35
Hình 4. 16. Dash board 2 ............................................................................................................................ 35
Hình 4. 17. Dashboard 3 ............................................................................................................................. 36
Hình 4. 18. Dashboard 4 ............................................................................................................................. 37
Hình 4. 19. Dashboard 5 ............................................................................................................................. 39
Hình 4. 20. Dashboard 6 ............................................................................................................................. 40
Hình 4. 21. Dashboard 7 ............................................................................................................................. 41
Hình 4. 22. Dashboard 8 ............................................................................................................................. 42
DANH MỤC BẢNG
Bảng 1: Kiểu dữ liệu các cột trong bảng Date ........................................................................................... 15
Bảng 2: Kiểu dữ liệu các cột trong bảng Geo ............................................................................................ 16
Bảng 3: Kiểu dữ liệu các cột trong bảng Manufacturer ............................................................................. 17
Bảng 4: Kiểu dữ liệu các cột trong bảng Product ...................................................................................... 18
Bảng 5: Kiểu dữ liệu các cột trong bảng SalesFact ................................................................................... 18
Bảng 6: Kiểu dữ liệu các cột trong bảng Sentiment................................................................................... 19
VIII
CHƯƠNG 1. TỔNG QUAN ĐỀ TÀI
1.1. Lý do chọn đề tài
Dữ liệu kinh doanh của doanh nghiệp là một phần quan trọng không thể thiếu trong hoạt
động kinh doanh. Với dữ liệu từ nhiều nguồn khác nhau, với các định dạng khác nhau và
chưa được chuẩn hóa gây ra khó khăn trong việc tổ chức và khai thác dữ liệu. Đồng thời,
cộng với sức ép cạnh tranh ngày càng cao trên thị trường như hiện nay, doanh nghiệp phải
liên tục đổi mới cách thức quản lý, cũng như ứng dụng nhiều hơn nữa các công nghệ thông
tin vào hoạt động kinh doanh của mình. Khai thác dữ liệu để tạo tri thức giúp cho doanh
nghiệp đưa ra những quyết định cho các hoạt động kinh doanh tiếp theo là vô cùng quan
trọng. Vì vậy, BI ra đời giúp cho việc chuyển dữ liệu thành các biểu đồ, hình ảnh trực quan,
giúp cho dữ liệu bảng dễ hiểu, dễ hình dung hơn đối với doanh nghiệp, giúp cho doanh
nghiệp có cái nhìn trực quan hơn về những gì đang diễn ra đối với hoạt động kinh doanh.
Từ đó, các quyết định sẽ được đưa ra dựa trên các kết quả trực quan hóa đã thực hiện.
Nhóm ERTeam sau khi học xong mơn chun đề Phân Tích Dữ Liệu Trong Kinh Doanh,
đã có những kiến thức nền tảng BI về nguồn dữ liệu, nhà kho dữ liệu, các phương pháp BI
cũng như được giới thiệu về các giải pháp BI phổ biến hiện nay như: Google Data Studio,
Power BI, Tableau. Để có thể hiểu được thêm về BI và các giải pháp BI nhằm tìm hiểu sâu,
cũng như bổ sung những kiến thức và kỹ năng cần thiết cho công việc sau này, nhóm quyết
định thực hiện một đồ án phân tích dữ liệu liên quan đến “Sales and Marketing” để trình
bày những hiểu biết về BI, cũng như trau dồi kỹ năng thực hành trên các phần mềm giải
pháp BI.
1.2. Mục tiêu đề tài
Mục tiêu đề tài là để các thành viên trong nhóm trau dồi thêm những kiến thức lý thuyết
về BI và thực hành với một mẫu dữ liệu (data sample) trên Power BI. Đối với mẫu dữ
liệu trên Power BI, nhóm sẽ thực hiện các yêu cầu:
Đưa ra những yêu cầu đối với mẫu dữ liệu;
- Mô tả mẫu dữ liệu và chọn lựa các dữ liệu cần phân tích;
- Giới thiệu về giải pháp Power BI;
- Giới thiệu hệ thống các báo cáo;
1
- Phân tích và trực quan hóa các u cầu;
- Đánh giá về kết quả phân tích và trực quan hóa.
1.3. Đối tượng và phạm vi nghiên cứu của đề tài
Đối tượng nghiên cứu: Kiến thức cơ bản về BI và giải pháp BI.
Phạm vi nghiên cứu: Mẫu dữ liệu “Sales and Marketing” của Microsoft.
1.4. Cơng cụ sử dụng
Nhóm sử dụng giải pháp Power BI của Microsoft.
1.5. Ý nghĩa nghiên cứu
Giúp các thành viên có cái nhìn tổng quan về BI và các giải pháp thực hiện BI.
Có những trải nghiệm, kỹ năng sử dụng giải pháp BI trong thực tế.
1.6. Cấu trúc đề tài
Cấu trúc đề tài gồm 5 chương, bao gồm:
Chương 1: Tổng quan đề tài
Trình bày về lý do chọn đề tài, mục tiêu đề tài, đối tượng và phạm vi nghiên cứu, công cụ
sử dụng, ý nghĩa nghiên cứu và cấu trúc đề tài.
Chương 2: Cơ sở lý thuyết
Trình bày lý thuyết về BI, mơ hình BI, giải pháp BI, lợi ích của BI trong doanh nghiệp,
quy trình xây dựng bộ giải pháp BI cho doanh nghiệp, lý thuyết và các phương pháp phân
tích dữ liệu, cuối cùng là trực quan hóa.
Chương 3: Phân tích u cầu người dùng và mô tả dữ liệu
Ở chương 3, nhóm sẽ đưa ra các yêu cầu người dùng đối với dữ liệu mẫu, sau đó mơ tả dữ
liệu nguồn và cuối cùng là lựa chọn các dữ liệu cần phân tích đối với yêu cầu người dùng.
Chương 4: Phân tích dữ liệu và trực quan hóa
Ở chương 4, nhóm sẽ giới thiệu về giải pháp Power BI, trình bày cấu trúc báo cáo, phân
tích dữ liệu và trực quan hóa, cuối cùng là thảo luận về các kết quả phân tích và trực quan
hóa.
Chương 5: Kết luận
Trình bày về các kết quả đạt được và hướng phát triển đề tài.
2
CHƯƠNG 2. CƠ SỞ LÝ THUYẾT
2.1. Tổng quan về BI
BI kết hợp các sản phẩm, công nghệ và các phương pháp để tổ chức các thơng tin chính
mà quản lý cần để cải thiện lợi nhuận và hiệu suất. Rộng hơn nữa, BI là thông tin kinh
doanh và các phân tích kinh doanh trong các quy trình kinh doanh chính sẽ dẫn tới những
quyết định và các hành động, từ đó cải thiện hiệu suất kinh doanh. BI bao gồm các thơng
tin và phân tích kinh doanh: được sử dụng trong phạm vi của một quy trình nghiệp vụ chủ
chốt, hỗ trợ các quyết định và hành động, định hướng để cải thiện hiệu suất kinh doanh.[1]
2.1.1. Giới thiệu mô hình và giải pháp BI
Mơ hình BI
Hình dưới đây mơ tả tổng quan về các thành phần chính tạo nên hệ thống BI:
Hình 2. 1. Kiến trúc của BI (Chaidez, 2008)
Data Sources (Các nguồn dữ liệu): Các nguồn dữ liệu đa phần được thu thập từ các hệ
thống tác nghiệp nhưng cũng có thể bao gồm các tài liệu phi cấu trúc như email và các
dữ liệu nhận được từ các nhà cung cấp bên ngồi[2]. Đây có thể xem như là dữ liệu thô.
Data Warehouses/Data Marts (Nhà kho dữ liệu và dữ liệu theo chủ đề): Sử dụng các
công cụ trích xuất và chuyển đổi như ETL (Extract - Transform - Load) để lưu trữ các
nguồn dữ liệu khác nhau vào một CSDL chung nhằm hỗ trợ phân tích kinh doanh.[3]
3
Data Exploration: Bao gồm các công cụ nhằm thi hành những phân tích mang tính bị
động, bao gồm hệ thống báo cáo và truy vấn cũng như các phương pháp thống kê.[4]
Data Mining: Tầng bốn bao gồm các phương pháp BI chủ động, mục đích là khai thác
thơng tin và tri thức từ dữ liệu. Các phương pháp này bao gồm các mơ hình tốn học
cho nhận dạng mẫu, các kỹ thuật khai phá dữ liệu. Không giống như các cơng cụ ở tầng
ba của tháp, các mơ hình chủ động khơng địi hỏi các nhà ra quyết định đưa ra bất kỳ
giả thiết nào để xác nhận sau đó; mục đích của các mơ hình chủ động là mở rộng tri thức
cho các nhà ra quyết định.[5]
Optimization: Các mô hình tối ưu hóa cho phép chúng ta xác định các giải pháp tốt
nhất trong tập hợp các giải pháp được đưa ra.[6]
Making Decisions: đưa ra sự lựa chọn và áp dụng thực tế của một quyết định cụ thể.[7]
2.1.2. Lợi ích của BI trong doanh nghiệp
Cắt giảm chi phí nhân công: Các hệ thống BI giúp cắt giảm chi phí nhân cơng khi tạo
ra báo cáo bởi chúng: tự động thu thập và sắp xếp dữ liệu; tự động tạo báo cáo; cung
cấp các công cụ thiết kế báo cáo giúp việc tạo ra các báo cáo mới trở nên đơn giản hơn;
cắt giảm chi phí đào tạo nhận công cần thiết cho việc phát triển và tạo báo cáo.[8]
Giảm thiểu việc tắc nghẽn thông tin: Hệ thống BI cho phép người sử dụng cuối trích
lọc các báo cáo khi họ cần chúng thay vì phải nhờ vào những nhân viên của phịng IT
hay tài chính chuẩn bị những báo cáo này. Các hệ thống BI làm giảm việc tắc nghẽn
thông tin bởi chúng:
- Cung cấp các biểu đồ cá nhân hóa, dựa trên vai trị của các nghiệp vụ mà thu thập các
dữ liệu quan trọng nhất cho các nghiệp vụ hằng ngày;
- Cho phép người sử dụng mở và chạy các báo cáo một cách tự chủ;
- Cung cấp các tài liệu về các chỉ số hiệu suất (KPIs) và các thông tin khác;
- Cho phép người dùng phân tích và phê chuẩn các dữ liệu mà khơng địi hỏi các chun
gia IT;
- Cho phép người dùng tạo ra các góc nhìn mới của dữ liệu như họ cần.[9]
4
Làm cho dữ liệu có khả năng thực thi
Các hệ thống BI làm cho thơng tin có khả năng thực thi (Actionable) bởi chúng có thể:
- Cung cấp thơng tin thơng qua những góc nhìn thống nhất của dữ liệu nhờ vào các chỉ
số KPIs được xây dựng và tính toán dựa trên một tập hợp các định nghĩa chuẩn hóa
để tránh các trường hợp việc đo lường hiệu quả dựa trên các định nghĩa không nhất
quán;
- Cung cấp các thông tin đến từng phút (To-the-minute) trong các báo cáo thời gian
thực cho thấy tình trạng kinh doanh ngay tại thời điểm hiện tại - khơng phải tại một
góc nhìn lịch sử cách đây nhiều ngày hay nhiều tuần;
- Cho phép người dùng tự chủ tìm kiếm và thiết kế các báo cáo thay vì phụ thuộc vào
các chuyên viên của bộ phận IT;
- Sử dụng các luật để nhấn mạnh các ngưỡng KPIs là tốt hay không;
- Cung cấp các tài liệu tích hợp để giúp người dùng hiểu nghĩa và định nghĩa của KPIs;
- Cung cấp các đường dẫn tới các hệ thống vận hành, giúp nó trở nên dễ dàng cho
người dùng để có những hành động chính xác;
- Chỉ cho thấy những dữ liệu thích hợp với từng người dùng cụ thể dựa trên vai trò của
họ, giúp tránh trường hợp q tải thơng tin;
- Trình bày dữ liệu ở cấp độ tổng quát, tập trung giúp các xu hướng tổng quan có thể
dễ dàng được phát hiện và sau đó cho phép người sử dụng “khoan xuống” (Drilldown) đến dữ liệu chi tiết;
- Sử dụng hình ảnh trực quan làm nổi bật bản chất của dữ liệu như các biểu đồ, đồ thị
và các đồng hồ đo.[10]
Các quyết định có chất lượng tốt hơn
Các hệ thống BI giúp tạo ra các quyết định tốt hơn bằng cách:
- Cung cấp cho các nhà ra quyết định các thơng tin hữu ích, chính xác và cập nhật;
- Cho phép người sử dụng khai thác dữ liệu cho các nghiên cứu xa hơn.[11]
Các quyết định được đưa ra nhanh hơn
Các hệ thống BI cho phép các quyết định nhanh chóng hơn vì:
5
- Kết hợp các nguồn dữ liệu đa dạng trong các báo cáo phổ biến, nhờ vậy tiết kiệm thời
gian cho người dùng từ việc kết hợp dữ liệu thủ cơng trong các bảng tính tách biệt.
- Cung cấp các báo cáo phân tích và các khả năng tùy biến báo cáo cho phép người sử
dụng nhanh chóng nhận dữ liệu mới hay kết hợp các dữ liệu khác nhau theo nhu cầu
thay vì phải yêu cầu những báo cáo mới từ IT hoặc bộ phận tài chính.
- Cung cấp hệ thống phản hồi giảm thiểu thời gian trả lời bằng cách sử dụng các dữ
liệu đã được tập hợp trước hay các kỹ thuật khác cho việc thu thập dữ liệu nhanh
chóng.[12]
Hướng tổ chức đến mục tiêu kinh doanh
Các hệ thống BI giúp gắn kết tất cả các thành phần của tổ chức hướng tới các mục tiêu
kinh doanh bằng cách:
- Tập trung vào các định nghĩa về KPI. Các báo cáo BI khơng tính tốn các chỉ số KPI
sử dụng các truy vấn hay mã script một cách độc lập. Các báo cáo BI nhận giá trị
KPI và định nghĩa về KPI thông qua một nơi lưu trữ tập trung và do đó tránh sự
khơng nhất qn giữa các định nghĩa về KPI và các giá trị KPI.
- Hướng dẫn trình bày thơng tin sử dụng hình ảnh trực quan tiên tiến, ngưỡng tiêu
chuẩn và KPI, vì vậy đảm bảo một giải thích chung của các chỉ số KPI.
- Cung cấp một nguồn duy nhất của thông tin. Tất cả các báo cáo tập hợp dữ liệu từ
một nguồn - hệ thống BI.
- Đẩy thông tin được chọn lựa đi khắp tổ chức. Bằng cách cho phép các tổ chức đẩy
các chỉ số KPI và các thông tin tới những người sử dụng cuối, hệ thống BI giúp tập
trung sự chú ý của nhân viên vào các yếu tố thành công quan trọng nhất.
- Gắn các mục tiêu cho các giá trị KPI cho mỗi đơn vị của tổ chức để sử dụng khả năng
đo lường để đạt được mục tiêu phía trước và vì vậy thúc đẩy tổ chức hướng về các
mục tiêu đã được xác định.[13]
6
2.1.3. Quy trình xây dựng bộ giải pháp BI cho doanh nghiệp
BI giúp cho dữ liệu dễ hiểu hơn, từ đó doanh nghiệp có được các tri thức cần thiết để
đưa ra các quyết định kinh doanh phù hợp. Quy trình xây dựng bộ giải pháp BI cho
doanh nghiệp sẽ gồm:
Hình 2. 2. Xây dựng bộ giải pháp BI cho doanh nghiệp
Giai đoạn 1: Xác định được các yêu cầu cần tạo báo cáo trong doanh nghiệp – Xác
định được và phân tích các u cầu để từ đó quyết định sẽ tạo ra những loại báo cáo nào.
Giai đoạn 2: Tổng hợp dữ liệu nguồn – Đây là các loại dữ liệu thô, đến từ nhiều nguồn
khác nhau như excel, SQL, text,… cần phải được tổng hợp lại.
Giai đoạn 3: Xây dựng mơ hình Data Warehouses – Xây dựng nên mơ hình Data
Warehouse để có được cấu trúc dữ liệu phù hợp với việc truy xuất cũng như xử lý dữ
liệu để trực quan hóa cho các yêu cầu của tổ chức.
Giai đoạn 4: Đưa dữ liệu nguồn vào Data Warehouse – Dùng cơng cụ ETL để trích
xuất, chuyển đổi, tải dữ liệu từ các nguồn dữ liệu ở giai đoạn 2 vào trong Data
Warehouse.
Giai đoạn 5: Trực quan hóa dữ liệu và trình bày báo cáo – Dùng các phần mềm giải
pháp BI để trực quan hóa các dữ liệu cần thiết và sắp xếp các dữ liệu đã được trực quan
trên báo cáo, phù hợp với các yêu cầu của tổ chức.[14]
7
2.2. Phân tích dữ liệu và trực quan hóa
2.2.1. Lý thuyết và các phương pháp trong phân tích dữ liệu
Phân tích dữ liệu
Phân tích dữ liệu là q trình phát hiện, giải thích và truyền đạt các mơ hình có ý nghĩa
trong dữ liệu[15]. Phân tích dữ liệu có thể tìm ra các xu hướng và số liệu trong các khối
thơng tin mà có thể bị bỏ sót nếu khơng sử dụng kĩ thuật này. Thơng tin thu được có thể
được sử dụng để tối ưu hóa các qui trình làm tăng hiệu quả tổng thể của một doanh
nghiệp hoặc một hệ thống.[16]
Các phương pháp trong phân tích dữ liệu:
Trong công nghệ Nhà Kho Dữ Liệu, OLAP (On Line Analytical Processing) là kỹ thuật
cơ bản được ứng dụng để phân tích các khối dữ liệu đa chiều. OLAP gồm có 4 kỹ thuật
chính bao gồm:
Roll up: tăng độ tổng quát của dữ liệu thể hiện.
Hình 2. 3. Kỹ thuật Roll up
Ví dụ, hình trên là tổng qt doanh thu đối với từng vùng miền mà khơng thể hiện chi
tiết gì về các khu vực trong vùng hoặc chi tiết về doanh thu của từng sản phẩm trong
vùng miền đó.
Drill down: Tăng độ chi tiết của dữ liệu thể hiện.
8
Hình 2. 4. Kỹ thuật Drill Down
Ví dụ, hình trên đang thực hiện kỹ thuật drill down để tăng độ chi tiết đối với doanh thu
của miền Bắc (North), miền Nam (South), và miền Tây (West): bao gồm các khu vực
có trong vùng đó.
Rotate/Pivot: Ta có thể đổi chiều của cột dữ liệu như sau đây:
Hình 2. 5. Kỹ thuật Rotate/Pivot
Hình trên thể hiện các vùng đã được sắp xếp lại theo chiều ngang.
Dice-Slice:
Tách các khối dữ liệu và điều kiện (cắt lát) dữ liệu.
9
Hình 2. 6. Kỹ thuật Dice-Slice
Hình trên là thể hiện doanh thu của từng sản phẩm theo miền hoặc chi tiết hơn là theo
khu vực của miền đó. Doanh thu theo sản phẩm chính là cắt lát theo điều kiện dữ liệu.
Dice-Slice thường được xử lý trong các ngôn ngữ truy vấn.
2.2.2. Trực quan hóa
Trực quan hóa dữ liệu là q trình mơ tả dữ liệu lên các đồ thị, biểu đồ (Chart) hoặc
sử dụng các công cụ để làm cho dữ liệu dễ hiểu, dễ hình dung đối với người đọc.
Một số lợi ích của trực quan hóa dữ liệu:
-
Dữ liệu được thể hiện một cách tinh gọn, cô đọng giúp cho người đọc và người
xem có thể dễ dàng hình dung, cũng như hiểu được các dữ liệu đã được trực quan.
-
Trực quan hóa dữ liệu thể hiện mối liên hệ giữa các đối tượng nghiên cứu, khám
phá ra được những sự thật chưa biết, những điểm bất thường và xu hướng biến
động của đối tượng nghiên cứu.[17]
-
Trực quan hóa dữ liệu giúp theo dõi các chỉ số về hiệu quả hoạt động, KPIs, tình
hình hoạt động của công ty dựa trên các dashboard, cho thấy tầm quan trọng của
việc tận dụng, khai thác tài sản dữ liệu để phục vụ ra quyết định.[18]
-
...
Một số ví dụ về trực quan hóa dữ liệu trên các giải pháp BI:
10
Hình 2. 7. Trực quan hóa dữ liệu bằng Google Data Studio
Hình 2. 8. Trực quan hóa dữ liệu bằng phần mềm Power BI desktop
11
Hình 2. 9. Trực quan hóa dữ liệu bằng phần mềm Tableau
12
CHƯƠNG 3: PHÂN TÍCH U CẦU NGƯỜI DÙNG VÀ MƠ TẢ DỮ LIỆU
3.1. Xác định và phân tích yêu cầu người dùng
Tình huống: Atalo Ltd là cơng ty chun phân phối các sản phẩm từ các nhà sản xuất trên
khắp nước Mỹ. Kết thúc năm 2014, cơng ty đã hồn thành nhiều mục tiêu đã được đề ra từ
đầu năm. Bước sang năm 2015, Giám đốc và ban lãnh đạo của công ty muốn một số báo
cáo của tất cả các phịng ban trong cơng ty để làm cơ sở đề ra các mục tiêu, chiến lược kinh
doanh trong năm 2015. Phòng ban Kinh Doanh được ban lãnh đạo giao nhiệm vụ thực hiện
một số báo cáo theo yêu cầu như sau đây:
Yêu cầu 1: Ban lãnh đạo cần số liệu doanh thu thực tế (Revenue) của công ty trong một số
năm trở lại đây để đưa ra doanh thu mục tiêu cho năm 2015.
Ta sẽ tính tổng doanh thu trong các năm và trực quan. Cần chọn các năm gần nhất
để con số sát với xu hướng doanh thu thực tế của cơng ty. Ta có thể chọn 5 năm gần
nhất là 2010, 2011, 2012, 2013, 2014 để trực quan doanh thu.
Yêu cầu 2: Ban lãnh đạo muốn biết xu hướng doanh thu theo các nhà sản xuất trong 3 năm
trở lại đây.
Trong ba năm trở lại đây tức là 2012, 2013 và 2014. Ta sẽ chọn các tháng hoặc các
quý là đơn vị để thể hiện xu hướng doanh thu trong từng năm.
Yêu cầu 3: Trong năm 2014, ban lãnh đạo công ty muốn biết về các nhà sản xuất có doanh
số cao nhất cũng như tỷ lệ doanh số của các nhà sản xuất trên tổng doanh số bán hàng.
Yêu cầu này có 2 ý: doanh số của các nhà sản xuất và tỷ lệ doanh số của các nhà sản
xuất trong năm 2014. Ta sẽ vẽ biểu đồ để thể hiện doanh số của tất cả các nhà sản
xuất rồi từ đó có thể dễ dàng biết được các nhà xuất có doanh số cao nhất. Sau đó,
vẽ thêm một biểu đồ thể hiện tỷ lệ doanh số của các nhà sản xuất.
Yêu cầu 4: Đối với 4 nhà sản xuất có doanh số cao nhất trong năm 2014, ban lãnh đạo
công ty muốn biết về sự tăng trưởng doanh số cũng như sự tăng trưởng phần trăm doanh
số trong các quý so với cùng kỳ năm 2013.
Sau khi giải quyết xong yêu cầu 3, ta sẽ biết được 4 nhà sản xuất có doanh số lớn nhất
trong năm 2014. Giải quyết yêu cầu này có 2 ý:
13
- Sự tăng trưởng doanh số các quý của năm 2014 với năm 2013 của 4 nhà sản xuất: ta
cần tính tốn được sự gia tăng doanh số của từng nhà sản xuất trong mỗi quý và sau
đó dùng biểu đồ để thể hiện sự gia tăng đó qua từng quý của mỗi nhà sản xuất.
- Sự tăng trưởng phần trăm doanh số các quý năm 2014 với năm 2013 của 4 nhà sản
xuất: cũng giống như ý trên nhưng ta cần tính tốn xem đối với từng nhà sản xuất,
trong mỗi quý đã tăng trưởng bao nhiêu % so với năm ngoái.
Yêu cầu 5: Ban lãnh đạo muốn biết doanh số theo từng loại hàng (Category) trong năm
2014 và sự tăng trưởng của từng loại hàng của năm 2014 so cùng kỳ với năm 2013.
Yêu cầu này có 2 ý:
- Doanh số theo từng loại hàng trong năm 2014;
- Sự tăng trưởng của từng loại hàng của năm 2014 so với năm 2013. (Ta sẽ chọn mốc
thời gian theo quý năm 2014 để xét sự tăng trưởng của từng loại hàng)
Yêu cầu 6: Ban lãnh đạo muốn biết tình hình chung về doanh số và thị phần các sản phẩm
của nhà sản xuất VanArsdel trên toàn nước Mỹ trong năm 2014.
Yêu cầu này có 2 ý:
- Doanh số của nhà sản xuất VanArsdel trên toàn quốc năm 2014: ta sẽ chọn các bang
để biểu thị, sau đó tính toán doanh số của VanArsdel để thể hiện trên các bang đó.
- Thị phần của nhà sản xuất VanArsdel trên toàn quốc năm 2014: ta cũng sẽ chọn các
bang để biểu thị, sau đó tính tốn tỷ lệ doanh số của VanArsdel so với tổng doanh số
để thể hiện lên biểu đồ.
Yêu cầu 7: Ban lãnh đạo muốn biết tình hình chung về sự phát triển doanh số ở tất cả các
bang của năm 2014 so với năm 2013.
Ta cần tính tốn ra được sự tăng trưởng doanh số của từng bang trong năm 2014 so
với năm 2013 và thể hiện lên biểu đồ. Ta cũng có thể thể hiện thêm sự tăng trưởng %
lên biểu đồ.
Yêu cầu 8: Ban lãnh đạo muốn biết tình hình hiệu quả chiến dịch Marketing trong năm
2014 dối với các sản phẩm của nhà sản xuất VanArsdel và các nhà sản xuất khác (Thơng
qua Score trung bình).
Ta sẽ dùng điểm Score trung bình để thể hiện sự hiệu quả của marketing.
14
3.2. Tổng quan về cơ sở dữ liệu nguồn
3.2.1. Mô tả dữ liệu nguồn
File dữ liệu “Sales and Marketing” mà nhóm dùng sẽ gồm các bảng như sau:
Bảng Date: bao gồm các thơng tin chi tiết về thời gian.
Hình 3. 1. Hình ảnh bảng Date trong Power BI desktop
Một số kiểu dữ liệu đối với từng cột cụ thể như sau:
Bảng 1: Kiểu dữ liệu các cột trong bảng Date
No.
Column name
Data type/Function
1
Date
DateTime
2
MonthID
Date, Extract()
3
MonthNo
Date, Month()
4
MonthName
Date, MonthName()
5
Month
Date, DateFormat()
6
Year
Date, Year()
7
RunningMonth
Integer
8
RunningYears
Integer
9
RunningMonths
Integer
10
MonthIndex
Integer
11
Quarter
VarChar
15
Bảng Geo: gồm thơng tin chi tiết vị trí địa lý ứng với mỗi mã Zip.
Hình 3. 2. Hình ảnh bảng Geo trong Power BI desktop
Kiểu dữ liệu đối với từng cột cụ thể như sau:
Bảng 2: Kiểu dữ liệu các cột trong bảng Geo
No.
Column name
Data type/Function
1
Zip
Integer
2
City
VarChar
3
State
VarChar
4
Region
VarChar
5
District
VarChar
Bảng Manufacturer: gồm các thông tin về nhà sản xuất. Mỗi nhà sản xuất có một
ManufacturerID.
16