Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (13.13 MB, 45 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<b>ĐẠI HỌC BÁCH KHOA HÀ NỘI </b>
<b>Ngành </b>Quản trị <b>Kinh doanh </b>
<b>Giảng viên hướng dẫn ThS. Nguy n Danh Tú </b>ễ
<b>Bộ mơn Phân tích d li u và tri th c kinh doanh </b>ữ ệ ứ
<b>Viện Toán ng d ng và Tin h c </b>ứ ụ ọ
<b>HÀ NỘI, 01/2023 </b>
<small>Chữ ký của GVHD</small>
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><b>1.3. Cấu trúc dữ liệu cho kho dữ liệu ... 9 </b>
<b>1.4. Các loại lược đồ của kho dữ liệu ... 10 </b>
<i><b>1.4.1. Lược đồ hình sao (Start Schema) ... 10 </b></i>
<i><b>1.4.2. Lược đồ bông tuyết (Snow Flake Schema) ... 10 </b></i>
<i><b>1.4.3. Galaxy Schema ... 11</b></i>
<i><b>1.4.4. Fact Constellation Schema ... 11</b></i>
<b>1.5. Nguyên lý thiết kế Data Warehouse ... 12 </b>
<b>PHẦN 2: TỒNG QUAN V BI ... 13</b>Ề<b>2.1. Các khái niêm cơ bản về BI ... 13 </b>
<b>2.2. M t s ho</b>ộ ố ạt độ<b>ng chính c a BI ... 13</b>ủ<b>2.3. ng d ng và l i ích c a BI trong kinh doanh ... 14</b>Ứ ụ ợ ủ<i><b>2.3.1. ng d</b></i>Ứ <i><b>ụng ... 14 </b></i>
<i><b>2.3.2. L i ích</b></i>ợ <b> ... 15</b>
<b>PHẦN 3: ỨNG DỤNG DATAWAREHOUSE VÀ BI VÀO PHÂN TÍCH DỮ LIỆU LĨNH VỰC BÁN L ... 17</b>Ẻ<b>3.1. Gi i thi u v bài toán và ODS ... 17</b>ớ ệ ề<b>3.2. Ki n trúc DataWarehouse ... 18</b>ế<b>3.3. Ti n x lý d li u ... 18</b>ề ử ữ ệ<b>3.4. Mô hình d li u OLTP ... 21</b>ữ ệ<i><b>3.4.1. Sơ đồ quan hệ thực thể ... 21 </b></i>
<i><b>3.4.2. Mô t cả ấu trúc trong cơ sở ữ ệu ... 21 d li3.4.3. Phân tích các chi u Dimension</b></i>ề <b> ... 23</b>
<b>3.5. Mơ hình d li u OLAP ... 25</b>ữ ệ<b>3.6. Các m u Dashboard ... 26</b>ẫ<i><b>3.6.1. DashboardSale - Doanh thu ... 26</b></i>
<i><b>3.6.2. Dashboard Quantity - Sản lượng ... 33 </b></i>
<i><b>3.6.3. Dashboard Profit - L i nhu</b></i>ợ <i><b>ận ... 39 </b></i>
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">2
<b>KẾT LUẬN ... 45TÀI LI U THAM KH O ... 46</b>Ệ Ả
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">3
<b>ĐÁNH GIÁ THÀNH VIÊN NHÓM HỌ VÀ TÊN </b> Nguyễn Trọng Chiến
<b>LỚP </b> Quản trị kinh doanh 02 - K65
<b>NHĨM </b> Nhóm 7
<b>STT <sup>Tên thành </sup><sub>viên </sub></b>
<b>Làm t t </b>ố
<b>phần việc được </b>
<b>nhóm </b>
Ký (Ghi rõ họ tên) Chiến
<small> </small>Nguyễn Trọng Chiến
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">4
<b>TỰ ĐÁNH GIÁ BÁO CÁO </b>
Khoản th i gian h c tờ ọ ập môn Phân tích dữ liệu và tri thức kinh doanh trong học kì 2022.1 là giai đoạn nhóm em được ti p xúc v i m t m ng ki n th c mế ớ ộ ả ế ứ ới. Để ờ đây, vào cuối gi kì nhóm có cơ hội t ng h p và hổ ợ ệ th ng hóa l i m t vài ki n thố ạ ộ ế ức đã học, đồng th i k t h p v i ờ ế ợ ớdữ liệu thực tế để nâng cao kiến thức chun mơn, được trình bày thơng qua bài báo cáo cu i ốkì c a nhóm. Tuy ch có 17 tu n hủ ỉ ầ ọc, nhưng qua q trình học tập và trao đổi, nhóm em đã mởrộng tầm nhìn và tiếp thu nhiều kiến thức sẽ được s d ng trong suử ụ ốt 04 năm đạ ọi h c. Từ đó nhóm em nh n th y, vi c th c hiậ ấ ệ ự ện báo cáo vơi dữ ệ li u ngoài th c t là vô cùng quan tr ng - ự ế ọnó giúp sinh viên xây d ng n n t ng lý thuyự ề ả ết được học cũng như cách thức trình bày một bài tiểu luận báo cáo. Trong quá trình thực hiện bài báo cáo, từ ch còn b ng ỗ ỡ ỡ cho đến thiếu ki n ếthức và kinh nghiệm, nhóm em đã gặp phải rất nhiều khó khăn nhưng vớ ự giúp đỡ ậi s t n tình của th y Nguy n Danh ầ ễ Tú đã giúp nhóm em có được nh ng kinh nghi m, tr i nghi m quý báu ữ ệ ả ệđể hồn thành t t bài báo cáo. ố
Vì th i gian và ki n th c còn h n h p nên bài báo cáo không th tránh kh i nh ng thi u ờ ế ứ ạ ệ ể ỏ ữ ếsót, r t mong s góp ý c a th y Nguyấ ự ủ ầ ễn Danh Tú, để nhóm em rút kinh nghi m và hoàn thành ệtốt hơn trong những bài báo cáo tiếp theo.
Em xin chân thành c m ả ơn!
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">5
<b>LỜI M Ở ĐẦU </b>
Trong những năm gần đây xu thế ộ h i nh p v kinh tậ ề ế hi n nay, s c nh tranh di n ra ệ ự ạ ễgay gắt, để t n t i và phát tri n các doanh nghi p phồ ạ ể ệ ải đối m t v i r t nhiặ ớ ấ ều khó khăn. Đứng trước nh ng thách thữ ức như hiện nay, các doanh nghi p ph i khơng ng ng hồn thi n, nâng cao ệ ả ừ ệhoạt động kinh doanh của mình, đồng thời phải có những chiến lược kinh doanh để thích ứng cho mỗi giai đoạn phát tri n. Chính vì v y, viể ậ ệc phân tích thường xuyên hoạt động kinh doanh của doanh nghiệp sẽ giúp cho các nhà qu n tr ả ị đánh giá đầy đủ, chính xác mọi diễn biến và kết quả hoạt động s n xu t kinh doanh, biả ấ ết được những điểm mạnh, điểm yếu c a doanh ng iệp để ủcủng cố, phát huy hay khắc ph c, cụ ải tiến quản lý. Từ đó, doanh ghi p t n d ng phát huy m i ệ ậ ụ ọtiềm năng, khai th c tắ ối đa nguồ ựn l c nhằm đạt đến hi u qu cao nh t trong kinh doanh. K t ệ ả ấ ếquả của phân tích là cơ sở để đưa ra các quyết định qu n tr ng n h n và dài h n. Phân tích hi u ả ị ắ ạ ạ ệquả hoạt động kinh doanh thông qua dữ liệu thu thập được, giúp dự báo, đề phòng và hạn chế những rủi ro trong kinh doanh. Hi n nay, xu th phát tri n hung c a n n kinh t th gi i nói ệ ế ể ủ ề ế ế ớchung và n n kinh t cề ế ủa nước ta nói riêng địi hỏi các doanh nghi p ph i n l c r t l n m i có ệ ả ổ ự ấ ớ ớtể t n t i và phát triồ ạ ển được. Điều này đòi hỏi các nhà quản trị doanh nghiệp phải biết rõ thực lực c a doanh nghiủ ệp mình mà đề ra các phương hướng phát tri n phù hể ợp. Để làm được điều này nhà qu n tr ph i th c hi n nghiêm túc vi c phân tích k t qu hoả ị ả ự ệ ệ ế ả ạt động kinh doanh d a ựtrên d li u c a doanh nghi p mình. ữ ệ ủ ệ
Vì v y, phân tích k t qu hoậ ế ả ạt động kinh doanh có vai trị r t quan trấ ọng đối với mọi doanh nghi p. Việ ệc hoàn thành hay không đạt được k hoế ạch kinh doanh đề ra s quyẽ ết định sự sống còn c a m t doanh nghiủ ộ ệp. Để rút ng n kho ng cách c a nh ng d tính k ho ch thì vi c ắ ả ủ ữ ự ế ạ ệphân tích k t qu hoế ả ạt động kinh doanh c a doanh nghi p phủ ệ ải được th c hi n c n tr ng nh m ự ệ ẩ ọ ằcó sự đánh giá đúng đắn và chính xác. Từ đó, nhà quản tr s có nhị ẽ ững định hướng cho tương lai c a doanh nghi p phù h p v i s phát tri n chung c a n n kinh tủ ệ ợ ớ ự ể ủ ề ế đất nước, tăng khả năng cạnh tranh cho doanh nghiệp, giúp doanh nghiệp phát triển bền vững.
Đồng thời với s phát tri n ngày càng nhanh c a Công ngh , vi c phân tích d li u t ự ể ủ ệ ệ ữ ệ ừđo xây dựng lên các Dashboard ngày càng tr nên d dàng. Vì v y, nhóở ễ ậ m em đã lựa ch n Phân ọtích d li u vữ ệ ới bài tốn “Bán lẻ” thơng qua Hệ cơ sở ữ ệ d li u và Quá trình kinh doanh thơng minh (BI).
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Hình 3. 19. Dashboard Doanh thu_Năm 2015 ... 30
Hình 3. 20. Dashboard Doanh thu_Năm 2016 ... 31
Hình 3. 21. Dashboard Doanh thu_Năm 2017 ... 32
Hình 3. 22. Dashboard S n lả ượng_Tổng quát ... 34
Hình 3. 23. Dashboard Sản lượng_Năm 2014 ... 35
Hình 3. 24. Dashboard Sản lượng_Năm 2015 ... 36
Hình 3. 25. Dashboard Sản lượng_Năm 2016 ... 37
Hình 3. 26. Dashboard Sản lượng_Năm 2017 ... 38
Hình 3. 27. Dashboard L i nhuợ ận_Tổng quát ... 40
Hình 3. 28. Dashboard L i nhuợ ận_Năm 2014 ... 41
Hình 3. 29. Dashboard L i nhuợ ận_Năm 2015 ... 42
Hình 3. 30. Dashboard L i nhuợ ận_Năm 2016 ... 43
Hình 3. 31. Dashboard L i nhuợ ận_Năm 2017 ... 44
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">7
<b>DANH MỤC B NG BI U </b>Ả Ể
Bảng 3. 1. Mô tả các trường dữ liệu ... 17
Bảng 3. 2. Mô tả cấu trúc DetailOrde ... 22
Bảng 3. 3. Mô tả cấu trúc Customer ... 22
Bảng 3. 4. Mô tả cấu trúc Order ... 22
Bảng 3. 5. Mô tả cấu trúc Category ... 22
Bảng 3. 6. Mô tả cấu trúc Product ... 23
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">Data Warehouse hoạt động như một kho lưu trữ trung tâm. D liữ ệu đi vào kho dữ ệ li u từ h th ng giao dệ ố ịch và các cơ sở ữ ệu liên quan khác. Sau đó, dữ ệu đượ d li li c x lý, chuy n ử ểđổi để người dùng có thể truy cập những dữ liệu này thông qua công cụ Business Intelligence, SQL client hay b ng tính. ả
Một Data Warehouse thường bao gồm các yếu tố như: • Một cơ sở dữ liệu quan hệ để lưu trữ và quản lý dữ liệu.
• Giải pháp trích xuất, tải và biến đổi ELT để chuẩn b dị ữ liệu cho phân tích. • Khả năng phân tích thống kê, báo cáo và khai thác dữ liệu.
• Các cơng cụ phân tích khách hàng để ự tr c quan hóa và trình bày d li u cho ữ ệngười dùng doanh nghiệp.
• Các ng d ng phân tích khác, ph c tứ ụ ứ ạp hơn tạo ra thơng tin có thể hành động bằng cách áp dụng khoa học dữ liệu và thuật toán trí tuệ nhân tạo AI hoặc các tính năng đồ thị và không gian cho phép nhi u lo i phân tích d liề ạ ữ ệu hơn trên quy mơ l n. ớ
Bên cạnh đó, Data Warehouse cũng có những đặc tính nhất định của b n thân h ả ệ cơ sở, bao gồm 04 đặc tính: hướng chủ đề, tích hợp, dữ liệu theo thời gian và bền vững; giống như Inmon, W.H - một chuyên gia hàng đầu trong vi c xây d ng h th ng kho d li u - ệ ự ệ ố ữ ệ từng đề cập "Một kho dữ liệu là một tập hợp dữ liệu hướng chủ đề, tích hợp, biến thể thời gian, ít biến động hỗ trợ cho quá trình đưa ra quyết định của doanh nghiệp"; cụ thể như sau:
<b>Hướng chủ đề: Thông tin trong Data Warehouse sẽ được tập trung vào việc mơ hình </b>
và phân tích dữ liệu cho việc ra quyết định chứ không phải xử lý các giao dịch hay tác nghiệp hàng ngày xoay quanh các chủ thể như: khách hàng, sản phẩm và doanh thu. Mục đích của Kho dữ liệu là phục vụ các yêu cầu phân tích, hoặc khai phá cụ thể được gọi là chủ đề dưới một góc nhìn cụ thể và đơn giản quanh một chủ đề bằng cách loại trừ dữ liệu thừa đối với quá trình đưa ra quyết định.
Tích hợp: Một kho dữ liệu thường được xây dựng bởi việc tích hợp nhiều nguồn dữ liệu khác nhau chẳng hạn như cơ sở dữ liệu quan hệ, các tập tin, và hồ sơ giao dịch trực tuyến. Áp dụng các kỹ thuật, tiền xử lý dữ liệu ETL nhằm làm sạch dữ liệu, tổng hợ dữ liệu từ nhiều p nguồn vào một kho dữ liệu cho phé người sử dụng có thể xem đồng thời nhiều nhóm chỉ tiêu p khác nhau, từ đó đảm bảo tính nhất quán giữa các nguồn dữ liệu.
Dữ liệu theo thời gian Vì dữ liệu thay đổi liên tục nên chúng sẽ được gán 1 nhãn thời : gian tương ứng tại thời điểm nhập liệu. Việc gắn thời gian này giúp người sử dụng dễ dàng so sánh dữ liệu với nhau để biết được các thay đổi đang đi theo chiều hướng tích cực hay tiêu cực.
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">9 cả các cấu trúc quan trọng trong kho dữ liệu chứa, hoặc ngầm chứa một phần tử của thời gian.
<b>Bền vững: Một kho dữ liệu luôn luôn là kho riêng biệt về mặt vật lý đối với dữ liệu </b>
trong xử lý giao tác hàng ngày. Do việc tách biệt này, một kho dữ liệu không yêu cầu xử lý giao dịch, phục hồi, và cơ chế kiểm soát xử lý đồng thời. Nó thường địi hỏi chỉ có hai hoạt động trên dữ liệu là tải dữ liệu và làm mới dữ liệu.
1.2. Vai trò của Data Warehouse
Sự xuất hiện của kho dữ liệu nhằm mục đích đáp ứng lượng dữ liệu ngày càng tăng cần được xử lý. Nhu cầu lưu trữ dữ liệu tăng lên đi kèm với đó là sự phức tạp của hệ thống máy tính. Từ đó, ta thấy được những lợi ích mà kho dữ liệu mang lại cho doanh nghiệp như:
• Tích hợp dữ liệu vào một nguồn, ở cùng một định dạng, giải quyết sự phân mảnh và mất cân bằng dữ liệu để đáp ứng nhu cầu thông tin của tất cả người dùng. • Tiết kiệm thời gian và hiệu quả trong việc tìm kiếm dữ liệu cần thiết.
• Thơng qua xử lý và phân tích dữ liệu Data Warehouse giúp cho dữ liệu của doanh nghiệp hiệu quả hơn.
• Giúp người dùng đưa ra các quyết định hợp lý, nhanh chóng và hiệu quả, đem lại nhiều lợi nhuận hơn,…
• Giúp tổ chức, xác định, quản lý và thực hiện các dự án/hoạt động một cách hiệu quả và chính xác.
• Tăng đáng kể lượng dữ liệu cần được tổng hợp, lưu trữ và xử lý.
<b>1.3. Cấu trúc dữ liệu cho </b>kho dữ liệu
Lượng dữ liệu trong kho là rất lớn và khơng có những thao tác như sửa đổi hay tạo mới nên nó cần được tối ưu cho việc phân tích và báo cáo. Các thao tác với dữ liệu của kho dựa trên cơ sở Mơ hình dữ liệu đa chiều (multidimensional data model), được mơ hình hố vào đối tượng được gọi là data cube. Data cube là trung tâm phân tích, nó bao gồm nhiều dữ kiện (fact) và dữ kiện tạo ra nhiều chiều dữ kiện khác nhau (dimention).
Hình 1. 1. Mơ hình d li u nhi u chi u. ữ ệ ề ề
Trong kho dữ liệu Data Warehouse, ta sẽ bắt gặp 03 loại dữ kiện như: (1) Additive - dữ
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">10 Additive những sự kiện có thể được tóm tắt cho một số Dimension trong bảng Fact chứ không phải là những bảng khác; (3) Non-Additive Là những sự kiện không được tóm tắt cho bất kỳ Dimension hiện tại nào trong bảng Fact. Đồng thời, hệ thống kho dữ liệu gồm 3 tầng: (1) Tầng đáy - cung cấp dịch vụ lấy dữ liệu từ nhiều nguồn sau đó chuẩn hoá, làm sạch, tối ưu và lưu trữ dữ liệu đã tập trung; (2) Tầng giữa - cung cấp các dịch vụ thực hiện các thao tác với dữ liệu hay là dịch vụ OLAP; (3) Tầng trên - nơi chứa các câu truy vấn, báo cao, phân tích.
Bên cạnh đó, trong q trình phân tích dữ liệu ta sẽ bắt gặ các hoạt động OLAp P chính: • Thu nhỏ (roll up): Tập hợp thành những tập có phạm vi lớn hơn. VD: tập hợp theo năm -
thay vì theo q.
• Mở rộng (drill down): Chia nhỏ thành nhiều tập dữ liệu.- VD: Nhóm theo tháng thay vì theo q.
• Cắt lát (slice): Nhìn theo từng lớp một VD: Từ danh mục bán hàng của Q1,Q2,Q3, Q4 chỉ xem của quý Q1.
• Thu nhỏ (dice): Bỏ bớt một phần của dữ liệu.
• Pivot (rotate): Trực quan hóa, 3D thành hàng mặt phẳng 2D.
<b>1.4. Các loại lược đồ của kho dữ liệu </b>
<i><b>1.4.1. Lược đồ hình sao (Start Schema) </b></i>
Gồm 1 bảng Fact (bảng sự kiện) nằm ở trung tâm và được bao quanh bởi những bảng Dimension (bảng chiều). Dữ liệu của lược đồ hình sao khơng được chuẩn hố. Các câu hỏi nhằm vào bảng Fact và được cấu trúc bởi các bảng Dimension.
Hình 1. 2. Đồ thị lược đồ hình sao.
Ưu điểm: Bảng Fact, Dimension được mô tả rõ ràng, dễ hiểu. Bảng Dim là bảng dữ liệu tĩnh, và bảng Fact là dữ liệu động được nạp bằng các thao tác. Khoá của Fact được tạo bởi khoá của các bảng Dim. Nghĩa là khố chính của các bảng Dim chính là khố của bảng Fact.
Nhược: Dữ liệu khơng được chuẩn hố.
<i><b>1.4.2. Lược đồ bơng tuyết (Snow Flake Schema) </b></i>
Lược đồ bông tuyết là dạng mở rộng của lược đồ hình sao bằng các bổ sung các Dim. Bảng Fact như lược đồ hình sao, bảng Dim được chuẩn hoá. Các chiều được cấu trúc rõ ràng. Bảng Dim được chia thành chiều chính hay chiều phụ,
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">11 Nhược: Cấu trúc phi dạng chuẩn của lược đồ hình sao phù hợp hơn cho việc duyệt các chiều.
Hình 1. 3. Đồ ị lược đồ th hình sao.
<i><b>1.4.3. Galaxy Schema </b></i>
Galaxy Schema chứa nhiều bảng Fact sử dụng chung một số bảng Dim. Lược đồ là sự kết hợp của nhiều data mart (kho dữ liệu có chủ đề, dạng thu nhỏ của kho dữ liệu, kho dữ liệu được chia thành nhiều phần nhỏ khác nhau).
Hình 1. 4. Đồ ị lược đồ th Galaxy.
<i><b>1.4.4. Fact Constellation Schema </b></i>
Dimension trong lược đồ được tách thành các Dimension độc lập dựa trên các cấp độ của hệ thống phân cấp.
Hình 1.5. Đồ thị lược đồ Fact Constellation.
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">14 • Phân tích th ng kê (Statistical analysis); ố
• Dự đốn (Forecasting).
Bên cạnh đó, ệ vi c xác l p báo cáo trong h th ng BI cậ ệ ố ần lưu ý các bước quan trọng, bao gồm:
<b>• Data sources: Đầu tiên, các d li u s </b>ữ ệ ẽ được thu th p t các ngu n d liậ ừ ồ ữ ệu đa dạng như CRM, HRM, các trang web Thương mại điện tử,..
<b>• Data warehousing (Kho d li u): Kho d li u </b>ữ ệ ữ ệ là nơi dữ ệu được lưu trữ li lâu dài b ng ằhệ thống các thiết b ịđiện tử của doanh nghiệp;
<b>• Integrating Server (Tích h p máy ch ): Giúp v n hành công c </b>ợ ủ ậ ụ ETL để chuyển đổi dữ liệu từ Data Sources sang Data Warehouse;
<b>• Analysis Server (Máy ch</b>ủ phân tích): Đầu vào c a d liủ ữ ệu, sau đó thu nhận d li u s ữ ệ ẽtrả về kết quả dựa trên tri thức nghiệp vụ đã định nghĩa sẵn;
<b>• Reporting Server (Máy ch báo cáo): B ph n báo cáo các output nh</b>ủ ộ ậ ận được t ừAnalysis Server;
<b>• Data Mining (Khai thác d li</b>ữ ệu): Đây là quá trình dữ ệu đ li ã qua xử lý được đem đi trích xuất, được đánh giá là một trong nh ng khâu khá quan tr ng! Data Mining bao ữ ọgồm phân loại (classification), phân cụm (Clustering), hoặc dự đốn (Prediction);
<b>• Data Presentation (Trình bày d li u): Cu i cùng, d li u s </b>ữ ệ ố ữ ệ ẽ đượ ổc t ng h p thành các ợbiểu đồ từ quá trình data mining được tạo ra từ đây.
<b>2.3. ng d ng và l i ích c a BI trong kinh doanh </b>Ứ ụ ợ ủ
<i><b>2.3.1. ng d ng </b></i>Ứ ụ
<b>2.3.1.1. Tr c quan d li u </b>ự ữ ệ
Phần mềm BI s d ng m t lo t các công c phân tích d liử ụ ộ ạ ụ ữ ệu được thi t k ế ế để phân tích và qu n lý d liả ữ ệu liên quan đến hoạt động kinh doanh c a doanh nghi p. D liủ ệ ữ ệu này, được trình bày dưới dạng trực quan, cho phép t ch c theo dõi hoổ ứ ạt động h u cậ ần, bán hàng, năng suất và hơn thế nữa.
Một s n n t ng BI cung c p khố ề ả ấ ả năng báo cáo tùy chỉnh, nơi người dùng có thể chỉ định các thông s c a h . Nhố ủ ọ ững người khác cung c p các m u báo cáo sấ ẫ ẵn có đã bao gồm các chỉ số tiêu chuẩn ngành.
Trình bày d li u b ng hình nh trữ ệ ằ ả ực quan và định d ng d hi u, h th ng BI cho phép ạ ễ ể ệ ốngay c nhân viên ít kinh nghi m nhả ệ ất cũng có thể rút ra thơng tin chi ti t t d li u. Thay vì ế ừ ữ ệdựa vào các nhà khoa h c dọ ữ liệu được đào tạo để phân tích dữ liệu của mình, nhà quản tr có ịthể phân tích và trình bày d li u c a chính mình cho các c ữ ệ ủ ổ đơng, các bộ phận khác ho c nhóm ặcủa cơng ty.
Trên th c t , ta có thự ế ể nghĩ đến m t s h thộ ố ệ ống BI như: QlikView, Power BI, Spago, Pentaho, SAP BO, Oracle BI, IBM Cognos.
<b>2.3.1.2. Báo cáo </b>
Một ng d ng kinh doanh quan tr ng c a BI là báo cáo. Các công c BI thu th p và ứ ụ ọ ủ ụ ậnghiên c u các t p h p d li u phi c u trúc ngoài vi c t ch c và s dứ ậ ợ ữ ệ ấ ệ ổ ứ ử ụng chúng để ạ t o ra m t ộloạt các loại báo cáo khác nhau. Chúng có thể bao gồm nhân sự, chi phí, bán hàng, d ch v ị ụkhách hàng và các quy trình khác.
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">15 đích, phân phối, nhiệm vụ và giá tr . Báo cáo là quá trình s p x p d liị ắ ế ữ ệu dưới dạng tóm t t v i ắ ớmục đích theo dõi hoạt động kinh doanh. Phân tích là q trình khám phá d liữ ệu để rút ra những hiểu biết sâu sắc có thể được áp dụng để ả c i thiện thực tiễn kinh doanh.
Về cơ bản, báo cáo biến dữ liệu thành thơng tin đơn giản. Phân tích lấy dữ liệu và biến nó thành thơng tin chi ti t h u ích. Cế ữ ả hai đều giúp doanh nghi p c i thi n hi u su t và giám ệ ả ệ ệ ấsát hoạt động nhưng sử ụng các phương pháp khác nhau để làm điều đó. d
Báo cáo cho người dùng biết điều gì đang xảy ra và phân tích giải thích lý do t i sao ạđiều đó lại xảy ra. Cả hai quy trình đều có thể được thực hiện bằng hình ảnh hóa nhưng khơng nhất thiết phải làm như vậy.
Các công c ụ BI là lý tưởng để xử lý d liữ ệu động. V m t l ch s , tr c quan hóa d li u ề ặ ị ử ự ữ ệlà tĩnh và một cái mới sẽ phải được tạo cho mỗi lần thay đổi biến. Phần mềm BI hiện đại cung cấp các bảng điều khiển tương tác có thể ập nh t theo th i gian th c ậ ờ ực, mang đến m t cộ ấp độmới v kh ng s d ng và s nhanh nh y trong phân tích d li u. ề ả nă ử ụ ự ạ ữ ệ
<b>2.3.1.3. Qu n lý hi u su t </b>ả ệ ấ
Với các ứng dụng BI, các tổ chức có thể theo dõi tiến độ ục tiêu dựa trên khung th i m ờgian được xác định trước hoặc có thể tùy ch nh. Các mỉ ục tiêu theo hướng d liữ ệu như thờ ại h n hoàn thành d án, m c tiêu th i gian giao hàng ho c m c tiêu bán hàng. Ví d , n u nhà qu n ự ụ ờ ặ ụ ụ ế ảlý muốn đạt được m t m c tiêu bán hàng nhộ ụ ất định, h th ng BI c a h có th phân tích d li u ệ ố ủ ọ ể ữ ệcủa các tháng trước đó và đề xuất một mục tiêu hợp lý để hướng tới dựa trên hiệu suất trong quá kh . ứ
Các m c tiêu này có thụ ể được theo dõi ch t chặ ẽ để cung c p thông tin c p nhấ ậ ật thường xuyên v tiề ến độ ục tiêu. Điề m u này giúp nhà qu n lý hi u nh ng kho ng tr ng có th cịn lả ể ữ ả ố ể ại. Người dùng có th ể cài đặt h th ng c nh báo khi h sệ ố ả ọ ắp đạt được m c tiêu ho c n u th i ụ ặ ế ờhạn kết thúc mà họ vẫn chưa đạt được mục tiêu. Điều này giúp các nhà quản lý và nhân viên luôn c p nh t tiậ ậ ến độ ủ c a h ọ và giúp các nhóm ln hướng t i m c tiêu. ớ ụ
Người dùng cũng có thể theo dõi việc hoàn thành mục tiêu và sử dụng dữ liệu tiến độđể đánh giá năng suất t ng th của m t t ch c. Không giổ ể ộ ổ ứ ống như các trường hợp m t m t ấ ộlượng thời gian đáng kể để theo dõi ho c s p x p d li u c n thi t kh n c p, thơng tin ln có ặ ắ ế ữ ệ ầ ế ẩ ấthể truy cập dễ dàng. Điều này giúp doanh nghiệp tiết kiệm th i gian và ti n bờ ề ạc.
Từ đó, mỗi doanh nghi p s tìm cho mình nhệ ẽ ững hướng đi phù hợp với định hướng phát triển và gia tăng tính cạnh tranh trong q trình kinh doanh c a mình. Ngồi ra, khi áp d ng BI ủ ụvào q trình kinh doanh, doanh nghiệp cịn được nh n nh ng l i ích sau: ậ ữ ợ
• Đưa ra những thông tin và giúp doanh nghiệp sử dụng những thông tin một cách hiệu
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">16 • Giúp doanh nghiệp đưa ra những quyết định nhanh chóng, k p th i. ị ờ
• Phân tích và dự đốn xu hướng và hành vi c a khách hàng, giúp doanh nghi p v lên ủ ệ ẽbức tranh khách hàng tổng thể.
• BI giúp doanh nghi p hoệ ạch định t t c k ho ch, chiấ ả ế ạ ến lược marketing trong tương lai. • Giúp doanh nghi p có cái nhìn khách quan, t ng th v doanh nghi p c a mình ệ ổ ể ề ệ ủ• Tối ưu chi phí và thời gian hoạt động cũng như hỗ trợ sát sao công tác điều hành của
doanh nghi p. ệ
• Lợi thế tính về cạnh tranh, nắm trong tay nhiều cơ hội kinh doanh. • Giúp doanh nghiệp đánh giá và cải thi n b máy c a t ch c. ệ ộ ủ ổ ứ
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">17
<b>PHẦN 3: ỨNG DỤNG DATAWAREHOUSE VÀ BI VÀO PHÂN TÍCH DỮ LIỆU LĨNH VỰC BÁN LẺ </b>
<b>3.1. Gi i thi u v bài toán và ODS </b>ớ ệ ề
T p d li u ậ ữ ệ được s d ng trong bài phân tích thuử ụ ộc lĩnh vực bán hàng t i th ạ ị trường Hoa kỳ trong giai đoạn 2014 - 2017, được cung cấ bởi Michael Martin. Dữ liệu gồm 21 cột, tương p ứng với 21 giữ liệu với 9994 đơn hàng được thực hiện trong suốt 04 năm bao gồm 792 khách hàng khác nhau được chia ra làm 03 bộ phận khách hàng chính Người tiêu dùng: (Consumer), tổ chức (Corporate), văn phòng (Home Office).
1 Row ID (Order Item Id) Đơn hàng thứ n
3 Order Date Ngày đặt hàng
5 Ship Mode Chế độ vận chuyển 6 Customer ID Mã ID khách hàng 7 Customer Name Tên khách hàng
9 Country Quốc gia cư trú của khách hàng 10 City Thành phố cư trú của khách hàng 11 State Bang cư trú của khách hàng 12 Postal Code Mã bưu chính
Bảng 3. 1. Mơ tả các trường dữ liệu
Hình 3. 1. Sơ đồ quy trình nghi p v . ệ ụ
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">18
<b>(Requirement), bao gồm: Sale, Quantity, Profit; các FACT được được phân tích dựa trên các </b>
DIM như: Order Date (Month, Quarter, Year), Ship Mode, Segment, Region, State, City, Category, Sub - Category, Product.
Vi c phân tích các chệ ủ điểm d a vào các DIM trên s giúp ự ẽ ngườ ử ụi s d ng có cái nhìn tổng qt nh t v k t qu kinh doanh, cung cấ ề ế ả ấp nh ng thông tin c n thi t cho vi c ra quyữ ầ ế ệ ết định (chân dung khách hàng tiềm năng, dòng sản phẩm được sử dụng nhiều, doanh thu của sản phẩm...) từ đó cải thiện hiệu suất kinh doanh.
<b>3.2. Ki n trúc DataWarehouse </b>ế
Hình 3. 2. Ki n trúc Data Warehouse c a h th ng qu n lý hoế ủ ệ ố ả ạt động bán l . ẻ
<b>Tầng đầu tiên c a ki n trúc là Data Source - </b>ủ ế “Sample Superstore” đượ ấ ự ệ cơ sởc l y t hdữ liệu hoạt động t các nguừ ồn bên ngồi (file csv, excel...). Những cơng cụ và tiện ích này thực hiện việc loại b d liỏ ữ ệu thừa, làm sạch dữ liệu, chuyển i d li u, c p nh t d li u. D đổ ữ ệ ậ ậ ữ ệ ữliệu được lưu trữ vào 5 bảng:
(1) B ảng Detail Order; (2) B ảng Customer; (3) B ảng Order; (4) B ảng Produc; (5) B ảng Category.
Tầng ti p theo là vi c s d ng các công c tích h p trên Excel ho c Power Query nh m ế ệ ử ụ ụ ợ ặ ằETL - ti n x lý d liề ử ữ ệu trước khi <b>đưa vào Data Warehouse. Tầng giữa là “</b>Storage Layer” bao gồm các Data Warehouse và Data marts được cài đặt dùng mơ hình quan h OLAP. ệ <b>Tầng trên cùng là tầng người dùng cuối, gồm các câu truy v n và các công c làm báo cáo, phân tích, </b>ấ ụcơng c khai thác d li u, thông qua công c Power BI v : ụ ữ ệ ụ ề
(1) Quantity: Số lượng đơn đặt hàng được đặt; (2) Sale: Doanh thu;
(3) Profit: L i nhuợ ận thu được.
<b>3.3. Ti n x lý d li u </b>ề ử ữ ệ
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">19 cột, xóa dữ li u trùng l p, xóa d li u trệ ặ ữ ệ ống, định d ng l i dạ ạ ữ li u, tách sheet, transform d li u ệ ữ ệsang Power BI.
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">20 Hình 3. 6. Xóa d li u null. ữ ệ
Đị<b>nh d ng l i d li u </b>ạ ạ ữ ệ
Hình 3. 7. Định d ng l i d li u. ạ ạ ữ ệ
<b>Tách sheet </b>
Hình 3. 8. Tách d li u thành t ng b ng. ữ ệ ừ ả
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">21 ữ ệ
Hình 3. 9. Chuy n d li u sang Power BI. ể ữ ệ
<b>3.4. Mơ hình d li u OLTP </b>ữ ệ
<i><b>3.4.1. Sơ đồ quan hệ thực thể </b></i>
Hình 3. 10. Sơ đồ quan h th c th OLTP. ệ ự ể
<i><b>3.4.2. Mô t c</b></i>ả ấu trúc trong cơ sở ữ ệ<i><b> d li u </b></i>
<b>Bảng “FACT DetailOrder” </b>
<b>STT Tên thu c tính </b>ộ <b>Kiểu </b>
2 Customer ID Nvarchar(255) 3 Product ID Nvarchar(255)
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">23
<b>STT Tên thu c tính </b>ộ <b>Kiểu </b>
1 Category ID Nvarchar(255) 2 Product ID Nvarchar(255)
4 Product Name Nvarchar(255)
Bảng 3. 6. Mô tả cấu trúc Product
<i><b>3.4.3. Phân tích các chi u Dimension </b></i>ề
<b>3.4.3.1. Các chi u phân tích </b>ề
<b>Chiều thời gian </b>
<b>STT Tên thu c tính </b>ộ <b>Kiểu </b>
Bảng 3. 7. OLTP - Dim_Date
<b>Chiều sản phẩm </b>
<b>STT Tên thu c tính </b>ộ <b>Kiểu </b>
1 Product ID Nvarchar(255) 2 Category ID Nvarchar(255) 3 Category Name Nvarchar(255)
Bảng 3. 10. OLTP - Dim_Customer
</div>