Tải bản đầy đủ (.pdf) (16 trang)

tiểu luận phân nhóm khách hàng theo phương pháp phân tích cụm cluster analysis với thuật toán k means

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.43 MB, 16 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

<b>BÁO CÁO BÀI TẬP CUỐI KÌ</b>

<b>HỌC PHẦN: PHÂN TÍCH KINH DOANH TRONG MƠI TRƯỜNG SỐ</b>

Giảng viên hướng dẫn : Hoàng Văn Hải

Sinh viên thực hiện : Trần Thị Mỹ Linh

<i>Đà Nẵng, 2023</i>

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

<b>Lời mở đầu</b>

Trong bối cảnh ngày nay, môi trường kinh doanh đang chứng kiến sự biến đổi đáng kể do sự lan tỏa mạnh mẽ của công nghệ và môi trường số. Dữ liệu, được xem là dầu mỏ của thời đại số, đóng vai trị quan trọng trong việc định hình chiến lược kinh doanh và tạo ra lợi thế cạnh tranh. Báo cáo này tập trung vào phân tích dữ liệu khách hàng của một doanh nghiệp bằng cách sử dụng cơng cụ phân tích dữ liệu như Excel và Tabeau để trích xuất thơng tin có ý nghĩa. Bằng cách này, chúng ta có thể nhìn nhận rõ hơn về cách dữ liệu có thể được biến đổi thành thông tin chiến lược, giúp doanh nghiệp hiểu rõ hơn về thị trường, khách hàng và cơ hội kinh doanh. Từ đó, giúp nhà quản trị đưa ra quyết định phù hợp hơn cho doanh nghiệp.

Trân trọng cảm ơn thầy Hoàng Văn Hải đã đọc bài cáo và nhận xét!

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

Hình 2. Dashboard thể hiện đặc tính của khách hàng...11

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<small>GVHD: Hồng Văn Hải</small>

<b>I. Phân nhóm khách hàng theo phương pháp phân tích cụm (Cluster Analysis) với thuật tốn K-means</b>

Ta sử dụng thuật toán K-means để phân tập dữ liệu thành các cụm (cluster) khácnhau trong cùng một 1 cụm có tính chất giống nhau. Từ đó, doanh nghiệp có thểdựa vào phân tích để đưa ra những chiến lược phù hợp cho doanh nghiệp củahọ. Ta thực hiện các bước sau:

<b>1. Lựa chọn thuộc tính</b>

Tập dữ liệu của cơng ty chứa nhiều những thuộc tính khác nhau. Mỗi thuộc tínhđều biểu hiện một giá trị dạng số hay phi số nào đó của giao dịch như mã kháchhàng, tuổi khách hàng, mức mua sắm… Ở tập trung khai thác vào các thuộc tínhsau: thu nhập và mức mua sắm của khách hàng.

Việc chọn hai đặc tính trên để phân tích nhóm khách hàng sẽ giúp em hiểu, biếtđược hơn về nhóm khách hàng nào đang dành lượng lớn thu nhập để gia tăngmức mua sắm. Điều này cho thấy được độ hấp dẫn của sản phẩm, lòng trungthành của khách hàng đối với doanh nghiệp.

<b>2. Chuẩn hóa thang đo</b>

Đầu tiên em chuẩn hóa thang đo cột thu nhập khách hàng theo năm theo địa chỉ cột mới là K2 với công thức excel:

Save to a Studylist

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

<b>4. Khởi tạo centroid và tính khoảng cách </b>

Tính khoảng cách từ tâm đến cluster với công thức : =SQRT((L2-$AB$3)^2+(K2-$AB$2)^2)

5

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<small>GVHD: Hồng Văn Hải</small>

Sau đó, tương tự với các cụm cluster sau

Tâm là giá trị em cho ngẫu nhiên từ -1 đến 1 và tiến hành lựa chọn Cluster nàocó giá trị min trong 5 cluster vừa tính được ở câu trên

Tiếp theo, em tính khoảng cách của các cluster và cột tổng khoảng cách em sẽ để ở dạng function tổng của cả 5

6

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

<b>5. Phân cụm khách khàng</b>

Sau khi có tổng khoảng cách của các cluster, em chạy solver như ảnh ở dưới vì ta tìm khoảng cách nhỏ nhất giữa các cluster đến tâm cụm. Chọn giá trị nằm trong khoảng (-3; 3) vì đây là giá trị nhỏ nhất là lớn nhất của dữ liệu vừa normalized ở trên

7

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<small>GVHD: Hoàng Văn Hải</small>

Kết quả sau khi chạy xong đã cho ra khoảng cách 98,775Vẽ biểu đồ từ địa chỉ từ cluster 1-cluster 5

và sau đó kích chuột phải vào biểu đồ để select data xác định tâm cụm, ví dụ cho cụm 1 và thực hiện tương tự các cụm khác

Cluster 1:

Centroid 1:

8

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

Sau khi làm tương tự ta nhấn OK và chỉnh sửa sao cho trực quan.

<b>II. Phân tích các đặc tính của khách hàng theo nhóm khách hàng</b>

<i><small>Hình 1. Cluster Chart</small></i>

<b>1. Cụm 1 </b>

Kích thước cụm 1 là 80 đối tượng, phân bố tập trung và sát tâm

Tâm điểm cụm 1 (centroid cluster 1): độ tuổi 43,2; thu nhập $55,088/năm; mức mua sắm $4,971

Cụm khách hàng 1 màu xanh lá thuộc nhóm khách hàng có mức mua sắm và thu nhập trung bình

<b>2. Cụm 2 </b>

Kích thước cụm 2 là 23 đối tượng, phân bố rải rác và xa tâm

9

</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">

<small>GVHD: Hoàng Văn Hải</small>

Tâm điểm cụm 2 (centroid cluster 2): độ tuổi 45,7; thu nhập $26,304/năm; mức mua sắm $2,09

Cụm khách hàng 2 màu cam thuộc nhóm khách hàng có mức mua sắm và thu nhập đều thấp

<b>3. Cụm 3</b>

Kích thước cụm 3 là 39 đối tượng, phân bố không đồng đều và xa tâm

Tâm điểm cụm 3 (centroid cluster 3): độ tuổi 32,7; thu nhập $86,538/năm; mức mua sắm $8,213

Cụm khách hàng 3 màu đỏ thuộc nhóm khách hàng có mức mua sắm thu nhập đều cao

<b>4. Cụm 4</b>

Kích thước cụm 4 là 22 đối tượng, đa số tập trung ở rìa tâm và khơng đồng đềuTâm điểm cụm 4 (centroid cluster 4): độ tuổi 25,3; thu nhập $25,727/năm; mức mua sắm $7,936

Cụm khách hàng 4 màu vàng thuộc nhóm khách hàng có mức mua sắm cao và có thu nhập thấp

</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">

<i><small>Hình 2. Dashboard thể hiện đặc tính của khách hàng</small></i>

</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">

<small>GVHD: Hồng Văn Hải</small>

 Nhận xét:

Theo hình trên, ta thấy rằng nhóm khách hàng này đơng nhất tập trung ở phía Tây và Trung Tây, có thu nhập và chi tiêu ở mức tầm trung. Tỉ trọng đơn đặt hàng của nhóm này chiếm 41,79% so với tổng số đơn, tuy nhiên vào năm 2021 nó có xu hướng mua sắm giảm so với năm ngoái mà mức chiết khấu của doanh nghiệp cung cấp chỉ ở mức 9,35% thấp hơn so với trung bình các nhóm khác. Điều này đã khiến doanh nghiệp mất đi lượng khách hàng đáng kể và doanh thu cũng giảm.

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này.

<b>2. Cụm 2 (cluster 2)</b>

 Nhận xét:

12

</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">

<b>3. Cụm 3 (cluster 3)</b>

 Nhận xét:

Theo hình trên, ta thấy rằng nhóm khách hàng vẫn có số lượng ít tuy nhiên đứngthứ 2 trong tổng số lượng, tập trung ở phía Tây Trung Tây và phía Nam, có thu nhập và chi tiêu nằm trong top đầu. Tỉ trọng đơn đặt hàng của nhóm này chiếm 18,49% so với tổng số đơn, ngoài ra vào năm 2021 nhóm này cịn có xu hướng mua sắm tăng mạnh so với năm ngoái và mức chiết khấu đang ở mức cao nhất 18,49%. Điều này đã giúp doanh nghiệp có thêm khách hàng mới và doanh thu cũng tăng.

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này.

<b>4. Cụm 4 (cluster 4)</b>

13

</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">

<small>GVHD: Hoàng Văn Hải</small>

Theo hình trên, ta thấy rằng đây là nhóm khách hàng có số lượng ít nhất, tập trung ở phía Tây Trung Tây và phía Nam. Tuy họ có thu nhập nhấp nhưng mức mua sắm lại cao đứng thứ 2. Tỉ trọng đơn đặt hàng của nhóm này chiếm tỉ lệ khá cao là 21,64% so với tổng số đơn mặc dù mức chiết khấu đang ở mức thấp nhất 6,96%. Mức mua sắm vào năm 2021 của nhóm này đột ngột chững lại. Điều này đang là mối đe dọa doanh nghiệp bởi lẽ doanh thu từ nhóm khách hàng này khơng cịn nữa.

Vì vậy, trong năm tiếp theo doanh nghiệp nên cân nhắc về chính sách thưởng hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này.

</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">

hay những sản phẩm/dịch vụ mới để thu hút nhóm khách hàng này.

<b>IV. Chính sách thưởng cuối năm</b>

Để đưa ra chính sách tặng thưởng cuối năm cho nhóm khách hàng mua sắm thường xun thì doanh nghiệp nên kết hợp chiến lược ưu tiên giữa việc giữ chân khách hàng hiện tại và thu hút khách hàng mới có tiềm năng tăng trưởng. Cụm 3 và Cụm 5 có vẻ là ứng viên tiềm năng cho chính sách thưởng cuối năm do có sự cân bằng giữa thu nhập, chiết khấu, và tiềm năng tăng trưởng:

</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">

<small>GVHD: Hồng Văn Hải</small>

<b>V. Vai trị thành viên nhóm</b>

Ở mỗi chương sẽ có từng bài tập cụ thể và mỗi thành viên sẽ đảm nhiệm các vaitrò khác nhau. Ở bài tập giữa kỳ, em tự vẽ dashboard và khi họp lại thì tất cả sẽ cùng nhau đóng góp ý kiến để hồn thành bài báo cáo một cách tốt nhất. Về phần bài tập trên lớp, nhóm em đã cùng nhau thảo luận và làm được các bài tập được giao. Và với mỗi thế mạnh khác nhau, ở mỗi nhiệm vụ khác nhau, các bạn đều hồn thành được cơng việc của mình. Bản thân em được giao ở nhiệm vụ soạn nội dung và đơi khi cũng có thuyết trình. Nếu có thắc mắc, các thành viên trong nhóm sẽ cùng nhau giải đáp và hỗ trợ thành viên còn lại trong những việc như cài tableau hoặc sử dụng excel để tạo dashboard. Sau khi học học phần này thì tất cả thành viên đều có thêm những kiến thức bổ ích và cần thiết cho công việc cũng như cuộc sống sau này, phát triển khả năng tự học, khả năng làm việc nhóm, kỹ năng thuyết trình cũng như trả lời câu hỏi.

16

</div>

×