Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.56 MB, 48 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
ĐỀ TÀI: NGHIÊN CỨU THÔNG TIN CHUYẾN BAY TRONG VẬN CHUYỂN
HÀNG KHÔNG VÀ DU LỊCH
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><small>NGUYỄN VĂN TÚ31221025423Xử lý dữ liệu thơ ,Phân tích giải bài tốn, đưa ra kiến nghị giải pháp, phương pháp </small>
<small>phân cụm, tiểu luận, slides</small>
<small>PHAN THỊ HỒI THƯƠNG31221026956Tìm Mẫu, Tiền Xử lý dữ liệu, phân tích bài tốn, phương phân lớp, đưa kiến nghị dự </small>
<small>đoán, slides, tiểu luận</small>
<small>100%</small>
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">• Dữ liệu phục vụ cho việc nghiên cứu những thông tin chuyến bay trong ngành vận chuyển hàng không và vận chuyển trong du lịch. • Dữ liệu thơ chứa 271888 đối tượng (hàng) và 10 thuộc tính (cột)
hiểu khách hàng đó đi với giá cao hay thấp.
• Sử dụng cơng cụ Feature Statistics để mô tả thống kê các biến này với những giá trị như Mean, Median, Dispersion, Min, Max,... của 8932 kết quả khảo sát.
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10"><b>Bởi vì</b>
<small></small> <sub>FlightType, Price, Time, Distance ảnh </sub>
<small>hưởng trực tiếp và gián tiếp theo chiều hướng tỉ lệ thuận với priceType. </small>
<small></small> <sub>Year, Month ảnh hưởng priceType </sub>
<small>theo chiều hướng tháng cao điểm hoặc thấp điểm của mùa bay thì sẽ ảnh hưởng tới Price và priceType tăng hoặc giảm. Mỗi năm sẽ bị ảnh hưởng theo biến động của nền kinh tế - xã hội. </small>
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">Dự báo giá vé máy bay nhằm để hãng hàng không điều chỉnh giá vé thích hợp và khách hàng điều chỉnh hành vi tiêu dùng
Sử dụng các thuật toán phân cụm để định hình và hiểu rõ hơn hành vi đặt vé của các nhóm khách hàng
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">Kết quả đánh giá bài toán 1 theo SVM
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">Kết quả đánh giá bài toán 1 và quyết định chọn phương pháp nghiên cứu
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">Đường cong ROC
Quan sát bảng kết quá trên ta thấy đường màu cam của mơ hình Tree là mơ hình tiệm cận với điểm (0;1) nhất.
Còn đường màu xanh dương của mơ hình SVM và đường màu xanh lá của mô
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">Kết quả nghiên cứu bài toán 1
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">Kết quả đánh giá bài toán 1 theo Tree
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">Phân tích:
• <sub>(Time) ≤ 0,72 có giá vé thấp 100% → nên </sub> tăng giá.
• (Time) ≥ 0,72 có tỉ lệ tăng đến 21% ( 73,2%) → nên giảm giá.
• Giá vé khơng được hơn 1166,1 BRL → Xét 2 premium) do tỷ lệ dự báo giá cao đến 71,2% → lợi nhuận cao, duy trì lâu → cạnh tranh → mất khách hàng.
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">• Khách hàng có xu hướng đi bằng phương tiện hàng không nhiều hơn → tạo chương trình thưởng và ưu đãi dành riêng cho khách hàng thân thiết → thúc đẩy hành khách quen thuộc của bạn tiếp tục lựa chọn hãng của bạn khi đi lại.
• <sub>Xem xét giá vé của các đối thủ cạnh tranh trong cùng tuyến </sub>
đường và cùng phân đoạn thị trường → điều chỉnh giá → cân nhắc liệu nên cạnh tranh bằng giá thấp hơn / giá tương đương /giá cao hơn.
• Khách hàng sẵn sàng chi trả với mức giá cao → tạo ra các giá trị và trải nghiệm đáng giá , duy trì một dịch vụ xuất sắc để có thể cạnh tranh được với các đối thủ.
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24"><small>Thực hiện phân cụm bằng bộ dữ liệu phân lớp để dự báo xu hướng đặt vé máy bay của </small>
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29"> Do số lượng dự liệu lên đến 8932 kết quả khảo sát -> Dùng Data Sampler để lấy ngẫu nhiên dữ liệu để khảo sát để có thể làm việc hiệu quả hơn -> tránh mất thời gian tiến hành và khai thác
</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30"> Để tiến hành Hierarchical Clustering -> Cần tính khoảng cách ước tính (sử dụng Euclidean (normalized)) -> với cách tính khoảng cách Complete-link (khoảng cách lớn nhất). Cho kết quả chạy từ 2 đến 5 cụm.
</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31"><b>Hộp thoại Hierarchical Clustering để chia dữ liệu thành các cụm từ 2 tới 5</b>
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33"> Sau khi chia dữ liệu lần lượt thành 2, 3, 4, 5 cùng thì ta dùng Silhouette Plot để xem kết quả cơng cụ từ đó lựa chọn phương án tối ưu. Khi đó
Silhouette Plot sẽ được
</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35"><b>Silhouette score của cụm càng lớn thì độ tương đồng của từng điểm trong cum càng cao thì kết quả </b>
phân cụm đó càng tốt. Vì thế sau khi thử phân cụm bố dữ liệu thành 2, 3, 4 và 5 cụm thì kết quả khi chia dữ liệu thành hai cụm là tốt nhất.
=> Qua những giá trị này, có thể nói cách phân cụm chưa thật sự đáng tin cậy, sát với thực tế và cần thêm các chuyên gia có kinh nghiệm, chun mơn để đánh giá lại.
</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">Kết quả phân cụm bằng k-Means
</div><span class="text_page_counter">Trang 40</span><div class="page_container" data-page="40">Bảng Silhouette Plot cho 2 phân cụm phân hoạch
</div><span class="text_page_counter">Trang 41</span><div class="page_container" data-page="41">Bảng thống kê mô tả cụm 1
</div><span class="text_page_counter">Trang 43</span><div class="page_container" data-page="43">Bảng thống kê mô tả cụm 2
</div><span class="text_page_counter">Trang 44</span><div class="page_container" data-page="44">Biểu đồ Bar Plot so sánh giá trị distance giữa 2 cụm
</div><span class="text_page_counter">Trang 45</span><div class="page_container" data-page="45">Biểu đồ Box Plot so sánh giá trị distance giữa 2 cụm
</div><span class="text_page_counter">Trang 46</span><div class="page_container" data-page="46">+ Với nhóm khách hàng cụm 1 (chặng bay ngắn hơn), nên tiếp tục tối ưu hóa giá vé economy để thu hút họ. Cân nhắc cung cấp các ưu đãi giảm giá cho vé economy trên các chặng bay ngắn.
+ Dựa trên sự hiểu biết về hành vi lựa chọn loại vé của các nhóm khách hàng, tạo chiến dịch tiếp thị đặc trưng cho từng nhóm.
+ Chú ý những ngành hàng khơng và du lịch là nhũng ngành có tính cạnh tranh cao và thị trường thay đổi nhanh chóng. Do đó, việc duy trì sự linh hoạt và thích nghi là rất quan trọng để thành cơng
+ Đối với nhóm khách hàng cụm 2 (chặng bay dài), tiếp tục cung cấp các dịch vụ và tiện ích cao cấp cho hành khách như firstClass và premium
</div><span class="text_page_counter">Trang 48</span><div class="page_container" data-page="48"><small>NHÓM G05 – KHOA HỌC DỮ LIỆU </small>
</div>