Tải bản đầy đủ (.docx) (25 trang)

PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG DỰ BÁO SỐ TIỀN KHÁCH HÀNG MUA SẢN PHẨM HÀNG NĂM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (937.57 KB, 25 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC

PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG

DỰ BÁO SỐ TIỀN KHÁCH HÀNG MUA SẢN PHẨM HÀNG
NĂM

Giảng viên hướng dẫn: TS. LÊ CHÍ NGỌC
Sinh viên thực hiện:

Hà Minh Tuấn

MSSV:

20164329

Lớp:

HTTTQL K61

HÀ NỘI – 2019


DSS

Mục lục
LỜI MỞ ĐẦU..................................................................................................2
CHƯƠNG I. KHẢO SÁT HỆ THỐNG........................................................4
1. Khảo sát hiện trạng................................................................................4
2. Dữ liệu khảo sát......................................................................................4


3.1. Khái niệm:........................................................................................6
3.2. Mô hình hồi quy...............................................................................6
3.3

Sử dụng hồi quy đối với tập dữ liệu khảo sát...................................8

CHƯƠNG II. PHÂN TÍCH HỆ THỐNG...................................................14
1. Các chức năng của hệ thống trợ giúp nhà quản lý...........................14
2. Sơ đồ luồng dữ liệu..............................................................................15
2.1. Biểu đồ mức ngữ cảnh...................................................................15
2.2. Biểu đồ mức đỉnh...........................................................................15
2.3. Biểu đồ mức dưới đỉnh..................................................................16
CHƯƠNG III. THIẾT KẾ HỆ THỐNG.....................................................18
1. Ngơn ngữ viết chương trình................................................................18
 Front-end:..........................................................................................18
 Back-end:...........................................................................................20
2. Giao diện Website................................................................................22
Nguồn tài liệu tham khảo:.............................................................................23

1


DSS

LỜI MỞ ĐẦU
Trí tuệ nhân tạo cũng như học máy là hai lĩnh vực thu hút được rất
nhiều sự quan tâm hiện nay. Bởi vì nhìn vào thực tế hiện nay chúng ta có
thể thấy được các robot, máy móc được lập trình bằng phần mềm có sử
dụng trí tuệ nhân tạo đang trở thành thành một phần không thể thiếu
trong phát triển kinh tế và nâng cao chất lượng cuộc sống con người.

Machine Learning là một tập con của trí tuệ nhân tạo và các khố học về
machine learning thường mở đầu với một thuật tốn cơ bản đó là hồi quy
tuyến tính.
Trong phân tích hoạt động kinh doanh cũng như trong nhiều lĩnh
vực khác, hồi quy là công cụ phân tích đầy sức mạnh khơng thể thay thế.
Nó là phương pháp thống kê dùng để ước lượng, dự báo những sự kiện
xảy ra trong tương lai dựa vào quy luật quá khứ. Phân tích hồi quy là
nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc)
vào một hay nhiều biến khác (gọi là biến độc lập).
Trong phân tích hồi quy, có hai loại biến chính là biến định lượng
và biến định tính. Biến định lượng là biến mà giá trị của những quan sát
đó là những con số. Biến định tính thường biểu thị có hay khơng có một
tính chất hoặc biểu thị các mức độ khác nhau của một tiêu thức, thuộc
tính nào đó, chẳng hạn như giới tính, tơn giáo, chủng tộc, nơi cư
trú, ....Những biến định tính này cũng có sự ảnh hưởng đối với biến phụ
thuộc và phải được đưa vào mơ hình hồi quy.

2


DSS

Chính vì vậy, em chọn đề tài “DỰ BÁO SỐ TIỀN KHÁCH HÀNG
MUA SẢN PHẨM HÀNG NĂM” sử dụng mô hình hồi quy tuyến tính
để xậy dựng một hệ hỗ trợ quyết định cho nhà quản lý

3


DSS


CHƯƠNG I. KHẢO SÁT HỆ THỐNG
1. Khảo sát hiện trạng
Dự báo là một số nhiệm vụ quan trọng nhất trong bất kỳ công ty nào.
Việc dự báo được thực hiện sẽ ảnh hưởng đến các quyết định tiếp thị và
bán hàng, và có khả năng là quyết định sự phát triển của một công ty.
Trước khi lên kế hoạch chi tiết cho một chương trình nhằm nâng cao
trải nghiệm người dùng , công ty cần phải chú ý đến cách xác định các
yếu tố ảnh hưởng đến hành vi mua hang của khách hàng. Sẽ thật là lãng
phí nếu một chiến dịch lại nhắm đến những yếu tố mang lại lơi nhuận
thật hoặc tồi tệ hơn làm giảm đi doanh thu của bạn. Điều này có thể sẽ
khơng giúp bạn bán được nhiều sản phẩm mà ngược lại, sẽ gây tổn thất,
lãng phí cho doanh nghiệp của bạn.

2. Dữ liệu khảo sát
Dữ liệu được sử dụng là bộ dữ liệu của cơng ty thương mại điện
tử có trụ sở tại thành phố New York chuyên bán quần áo trực tuyến
nhưng họ cũng có các buổi tư vấn về phong cách và quần áo tại cửa
hàng. Khách hàng đến cửa hàng, có các buổi gặp gỡ với stylist cá
nhân, sau đó họ có thể về nhà và đặt hàng trên ứng dụng di động
hoặc trang web cho quần áo họ muốn.
Công ty đang cố gắng quyết định xem nên tập trung phát triển
vào trải nghiệm ứng dụng di động hay trang web của họ.

4


DSS

Hình 1: Dữ liệu thống kê

 Chú thích dữ liệu
 Avg. Session Length: Thời gian trung bình một buổi tư
vấn(phút).


Time on App: Thời gian trung bình người đó dùng app(phút).



Time on Website: Thời gian trung bình người đó dùng
website(phút).



Length of Membership: Thời gian khách hàng gắn bó(năm).



Yearly Amount Spent: Tổng số tiền khách hàng đó bỏ ra trong
một năm ($).

 Link nguồn dữ liệu khảo sát:
/>
5


DSS

3. Phân tích hồi quy
3.1. Khái niệm:

Phân tích hồi quy (regression analysis) là kỹ thuật thống
kê dùng để ước lượng phương trình phù hợp nhất với các tập hợp
kết quả quan sát của biến phụ thuộc và biến độc lập. Nó cho phép
đạt được kết quả ước lượng tốt nhất về mối quan hệ chân thực
giữa các biến số. Từ phương trình ước lượng được này, người ta
có thể dự báo về biến phụ thuộc (chưa biết) dựa vào giá trị cho
trước của biến độc lập (đã biết).

3.2. Mơ hình hồi quy

6


DSS

7


DSS

8


DSS

3.3 Sử dụng hồi quy đối với tập dữ liệu khảo sát
Sử dụng python để phân tích dữ liệu:
 Import thư viện và đọc dữ liệu:

 Tông quan về tập dữ liệu:


9


DSS

 Xét sự phân bố của từng cặp dữ liệu:

10


DSS

Ở đây ta quan tâm đến hàng cuối cùng là biến cần dự báo(Yearly
amount spent) qua các biến độc lập.
 Luyện Model
- Tách train và test data

11


DSS

- Luyện model

Ta được các hệ số hồi quy của các biến độc lập(Avg. Session
Length, Time on App, Time on Website, Length of Membership) lần
lượt là 25.98, 38.59, 0.19, 61.27 .

12



DSS

 Đánh giá

- Sai số tuyệt đối : 7.23
- Sai số bình phương trung bình: 79.81
- Sai số căn bậc 2 trung bình: 8.93
- Hệ số xác định R2: 0.99
Từ hệ số xác định ta thấy biến độc lập giải thích được 99% biến phụ
thuộc

13


DSS

Phân bố của phần dư xấp xỉ phân phối chuẩn

14


DSS

CHƯƠNG II. PHÂN TÍCH HỆ THỐNG
1. Các chức năng của hệ thống trợ giúp nhà quản lý
Trên hệ thống thông tin với cơ sở dữ liệu bán hàng đã được thu
thập, lãnh đạo công ty cần ra các quyết định. Việc ra quyết định
chính là cơng tác quản lí của lãnh đạo, hay nhà quản lí.

Hệ thống trợ giúp quyết định cho phép thực hiện các trợ giúp
liệt kê dưới đây. Các trợ giúp có ý nghĩa cùng nhà quản lí, hay lãnh
đạo cơng ty đưa ra quyết định cuối cùng. Trong trường hợp này,
phần mềm máy tính là cơng cụ giúp cho con người ra quyết định
quản lí.

15


DSS

Hình 2. Biểu đồ phân cấp chức năng

2. Sơ đồ luồng dữ liệu
2.1. Biểu đồ mức ngữ cảnh

Hình 3: Biểu đồ mức ngữ cảnh

2.2. Biểu đồ mức đỉnh

16


DSS

Hình 4: Biểu đồ mức đỉnh

2.3. Biểu đồ mức dưới đỉnh
1. Chức năng xử lý dữ liệu


Hình 5: Biểu đồ luồng dữ liệu cho chức năng xử lý dữ liệu

2. Chức năng dự đoán

17


DSS

Hình 8: Biểu đồ luồng dữ liệu cho chức năng dự đốn

3. Chức năng mơ hình

Hình 7: Biểu đồ luồng dữ liệu cho chức năng mơ hình

18


DSS

CHƯƠNG III. THIẾT KẾ HỆ THỐNG
1. Ngôn ngữ viết chương trình
 Front-end:
 HTML
HTML là từ viết tắt của HyperText Markup Language
(ngôn ngữ đánh dấu siêu văn bản) dùng mô tả cấu trúc của các
trang Web và tạo ra các loại tài liệu có thể xem được trong trình
duyệt.
HTML được tạo ra và phát triển bởi tổ chức W3C (World
Wide Web Consortium)Hiện nay phiên bản mới nhất của HTML

là HTML5 với nhiều tính năng ưu việt so với các phiên bản cũ.
 CSS
CSS (viết tắt của Cascading Style Sheets) là một ngơn ngữ
định dạng được sử dụng để mơ tả trình bày các trang Web, bao
gồm màu sắc, cách bố trí và phông chữ. CSS cho phép chúng
hiển thị nội dung tương thích trên các loại thiết bị có kích thước
màn hình khác nhau, chẳng hạn như màn hình lớn, màn hình nhỏ
như điện thoại hay máy tính bản.
CSS là độc lập với HTML và có thể được sử dụng với bất
kỳ ngôn ngữ đánh dấu nào xây dựng dựa trên XML. CSS tuân
theo chuẩn chung do W3C quy định.
 JavaScript
JavaScript là một ngôn ngữ nhỏ và nhẹ chạy trong môi
trường máy chủ lưu trữ (ví dụ: trình duyệt web), JavaScript có

19


DSS

thể được kết nối với các đối tượng của môi trường để cung cấp
kiểm sốt chương trình đối với chúng.
JavaScript cho phép bạn thực hiện những điều phức tạp trên
các trang web như bản đồ tương tác…
Javascript được hỗ trợ hầu như trên tất cả các trình duyệt
như Firefox, Chrome, … thậm chí các trình duyệt trên thiết bị di
động cũng có hỗ trợ.
Hiện nay nó được dùng rộng rãi cho các trang web (phía
người dùng) cũng như phía máy chủ (với Nodejs).
 Bootstrap

Bootstrap là một framework cho phép thiết kế website
reponsive nhanh hơn và dễ dàng hơn Bootstrap là bao gồm các
HTML templates, CSS templates và Javascript tao ra những cái
cơ bản có sẵn như: typography, forms, buttons, tables, navigation,
modals, image carousels và nhiều thứ khác. Trong bootstrap có
thêm các plugin Javascript trong nó. Giúp cho việc thiết kế
reponsive của bạn dễ dàng hơn và nhanh chóng hơn.
Bootstrap là dược phát triển bởi Mark Otto và Jacob
Thornton tại Twitter. Nó được xuất bản như là một mã nguồn mở
vào tháng 8 năm 2011 trên GitHub. Tính ra đến thời điểm mình
viết bài viết này nó cũng đã phát triển được 3 năm rồi. Bản
bootstrap mới nhất bây giờ là bootstrap 3.

20


DSS

 Back-end:
 Nodejs
Node.js là một nền tảng chạy trên môi trường V8 JavaScript
runtime - một trình thơng dịch JavaScript cực nhanh chạy trên trình
duyệt Chrome. Bình thường thì bạn cũng có thể tải bộ V8 và nhúng
nó vào bất cứ thứ gì; Node.js làm điều đó đối với các web server.
JavaScript suy cho cùng cũng chỉ là một ngôn ngữ - vậy thì khơng
có lý do gì để nói nó không thể sử dụng trên môi trường server tốt
như là trong trình duyệt của người dùng được.
Trong một mơi trường server điển hình LAMP (Linux-ApacheMySQL-PHP), bạn có một web server là Apache hoặc NGINX
nằm dưới, cùng với PHP chạy trên nó. Mỗi một kết nối tới server
sẽ sinh ra một thread mới, và điều này khiến ứng dụng nhanh

chóng trở nên chậm chạp hoặc quá tải - cách duy nhất để hỗ trợ
nhiều người dùng hơn là bằng cách bổ sung thêm nhiều máy chủ.
Đơn giản là nó khơng có khả năng mở rộng tốt. Nhưng với Node.js
thì điều này khơng phải là vấn đề. Khơng có một máy chủ Apache
lắng nghe các kết nối tới và trả về mã trạng thái HTTP - bạn sẽ phải
tự quản lý kiến trúc lõi của máy chủ đó. May mắn thay, có một số
module giúp thực hiện điều này được dễ dàng hơn, nhưng công
việc này vẫn gây cho bạn một chút khó khăn khi mới bắt đầu. Tuy
nhiên, kết quả thu được là một ứng dụng web có tốc độ thực thi
cao.

 Python
Python là một ngơn ngữ lập trình thơng dịch (interpreted), hướng
đối tượng (object-oriented), và là một ngôn ngữ bậc cao (high-level)
ngữ nghĩa động (dynamic semantics). Python hỗ trợ các module và gói
(packages), khuyến khích chương trình module hóa và tái sử dụng mã.
Trình thơng dịch Python và thư viện chuẩn mở rộng có sẵn dưới dạng

21


DSS

mã nguồn hoặc dạng nhị phân miễn phí cho tất cả các nền tảng chính và
có thể được phân phối tự do. Được sử dụng để chạy model của bài tốn.
 Express Framework
Express là một framework giành cho nodejs. Nó cung cấp
cho chúng ta rất nhiều tính năng mạnh mẽ trên nền tảng web cũng
như trên các ứng dụng di động. Express hỗ rợ các phương thức
HTTP và midleware tạo ra môt API vô cùng mạnh mẽ và dễ sử

dụng. Có thể tổng hợp một số chức năng chính của express như
sau:
 Thiết lập các lớp trung gian để trả về các HTTP
request
 Định nghĩa router cho phép sử dụng với các hành
động khác nhau dựa trên phương thức HTTP và
URL
 Cho phép trả về các trang HTML dựa vào các tham
số.

2. Giao diện Website

22


DSS

Hình 8: Giao diện mở đầu

Hình 9: Giao diện đưa ra kết quả dự đoán

23


DSS

Nguồn tài liệu tham khảo:
1. />2. />anUngDung/mhnhhiquyabin.html
3. />4. />
24



×