ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU: TÌM HIỂU MẠNG NEURON NHÂN TẠO ĐỂ DỰ BÁO DOANH SỐ BÁN HÀNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (435.2 KB, 34 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH
KHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU

TÌM HIỂU MẠNG NEURON NHÂN TẠO
ĐỂ DỰ BÁO DOANH SỐ BÁN HÀNG
Giảng viên hướng dẫn: VƯƠNG XUÂN CHÍ
Sinh viên thực hiện:
DƯ THOẠI KỲ
MSSV:
2000006403
Chuyên ngành:
Khoa học dữ liệu
Môn học:
Đồ án cơ sở KHDL
Khóa:
2020

Tp.HCM, Tháng 6 năm 2022

1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC NGUYỄN TẤT THÀNH
KHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU

TÌM HIỂU MẠNG NEURON NHÂN TẠO
ĐỂ DỰ BÁO DOANH SỐ BÁN HÀNG

Giảng viên hướng dẫn: VƯƠNG XUÂN CHÍ
Sinh viên thực hiện
DƯ THOẠI KỲ
MSSV:
2000006403
Chuyên ngành:
Khoa học dữ liệu
Môn học:
Đồ án cơ sở KHDL
Khóa:
2020

Tp.HCM, Tháng 6 năm 2022

2

Trường Đại học Nguyễn Tất Thành
Khoa Công Nghệ Thông Tin
   

CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lập – Tự do – Hạnh phúc
   

NHIỆM VỤ ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU
(Sinh viên phải đóng tờ này vào báo cáo)

Họ và tên: DƯ THOẠI KỲ
MSSV: 2000006403
Chuyên ngành: KHOA HỌC DỮ LIỆU
Lớp: 20DTH1D
Email:
SĐT: 0376891511
Tên đề tài: TÌM HIỂU MẠNG NEURON NHÂN TẠO ĐỂ DỰ BÁO DOANH SỐ
BÁN HÀNG
Gíao viên hướng dẫn: VƯƠNG XUÂN CHÍ
Thời gian thực hiện: 03/07/2017 đến 24/09/2017
Nhiệm vụ/nội dung (mơ tả chi tiết nội dung, yêu cầu, phương pháp… ) :

-

Thực hiện công việc a

-

Thực hiện công việc b

-

Thực hiện công việc c

Nội dung và yêu cầu đã được thông qua Bộ môn.

3

TP.HCM, ngày 26 tháng 6 năm 2022
TRƯỞNG BỘ MÔN
(Ký và ghi rõ họ tên)

GIÁO VIÊN HƯỚNG DẪN
(Ký và ghi rõ họ tên)

4

LỜI CẢM ƠN
Đối với một sinh viên trường Đại học Nguyễn Tất Thành, đồ án cơ sở là một
minh chứng cho những kiến thức đã có được sau một khoảng thời gian học tập.
Trong q trình hồn thành đị án cơ sở, ngoài những cố gắng của bản thân, em sẽ
khơng hồn thành tốt cơng việc của mình nếu khơng có sự chỉ bào và hướng dẫn
tận tình của thầy Vương Xuân Chí. Em xin được gửi lời cảm ơn chân thành nhất
tới thầy.
Ngồi ra trong suốt q trình thực hiện em cũng nhận được những sự giúp đỡ,
hỗ trợ tận tình của các anh chị khóa trên và những người bạn cùng chuyên ngành
tại trường Đại học Nguyễn Tất Thành. Em xin được gửi lời cảm ơn các anh chị,
bạn bè và ban chủ nhiệm bộ môn, tập thể cán bộ giảng dạy môn Đồ án cơ sở khoa
học dữ liệu trường Đại học Nguyễn Tất Thành, đã hết sức tạo điều kiện để em có
thể thực hiện tốt Đồ án cơ sở này.
Cuối cùng, em xin gửi lời cảm ơn tới gia đình, bạn bè giúp đỡ, chia sẻ cùng em
trong q trình học tập và hồn thành đồ án của mình.
Em xin chân thành cảm ơn.

5

LỜI MỞ ĐẦU
Trong cuộc sống ta thường gặp các bài toán liên quan đến xếp lịch như xếp lịch vận hành
máy móc, xếp lịch biểu cho việc thực hiện một dự án, xếp lịch làm việc, xếp lịch thi đấu
thể thao,… Đối với loại bài tốn này cần phải tìm ra một phương án xếp lịch thỏa mãn tất
cả các ràng buộc cũng như khai thác hiệu quả các nguồn tài ngun hiện có, giảm thời
gian và chi phí thực hiện.
Bài tốn xếp thời khóa biểu trong trường học nói chung và trong trường Đại học nói riêng
là một trong những bài tốn như vậy. Có rất nhiều các ràng buộc được đặt ra trong bài
tốn này như ràng buộc về ñối tượng tham gia (giảng viên, lớp học, sinh viên), ràng buộc
về tài nguyên phục vụ giảng dạy (phòng học lý thuyết, phòng thực hành,…), ràng buộc
về thời gian (số tiết học, số lần học, số tiết mỗi lần), ràng buộc về chuyên môn và rất
nhiều các ràng buộc khác tùy thuộc vào từng trường. Vấn đề đặt ra là cần xây dựng một
thời khóa biểu thỏa mãn tất cả các ràng buộc trên ñồng thời khai thác hiệu quả các nguồn
tài nguyên phục vụ giảng dạy.
Bài toán xếp thời khóa biểu thuộc lớp các bài tốn NP-đầy đủ vì vậy có thể khơng tìm ra
được lời giải tối ưu. Đây là một bài tốn khơng mới và đã có nhiều giải thuật được đưa ra
để giải quyết như giải thuật nhánh cận, giải thuật leo ñồi, giải thuật luyện thép, giải thuật
tô màu đồ thị, giải thuật xấp xỉ,… Tuy nhiên các giải thuật này thường khơng có tính tổng
quát và chỉ áp dụng hiệu quả đối với các trường học có quy mơ nhỏ, ít ràng buộc về mặt
dữ liệu.
Ở Việt Nam hiện nay, các trường Đại học đang dần chuyển sang hình thức đào tạo tín chỉ.
Mặc dầu hình thức đào tạo này có nhiều ưu điểm hơn so với đào tạo niên chế tuy nhiên
việc xếp thời khóa biểu vẫn là một gánh nặng thực sự cho các trường, đặc biệt là các
trường có quy mô đào tạo lớn. Vả lại trên thị trường cũng chưa có sản phẩm phần mềm
nào giải quyết hiệu quả bài toán trên.
Trong những năm gần đây, phương pháp tiếp cận di truyền đã thu hút rất nhiều sự chú ý
trong các lĩnh vực nghiên cứu khác nhau trong đó có khoa học máy tính. Phương pháp
này có nhiều đặc điểm nổi trội như khơng địi hỏi tri thức, tránh tối ưu cục bộ, thực hiện

tốt với các bài toán có khơng gian lời giải lớn và có thể áp dụng cho nhiều loại bài toán
tối ưu khác nhau. Trên thế giới hiện nay, giải thuật di truyền kết hợp với tin học được ứng
dụng để giải quyết những bài tốn tối ưu một cách rất hiệu quả.
Vì vậy, việc nghiên cứu và ứng dụng giải thuật di truyền (Genetic Algorithm - GA) để
giải quyết hiệu quả bài toán xếp thời khóa biểu nói trên là việc làm cần thiết.

6

NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN

.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................
Điểm đồ án: ......................................................................................
.......................................................................................................
.......................................................................................................
.......................................................................................................

TPHCM, Ngày …… tháng …… năm
Giáo viên hướng dẫn
(Ký tên, đóng dấu)

MỤC LỤC
Chương I: Tìm hiểu mạng Neural...................................................................................
1.1: Neural nhân tạo………………………………………………………………….9
1.2: mạng Neural nhân tạo…………………………………………………………..11
1.3: Đặc trưng của mạng Neural…………………………………………………….13
1.3.1: Tính phi tuyến………………………………………………………………13
7

1.3.2: Tính chất tương ứng đầu vào đầu ra…………………………………….13
1.3.3: Tính chất thích nghi……………………………………………………….14
1.3.4: Tính chất đưa ra lời giải có bằng chứng………………………………14
1.3.5: Tính chất chấp nhận sai sót…………………………………………….14
1.3.6: Khả năng cài đặt VLSI (Very Large Scale Intergrated)……………14
1.3.7: Tính chất đồng dạng trong phân tích và thiết kế…………………..15
1.4: kiến trúc về mạng Neural…………………………………………………….16
1.5: Phương pháp học……………………………………………………………..17
1.5.1: Học có giám sát………………………………………………………..17
1.5.2: Học khơng có giám sát……………………………………………….18
1.5.3: Học tăng cường……………………………………………………….18
Chương II: Áp dụng vào dự báo doanh số bán hàng…………………
2.1: Dữ liệu về doanh số bán hàng………………………………………………20
2.2: Phát biểu bài toán…………………………………………………………....21
2.3: Thiết kế mạng nơ ron………………………………………………………...23
2.3.2: Cấu trúc mạng……………………………………………………….23
2.3.3: Hàm tương tác đầu ra……………………………………………….24

2.4: Cơng cụ mơ phỏng bài tốn dự báo doanh số…………………………………...24
Chương III: Kết luận………………………………….………………
1.Kết quả đạt được…………………………………………………………..…….29
2.Một số hướng mở rộng đề tài………………………………………………….…31

Chương I: Tìm hiểu mạng Neural
1.1: Neural nhân tạo.

8

- Neural nhân tạo hay còn gọi là Mạng nơ-ron nhân tạo là mạng sử dụng
các mơ hình tốn học phức tạp để xử lý thông tin. Chúng dựa trên mơ
hình hoạt động của các tế bào thần kinh và khớp thần kinh trong não của
con người. Tương tự như bộ não con người, mạng nơ-ron nhân tạo kết
nối các nút đơn giản, còn được gọi là tế bào thần kinh. Và một tập hợp
các nút như vậy tạo thành một mạng lưới các nút, do đó có tên là mạng
nơ-ron nhân tạo.
- Liên kết neural là một thành phần của mạng neural nhận tạo để liên kết
giữa các neural, nó nối đầu ra của neural lớp này với đầu vào của một
neural trong lớp khác. Đặc trưng của thành phần liên kết là một trọng số
mà mỗi tín hiệu đi qua đều được nhân với trọng số này. Các trọng số liên
kết chính là các tham số tự do cơ bản của mạng neuron, có thể thay đổi
được nhằm thích nghi với mơi trường xung quanh.
- Bộ cộng dùng để tính tổng các tín hiệu đầu vào của neural, đã được
nhân với các trọng số liên kết tương ứng. phép tốn được mơ tả ở đây
tạo nên một bộ hợp tuyến tính.
- Hàm kích hoạt hay cịn gọi hàm kích hoạt phi tuyến, chuyển đổi một tổ
hợp tuyến tính của tất cả các tín hiệu đầu vào thành tín hiệu đầu ra. Hàm
kích hoạt này đảm bảo tính chất phi tuyến cho tính tốn mạng neural. Nó

được xem như là một hàm giới hạn, nó giới hạn phạm vi biên độ cho
phép của tín hiệu đầu ra trong một khoảng giá trị hữu hạn. Mơ hình
neural cịn bao gồm một hệ số điều chỉnh b tác động từ bên ngoài. Hệ số

9

điều chỉnh b có tác dụng tăng lên hoặc giảm đi đầu vào thực của hàm
kích hoạt, tùy theo nó dương hay âm.

10

1.2: Mạng Neural nhân tạo.
Là một hệ thống bao gồm nhiều phần tử xử lý đơn giản (hay còn
gọi là neural) tựa như neural thần kinh của não người, hoạt động song
song và được nối với nhau bởi các liên kết neural. Mỗi liên kết kèm theo
một trọng số nào đó, đặc trưng cho tính kích hoạt hoặc ức chế giữa các
neural.
Có thể xem các trọng số là phương tiện để lưu trữ thông tin dài hạn
trong mạng neural và nhiệm vụ của quá trình huấn luyện của mạng là
cập nhật các trọng số khi có thêm thơng tin về mẫu học. Hay nói một
cách khác, các trọng số đều được điều chỉnh sao cho dáng điệu vào ra
của mạng sẽ mơ phỏng hồn tồn phù hợp với mơi trường đang xem xét.

Mơ hình mạng Neural:

11

Mơ hình mạng

Neural

Mơ hình mạng neural ở trên gồm 3 lớp: lớp nhập (input), lớp
ẩn(hidden) và lớp xuất (output). Mỗi nút trong lớp nhập nhận giá trị của
một biến độc lập và chuyển vào mạng.
Dữ liệu từ tất cả các nút trong lớp nhập được tích hợp – ta gọi là tổng
trọng số – và chuyển kết quả cho các nút trong lớp ẩn. Gọi là “ẩn” vì các
nút trong lớp này chỉ liên lạc với các nút trong lớp nhập và lớp xuất, và
chỉ có người thiết kế mạng mới biết lớp này (người sử dụng không biết
lớp này).
Các nút trong lớp xuất nhận các tín hiệu tổng trọng hóa từ các nút
trong lớp ẩn. Mỗi nút trong lớp xuất tương ứng với một biến phụ thuộc.

1.3 Đặc trưng của mạng neural
1.3.1. Tính phi tuyến

12

Một neural có thể tính tốn một cách tuyến tính hay phi tuyến. Một
mạng neural, cấu thành bởi sự kết nối các neural phi tuyến thì tự nó sẽ
có tính phi tuyến. Hơn nữa, điều đặc biệt là tính phi tuyến này được
phân tán trên tồn mạng. Tính phi tuyến là một thuộc tính rất quan trọng,
nhất là khi các cơ chế vật lý sinh ra các tín hiệu đầu vào (ví dụ tín hiệu
tiếng nói) vốn là phi tuyến.
1.3.2. Tính chất tương ứng đầu vào đầu ra
Mặc dù khái niệm “học” hay “huấn luyện” chưa được bàn đến nhưng
để hiểu được mối quan hệ đầu vào-đầu ra của mạng neural, chúng ta sẽ

đề cập sơ qua về khái niệm này. Một mơ hình học phổ biến được gọi là
học với một người dạy hay học có giám sát liên quan đến việc thay đổi
các trọng số liên kết của mạng neural bằng việc áp dụng một tập hợp các
mẫu tích luỹ hay các ví dụ tích luỹ. Mỗi một ví dụ bao gồm một tín hiệu
đầu vào và một đầu ra mong muốn tương ứng. Mạng neural nhận một ví
dụ lấy một cách ngẫu nhiên từ tập hợp nói trên tại đầu vào của nó, và các
trọng số liên kết của mạng được biến đổi sao cho có thể cực tiểu hoá sự
sai khác giữa đầu ra mong muốn và đầu ra thực sự của mạng theo một
tiêu chuẩn thống kê thích hợp. Sự tích luỹ của mạng được lặp lại với
nhiều ví dụ trong tập hợp cho tới khi mạng đạt tới một trạng thái ổn định
mà ở đó khơng có một sự thay đổi đáng kể nào của các trọng số liên kết.
Các ví dụ tích luỹ được áp dụng trước có thể được áp dụng lại trong thời
gian của phiên tích luỹ nhưng theo một thứ tự khác. Như vậy mạng

13

neural học từ các ví dụ bằng cách xây dựng nên một tương ứng đầu vàođầu ra cho vấn đề cần giải quyết.
1.3.3. Tính chất thích nghi
Các mạng neural có một khả năng mặc định là biến đổi các trọng số
liên kết tuỳ theo sự thay đổi của môi trường xung quanh. Đặc biệt, một
mạng neural đã được tích luỹ để hoạt động trong một mơi trường xác
định có thể được tích luỹ lại một cách dễ dàng khi có những thay đổi
nhỏ của các điều kiện môi trường hoạt động.
1.3.4. Tính chất đưa ra lời giải có bằng chứng
Trong ngữ cảnh phân loại mẫu, một mạng neural có thể được thiết kế
để đưa ra thông tin không chỉ về mẫu được phân loại, mà còn về sự tin
cậy của quyết định đã được thực hiện. Thơng tin này có thể được sử
dụng để loại bỏ các mẫu mơ hồ hay nhập nhằng.
1.3.5. Tính chất chấp nhận sai xót

Một mạng neural, được cài đặt dưới dạng phần cứng, vốn có khả
năng chấp nhận lỗi, hay khả năng tính tốn thơ, với ý nghĩa là tính năng
của nó chỉ thối hố khi có những điều kiện hoạt động bất lợi. Ví dụ, nếu
một neural hay các liên kết kết nối của nó bị hỏng, việc nhận dạng lại
một mẫu được lưu trữ sẽ suy giảm về chất lượng.
1.3.6. Khả năng cài đặt VLSI (Very Large Scale Intergrated)

14

Bản chất song song đồ sộ của một mạng neural làm cho nó rất nhanh
trong tính tốn đối với một số cơng việc. Đặc tính này cũng tạo ra cho
một mạng neural khả năng phù hợp cho việc cài đặt sử dụng kỹ thuật
Very-large-scale-intergrated (VLSI). Kỹ thuật này cho phép xây dựng
những mạch cứng tính tốn song song quy mơ lớn. Chính vì vậy mà ưu
điểm nổi bật của VLSI là mang lại những phương tiện hữu hiệu để có
thể xử lý được những hành vi có độ phức tạp cao.
1.3.7. Tính chất đồng dạng trong phân tích và thiết kế
Về cơ bản, các mạng neural có tính chất chung như là các bộ xử lý
thông tin. Chúng ta nêu ra điều này với cùng ý nghĩa cho tất cả các lĩnh
vực có liên quan tới việc ứng dụng mạng neural. Đặc tính này thể hiện ở
một số điểm như sau:
- Các neural, dưới dạng này hoặc dạng khác, biểu diễn một thành
phần chung cho tất cả các mạng neural.
- Tính thống nhất này đem lại khả năng chia sẻ các lý thuyết và các
thuật toán học trong nhiều ứng dụng khác nhau của mạng neural.
- Các mạng tổ hợp (modular) có thể được xây dựng thơng qua một sự
tích hợp các mơ hình khác nhau.

1.4: Kiến trúc về mạng neural

15

Về cơ bản ta có thể hiểu mạng neural là một đồ thị có hướng.
Trong đó các đỉnh của đồ thị là các neural và các cạnh của đồ thị là
các liên kết giữa các neural.

Sơ đồ đồ thị có hướng đơn giản

Vì vậy để xây dựng một mạng neural ta xây dựng một đồ thị có
hướng: số đỉnh của đồ thị bằng số neural trong mạng, giá trị của các
cạnh chính là trọng số liên kết neural.
Ví dụ xây dựng một mạng neural đơn giản:










Đầu vào: Cho
Mạng neural có sơ lớp (với sơ lớp>1).
Mỗi lớp có số neural trong một lớp (số neural>=1).
Trọng số w liên kiết neural ngẫu nhiên trong khoảng (-a,a).
Đầu ra: Mạng neural nhân tạo.
Kiểu dữ liệu: chọn lưu dữ kiểu mảng
int số lớp

int số Neural[số lớp];
float w[i][j][k]; với 2<=i<=số lớp, 1<=j,k<=số neural[] ,

Thuật toán.
Bước 1: Chọn lớp i=2 là lớp bắt đầu
16

Bước 2: Chọn lớp i là lớp hiện thời.
Bước 3 : Tại lớp đang xét i , xét neural thứ j .
Bước 4: Thực hiện khởi tạo ngẫu nhiên trọng số kết nối với neural k của lớp i-1 trong
khoảng (-a,a). w(i,j,k)=random(-a,a)
Bước 5: Nếu k <= số neural[i-1] quay lại “Bước 4”, ngược lại thực hiện “Bước 6”.
Bước 6: Nếu j<= số neural[i] quay lại “Bước 3”, ngược lại thực hiện “Bước 7”.
Bước 7: Nếu i<=số lớp quay lại “Bước 3”. ngược lại kết thúc.

1.5: Phương pháp học
Mạng neural nhân tạo phỏng theo việc xử lý thông tin của bộ não
người, do vậy đặc trưng cơ bản của mạng là có khả năng học, khả
năng tái tạo các hình ảnh và dữ liệu khi đã học. Trong trạng thái học
thông tin được lan truyền theo hai chiều nhiều lần để học các trọng số.
Có 3 kiểu học chính, mỗi kiểu học tương ứng với một nhiệm vụ học
trừu tượng. Đó là học có giám sát (có mẫu), học khơng giám sát và
học tăng cường. Thông thường loại kiến trúc mạng nào cũng có thể
dùng được cho các nhiệm vụ.
1.5.1: Học có giám sát
Một thành phần khơng thể thiếu của phương pháp này là sự có mặt
của một người thầy (ở bên ngồi hệ thống). Người thầy này có kiến
thức về môi trường thể hiện qua một tập hợp các cặp đầu vào - đầu ra
đã được biết trước. Hệ thống học (ở đây là mạng neural) sẽ phải tìm

cách thay đổi các tham số bên trong của mình (các trọng số và các
ngưỡng) để tạo nên một ánh xạ có khả năng ánh xạ các đầu vào thành
17

các đầu ra mong muốn. Sự thay đổi này được tiến hành nhờ việc so
sánh giữa đầu ra thực sự và đầu ra mong muốn.
1.5.2: Học không giám sát
Trong học khơng có giám sát, ta được cho trước một số dữ liệu x
và hàm chi phí cần được cực tiểu hóa có thể là một hàm bất kỳ của dữ
liệu x và đầu ra của mạng, f – hàm chi phí được quyết định bởi phát
biểu của bài tốn. Phần lớn các ứng dụng nằm trong vùng của các bài
toán ước lượng như mơ hình hóa thống kê, nén, lọc, phân cụm.
1.5.3: Học tăng cường
Dữ liệu x thường không được tạo trước mà được tạo ra trong quá
trình một agent tương tác với môi trường. Tại mỗi thời điểm t, agent
thực hiện hành động yt và môi trường tạo một quan sát xt với một chi
phí tức thời Ct , theo một quy trình động nào đó (thường là khơng
được biết). Mục tiêu là một sách lược lựa chọn hành động để cực tiểu
hóa một chi phí dài hạn nào đó, nghĩa là chi phí tích lũy mong đợi.
Quy trình hoạt động của mơi trường và chi phí dài hạn cho mỗi sách
lược thường khơng được biết, nhưng có thể ước lượng được. Mạng
neural nhân tạo thường được dùng trong học tăng cường như một phần
của thuật tốn tồn cục. Các bài toán thường được giải quyết bằng học
tăng cường là các bài tốn điều khiển, trị chơi và các nhiệm vụ quyết
định tuần tự (sequential decision making) khác.

18

Chương II: Áp dụng vào dự báo doanh số bán hàng

19

2.1 Dữ liệu về doanh số bán hàng
Lấy dữ liệu minh họa là dữ liệu doanh số bán hàng của một chi nhánh từ
ngày 1/06/2016 đến 30/06/2016 được thống kê trong bảng sau:
Bảng 3.1 Dữ liệu doanh số bán hàng của thương hiệu sữa Vinamilk
TT

Tháng năm

Ngày

Doanh thu

1

201606

1

87637330000

2

201606

2

51592350000

3

201606

3

70710450000

4

201606

4

90337190000

5

201606

5

59876860000

6

201606

6

40409400000

7

201606

7

27422300000

8

201606

8

45635030000

9

201606

9

38154530000

10

201606

10

23910350000
20

11

201606

11

36457930000

12

201606

12

27384000000

13

201606

13

27385000000

14

201606

14

28537960000

15

201606

15

37820520000

16

201606

16

84600000000

17

201606

17

38400000000

18

201606

18

160000000000

19

201606

19

240000000000

20

201606

20

92300000000

21

201606

21

281000000000

22

201606

22

116000000000
21

23

201606

23

96900000000

24

201606

24

168000000000

25

201606

25

127000000000

26

201606

26

104000000000

27

201606

27

57400000000

28

201606

28

197000000000

29

201606

29

96406120000

30

201606

30

81598620000

Sử dụng 1 đặc trưng làm cấu trúc dữ liệu cho bài toán nên phương án
giải bài toán sẽ là dự báo dạng hồi quy. Tức là sử dụng dữ liệu của
những ngày trước đó để dự báo cho những ngày tiếp theo.
2.2 Phát biểu bài toán
Dữ liệu của bài toán chia ra 2 phần là phần training và phần test.
22

Từ bảng dữ liệu doanh số bán hàng của bảng trên ta thấy bài toán được

xây dựng như sau:
Lấy tháng 6 năm 2016 từ ngày 1 đến ngày 30 tháng 6 năm 2016 để minh
họa doanh số sẽ được dự báo theo ngày cụ thể như sau:
- Lấy 4 ngày đầu của tháng 6 năm 2016 làm dữ liệu input đầu vào để dự
báo cho ngày thứ 5.
- Sau đó lại lấy tiến lên một ngày từ ngày thứ 2 đến ngày thứ 5 để dự báo
cho ngày thứ 6.
- Cứ tiếp tục như vậy cho đến hết dữ liệu.
.
Bài toán gồm 2 pha: là pha học và pha chạy
-Pha học
Dữ liệu dùng để học sẽ lấy từ ngày 1 tháng 6 đến 25 tháng 6 như vậy ta
có 21 mẫu mỗi mẫu gồm 4 đầu vào là doanh số của 4 ngày. Mẫu 1 là
doanh số của ngày 1 đến ngày 4 và đầu ra là ngày 5. Mẫu 2 lấy tiến lên 1
ngày là doanh số từ ngày 2 tháng 6 đến ngày 5 tháng 6 và đầu ra là
doanh số ngày 7 tháng 6, cứ như vậy cho tới mẫu dữ liệu 18. Dữ liệu từ
ngày 26 tháng 6 đến 30 tháng 6 sẽ được sử dụng để kiểm tra độ chính
xác của dự báo.
Ta có bảng dữ liệu học như sau:
Bảng 2.2 Bảng dữ liệu học
Đầu
vào

x1

x2

x3

x4

Đầu ra

k=1 87637330000 51592350000 70710450000 90337190000 59876860000
23

k=2 51592350000 70710450000 90337190000 59876860000 40409400000
k=3 70710450000 90337190000 59876860000 40409400000 27422300000
k=4 90337190000 59876860000 40409400000 27422300000 45635030000
k=5 59876860000 40409400000 27422300000 45635030000 38154530000
k=6 40409400000 27422300000 45635030000 38154530000 23910350000
k=7 27422300000 45635030000 38154530000 23910350000 36457930000
k=8 45635030000 38154530000 23910350000 36457930000 27384000000
k=9 38154530000 23910350000 36457930000 27384000000 27385000000
k=1 23910350000 36457930000 27384000000 27385000000 28537960000
0
k=1 36457930000 27384000000 27385000000 28537960000 37820520000
1
k=1 27384000000 27385000000 28537960000 37820520000 84600000000
2
24

k=1 27385000000 28537960000 37820520000 84600000000 38400000000
3
k=1 28537960000 37820520000 84600000000 38400000000 16000000000
4
0
k=1 37820520000 84600000000 38400000000 16000000000 24000000000

5
0
0
k=1 84600000000 38400000000 16000000000 24000000000 92300000000
6
0
0
k=1 38400000000 16000000000 24000000000 92300000000 28100000000
7
0
0
0
k=1 16000000000 24000000000 92300000000 28100000000 11600000000
8
0
0
0
0

2.3 Thiết kế mạng nơron
Trong bài toán, ta xác định cặp đầu vào (x(k), d(k)) trong đó k=1…18 là
giá trị dữ liệu doanh thu từ 01/06/2016 đến 30/06/2016.
2.3.2 Cấu trúc mạng
Số nơron lớp vào
25

ĐỒ ÁN CƠ SỞ KHOA HỌC DỮ LIỆU: TÌM HIỂU MẠNG NEURON NHÂN TẠO ĐỂ DỰ BÁO DOANH SỐ BÁN HÀNG

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về