Tải bản đầy đủ (.docx) (86 trang)

Nghiên cứu ứng dụng học sâu convolutional neural network (cnn) trong nhận biết thời kỳ trái dứa chín tại vùng trồng dứa khu vực miền núi quảng nam – đà nẵng thạc sĩ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.03 MB, 86 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DUY TÂN

NGUYỄN LÀO

NGHIÊN CỨU ỨNG DỤNG HỌC SÂU CONVOLUTIONAL
NEURAL NETWORK (CNN) TRONG NHẬN BIẾT THỜI
KỲ TRÁI DỨA CHÍN TẠI VÙNG TRỒNG DỨA KHU VỰC

MIỀN NÚI QUẢNG NAM – ĐÀ NẴNG

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

ĐÀ NẴNG – 2021

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC DUY TÂN

NGUYỄN LÀO

NGHIÊN CỨU ỨNG DỤNG HỌC SÂU CONVOLUTIONAL
NEURAL NETWORK (CNN) TRONG NHẬN BIẾT THỜI
KỲ TRÁI DỨA CHÍN TẠI VÙNG TRỒNG DỨA KHU VỰC

MIỀN NÚI QUẢNG NAM – ĐÀ NẴNG

Chuyên ngành: Khoa học máy tính
Mã số: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


Người hướng dẫn khoa học: TS. Nguyễn Hà Huy Cường

ĐÀ NẴNG – 2021


LỜI CAM ĐOAN

Tên tôi là: Nguyễn Lào
Sinh ngày: 10/ 10/ 1978
Học viên lớp cao học MCS – K20, ngành Khoa học máy tính, – Trường Đại
học Duy Tân
Tôi xin cam đoan: Đề tài “ Nghiên cứu ứng dụng học sâu convolutional neural
network (CNN) trong nhận biết thời kỳ trái dứa chín tại vùng trồng dứa khu vực
miền núi Quảng Nam – Đà Nẵng” là do tôi nghiên cứu, tìm hiểu và phát triển dưới
sự hướng dẫn của TS. Nguyễn Hà Huy Cường, không phải sao chép từ các tài liệu,
cơng trình nghiên cứu của người khác mà không ghi rõ trong tài liệu tham khảo.
Tôi xin chịu trách nhiệm về lời cam đoan này.

Học viên thực hiện

Nguyễn Lào

LỜI CẢM ƠN

Để hoàn thành luận văn này, đầu tiên em gửi lời cảm ơn chân thành đến toàn
thể Quý Thầy, Cô giảng viên Trường Đại học Duy Tân đã tận tình giảng dạy, truyền
đạt những kiến thức quý báu và tạo điều kiện thuận lợi cho em trong suốt quá trình
học tập, nghiên cứu.

Em bày tỏ lòng biết ơn đến TS. Nguyễn Hà Huy Cường đã tận tâm giảng

dạy, hướng dẫn và đưa ra những góp ý, điều chỉnh vơ cùng xác thực cho luận văn,
đồng thời Quý thầy cũng cho em những lời động viên sâu sắc giúp em có những
định hướng đúng đắn để hoàn thành luận văn.

Cuối cùng em gửi lời cảm ơn đến gia đình, các bạn cùng khóa, đồng nghiệp
cùng cơ quan đã nhiệt tình hỗ trợ những thơng tin, chia sẻ những kiến thức hay giúp
em trong quá trình thực hiện.

Trân trọng!

MỤC LỤC
LỜI CAM ĐOAN.....................................................................................................i
LỜI CẢM ƠN..........................................................................................................ii
MỤC LỤC............................................................................................................... iii
DANH MỤC CHỮ VIẾT TẮT............................................................................viii
DANH MỤC BẢNG BIỂU......................................................................................x
DANH MỤC HÌNH, ĐỒ THỊ................................................................................xi
MỞ ĐẦU..................................................................................................................1

1. Lý do chọn đề tài..........................................................................................1
2. Mục tiêu nghiên cứu (mục tiêu chung, mục tiêu cụ thể)...............................4
3. Tổng quan nghiên cứu của đề tài..................................................................5
4. Đối tượng và phạm vi nghiên cứu.................................................................5
5. Phương pháp nghiên cứu...............................................................................6
6. Đóng góp của đề tài......................................................................................6
7. Cấu trúc của đề tài........................................................................................7
Chương 1. TỔNG QUAN VỀ NHẬN DẠNG DỰA TRÊN MẠNG NƠ RON
TÍCH CHẬP (CNN)................................................................................................8
1.1 Khái niệm cơ bản trong xử lý ảnh........................................................................8
1.1.1 Điểm ảnh..................................................................................................8

1.1.2 Độ phân giải của ảnh (Resolution)..........................................................8
1.1.3 Mức xám của ảnh.....................................................................................9
1.1.4 Các kiểu ảnh.............................................................................................9
1.1.5 Biểu diễn ảnh.........................................................................................12
1.1.6 Khử nhiễu..............................................................................................13
1.1.7 Nhận dạng ảnh.......................................................................................13

1.1.8 Nhận dạng đối tượng.............................................................................13

1.2 Nhận dạng trái chín trong vùng trồng dứa dựa trên mạng nơ ron tích chập.......14

1.2.1 Lọc màu vỏ trái cây................................................................................18

1.2.2 Lọc độ sâu..............................................................................................18

Chương 2 . BÀI TOÁN NHẬN DẠNG TRÁI DỨA CHÍN ÁP DỤNG MẠNG
NƠ RON TÍCH CHẬP..........................................................................................20

2.1 Mạng Neural 20
2.1.1 Giới thiệu về mạng nơ-ron nhân tạo.......................................................20

2.1.2 Đơn vị xử lý...........................................................................................22
2.1.3 Mạng nơ-ron truyền thẳng......................................................................23
2.1.4 Mạng nơ-ron truyền thẳng một lớp........................................................23
2.2 Phân lớp, nhận dạng đối tượng với Support Vector Machine 2 lớp...................26
2.2.1. SVM với tập mẫu phân hoạch tuyến tính được.....................................26
2.2.2. SVM tuyến tính với tập mẫu khơng phân hoạch tuyến tính được.........30
2.2.3. SVM phi tuyến......................................................................................33
2.3 Mạng nơ ron tích chập.......................................................................................37
2.3.1. Khái niệm về mạng nơ ron tích chập.....................................................37

2.3.2. Mơ hình mạng nơ ron tích chập............................................................38
2.3.3. Xây dựng mạng nơ ron tích chập..........................................................39
2.4. Kết luận 47

Chương 3 . KẾT QUẢ THỰC NGHIỆM............................................................48

3.1 Áp dụng mạng nơ ron tích chập vào các giải pháp thơng minh trong thực tế....48

3.2. Áp dụng mạng nơ ron tích chập để xây dựng hệ thống nhận diện người vào/ra
và đánh giá thực nghiệm, so sánh với phương pháp HOG.......................................48

3.2.1. Giới thiệu hệ thống nhận diện và đếm lượt người vào/ra sử dụng mạng
nơ ron tích chập .....................................................................................................48

3.2.2 Giới thiệu kiến trúc của máy chủ xử lý nhận diện và đếm lượng người.........49
3.2.3 Giới thiệu sơ lược về phương pháp mô tả đặc trưng HOG sẽ được dùng
để so sánh................................................................................................................51
3.2.4 Giới thiệu sơ lược về phương pháp HOG sử dụng để phát hiện đối tượng...51
3.3 Dựa trên thử nghiệm thực tế nhận diện trái dứa chín , ta thu được hình ảnh là
kết quả của các mơ hình..........................................................................................54
3.3.1. Môi trường cài đặt.................................................................................54
3.3.2 Mô tả thực nghiệm.................................................................................55
3.3.3 Thiết kế hệ thống...................................................................................55
3.3.4 Tiến hành thực nghiệm..........................................................................55
3.3.5 Triển khai xây dựng...............................................................................56
3.4. Huấn luyện mơ hình.........................................................................................63
3.4.1 Tiền huấn luyện.....................................................................................63
3.4.2. Huấn luyện............................................................................................63
3.5 Đánh giá...........................................................................................................65
KẾT LUẬN............................................................................................................68

1. Kết luận.......................................................................................................68
2. Hướng phát triển của đề tài.........................................................................68
TÀI LIỆU THAM KHẢO

DANH MỤC CHỮ VIẾT TẮT

Chữ viết Ý nghĩa
tắt
Support Vector Machine
SVM Color Graphic Adaptor
CGA Picture Element
Pixel Red
R Green
G Blue
B Radial Basis Function
RBF Artificial Intelligence – Trí tuệ nhân tạo
AI Artificial Neural Network – Mạng thần kinh nhân tạo
ANN Convolutional Neural Network – Mạng thần kinh tích chập
CNN Rectified Linear Unit – Điều chỉnh đơn vị tuyến tính
ReLU Cơ sở dữ liệu
CDSL Graphics Processing Unit – Vi xử lý đồ hoạ
GPU Central Processing Unit – Bộ xử lý trung tâm
CPU Compute Unified Device Architecture – Kiến trúc tính tốn
song song do hãng NVDIA phát triển
CUDA Internet of Thing – Vạn vật kết nối
Application Programming Interface – Giao diện lập trình
IoT You only lock one – Một hệ thống mạng nơ ron nhân tạp phát
API hiện đối tượng thời gian thực
Histogram of Oriented Gradients – Biểu đồ độ dốc định hướng
YOLO Principal Component Analysis – Phân tích thành phần chính


HOG
PCA

DANH MỤC BẢNG BIỂU

Bảng 1. Bảng số liệu thống kê diện tích đất trồng cây ăn trái ( đơn vị 1000 m2).......2
Bảng 2. Bảng số liệu thống sản lượng cây ăn trái (Đơn vị 1000 Tấn).......................3

DANH MỤC HÌNH, ĐỒ THỊ

Hình 1.1: So sánh ảnh với độ phân giải khác nhau....................................................9
Hình 1.2: Hệ màu cơ bản RGB................................................................................11
Hình 1.3: Khơng gian màu RGB.............................................................................11
Hình 1.4: Ảnh màu..................................................................................................12
Hình 1.5. Qui trình tổng quát xử lý nhận dạng, phát hiện trái chín..........................16
Hình 1.6. Sơ đồ khối hệ thống xử lý nhận dạng, phát hiện trái dứa chín.................17
Hình 2.1. Nơ-ron sinh học......................................................................................20
Hình 2.2. Đơn vị xử lý của mạng nơ-ron................................................................22
Hình 2.3. Mạng nơ-ron truyền thẳng nhiều lớp......................................................23
Hình 2.4. Mạng perceptron một lớp........................................................................24
Hình 2.5. Siêu phẳng phân chia dữ liệu..................................................................27
Hình 2.6. Siêu phẳng với lề cực đại cho một SVM phân chia hai tập mẫu [16]......28
Hình 2.7. Minh hoạ các mẫu được gọi là Support Vector.......................................30
Hình 2.8. Khơng thể phân hoạch hai tập mẫu trên bằng một siêu phẳng [16].........30
Hình 2.9. Ảnh hưởng của hằng số lề mềm C [8]...................................................31
Hình 2.10. Một mặt phân chia phi tuyến có thể trở thành một siêu phẳng trong
khơng gian lớn hơn [16]..........................................................................................34
Hình 2.11. Mặt phẳng [-1,1]x[-1,1] trong R2 thành mặt cong trong R3 [12]...........34
Hình 2.12. RBF Gaussian Kernel có thể chuyển một mặt bất kỳ thành một siêu

phẳng [11\2]............................................................................................................37
Hình 2.13. Các tầng (layer) trong CNN là 3 chiều...................................................37
Hình 2.14. Hình minh họa một ví dụ sử dụng CNN để phân lớp đồ vật [20]...........38

Hình 2.15. Ví dụ minh họa về cấu trúc CNNs – LeNet – 5[19]...............................38
Hình 2.16. Hình ảnh một mạng nơ ron được kết nối đầy đủ....................................39
Hình 2.17. Tích chập một ma trận nhỏ để tạo ra dữ liệu đầu vào cho một...............40
Hình 2.18. Ví dụ về lớp tích chập............................................................................40
Hình 2.19. So sánh giữa ReLU và Sigmoid.............................................................42
Hình 2.20. Ví dụ minh họa đơn giản về tầng gộp....................................................43
Hình 2.21. Một ví dụ của lớp được kết nối đầy đủ..................................................44
Hình 2.22. Ví dụ về trường hợp quá khớp (bên trái) và trường hợp chuẩn (bên phải)......45
Hình 2.23. Cấu trúc của AlexNet.............................................................................46
Hình 2.24. Cấu trúc của VGGNet............................................................................47
Hình 3.1. Hình ảnh thiết kế của hệ thống nhận diện đối tượng................................49
Hình 3.2. Phương pháp mạng YOLO sử dụng để nhận diện đối tượng...................50
Hình 3.3. Mơ hình mạng YOLO..............................................................................50
Hình 3.4. Tiền xử lý để xác định khung hình..........................................................51
Hình 3.5. Độ dốc sau khi tính tốn..........................................................................52
Hình 3.6. Kết quả sau khi tính tốn véc tơ đặc trưng cho từng ơ.............................53
Hình 3.7. Biểu diễn các véc tơ chỉ hướng theo HOG thu được sau khi tính tốn.............54
Hình 3.8. Figure 15 Sơ đồ hoạt động hệ thống nhận dạng.......................................55
Hình 3.9. Ảnh gốc ban đầu với các trái dứa kích cỡ, độ chín khác nhau................56
Hình 3.10. Vùng trồng dứa tại xã Đại Hồng – Huyện Đại Lộc................................57
Hình 3.11. Các quả dứa thu hoạch từ trang trại trồng dứa tại xã Đại Hồng - Huyện
Đại Lộc.................................................................................................................... 57
Hình 3.12. Dữ liệu trái dứa được thu thập...............................................................58

Hình 3.13. Cài đặt thơng số và thư viện pipenv.......................................................58
Hình 3.14. Cài đặt thư viện qt5py3..........................................................................59

Hình 3.15. Cài đặt cơng cụ LabelImg từ github.......................................................59
Hình 3.16. Khởi chạy cơng cụ LabelImg.................................................................59
Hình 3.17: Giao diện chính của LabelImg...............................................................60
Hình 3.18. Mở thư mục chưa hình ảnh trái dứa để bắt đầu gán nhãn.......................60
Hình 3.19. Chọn đường dẫn tới vị trí lưu trữ tệp thơng số gán nhãn.......................61
Hình 3.20. Chọn định dạng YOLO cho mơ hình.....................................................61
Hình 3.21. Thực hiện q trình chọn vùng đặc trưng trái dứa.................................62
Hình 3.22. Cập nhập thêm nhãn cho vùng đặc trưng vừa chọn...............................62
Hình 3.23. Thơng số đặc trưng của hình ảnh sau khi được lưu................................62
Hình 3.24. Khởi tạo quá trình sử dụng và kết nối với Google Colab.......................63
Hình 3.25. Huấn luyện mơ hình với các thơng số đã cài đặt....................................64
Hình 3.26. Quá trình huấn luyện bắt đầu thực thi....................................................64
Hình 3.27. Mơ hình huấn luyện sau khi đã huấn luyện hồn thành.........................65
Hình 3.28. Giao diện hệ thống nhận dạng và phát hiện trái thơm............................65
Hình 3.29. Chọn hình ảnh cho hệ thống so sánh......................................................66
Hình 3.30. Kết quả hệ thống trả về..........................................................................66
Hình 3.31. Kết quả hệ thống trả về..........................................................................66

1

MỞ ĐẦU

1. Lý do chọn đề tài
Với sự phát triển nhanh chóng của các loại máy móc hiện đại như máy ảnh số,
máy quay phim kỹ thuật số, máy vi tính,… thì lượng thơng tin con người thu được
dưới dạng hình ảnh là rất dễ dàng. Xử lý ảnh là một trong những lĩnh vực ngày càng
được phổ biến trong đời sống xã hội. Các thiết bị ghi hình có thể thấy và hiểu được
thế giới xung quanh được xây dựng và phát triển ngày càng nhiều bởi sự tiến bộ
trong các thuật toán phân tích, chọn lọc hình ảnh.


Máy tính hiện nay có sức mạnh tính tốn lớn nhưng giá thành lại ở mức phổ
thông,dẫn tới người làm nghiên cứu rất dễ dàng để có thể tự kiểm nghiệm được các
lý thuyết về trí tuệ nhân tạo từ nhiều năm trước. Cùng với mã nguồn mở, hiện làn
sóng trí tuệ nhân tạo đang bùng nổ mạnh mẽ trong thời gian gần đây, và đem lại
rất nhiều ứng dụng trong đời sống Chính vì lý do trên, việc tìm hiểu và nghiên cứu
thị giác máy tính rất có ý nghĩa và thiết thực.

…Hiện nay, trên thế giới có các mơ hình đã nghiên cứu về nhận dạng hình ảnh
như: YOLO, CNN, R-CNN, Fast R-CNN, Faster R-CNN và mơ hình Mask R-CNN
[1,2,3,4,5]. Tuy nhiên, trong các mơ hình này chưa có nhiều nghiên cứu trực tiếp
liên quan đến nhận dạng thời kỳ trái chín, chủ yếu các nghiên cứu tập trung vào
nhận dạng văn bản, nhận dạng khuôn mặt, vân tay và một số nghiên cứu nhận dạng
con vật nuôi.

Trong nông nghiệp thông minh và nông nghiệp chính xác, vấn đề ước tính kịp
thời và chính xác thời kỳ trái chín của vườn cây sẽ giúp cải thiện và nâng cao chất
lượng, đảm bảo sản lượng trái cây và kế hoạch thu hoạch. Ngoài ra, xác định kịp
thời và chính xác thời kỳ trái chín trong các giai đoạn trưởng thành cây quả sẽ cho
phép giảm chi phí canh tác, chi phí lưu trữ sau thu hoạch và làm tăng giá trị kinh tế,
đáp ứng yêu cầu thị trường. Đây là những vấn đề rất được quan tâm trong định
hướng phát triển nông nghiệp tận dụng lợi thế của công nghệ cao trong thời gian tới

2

ở Việt Nam.

Cho đến năm 2020, diện tích trồng cây ăn quả chủ lực của Việt Nam là
257.000 ha, chiếm 52% tổng diện tích quy hoạch cây ăn quả ở Nam bộ, trong đó
vùng Đồng bằng sơng Cửu Long (ĐBSCL) 185.100 ha, vùng Đông Nam bộ 71.900
ha. Trong khu vực này, hiện nay chú trọng trồng 12 loại cây ăn quả chủ lực gồm:

Thanh long, xồi, chơm chơm, sầu riêng, vú sữa, bưởi, nhãn, chuối, dứa, cam, mãng
cầu và quýt. Trong bảng dữ liệu 1 và 2 đưa ra thống kê diện tích trồng cây ăn quả và
sản lượng thu hoạch cây ăn từ năm 2015 đến năm 2018. Có thể nhận thấy diện tích
trồng và sản lượng thu hoạch tăng lên đáng kể, mang hiệu quả kinh tế xã hội. Đặc
biệt, khi ngày càng có nhiều nơng dân và trang trại nơng nghiệp có diện tích trồng
lớn tham gia chuỗi sản xuất và xuất khẩu.

Ở Việt Nam cây dứa được trồng khá phổ biến, phân bố từ Phú Thọ đến Kiên
Giang. Tiền Giang là tỉnh có sản lượng dứa đứng đầu cả nước.

Năm 2019, sản lượng dứa của tỉnh Tiền Giang đạt 211.300 tấn. Tiếp theo
là Kiên Giang (185.000 tấn), Ninh Bình (150.400 tấn), Nghệ An (130.600
tấn), Long An (127.000 tấn), Hà Nam (123.400 tấn), Thanh Hoá (120.500 tấn),
Quảng Nam (112.000 tấn); Đà Nẵng (30.000 tấn). Tổng sản lượng cả nước năm
2019 đạt 12.229.100 tấn. Nhiều địa phương đã xây dựng thương hiệu đặc sản trái
dứa như dứa Đồng Giao (Tam Điệp - Ninh Bình), hoặc ở Kiên Giang, Tiền
Giang đều có những nhà máy chuyên sản xuất, chế biến các thực phẩm từ trái dứa.

Bảng 1. Bảng số liệu thống kê diện tích đất trồng cây ăn trái ( đơn vị 1000 m2)

STT Cam, Dứ Chuố Xoà Nhã Vải, Chôm Bưởi,
theo quýt a i i n Bòng
năm chôm

2015 6,7 9,7 133 83,7 73,3 90,6 51,7

2016 7,4 0,5 138,6 86,7 73,3 87,8 60

2017 10 1 140,2 92,7 75,6 86,5 66,5


2018 20 2 140 95 71 90 64

Bảng 2. Bảng số liệu thống sản lượng cây ăn trái (Đơn vị 1000 Tấn)

3

STT theo Cam, Dứa Chuối Xồi Nhãn Vải, Chơm Bưởi,
năm quýt chôm Bòng

2015 566,1 578,2 1.943, 702,9 513 715,1 471,4
4

2016 799,5 560,4 1.958, 728 504,1 648,9 500,3
5

2017 948,1 567,1 2.066, 788,2 492,5 563,9 533,3
2

2018 976 610 2.100 795 520 650 525

Hiện nay, Dứa đã trở thành một trong những loại cây ăn trái phổ biến nhất trên

thế giới. Được xác định là cây trồng chủ lực của các xã vùng núi huyện Đại Lộc

(Quảng Nam) huyện Hòa Vang thành phố Đà Nẵng, từ năm 2009, cây dứa (thơm)

đã trở thành nguồn thu nhập chính của hầu hết các hộ gia đình nơi đây.

Tuy nhiên, trong bối cảnh hội nhập, cạnh tranh về giá cả và chất lượng xuất
khẩu sang thị trường Châu Âu, Mỹ, Nhật Bản và cả Trung Quốc, cần phải đưa các

công nghệ hỗ trợ cho việc nâng cao chất lượng nhờ xác định đúng, trúng và sát với
thực tế thời kỳ trái chín, nhờ vậy giảm chi phí bảo quản trái cây sau thu hoạch, góp
phần luân canh tăng vụ. Ngồi ra, nhận biết trái chín cũng giúp giảm chi phí sản
xuất, nhờ xác định lượng nước, lượng phân bón cho giai đoạn cuối mùa phù hợp.
Đây là một bài tốn rất quan trọng và cần thiết cho ngành nơng nghiệp ở Việt Nam.

Qua khảo sát thực tế tại các trang trại nông nghiệp, cơng việc nhận biết thời kỳ
trái Dứa chín và trái Dứa chưa chín cần tiếp tục được chăm sóc, hồn tồn làm bằng
thủ cơng, theo kinh nghiệm dân gian truyền thống. Do vậy, tốn công sức và nếu
không nhận biết trái chín kịp thời, tỷ lệ tổn thất sản lượng thu hoạch sẽ rất lớn.

Xuất phát từ nhưng đặc điểm trên đề tài “Nghiên cứu ứng dụng mơ hình học
sâu trong nhận biết thời kỳ trái Dứa chín cho các vùng trồng dứa khu vực
miền núi Quảng Nam – Đà Nẵng” sẽ góp một phần giải quyết bài toán này. Việc
nhận biết thời kỳ trái chín dựa vào xử lý và nhận dạng hình ảnh camera quan sát
vùng canh tác cây ăn quả. Từ hình ảnh sẽ trích ra các phần ảnh quả. Phần mềm học
sâu sẽ nhận dạng phân loại mức độ chín của quả hiện đang xét. Để đạt độ chính xác

4

nhận dạng, phần mềm cần phải được huấn luyện với một tập mẫu ảnh quả đủ lớn,
đa dạng về kích thước, màu sắc, góc nhìn với các điều kiện thực tế thu thập ảnh (độ
sáng, độ chói,…) khác nhau.

2. Mục tiêu nghiên cứu (mục tiêu chung, mục tiêu cụ thể)
2.1 Mục tiêu chung:
- Luận văn của tôi hướng tới việc nghiên cứu một mơ hình có chức năng nhận
dạng, chọn lọc đối tượng thơng qua hình ảnh thu được và từ đó khuyến nghị nhận
dạng các đối tượng, từ vùng trồng dứa, hay các đại lý thu mua nông sản, hay áp
dụng tại các siêu thị bán trái cây nông sản.

2.2 Mục tiêu cụ thể:
- Nghiên cứu xác định mô hình học sâu phù hợp nhận dạng hình ảnh giải quyết
bài tốn nhận biết thời kỳ trái dứa chín.
- Tìm hiểu các cơng đoạn xử lý nhận dạng hình ảnh camera.
- Nghiên cứu các mơ hình học sâu (YOLO,CNN, R-CNN, Fast R-CNN,
Faster R-CNN, Mask-R-CNN)
- Phân tích lựa chọn mơ hình học sâu phù hợp nhận dạng hình ảnh giải quyết
bài tốn nhận biết thời kỳ trái Dứa chín.
Nghiên cứu các giống dứa phổ biến khu vực Quảng Nam - Đà Nẵng và đặc
điểm sinh hóa của trái dứa thời kỳ chín
- Tình hình các loại dứa được trồng trên thế giới và Việt Nam; tình hình trái
dứa được trồng tại các vùng canh tác thuộc tỉnh Quảng Nam – thành phố Đà Nẵng;
- Nghiên cứu đặc điểm sinh học của cây dứa; trái dứa: đặc điểm phân loại;
đặc điểm về hình trái; giải phẫu; đặc điểm về sinh lý; sinh hóa của trái dứa; đặc
điểm sinh trưởng và phát triển; đặc điểm các thành phần dinh dưỡng;
- Quá trình biến đổi của trái dứa: Thời điểm ra hoa và kết quả; Quá trình biến
đổi từ trái xanh tới trái chín; Nghiên cứu đặc điểm mùi vị và màu sắc của trái dứa
khi biến đổi; chất lượng của trái khi biến đổi.
- Việc áp dụng các giải pháp kỹ thuật, độ chính xác của mơ hình nhận dạng
phụ thuộc vào đề xuất giải pháp phù hợp với đặc điểm của đề tài. Do đó, tơi đã áp

5

dụng các kỹ thuật mạng nơ ron tích chập (CNN), cài đặt, thực nghiệm và so sánh
đánh giá. Trong đó, các mơ hình có độ phức tạp tăng dần theo thứ tự như sau:

Mô hình 1: Áp dụng bộ lọc Gauss 3 chiều để giữ lại điểm ảnh có màu lân cận
với màu của thời kỳ trái chín để nhận dạng. Thực hiện phép đếm các đối tượng còn
lại trên ảnh.


Mơ hình 2: Lọc tách các điểm ảnh có màu đặc trưng của trái dứa dựa trên
mạng nơ-ron (Neural networks) truyền thẳng. Thực hiện phép đếm các đối tượng
cịn lại trên ảnh.

Mơ hình 3: Áp dụng phương pháp phân loại đối tượng bằng Support Vector
Machine (SVM) để lọc màu. Thực hiện phép đếm các đối tượng còn lại trên ảnh.

3. Tổng quan nghiên cứu của đề tài
Để đạt được mục tiêu trên, đề tài cần thực hiện các nội dung sau:
- Tìm hiểu các kỹ thuật xử lý ảnh, áp dụng các phương pháp vào đề tài như:
Một số tiêu chuẩn lưu trữ ảnh số, phân tách đối tượng bằng các phương pháp lọc
màu (Gauss 3 chiều, huấn luyện mạng nơ-ron truyền thẳng, phân loại đối tượng
bằng SVM).
- Tìm hiểu và phân tích các bài báo, cơng trình nghiên cứu liên quan gần hoặc
tương đương.
- Đề xuất các kỹ thuật, phương pháp đếm số lượng thẻ biểu quyết trong cuộc
họp dựa qua hình ảnh.
- Thực hiện và so sánh kết quả đạt được với các nghiên cứu khác.
4. Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu:
Đối tượng nghiên cứu của đề tài là các công trình nghiên cứu, các bài báo, tài
liệu liên quan đến mơ hình học sâu đã có hiện nay như: CNN, R-CNN, Fast R-CNN,
Faster R-CNN, Mask – R -CNN, có thể nói trên thế giới hiện nay cũng có khá nhiều
mơ hình học sâu trong nhận dạng và xử lý ảnh, vì thế nhóm nghiên phải có một
hướng tiếp cận tồn diện, mang tính tổng hợp và có hệ thống các nghiên cứu đã có.

6

Nhóm nghiên cứu cần có sự phân tích cụ thể về điểm mạnh cũng như điểm yếu từ các
giải pháp hiện tại để đề xuất giải pháp mới phù hợp với mục tiêu của đề tài.


- Nghiên cứu các bước trong quy trình nhận dạng của các mơ hình học sâu.
- Phân tích đánh giá ưu nhược điểm của từng mơ hình.
- Sử dụng ngơn ngữ lập trình, xây dựng phần mềm dự báo (mơ phỏng) để đánh
giá các mơ hình đã đề xuất
4.2 Phạm vi nghiên cứu
- Phạm vi không gian : Đề tài thực hiện trong phạm vi khu vực Quảng Nam –
Đà Nẵng
5. Phương pháp nghiên cứu
Để thực hiện đề tài này, tác giả sử dụng các phương pháp nghiên cứu sau:
- Phương pháp phân tích và tổng hợp lý thuyết: Tìm kiếm, tổng hợp và nghiên
cứu các tài liệu về xử lý ảnh; các thuật toán chọn lọc hình ảnh, kiến thức liên quan
kỹ thuật lập trình.
- Phương pháp thực nghiệm: Sau khi nghiên cứu phương pháp lý thuyết, xác
định vấn đề bài tốn, đề xuất mơ hình; tiến hành xây dựng và đề xuất các mơ hình;
cài đặt thử nghiệm chương trình với ngơn ngữ lập trình Python.
- Phương pháp so sánh và đánh giá: để phân tích đánh giá các mơ hình đề xuất.
6. Đóng góp của đề tài
Đối với mục tiêu nghiên cứu của luận văn, tác giả đã đề xuất thực hiện những
giải pháp như sau:
- Phân tách bài toán nhận dạng trái dứa thành bài toán lọc màu và bài toán
nhận dạng đối tượng.
- Đề xuất áp dụng các phương pháp như: Lọc Gauss, mạng nơ-ron tích chập
CNN, SVM cho bài tốn lọc màu. Tiến hành lập trình, thực nghiệm để đánh giá, lựa
chọn giải pháp phù hợp.
- Lập trình, áp dụng phương pháp đếm đối tượng trên ảnh.
7. Cấu trúc của đề tài
Ngoài phần mở đầu, kết luận, tài liệu tham khảo, luận văn có kết cấu gồm 03

7


chương như sau:
Chương 1: TỔNG QUAN NHẬN DẠNG DỰA TRÊN MẠNG NƠ RON TÍCH

CHẬP
Bài toán đặt ra cho việc nhận dạng dứa chín tại vùng trồng dứa.
Chương 2: NHẬN DẠNG TRÁI DỨA CHÍN DỰA VÀO MẠNG NƠ RON

TÍCH CHẬP
Dựa vào đặc trưng của thẻ, tác giả đề xuất phương pháp lọc màu và phương

pháp đếm thẻ.
Chương 3: KẾT QUẢ THỰC NGHIỆM
- Mô tả thực nghiệm.
- Tiến hành thực nghiệm.
- Đánh giá kết quả.


×