Tải bản đầy đủ (.pdf) (26 trang)

Sử dụng phương pháp deep learning trong nhận dạng dữ liệu y tế (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.59 MB, 26 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA
¾¾¾¾¾¾¾¾¾

NGUYỄN HUỲNH THUÝ HIỀN

SỬ DỤNG PHƯƠNG PHÁP DEEP LEARNING
TRONG NHẬN DẠNG DỮ LIỆU Y TẾ

C
C
R
UT.L

D

Chun ngành: Khoa học máy tính
Mã số: 8480101

TĨM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng – Năm 2021


Cơng trình được hồn thành tại
TRƯỜNG ĐẠI HỌC BÁCH KHOA

Người hướng dẫn khoa học: TS. PHẠM MINH TUẤN

Phản biện 1: TS. Phạm Công Thắng
Phản biện 2: TS. Trịnh Công Duy



C
C
R
UT.L

Luận văn sẽ được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ

D

Khoa học máy tính họp tại Trường Đại học Bách khoa vào ngày 23 tháng
01 năm 2021

Có thể tìm hiểu luận văn tại:
- Trung tâm Học liệu và Truyền thông , Đại học Đà Nẵng tại Trường
Đại học Bách khoa
- Thư viện Khoa Công Nghệ Thông Tin, Trường Đại học Bách khoa –
ĐHĐN


1
MỞ ĐẦU
1.

LÝ DO CHỌN ĐỀ TÀI
Cùng với sự phát triển của khoa học cơng nghệ, trí tuệ nhân tạo

được xem là nhân tố định hình tương lai. Với sự phát triển nhanh
chóng trong những năm gần đây, trí tuệ nhân tạo đã thực sự đi vào
cuộc sống. Hàng loạt các cơng nghệ mới sử dụng trí tuệ nhân tạo ra

đời giúp ích cho con người trong nhiều lĩnh vực như an ninh, bảo mật,
y học, giáo dục...
Machine learning là một lĩnh vực con của trí tuệ nhân tạo (AI).
Nguyên tắc cốt lõi của Machine learning là các máy tiếp nhận dữ liệu

C
C
R
UT.L

và tự học. Machine learning là một phương pháp phân tích dữ liệu mà

D

sẽ tự động hóa việc xây dựng mơ hình phân tích. Một trong những kỹ
thuật được sử dụng phổ biến trong Machine learning hiện nay là kỹ
thuật Deep learning.
Deep learning là một lĩnh vực chuyên sâu trong Machine learning.
Nó sử dụng một số kỹ thuật của Machine learning để giải quyết các
vấn đề thực tế bằng cách khai thác các mạng thần kinh nhân tạo và mô
phỏng việc đưa ra các quyết định của con người. Deep learning có ứng
dụng sâu rộng trong các lĩnh vực của đời sống như tìm kiếm sự sai
khác giữa các văn bản, phát hiện gian lận, nhận dạng chữ viết tay, nhận
dạng hình ảnh, giọng nói... góp phần quan trọng trong việc hỗ trợ con
người trong nhiều lĩnh vực đời sống.
Trong Y học, ảnh Y học thường chụp các bộ phận bên trong
cơ thể người bằng các thiết bị chuyên dụng như máy X-Quang, máy


2

chụp cắt lớp, máy chụp cộng hưởng từ … chất lượng ảnh thường
không rõ và không sắc nét nên gây khó khăn cho các chuyên gia y học
trong việc chuẩn đoán bệnh. Mặc dù các thiết bị y tế với công nghệ
ngày càng được nâng cao để hỗ trở các chun gia y tế phân tích và
xử lý thơng tin từ hình ảnh một cách chính xác và nhanh chóng nhất,
nhưng vẫn cần một bước tiền xử lý giúp nhận dạng ảnh y học.
Từ những ứng dụng thực tế, lợi ích mà Deep learning đem lại,
tôi đề xuất đề tài: Vì lý do trên tơi quyết định chọn đề tài “Sử dụng
phương pháp deep learning trong nhận dạng dữ liệu y tế”.
2.

MỤC TIÊU VÀ NHIỆM VỤ

2.1.

Mục tiêu

C
C
R
UT.L

Nghiên cứu kỹ thuật Deep learning thông qua phương pháp

D

CNN - Convolutional Neural Network (Mạng nơron tích chập).
Kết hợp kỹ thuật Deep learning trong mơ hình nhận dạng.
Nghiên cứu và xây dựng ứng dụng sử dụng phương pháp CNN
bằng ngơn ngữ lập trình Python.

2.2.

Nhiệm vụ
Tìm hiểu phương pháp CNN (Convolutional Neural Network)

trong deep learning
Ứng dụng kỹ thuật deep learning trong việc nhận dạng ảnh y tế.
Nghiên cứu về ngơn ngữ lập trình Python.


3
3.

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

3.1. Đối tượng
- Kỹ thuật deep learning và phương pháp CNN – Mạng nơron
tích chập
- Môi trường và các bộ thư viện của ngôn ngữ Python hỗ trợ cho
xử lý ảnh.
3.2. Phạm vi nghiên cứu
Dữ liệu y tế.
4.

PHƯƠNG PHÁP NGHIÊN CỨU

4.1. Phương pháp nghiên cứu tài liệu
Nghiên cứu tài liệu về kỹ thuật deep learning, các phép lọc,

C

C
R
UT.L

thuật toán và so khớp mẫu trong nhận dạng và xử lý ảnh liên quan..

D

4.2. Phương pháp nghiên cứu thực nghiệm

Sử dụng kỹ thuật deep learning để huấn luyện tập dữ liệu hình
ảnh y tế. Xây dựng hệ thống dựa trên ngơn ngữ lập trình Python.
5.

BỐ CỤC LUẬN VĂN

MỤC LỤC
MỞ ĐẦU
1.

LÝ DO CHỌN ĐỀ TÀI

2.

MỤC TIÊU VÀ NHIỆM VỤ CỦA ĐỀ TÀI

3.

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU


4.

PHƯƠNG PHÁP NGHIÊN CỨU

5.

Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN

6.

BỐ CỤC LUẬN VĂN

CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN


4
1.1.

NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC

1.2.

KHÁI QUÁT VỀ XỬ LÝ ẢNH

1.3.

XỬ LÝ ẢNH TRONG Y TẾ

CHƯƠNG 2: ÁP DỤNG KỸ THUẬT DEEP LEARNING VÀO
NHẬN DẠNG DỮ LIỆU Y TẾ

2.1. MÔ HÌNH GIẢI PHÁP
2.2. PHÂN TÍCH GIẢI PHÁP
2.3. CÁC THUẬT TỐN
2.4. QUÁ TRÌNH HUẨN LUYỆN
CHƯƠNG 3: TRIỂN KHAI VÀ NHẬN XÉT

C
C
R
UT.L

3.1. DỮ LIỆU THỬ NGHIỆM

3.2. NGÔN NGỮ PYTHON VÀ THƯ VIỆN HỌC MÁY

D

3.3. KẾT QUẢ THỬ NGHIỆM

3.4. ĐÁNH GIÁ KẾT QUẢ VỚI CÁC NGHIÊN CỨU LIÊN QUAN
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
TÀI LIỆU THAM KHẢO


5
CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN
1.1.

GIỚI THIỆU
Các phương pháp chẩn đốn hình ảnh rất phong phú, như chẩn


đốn qua hình ảnh X-Quang, hình ảnh siêu âm, siêu âm – Doppler
màu, hình ảnh nội soi (mà thơng dụng là nội soi tiêu hố và nội soi tiết
niệu), hình ảnh chụp cắt lớp vi tính (Computed Tomography ScannerCT), hình ảnh chụp cổng hưởng từ hạt nhân (Magnetic Resonance
Imaging).
Các thiết bị và máy y tế về chẩn đốn hình ảnh ngày càng ứng
dụng nhiều hơn về công nghệ thông tin, các phần mềm cho các máy Y

C
C
R
UT.L

tế ngày càng được nâng cấp, nhất là khi kỹ thuật số ra đời và phát triển

D

đã ghi nhận và phân tích tín hiệu rất tốt, cho hình ảnh sâu hơn, chất
lượng ảnh tốt hơn. Ứng dụng của xử lý ảnh có khả năng tác động mạnh
mẽ nhất đến cuộc sống của chúng ta nhất là trong lĩnh vực y tế . Soi
chụp bằng máy tính dựa trên cơ sở định lý cắt lớp, được dùng thường
xuyên trong xét nghiệm lâm sàng, ví dụ như phát hiện u não. Những
ứng dụng y học khác của xử lý ảnh số gồm cải thiện ảnh X-Quang, và
nhận dạng đường biên mạch máu từ những ảnh chụp bằng tia X
(angiograms), ảnh sau khi được tái tạo vẫn gây khó khăn cho việc
chuẩn đoán bệnh.
AI (Artificial Intelligent) là một ngành đang rất được quan tâm
trong thời gian gần đây. Các hệ thống sử dụng AI đã và đang đi sâu
vào phục vụ nhiều lĩnh vực trong cuộc sống, hiểu một cách đơn giản,
AI là trí thơng minh do con người tạo ra nhằm giúp máy tính có thể



6
hiểu, thích ứng, suy nghĩ và xử lý các thơng tin phục vụ mục đích của
con người. Trong những năm gần đây, có rất nhiều nghiên cứu về sử
dụng AI trong việc hỗ trợ chẩn đoán bệnh như phân vùng nội tạng
trong cơ thể, phát hiện khối u, hay xác định ung thư đã được công bố
trên nhiều bài báo khoa học như : Hệ thống sử dụng phương pháp học
chuyên sâu để đánh dấu phân đoạn các vùng nội tạng từ ảnh CT, hay
phương pháp học chuyên sâu để phát hiện các tổn thương ở phổi từ
ảnh chụp CT, dự đốn ung thư qua các chỉ số hóa sinh.
1.2.

TỔNG QUAN VỀ XỬ LÝ ẢNH

1.2.1.

Các bước cần thiết trong xử lý ảnh

a) Phần thu nhận ảnh (Image Acquisition)

C
C
R
UT.L

-

Qua các camera (tương tự, số).


-

Từ vệ tinh qua các bộ cảm ứng (Sensors).

-

Qua các máy quét ảnh (Scaners).

D

Các thiết bị thu nhận này có thể cho ảnh đen trắng. Nhìn chung
các hệ thống thu nhận ảnh thực hiện 1 q trình
• Cảm biến: biến đổi năng lượng quang học thành năng lượng điện
• Tổng hợp năng lượng điện thành ảnh
b) Tiền xử lý (Image Preprocessing): Sau bộ thu nhận, ảnh có thể
bị nhiễu ,mờ , không sắc nét nên cần đưa vào bộ tiền xử lý để nâng
cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tương phản để làm ảnh rõ hơn, nét hơn.
c) Phân đoạn (Segmentation): hay phân vùng là tách một ảnh đầu
vào thành các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh.
Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục


7
đích phân loại phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người
thành các từ, các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây
lỗi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc
rất nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation): Ảnh trên máy tính là kết

quả thu nhận theo các phương pháp số hoá được nhúng trong các thiết
bị kỹ thuật khác nhau. Q trình lưu trữ ảnh nhằm 2 mục đích:
• Tiết kiệm bộ nhớ
• Giảm thời gian xử lý.
Việc lưu trữ thơng tin trong bộ nhớ có ảnh hưởng rất lớn đến việc

C
C
R
UT.L

hiển thị, in ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với

D

cùng kích thước nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng
đẹp, càng mịn và càng thể hiện rõ hơn chi tiết của ảnh người ta gọi đặc
điểm này là độ phân giải. Việc lựa chọn độ phân giải thích hợp tuỳ
thuộc vào nhu cầu sử dụng và đặc trưng của mỗi ảnh cụ thể, trên cơ sở
đó các ảnh thường được biểu diễn theo 2 mơ hình cơ bản
e) Nhận dạng và nội suy ảnh (Image Recognition and
Interpretation): Nhận dạng ảnh là quá trình xác định ảnh. Quá trình
này thường thu được bằng cách so sánh với mẫu chuẩn đã được học
(hoặc lưu) từ trước. Nội suy là phán đốn theo ý nghĩa trên cơ sở nhận
dạng. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý thuyết
về nhận dạng, các mơ hình tốn học về ảnh được phân theo hai loại
nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số.



8
- Nhận dạng theo cấu trúc.
f) Cơ sở tri thức (Knowledge Base): Như đã nói ở trên, ảnh là
một đối tượng khá phức tạp về đường nét, độ sáng tối, dung lượng
điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh ngồi việc đơn giản hóa các phương
pháp tốn học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người.
g) Mô tả (biểu diễn ảnh) : Ảnh sau khi số hoá sẽ được lưu vào
bộ nhớ, hoặc chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ
ảnh trực tiếp từ các ảnh thơ, địi hỏi dung lượng bộ nhớ cực lớn và
khơng hiệu quả theo quan điểm ứng dụng và công nghệ.
1.2.2.

C
C
R
UT.L

Các vấn đề cơ bản trong xử lý ảnh.

D

Điểm ảnh (Picture Element)
Mức xám, màu
Độ phân giải

Lấy mẫu và lượng tử hoá ảnh
Các lân cận của điểm ảnh
1.3.


CÁC ỨNG DỤNG CỦA DEEP LEARNING TRONG
ẢNH Y TẾ

1.3.1.

Ảnh và ảnh y tế
Ảnh y tế là tên gọi chung của nhóm ảnh được sử dụng trong y

học như ảnh siêu âm, ảnh cộng hưởng từ - MRI, hay ảnh X-quang...
Các phương pháp chẩn đoán ảnh y tế bao gồm :
Chụp X-Quang : Chẩn đoán nguyên nhân đau, xác định mức độ chấn
thương, đánh giá hiệu quả các phương pháp điều trị.


9

Hình 1. 1. Ảnh minh hoạ chụp X-Quang
-

Chụp cộng hưởng từ MRI : Tương tự như chụp CT, MRI được

sử dụng hiệu quả để chụp ảnh các mô mềm như nội tạng và gân.

C
C
R
UT.L

D


Hình 1. 2. Ảnh minh hoạ chụp MRI

-

Chụp cắt lớp vi tính CT : Cho phép bác sĩ nhìn thấy các mặt

cắt ngang của cơ thể. Các hình ảnh cắt ngang tạo ra hình ảnh chi tiết
hơn so với tia X thơng thường.

Hình 1. 3. Ảnh minh hoạ chụp X-Quang, MRI và CT


10
1.3.2.

Các ứng dụng của deep learning trong ảnh y tế
Việc sử dụng AI để hỗ trợ con người tìm ra những thơng tin

hữu ích một cách nhanh chóng là một bước đi cần thiết và quan trọng
để phát triển ngành y cũng như tăng khả năng chữa trị thành công cho
các bệnh nhân. Các hệ thống AI cần được “huấn luyện” để có khả năng
sử dụng các thơng tin đã học, từ đó để đưa ra kết luận phù hợp. Theo
các nhà nghiên cứu sử dụng các bộ ảnh chụp CT nội tạng đã được các
chuyên gia “đánh dấu” để huấn luyện cho hệ thống AI. Sau khi được
huấn luyện, hệ thống AI có khả năng tự đánh dấu các nội tạng ở các
ảnh CT khác với độ chính xác phù hợp (phụ thuộc vào dữ liệu và
phương pháp huấn luyện) mà không cần sự can thiệp của con người.
1.3.3.


C
C
R
UT.L

Các cơng trình nghiên cứu của deep learning trong và

D

ngồi nước

Các hệ thống sử dụng AI đã và đang đi sâu vào phục vụ nhiều
lĩnh vực trong cuộc sống như: Điều khiển tự động (máy lạnh, máy giặt
biết tự điều chỉnh cường độ, mức độ vận hành; xe hơi tự lái), an ninh
(các hệ thống nhận dạng khuôn mặt, vân tay, chữ viết, giọng nói, mống
mắt), y tế (hỗ trợ chẩn đoán bệnh, phát hiện khối u, dự đoán bệnh),
sinh học (phát hiện gen, tối ưu gen), hóa học (dự đốn liên kết hóa
học, cấu trúc hóa học), kinh tế, nơng nghiệp...
1.4.

DEEP LEARNING VÀ CÁC MƠ HÌNH

1.4.1.

Deep learning
Tất cả các mạng thần kinh đều có một lớp đầu vào, trong đó

dữ liệu ban đầu được đưa vào và một lớp đầu ra, tạo ra dự đoán cuối



11
cùng. Nhưng trong một mạng lưới thần kinh sâu, sẽ có nhiều “lớp tế
bào” ẩn giữa các lớp đầu vào và đầu ra, mỗi lớp cho dữ liệu vào nhau.
1.4.2.

Các mơ hình trong deep learning
CNN: Convolutional Neural Network là một trong những mơ

hình Deep Learning tiên tiến, là một cửa sổ trượt (Sliding Windows)
trên một ma trận như mô tả hình dưới:

Hình 1. 4. Ảnh minh hoạ mơ hình CNN

C
C
R
UT.L

Các convolutional layer có các parameter (kernel) đã được

D

học để tự điều chỉnh lấy ra những thơng tin chính xác nhất mà khơng
cần chọn các feature. Trong hình ảnh ví dụ trên, ma trận bên trái là
một hình ảnh trắng đen được số hóa.
RNN : RNN ra đời với ý tưởng chính là sử dụng một bộ nhớ
để lưu lại thơng tin từ từ những bước tính tốn xử lý trước để dựa vào
nó có thể đưa ra dự đốn chính xác nhất cho bước dự đoán hiện tại.
Về cơ bản một mạng RNN có dạng như sau:


Hình 1. 5. Ảnh minh hoạ mạng RNN


12
Ví dụ ta có một câu gồm 5 chữ, thì mạng nơ-ron được triển khai sẽ gồm 5
tầng nơ-ron tương ứng với mỗi chữ một tầng. Lúc đó việc tính tốn bên
trong RNN được thực hiện như sau:


xt là đầu vào tại bước t. Ví dụ, x1 là một vec-tơ one-hot tương ứng với từ
thứ 2 của câu .



st là trạng thái ẩn tại bước t. Nó chính là bộ nhớ của mạng. st được tính
tốn dựa trên cả các trạng thái ẩn phía trước và đầu vào tại bước đó: st
=f(Uxt+Wst−1).



ot là đầu ra tại bước t. Ví dụ, ta muốn dự đốn từ tiếp theo có thể xuất hiện
trong câu thì ot chính là một vec-tơ xác xuất các từ trong danh sách từ vựng
của ta: ot = softmax(Vst).

D

C
C
R
UT.L



13
CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT

2.1.

TỔNG QUAN ĐỀ XUẤT
Mơ hình tổng quát được biểu diễn như hình dưới đây.

C
C
R
UT.L

D

Hình 2. 1. Ảnh mơ hình tổng qt

2.2.
2.2.1.

BỘ DỮ LIỆU
Tổng quan về dữ liệu y tế
Ảnh y tế gồm: là kỹ thuật chẩn đốn ảnh y khoa tạo ra hình

ảnh giải phẫu cơ thể nhờ sử dụng từ trường và sóng radio.

Hình 2. 2. Ví dụ của ảnh MRI chụp đầu gối



14
Ảnh X-Quang : X-Quang là loại bức xạ năng lượng cao. Máy chụp XQuang phát ra các chùm tia X có bức xạ cao, các tia X này xuyên qua
các mơ mềm va thành dịch trong cơ thể dễ dàng.

Hình 2. 3. Ví dụ của ảnh X-Quang ngực
Ảnh siêu âm : siêu âm là một phương pháp chẩn đoán bệnh bằng cách
sử dụng đầu dị phát sóng siêu âm

C
C
R
UT.L

D

Hình 2. 4. Ví dụ ảnh siêu âm túi mật
Ảnh CT Scan: là kỹ thuật cho phép phóng một chùm tia X liên tục qua
cơ thể. Hình ảnh thu được sẽ dược máy vi tính xử lý, tái tạo cho ra cấu
trúc bên trong.

Hình 2. 5. Ví dụ ảnh CT Scan ngực cắt ngang


15
Ảnh histopathology : hay cịn gọi là mơ bệnh học là nghiên cứu các
dấu hiệu của bệnh bằng cách kiểm tra mẫu mô sinh thiết được đặt cố
định trên lam kính hiển vi. Ảnh mơ bệnh học là ảnh chứa các mơ được
chụp lại dưới lam kính hiển vi giúp bác sĩ phân tích chính xác hơn về
bệnh


Hình 2. 6. Ví dụ ảnh mơ học Histopathology.
2.2.2.

C
C
R
UT.L

Bộ dữ liệu ảnh y tế

Trong luận văn này sẽ sử dụng dữ liệu hình ảnh làm dữ liệu

D

chính để huấn luyện và kiểm tra, và sẽ sử dụng ảnh histopathology làm
ví dụ. Để xây dựng được bộ dữ liệu ảnh y tế, thì luận văn sẽ thu thập
các ảnh histopathology của các bộ phận trên cơ thể và ghi lại các nhãn
tương ứng với các ảnh để đánh dấu và phân biệt ảnh.
Để cho dữ liệu được phong phú và đầy đủ thì luận văn sẽ sử
dụng bộ dữ liệu của IDC (Invasive Ductal Carcinoma), với nguồn dữ
liệu được sử dụng cho việc phát hiện ung thư vú, bộ dữ liệu sẽ cung
cấp ảnh cát lát cắt được quét trên 162 hình ảnh ung thư vú, từ đó cho
ra 277.524 bản vá có kích thước 50x50 pixel được trích xuất gồm 2
phần, âm tính (negative) và dương tính (positive).
Tên tệp của mỗi ảnh có định dạng: 10253idx5_x1351_y1101_class0
Trong đó :


16

-

10253idx5 là id bệnh nhân.

-

Toạ độ x của lát cắt: x1351.

-

Và toạ độ y của lát cắt: y1101.

-

Class 0 là lớp chỉ ra đó là lớp âm tính 0 hay dương tính 1.
Như đã mơ tả bộ dữ liệu bao gồm 277,524 bản vá có kích thước
50x50 pixel với:

-

198,738 ảnh âm tính. (negative).

-

78,786 ảnh dương tính (positive)

C
C
R
UT.L


D

Hình 2. 7. Ảnh histopathology của IDC âm tính và dương tính.
2.2.3.

Xây dựng bộ dữ liệu
Từ bộ dữ liệu gốc tập hợp các hình ảnh với 2 nhãn được chia

riêng biệt cho từng id bệnh nhân.

Hình 2. 8. Mơ hình hố tách datasets .


17

Hình 2. 9. Tách dataset từ dữ liệu gốc biễu diễn dưới dạng
code
2.3.

TIỀN XỬ LÝ (DATA PRE-PROCESSING)
Ảnh histopathology có kích thước khá lớn và có cấu trúc phức

tạp, cũng vì lý do này nên nó được dùng hầu hết trong học máy và
deep learning, bởi vì những hình ảnh này chứa nhiều thơng tin về kết
cấu hình ảnh nên giúp chẩn đốn thành cơng các loại bệnh.

C
C
R

UT.L

Ở bước tiền xử lý này, thường sẽ có các giai đoạn bao gồm :

D

Ảnh gốc không cần xử lý
Tiền xử lý ở mức normal

Tiền xử lý ở mức second normal
Over pre-processing algorithm
2.4.
2.4.1.

TRÍCH CHỌN ĐẶC TRƯNG
Convolution layer
Cấu trúc CNN bao gồm tập hợp các lớp cơ bản gồm : lớp đầu

vào (input layer), lớp trích xuất đặc trưng ( a feature extraction layer),
lớp đánh nhãn ( a classification layer) và lớp đầu ra.
Lớp trích xuất đặc trưng được tạo bởi lớp convolution và
pooling. Convolution layer là lớp quan trọng nhất và cũng là lớp đầu
tiên của của mơ hình CNN. Lớp này chịu trách nhiệm xử lý hình ảnh
đầu vào để trích xuất các tính năng mơ tả hình ảnh đầu vào. Lớp này


18
có chức năng chính là phát hiện các đặc trưng có tính khơng gian hiệu
quả. Trong lớp này có 4 đối tượng chính là: ma trận đầu vào, bộ filters,
và receptive field, feature map. Convolution layer nhận đầu vào là một

ma trận và một bộ filter cần phải học. Bộ filter này sẽ trượt qua từng
vị trí trên bức ảnh để tính tích chập giữa bộ filter và phần tương ứng
trên bức ảnh. Phần tương ứng này trên bức ảnh gọi là receptive field,
tức là vùng mà một neuron có thể nhìn thấy để đưa ra quyết định và
ma trận cho ra bởi quá trình này được gọi là feature map, khi bộ filter
tìm kiếm được đặc trưng nhất định thì tích chập đó sẽ cho giá trị lớn.
Tầng convolution có chức năng chính là phát hiện đặc trưng
cụ thể của bức ảnh. Những đặc trưng này bao gồm đặc trưng cơ bản là

C
C
R
UT.L

góc, cạnh, màu sắc, hoặc đặc trưng phức tạp hơn như texture của ảnh.

D

Vì bộ filter quét qua toàn bộ bức ảnh, nên những đặc trưng này có thể
nằm ở vị trí bất kì trong bức ảnh, cho dù ảnh bị xốy trái/phải thì những
đặc trưng này vẫn bị phát hiện.
2.4.2.

Filter

Hình 2. 10. Minh hoạ quá trình xử lý với bộ lọc filter


19
Trong ảnh màu ví dụ như ảnh histopathology được sử dụng

trong luận văn thì bộ lọc được áp dụng trong trường hợp này chính là
số kênh và các kênh màu. Ảnh RGB thường được sử dụng như là đầu
vào của mơ hình CNN với độ sâu của bộ lọc (the depth of filter) thường
sẽ là độ sâu của ảnh, trong trường hợp này là 3.
2.5.

HUẤN LUYỆN
Ở phần này thì luận văn sẽ giới thiệu các mơ hình học và huấn

luyện khác nhau được sử dụng trong deep learning.
2.5.1.

Học có giám sát (supervised learning )
Có ba mơ hình học sâu cơ bản đó là : phân loại (classification),

hồi quy (regression), phân đoạn (segmentation). Với phân loại thì

C
C
R
UT.L

phương pháp tiếp cận dựa trên phân loại pixel và cửa sổ trượt được

D

xây dựng theo công thức là phát hiện đối tượng hoặc phân loại hình
ảnh. Ở mơ hình thứ 2 là hồi quy thì tập trung vào việc dự đốn vị trí
của các đối tượng ví dụ như các tế bào hoặc hạt nhân hoặc đơi khi dự
đốn mức độ nghiêm trọng của ung thư vú. Với mơ hình cuối cùng thì

liên quan tới mạng tích chập hồn tồn.
2.5.2.

Học khơng giám sát (unsupervised learning)
Unsupervised Learning là một nhóm thuật tốn hay phương

pháp kỹ thuật cho phép máy tự học hỏi và tìm ra một mơ hình hay cấu
trúc nào đó ẩn trong một bộ dữ liệu không được gắn nhãn trước. Điều
này đồng nghĩa với việc chúng ta chỉ có bộ dữ liệu đầu vào và hồn
tồn khơng biết outcome là gì.


20

CHƯƠNG 3: TRIỂN KHAI VÀ NHẬN XÉT
3.1.

DỮ LIỆU THỬ NGHIỆM
Dữ liệu thử nghiệm được xây dựng trên nhiều đối tượng khác

nhau, mỗi đối tượng được gán với 1 mã id nhất định và được phân loại
thành 2 loại là : âm tính hoặc dương tính tương ứng với 0 hoặc 1. Tập
dữ liệu này được chia làm 2 phần: huấn luyện và thử nghiệm.
Bộ dữ liệu sử dụng được thu thập từ nguồn IDC và được phổ
biến trên website Kaggle. Bộ dữ liệu bao gồm 277,524 ảnh
histopathology với kích thước 50x50 pixel và được mô tả trong bảng
dưới đây.

C
C

R
UT.L

Số lượng

Phân loại

Ký hiệu

198,738

Negative

D

0

78,786

Positive

1

Mô tả

Số lượng các ảnh hay các bản
vá thuộc loại âm tính
Số lượng các ảnh hay các bản
vá thuộc loại dương tính


Bảng 3. 1. Bảng mơ tả loại dữ liệu.
3.2.

NGƠN NGỮ PYTHON VÀ THƯ VIỆN HỌC MÁY

3.2.1.

Ngơn ngữ python

3.2.2.

Thư viện học máy

3.3.

KẾT QUẢ THỬ NGHIỆM
Để thử nghiệm đầu tiên chúng ta cần chia dữ liệu gốc thành

các dữ liệu khác nhau bao gồm huấn luyện, thử nghiệm với mỗi dữ


21
liệu được chia thành 2 phần 0 và 1 với 0 là ảnh negative và 1 là ảnh
positive.

C
C
R
UT.L


D

Bảng 3.2. Ảnh chia dữ liệu gốc thành dữ liệu huấn luyện và thử
nghiệm
Để tạo ra model huấn luyện thì luận văn sẽ sử dụng API Sequential
của thư viện Keras trong tensorflow với 4 tham số gồm:
-

chiều dài, chiều rộng : kích thước của ảnh

-

độ sâu : chính là số kênh màu ứng với mỗi ảnh

-

lớp : chính là số lớp sẽ dự đoán của network, ở đây sẽ là 2
lớp 0 và 1.


22
Sau khi chia dữ liệu chúng ta tiến hành chạy file huấn luyện
để huấn luyện dữ liệu. Giá trị epoch có thể thay đổi tuỳ ý để có thể so
sánh kết quả ở các lần chạy. Quá trình huấn luyện sẽ mất thời gian vì
lượng dữ liệu để huấn luyện khá lớn.

C
C
R
UT.L


Hình 3. 1. Ảnh quá trình huấn luyện dựa trên dữ liệu ảnh

D

histopathology

Hình 3. 2. Ảnh kết quả quá trình huấn luyện


23
3.4.

ĐÁNH GIÁ KẾT QUẢ VỚI CÁC NGHIÊN CỨU LIÊN
QUAN
Nhìn vào đầu ra của mơ hình thì có thể thấy rằng mơ hình đạt

được kết quả khoản 79-80%, tuy nhiên độ chính xác thơ đó được khoản
80% bởi vì thực tế là dữ liệu huấn luyện đã được phân loại dương tính
và âm tính với độ chính xác của dữ liệu phân loại khoản 93% nên để
hiệu suất của mơ hình được cụ thể hơn thì 2 giá trị được tính tốn là
sensitivity (cho giá trị positive) chính là tỷ lệ dương tính thật sự và
specificity (cho giá trị negative) chính là mức độ phủ định hay âm tính
thực sự đạt khoản 77% và 85%. Ngồi ra để chính xác hơn thì cần tăng
số lần chạy epoch lên tầm 40, nhưng vì mỗi lần chạy tốn nhiều thời

C
C
R
UT.L


gian để huấn luyện và cho ra kết quả nên luận văn đã giảm số lần chạy

D

để hiển thị kết quả một cách nhanh hơn.

Bản thân các hình ảnh mơ học (histopathology) có kích thước
rất lớn về hình ảnh lẫn kích thước khơng gian trên đĩa cứng nên để tối
ưu hơn trong quá trình huấn luyện thì luận văn sử dụng hình ảnh có
kích thước nhỏ khoảng 50x50 pixel , trong khi các nghiên cứu khác
thì sử dụng hình ảnh có kích thước lớn hơn.


×