Tải bản đầy đủ (.pdf) (79 trang)

Sử dụng phương pháp deep learning trong nhận dạng dữ liệu y tế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.28 MB, 79 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN HUỲNH THUÝ HIỀN

C
C

R
L
T.

SỬ DỤNG PHƯƠNG PHÁP DEEP LEARNING
TRONG NHẬN DẠNG DỮ LIỆU Y TẾ

DU

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Đà Nẵng – Năm 2021


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN HUỲNH THUÝ HIỀN

C
C

SỬ DỤNG PHƯƠNG PHÁP DEEP LEARNING



R
L
T.

TRONG NHẬN DẠNG DỮ LIỆU Y TẾ

DU

Chuyên ngành : Khoa học máy tính
Mã số

: 8480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: TS. Phạm Minh Tuấn

Đà Nẵng – Năm 2021


C
C

DU

R
L
T.



-i-

LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi dưới sự hướng dẫn
trực tiếp của TS. Phạm Minh Tuấn.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả, tên
cơng trình, thời gian, địa điểm cơng bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu
hồn tồn trách nhiệm.
Tác giả

C
C

R
L
T.

Nguyễn Huỳnh Thuý Hiền

DU


-ii-

TÓM TẮT ĐỀ TÀI
SỬ DỤNG PHƯƠNG PHÁP DEEP LEARNING TRONG NHẬN
DẠNG DỮ LIỆU Y TẾ
Học viên: Nguyễn Huỳnh Thuý Hiền. Chun ngành: Khoa học máy tính

Mã số: 8480101.

Khóa:36

Trường Đại học Bách khoa – ĐHĐN

Tóm tắt - Cùng với sự phát triển của khoa học cơng nghệ, trí tuệ nhân tạo
được xem là nhân tố định hình tương lai. Với sự phát triển nhanh chóng

C
C

trong những năm gần đây, trí tuệ nhân tạo đã thực sự đi vào cuộc sống.
Hàng loạt các cơng nghệ mới sử dụng trí tuệ nhân tạo ra đời giúp ích cho

R
L
T.

con người trong nhiều lĩnh vực như an ninh, bảo mật, y học, giáo dục...

DU

Với sự phát triển của khoa học [1], ảnh y tế đã phát triển thành một
lĩnh vực quan trọng trong việc phân tích hình ảnh, cùng với việc áp dụng
các thuật tốn học máy như deep learning trong y học, ảnh y học sẽ giúp
các bác sĩ chẩn đoán bệnh một cách chính xác và hiệu quả.
Luận văn bao gồm các nội dung sau: (1) Nghiên cứu tổng quan về xử
lý ảnh và các phương pháp xử lý ảnh. (2) Giải pháp đề xuất. (3) Triển khai
và nhận xét

Từ khóa – ảnh y tế, phân tích dữ liệu y tế, deep learning, machine
learning, CNN


-iii-

MEDICAL IMAGE ANALYSIS WITH DEEP LEARNING
Abstract - Along with the development of science and technology,
artificial intelligence is considered a factor shaping the future. With the
rapid development in recent years, artificial intelligence has really come
to life. A series of new technologies using artificial intelligence have been
created to help people in many fields such as security, security, medicine,
education ...
With the development of science, medical imaging has grown into an

C
C

important area of image analysis [1], along with the application of

R
L
T.

machine learning algorithms such as deep learning in medical imaging,
will help doctors diagnose the disease correctly and effectively.

DU

The thesis includes the following contents: (1) Research about the

medical image, image analysis in medical imaging. (2) The solution to
detect medical image based on deep learning. (3) Deploy, analyze and
evaluate the results of the system
Key words – medical image, medical image analysis, deep learning,
machine learning, CNN


-iv-

MỤC LỤC
LỜI CAM ĐOAN................................................................................................... i
TÓM TẮT ĐỀ TÀI ............................................................................................... ii
MỤC LỤC ............................................................................................................ iv
DANH MỤC CÁC HÌNH ẢNH .......................................................................... vi
DANH MỤC TỪ VIẾT TẮT ............................................................................. viii
MỞ ĐẦU ............................................................................................................... 1
1. LÝ DO CHỌN ĐỀ TÀI ................................................................................... 1
2. MỤC TIÊU VÀ NHIỆM VỤ ........................................................................... 2
2.1. Mục tiêu .................................................................................................. 2

C
C

2.2. Nhiệm vụ ................................................................................................. 2
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU................................................. 2

R
L
T.


3.1. Đối tượng ................................................................................................ 2

DU

3.2. Phạm vi nghiên cứu................................................................................. 2
4. PHƯƠNG PHÁP NGHIÊN CỨU ................................................................... 2
4.1. Phương pháp nghiên cứu tài liệu ............................................................ 2
4.2. Phương pháp nghiên cứu thực nghiệm ................................................... 2
5. BỐ CỤC LUẬN VĂN ..................................................................................... 2
CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN ....................................................... 4
1.1.

GIỚI THIỆU ............................................................................................... 4

1.2.

TỔNG QUAN VỀ XỬ LÝ ẢNH ............................................................... 5
1.2.1. Các bước cần thiết trong xử lý ảnh ....................................................... 5
1.2.2. Các vấn đề cơ bản trong xử lý ảnh........................................................ 7

1.3.

CÁC ỨNG DỤNG CỦA DEEP LEARNING TRONG ẢNH Y TẾ ......... 9
1.3.1. Ảnh và ảnh y tế ..................................................................................... 9
1.3.2. Các ứng dụng của deep learning trong ảnh y tế .................................. 12
1.3.3. Các cơng trình nghiên cứu của deep learning trong và ngồi nước ... 14

1.4.

DEEP LEARNING VÀ CÁC MƠ HÌNH ................................................ 15

1.4.1. Deep learning ...................................................................................... 15


-v1.4.2. Các mơ hình trong deep learning ........................................................ 19
CHƯƠNG 2: GIẢI PHÁP ĐỀ XUẤT ................................................................ 28
2.1.

TỔNG QUAN ĐỀ XUẤT ........................................................................ 28

2.2.

BỘ DỮ LIỆU ............................................................................................ 29
2.2.1. Tổng quan về dữ liệu y tế.................................................................... 29
2.2.2. Bộ dữ liệu ảnh y tế .............................................................................. 32
2.2.3. Xây dựng bộ dữ liệu............................................................................ 33

2.3.

TIỀN XỬ LÝ (DATA PRE-PROCESSING) ........................................... 34

2.4.

TRÍCH CHỌN ĐẶC TRƯNG .................................................................. 37
2.4.1. Convolution layer ................................................................................ 37
2.4.2. Filter .................................................................................................... 39

2.5.

C
C


HUẤN LUYỆN ........................................................................................ 40

R
L
T.

2.5.1. Học có giám sát (supervised learning ) ............................................... 41
2.5.2. Học không giám sát (unsupervised learning) ..................................... 42

DU

CHƯƠNG 3: TRIỂN KHAI VÀ NHẬN XÉT ................................................... 43
3.1.

DỮ LIỆU THỬ NGHIỆM ........................................................................ 43

3.2.

NGÔN NGỮ PYTHON VÀ THƯ VIỆN HỌC MÁY ............................. 44
3.2.1. Ngôn ngữ Python ................................................................................ 44
3.2.2. Thư viện học máy ............................................................................... 45

3.3.

KẾT QUẢ THỬ NGHIỆM....................................................................... 46

3.4.

ĐÁNH GIÁ KẾT QUẢ VỚI CÁC NGHIÊN CỨU LIÊN QUAN .......... 48


KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN .......................................................... 49
TÀI LIỆU THAM KHẢO ................................................................................... 50
PHỤ LỤC ............................................................................................................ 52


-vi-

DANH MỤC CÁC HÌNH ẢNH
Số
hiệu

Tên hình vẽ

Trang

1. 1

Ảnh minh hoạ chụp X-Quang

11

1. 2

Ảnh minh hoạ chụp MRI

11

1. 3


Ảnh minh hoạ chụp X-Quang, MRI

12

1. 4

Ảnh ví dụ về deep learning

17

1. 5

Ảnh minh hoạ cấu trúc mạng lưới thần kinh và cách training18

18

1. 6.

Ảnh minh hoạ mơ hình CNN

20

1. 7

Phân lớp ảnh

21

1. 8


Ảnh minh hoạ neuron kích thước 5x5

22

1. 9

Neuron lớp ẩn 1

1. 10

Neuron lớp ẩn 2

1. 11

Feature map

1. 12.

Ảnh minh hoạ pooling layer

24

1. 13

Ảnh minh hoa pooling layer kích thước 2x2

25

1. 14


Ảnh đặt tất cả các lớp thành một CNN

25

1. 15

Ảnh minh hoạ mạng RNN

27

2. 1

Mơ hình tổng qt

28

2.2

Ví dụ của ảnh MRI chụp đầu gối

30

2. 3

Ví dụ của ảnh X-Quang ngực

31

2. 4


Ví dụ ảnh siêu âm túi mật

31

2. 5

Ví dụ ảnh CT Scan ngực cắt ngang

32

2. 6

Ví dụ ảnh mơ học Histopathology

32

2. 7

Ảnh histopathology của IDC ví dụ về âm tính và dương tính

33

2. 8

Mơ hình hố tách datasets thành training, validation, testing

34

2. 9


Tách dataset từ dữ liệu gốc biễu diễn dưới dạng code

34

2. 10

Ví dụ ảnh gốc với a là nhãn negative và b là positive

35

2. 11

Các bước tiền xử lý ở mức normal

35

C
C

R
L
T.

DU

22
23
23



-vii2. 12

Tiền xử lý với a. ảnh gốc và b là sau khi tiền xử lý

35

2. 13

Thuật toán xử lý ở mức second normal

36

2. 14

Tiền xử lý mức second với a là ảnh gốc và b là sau khi xử lý

36

2. 15

Thuật toán xử lý ở mức over pre-processing

36

2. 16

Ảnh trước và sau khi xử lý ở mức over

37


2. 17

Filter phát hiện cạnh

38

2. 18

Ảnh ví dụ áp dụng filter

38

2. 19

Minh hoạ quá trình xử lý với bộ lọc filter

39

2. 20

Ảnh 2D và 3D

40

2. 21

Minh hoạ về mơ hình học có giám sát

42


3. 1.

Ảnh mô tả cấu trúc dữ liệu

43

3. 2.

Ảnh chia dữ liệu gốc thành dữ liệu huấn luyện và thử nghiệm

46

3. 3.

Ảnh quá trình huấn luyện dựa trên dữ liệu ảnh histopathology

47

3. 4.

Ảnh kết quả quá trình huấn luyện

47

3. 5.

Biểu đồ so sánh kết quả

48


D

T
U

R
L
.

C
C


-viii-

DANH MỤC TỪ VIẾT TẮT

CNN

Convolutional Neural Network

RNN

Recurrent Neural Network

AI

Artificial Intelligence

ML


Machine Learning

MRI

Magnetic Resonance Imaging

CT

Cat Scan

3D

Three Dimension

2D

Two Dimension

C
C

DU

R
L
T.


-1-


MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Cùng với sự phát triển của khoa học cơng nghệ, trí tuệ nhân tạo được xem là
nhân tố định hình tương lai. Với sự phát triển nhanh chóng trong những năm gần
đây, trí tuệ nhân tạo đã thực sự đi vào cuộc sống. Hàng loạt các cơng nghệ mới sử
dụng trí tuệ nhân tạo ra đời giúp ích cho con người trong nhiều lĩnh vực như an
ninh, bảo mật, y học, giáo dục...
Machine learning là một lĩnh vực con của trí tuệ nhân tạo (AI). Nguyên tắc cốt
lõi của Machine learning là các máy tiếp nhận dữ liệu và tự học. Machine learning

C
C

là một phương pháp phân tích dữ liệu mà sẽ tự động hóa việc xây dựng mơ hình
phân tích. Một trong những kỹ thuật được sử dụng phổ biến trong Machine

R
L
T.

learning hiện nay là kỹ thuật Deep learning.

DU

Deep learning là một lĩnh vực chuyên sâu trong Machine learning. Nó sử dụng
một số kỹ thuật của Machine learning để giải quyết các vấn đề thực tế bằng cách
khai thác các mạng thần kinh nhân tạo và mô phỏng việc đưa ra các quyết định
của con người. Deep learning có ứng dụng sâu rộng trong các lĩnh vực của đời
sống như tìm kiếm sự sai khác giữa các văn bản, phát hiện gian lận, nhận dạng

chữ viết tay, nhận dạng hình ảnh, giọng nói... góp phần quan trọng trong việc hỡ
trợ con người trong nhiều lĩnh vực đời sống.
Trong Y học, ảnh Y học thường chụp các bộ phận bên trong cơ thể người bằng
các thiết bị chuyên dụng như máy X-Quang, máy chụp cắt lớp, máy chụp cộng
hưởng từ … chất lượng ảnh thường khơng rõ và khơng sắc nét nên gây khó khăn
cho các chuyên gia y học trong việc chuẩn đoán bệnh. Mặc dù các thiết bị y tế với
công nghệ ngày càng được nâng cao để hỗ trở các chuyên gia y tế phân tích và xử
lý thơng tin từ hình ảnh một cách chính xác và nhanh chóng nhất, nhưng vẫn cần
một bước tiền xử lý giúp nhận dạng ảnh y học.
Từ những ứng dụng thực tế, lợi ích mà Deep learning đem lại, tơi đề xuất đề
tài: Vì lý do trên tôi quyết định chọn đề tài “Sử dụng phương pháp deep


-2learning trong nhận dạng dữ liệu y tế”.
2.

MỤC TIÊU VÀ NHIỆM VỤ

2.1. Mục tiêu
Nghiên cứu kỹ thuật Deep learning thông qua phương pháp CNN Convolutional Neural Network (Mạng nơron tích chập).
Kết hợp giữa kỹ thuật Deep learning trong mơ hình nhận dạng.
Nghiên cứu và xây dựng ứng dụng sử dụng phương pháp CNN bằng ngơn
ngữ lập trình Python.
2.2. Nhiệm vụ
Tìm hiểu phương pháp CNN (Convolutional Neural Network) trong deep
learning

C
C


Ứng dụng kỹ thuật deep learning trong việc nhận dạng ảnh y tế.

R
L
T.

Nghiên cứu về ngơn ngữ lập trình Python.
3.

ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

3.1. Đối tượng

DU

- Kỹ thuật deep learning và phương pháp CNN – Mạng nơron tích chập
- Mơi trường và các bộ thư viện của ngôn ngữ Python hỗ trợ cho xử lý ảnh.
3.2. Phạm vi nghiên cứu
Dữ liệu y tế.
4.

PHƯƠNG PHÁP NGHIÊN CỨU

4.1. Phương pháp nghiên cứu tài liệu

Nghiên cứu tài liệu về kỹ thuật deep learning, các phép lọc, thuật toán và
so khớp mẫu trong nhận dạng và xử lý ảnh liên quan.
4.2. Phương pháp nghiên cứu thực nghiệm

Sử dụng kỹ thuật deep learning để huấn luyện tập dữ liệu hình ảnh y tế.

Xây dựng hệ thống dựa trên ngơn ngữ lập trình Python.
5. BỐ CỤC LUẬN VĂN
MỤC LỤC
MỞ ĐẦU


-31. LÝ DO CHỌN ĐỀ TÀI
2. MỤC TIÊU VÀ NHIỆM VỤ CỦA ĐỀ TÀI
3. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
4. PHƯƠNG PHÁP NGHIÊN CỨU
5. Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN
6. BỐ CỤC LUẬN VĂN
CHƯƠNG 1: NGHIÊN CỨU TỔNG QUAN
1.1. NGHIÊN CỨU TRONG VÀ NGOÀI NƯỚC
1.2. KHÁI QUÁT VỀ XỬ LÝ ẢNH
1.3. XỬ LÝ ẢNH TRONG Y TẾ
CHƯƠNG 2: ÁP DỤNG KỸ THUẬT DEEP LEARNING VÀO NHẬN
DẠNG DỮ LIỆU Y TẾ

R
L
T.

2.1. MƠ HÌNH GIẢI PHÁP
2.2. PHÂN TÍCH GIẢI PHÁP

C
C

DU


2.3. CÁC THUẬT TỐN

2.4. Q TRÌNH HUẨN LUYỆN
CHƯƠNG 3: TRIỂN KHAI VÀ NHẬN XÉT
3.1. DỮ LIỆU THỬ NGHIỆM
3.2. NGÔN NGỮ PYTHON VÀ THƯ VIỆN HỌC MÁY
3.3. KẾT QUẢ THỬ NGHIỆM
3.4. ĐÁNH GIÁ KẾT QUẢ VỚI CÁC NGHIÊN CỨU LIÊN QUAN
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
TÀI LIỆU THAM KHẢO


-4-

CHƯƠNG 1. NGHIÊN CỨU TỔNG QUAN
1.1.

GIỚI THIỆU
Y học hiện đại chẩn đoán bệnh dựa vào các triệu chứng lâm sàng (chẩn

đoán lâm sàng) và các triệu chứng cận lâm sàng (chẩn đoán cận lâm sàng). Trong
chẩn đoán cận lâm sàng thì chẩn đốn dựa trên hình ảnh thu được từ các thiết bị,
máy y tế (chẩn đốn hình ảnh) ngày càng chiếm một vai trò quan trọng, nhất là
ngày nay với sự trợ giúp của các thiết bị, máy y tế hiện đại, cơng nghệ cao có các
phần mềm tin học hỡ trợ khiến cho hình ảnh rõ nét và chính xác hơn.
Các phương pháp chẩn đốn hình ảnh rất phong phú, như chẩn đốn qua
hình ảnh X-Quang, hình ảnh siêu âm, siêu âm – Doppler màu, hình ảnh nội soi

C

C

(mà thơng dụng là nội soi tiêu hố và nội soi tiết niệu), hình ảnh chụp cắt lớp vi

R
L
T.

tính (Computed Tomography Scanner-CT), hình ảnh chụp cổng hưởng từ hạt nhân

DU

(Magnetic Resonance Imaging).

Các thiết bị và máy y tế về chẩn đốn hình ảnh ngày càng ứng dụng nhiều
hơn về cơng nghệ thông tin, các phần mềm cho các máy Y tế ngày càng được
nâng cấp, nhất là khi kỹ thuật số ra đời và phát triển đã ghi nhận và phân tích tín
hiệu rất tốt, cho hình ảnh sâu hơn, chất lượng ảnh tốt hơn. Ứng dụng của xử lý
ảnh có khả năng tác động mạnh mẽ nhất đến cuộc sống của chúng ta nhất là trong
lĩnh vực y tế [2]. Soi chụp bằng máy tính dựa trên cơ sở định lý cắt lớp, được dùng
thường xuyên trong xét nghiệm lâm sàng, ví dụ như phát hiện u não. Những ứng
dụng y học khác của xử lý ảnh số gồm cải thiện ảnh X-Quang, và nhận dạng
đường biên mạch máu từ những ảnh chụp bằng tia X (angiograms), ảnh sau khi
được tái tạo vẫn gây khó khăn cho việc chuẩn đốn bệnh.
Sử dụng trí tuệ nhân tạo (AI) trong lĩnh vực y khoa đang là mối quan tâm
hàng đầu ở nhiều quốc gia trên thế giới. AI không chỉ giúp các bác sỹ lấy ảnh với
thơng tin chính xác hơn từ người bệnh mà cịn có khả năng hỡ trợ trong q trình
chẩn đốn và đưa ra phác đồ điều trị hợp lý. Sở dĩ như vậy là vì AI có khả năng



-5tổng hợp thông tin từ nhiều ca bệnh trong quá khứ - việc mà con người phải mất
rất nhiều thời gian và cơng sức mới có thể thực hiện được
AI (Artificial Intelligent) là một ngành đang rất được quan tâm trong thời
gian gần đây. Các hệ thống sử dụng AI đã và đang đi sâu vào phục vụ nhiều lĩnh
vực trong cuộc sống, hiểu một cách đơn giản, AI là trí thơng minh do con người
tạo ra nhằm giúp máy tính có thể hiểu, thích ứng, suy nghĩ và xử lý các thơng tin
phục vụ mục đích của con người. Trong những năm gần đây, có rất nhiều nghiên
cứu về sử dụng AI trong việc hỡ trợ chẩn đốn bệnh như phân vùng nội tạng trong
cơ thể, phát hiện khối u, hay xác định ung thư đã được công bố trên nhiều bài báo
khoa học như : Hệ thống sử dụng phương pháp học chuyên sâu để đánh dấu phân
đoạn các vùng nội tạng từ ảnh CT, hay phương pháp học chuyên sâu để phát hiện

C
C

các tổn thương ở phổi từ ảnh chụp CT, dự đoán ung thư qua các chỉ số hóa sinh.
1.2.

R
L
T.

TỔNG QUAN VỀ XỬ LÝ ẢNH

1.2.1. Các bước cần thiết trong xử lý ảnh

DU

a) Phần thu nhận ảnh (Image Acquisition)
- Qua các camera (tương tự, số).


- Từ vệ tinh qua các bộ cảm ứng (Sensors).
- Qua các máy quét ảnh (Scaners).
Các thiết bị thu nhận này có thể cho ảnh đen trắng [3] .Các thiết bị thu nhận
ảnh có 2 loại chính ứng với 2 loại ảnh thơng dụng Raster, Vector. Nhìn chung các
hệ thống thu nhận ảnh thực hiện 1 q trình
• Cảm biến: biến đổi năng lượng quang học thành năng lượng điện
• Tổng hợp năng lượng điện thành ảnh
b) Tiền xử lý (Image Preprocessing): Sau bộ thu nhận, ảnh có thể bị nhiễu ,mờ
, không sắc nét nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng. Chức năng
chính của bộ tiền xử lý là lọc nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét
hơn.
c) Phân đoạn (Segmentation): hay phân vùng là tách một ảnh đầu vào thành
các vùng thành phần để biểu diễn phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng


-6chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân loại phẩm, cần chia các
câu, chữ về địa chỉ hoặc tên người thành các từ, các chữ, các số (hoặc các vạch)
riêng biệt để nhận dạng. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và
cũng dễ gây lỡi, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc
rất nhiều vào công đoạn này.
d) Biểu diễn ảnh (Image Representation): Ảnh trên máy tính là kết quả thu
nhận theo các phương pháp số hoá được nhúng trong các thiết bị kỹ thuật khác
nhau. Q trình lưu trữ ảnh nhằm 2 mục đích:
• Tiết kiệm bộ nhớ
• Giảm thời gian xử lý.
Việc lưu trữ thơng tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in

C
C


ấn và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử

R
L
T.

dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn
chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân

DU

giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và đặc trưng của mỡi ảnh cụ thể,
trên cơ sở đó các ảnh thường được biểu diễn theo 2 mơ hình cơ bản
e) Nhận dạng và nội suy ảnh (Image Recognition and Interpretation): Nhận
dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng cách so
sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán theo
ý nghĩa trên cơ sở nhận dạng. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo
lý thuyết về nhận dạng, các mơ hình tốn học về ảnh được phân theo hai loại nhận
dạng ảnh cơ bản:
- Nhận dạng theo tham số.
- Nhận dạng theo cấu trúc.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký điện
tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch, nhận dạng
mặt người…


-7f) Cơ sở tri thức (Knowledge Base): Như đã nói ở trên, ảnh là một đối tượng
khá phức tạp về đường nét, độ sáng tối, dung lượng điểm ảnh, môi trường để thu

ảnh phong phú kéo theo nhiễu. Trong nhiều khâu xử lý và phân tích ảnh ngồi
việc đơn giản hóa các phương pháp tốn học đảm bảo tiện lợi cho xử lý, người ta
mong muốn bắt chước quy trình tiếp nhận và xử lý ảnh theo cách của con người.
Trong các bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí
tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
g) Mô tả (biểu diễn ảnh) : Ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc
chuyển sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh
thơ, địi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thường, các ảnh thơ đó được đặc tả (biểu diễn) lại (hay

C
C

đơn giản là mã hoá) theo các đặc điểm của ảnh được gọi là các đặc trưng ảnh

R
L
T.

(Image Features) như: biên ảnh (Boundary/Egde), vùng ảnh (Region). Một số
phương pháp biểu diễn thường dùng:

DU

• Biểu diễn bằng mã chạy (Run-Length Code)
• Biểu diễn bằng mã xích (Chaine -Code)
• Biểu diễn bằng mã tứ phân (Quad-Tree Code)
1.2.2. Các vấn đề cơ bản trong xử lý ảnh.
- Điểm ảnh (Picture Element) : Điểm ảnh được xem như là dấu hiệu hay
cường độ sáng tại 1 toạ độ trong không gian của đối tượng và ảnh được xem như

là 1 tập hợp các điểm ảnh.
- Mức xám, màu : Là số các giá trị có thể có của các điểm ảnh của ảnh
- Độ phân giải : Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được
ấn định trên ảnh số khi hiển thị. Như vậy khoảng cách giữa các điểm ảnh được
chọn sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng
các thích hợp tạo nên một mật độ phân bổ, đó chính là phân giải và được phân bố
theo trục x và y trong không gian hai chiều.
Đo khoảng cách giữa các điểm ảnh: Khoảng cách D(p,q) giữa hai điểm ảnh p tọa
độ (x,y), q tọa độ (s,t) là hàm khoảng cách (Distance) nếu:


-8- D(p,q)≥ 0 ( Với D(p,q) = 0 khi và chỉ khi p = q)
- D(p,q) = D(q,p)
- D(p,z) ≤ D(p,q) + D(q,z) ; z là một điểm ảnh khác.
Khoảng cách Euclide giữa hai điểm ảnh p(x,y) và q(s,t) được định nghĩa như sau:
D(p,q) = [ (x-s)2 +(y-t)2 ] 1/2
- Lấy mẫu và lượng tử hoá ảnh : Một ảnh g(x, y) ghi được từ Camera là ảnh
liên tục tạo nên mặt phẳng hai chiều. Ảnh cần chuyển sang dạng thích hợp để xử
lí bằng máy tính. Phương pháp biến đổi một ảnh (hay một hàm) liên tục trong
không gian cũng như theo giá trị thành dạng số rời rạc được gọi là số hố ảnh.
Việc biến đổi này có thể gồm hai bước [4]:
Bước 1: Đo giá trị trên các khoảng không gian gọi là lấy mẫu.

C
C

Bước 2: Ánh xạ cường độ (hoặc giá trị) đo được thành một số hữu hạn các mức

R
L

T.

rời rạc gọi là lượng tử hố.
- Các lân cận của điểm ảnh:

DU

Giả sử có điểm ảnh p tại toạ độ (x, y), p có 4 điểm lân cận gần nhất theo
chiều đứng và ngang [4] (có thể coi như lân cận 4 hướng chính: Đơng, Tây, Nam,
Bắc).
{(x-1, y); (x, y-1); (x, y+1); (x+1, y)} = N4(p)
trong đó: số 1 là giá trị logic; N4(p) tập 4 điểm lân cận của p.

Lân cận các điểm ảnh của tọa độ (x,y)
Các lân cận chéo: Các điểm lân cận chéo NP(p) (Có thể coi lân cận chéo la 4
hướng: Đông-Nam, Đông-Bắc, Tây-Nam, Tây-Bắc)
Np(p) = { (x+1, y+1); (x+1, y-1); (x-1, y+1); (x-1, y-1)}


-9* Tập kết hợp: N8(p) = N4(p) + NP(p) là tập hợp 8 lân cận của điểm ảnh p.
* Chú ý: Nếu (x, y) nằm ở biên (mép) ảnh; một số điểm sẽ nằm ngoài ảnh.

1.3.

CÁC ỨNG DỤNG CỦA DEEP LEARNING TRONG ẢNH Y TẾ

1.3.1. Ảnh và ảnh y tế
Từ xa xưa, việc lưu trữ thơng tin dưới dạng hình ảnh đã là một phát minh
quan trọng trong lịch sử phát triển của loài người. Ở thời nguyên thủy, những
người cổ đại đã dùng đá để khắc thành các bức họa ở trên các bức tường hang

động. Tiến bộ hơn, người cổ đại khơng chỉ vẽ tranh mà cịn sử dụng những bức
ảnh mang ý nghĩa tổng quát hơn để xây dựng những hệ chữ tượng hình. Việc lưu
trữ thơng tin bằng hình ảnh đã được phát triển liên tục qua các thế hệ, kể cả trong

C
C

cách thức lưu trữ cũng như cách thức tạo ra bức ảnh. Về bản chất, các loại ảnh

R
L
T.

đều giống nhau, chúng đều là các thơng tin dưới dạng hình ảnh được lưu trữ trên
máy tính với mục đích mang đến các thơng tin cho người sử dụng. Tuy nhiên, ở

DU

những ngành nghề khác nhau với mục đích sử dụng khác nhau, các bức ảnh này
lại có những đặc điểm riêng biệt.

Ảnh y tế là tên gọi chung của nhóm ảnh được sử dụng trong y học như ảnh
siêu âm, ảnh cộng hưởng từ - MRI, hay ảnh X-quang... Do được xây dựng từ các
loại tín hiệu và thiết bị khác nhau [5] nên chất lượng ảnh cũng như sự tác động
trong quá trình chụp ảnh sẽ ảnh hưởng khác nhau tới sức khỏe người bệnh. Ngồi
ra, khác với các loại ảnh thơng thường, để thể hiện đầy đủ các thông tin cần thiết,
ảnh y khoa đôi khi cần nhiều lớp ảnh (như ảnh CT 3 hay 4 chiều, siêu âm 3 hay 4
chiều, MRI 3 chiều). Các loại ảnh này không chỉ hỗ trợ bác sỹ trong q trình
chẩn đốn cho bệnh nhân, mà còn lưu trữ làm tư liệu cho học tập và nghiên cứu.
Trước đây, để dự đoán các chấn thương hay để có được thơng tin bên trong

cơ thể của người bệnh, bác sỹ chỉ có thể dựa vào các thơng số xét nghiệm hay các
triệu chứng ở người bệnh hoặc phát hiện ra trong quá trình phẫu thuật. Kỹ thuật
dựng ảnh y khoa phát triển đã cho bác sỹ một cơng cụ hữu dụng để “nhìn thấy”
được những thơng tin bên trong cơ thể của người bệnh, các vết nứt xương có thể


-10được nhìn thấy thơng qua một bức ảnh chụp X-quang hay các khối u, các vết
thương, tế bào ung thư trên nội tạng của người bệnh có thể được nhìn thấy thông
qua ảnh chụp CT. Trước khi phẫu thuật, ảnh chụp CT cịn hỡ trợ như một bản đồ
giúp bác sỹ có thể nhìn thấy vị trí các khối máu vón cục trong mạch máu, những
vùng tổn thương trong não. Với lợi thế to lớn này, việc thu ảnh để chẩn đốn bệnh
đã trở thành một bước gần như khơng thể thiếu ở hầu hết các bệnh viện. Tuy
nhiên, điều này cũng tạo nên một lượng dữ liệu y học to lớn mà con người khó có
thể tự mình thống kê và sử dụng trong thời gian ngắn
Các phương pháp chẩn đoán ảnh y tế bao gồm [5] :
- Chụp X-Quang : Đây là cũng một thuật ngữ rộng bao gồm nhiều loại chụp
X-quang khác nhau. Người bệnh cần thực hiện kỹ thuật này vì nhiều lý do, bao

C
C

gồm chẩn đoán nguyên nhân đau, xác định mức độ chấn thương, kiểm tra sự tiến

R
L
T.

triển của bệnh và đánh giá hiệu quả của các phương pháp điều trị. Phần cơ thể cần
chụp sẽ được đặt giữa máy chụp X-quang và tấm phim chụp ảnh hoặc cảm biến


DU

X-quang kỹ thuật số. Người bệnh cần giữ yên vị trí trong khi máy phát sóng điện
từ (bức xạ) đi qua cơ thể, để lộ hình ảnh phản ánh cấu trúc bên trong cơ thể. Mức
độ phơi nhiễm phóng xạ từ tia X khơng có hại, nhưng bác sĩ sẽ có biện pháp phịng
ngừa đặc biệt nếu người bệnh đang mang thai. Trong một số trường hợp, người
bệnh sẽ sử dụng thêm chất cản quang được tiêm vào khớp trong khi chụp Xquang, kỹ thuật này được gọi là chụp X-quang ổ khớp nhằm giúp bác sĩ nhìn thấy
các cấu trúc mơ mềm bên trong khớp hoặc giúp bác sĩ xác định vị trí đâm kim vào
ổ khớp để rút dịch hoặc tiêm thuốc vào ổ khớp.


-11Hình 1. 1. Ảnh minh hoạ chụp X-Quang
- Chụp cộng hưởng từ MRI : Một lựa chọn khác để chụp các hình ảnh cắt
ngang là MRI. Tương tự như chụp CT, MRI được sử dụng hiệu quả để chụp ảnh
các mô mềm như nội tạng và gân. Không giống như chụp CT, chụp MRI khơng
sử dụng bức xạ ion hóa, thay vào đó máy sử dụng từ trường mạnh và sóng vơ
tuyến. Do khơng sử dụng phóng xạ nên MRI thường được cho là an toàn hơn,
nhưng chúng cũng mất nhiều thời gian hơn để thực hiện. Trong khi chụp CT có
thể mất ít nhất năm phút thì MRI có thể mất tới nửa giờ hoặc lâu hơn tùy thuộc
vào quy trình. Người bệnh sẽ nằm in trên một chiếc bàn trượt và trượt vào máy
qt MRI có hình ống. Máy MRI tạo ra từ trường xung quanh người bệnh và sau
đó phát sóng vơ tuyến đến khu vực của cơ thể cần được kiểm tra. Một máy tính

C
C

được sử dụng để ghi lại chuyển động của các bộ phận khác nhau như gân, dây

R
L

T.

chằng, dây thần kinh, ... và chuyển dữ liệu thành hình ảnh hai chiều. Người bệnh
sẽ không cảm thấy đau khi thực hiện chụp MRI, nhưng máy có thể bị ồn. MRI có

DU

thể được sử dụng để giúp chẩn đoán các bệnh lý dây chằng và sụn đầu gối bị
rách, thốt vị đĩa đệm, thối hóa xương, u xương và các vấn đề khác. Thời gian
thực hiện kỹ thuật này có thể mất từ 30 đến 60 phút.

Hình 1. 2. Ảnh minh hoạ chụp MRI
- Chụp cắt lớp vi tính CT : Cho phép bác sĩ nhìn thấy các mặt cắt ngang của
cơ thể. Các hình ảnh cắt ngang tạo ra hình ảnh chi tiết hơn so với tia X thông
thường. Trên thực tế, chụp CT thường được u cầu khi có thứ gì đó khả nghi


-12xuất hiện trên X-quang và bác sĩ cần tìm hiểu rõ hơn. Người bệnh sẽ nằm cố định
trên bàn trượt và sẽ trượt vào bên trong máy chụp cắt lớp có hình dáng giống hình
trụ. Q trình này khơng gây đau đớn. Một ống tia X từ từ quay xung quanh người
bệnh, chụp nhiều ảnh từ mọi hướng. Máy tính sẽ kết hợp các hình ảnh đã được
chụp để tạo ra một cái nhìn hai chiều trên màn hình máy tính. Người bệnh có thể
cần chụp CT nếu gặp vấn đề với cấu trúc xương nhỏ hoặc bị chấn thương nặng ở
não, tủy sống, ngực, bụng hoặc xương chậu. Đôi khi, người bệnh có thể được sử
dụng thuốc cản quang để làm cho một số bộ phận của cơ thể hiển thị tốt hơn khi
chụp. Ngoài ra, chụp CT tốn nhiều chi phí hơn và mất nhiều thời gian hơn so với
chụp X-quang thơng thường.

C
C


R
L
T.

DU

Hình 1. 3. Ảnh minh hoạ chụp X-Quang, MRI và CT
1.3.2. Các ứng dụng của deep learning trong ảnh y tế
Việc phát triển mạnh mẽ các kỹ thuật dựng ảnh trong y học đã tạo ra một
lượng dữ liệu y học to lớn mà con người khó có thể xử lý tốt được. Vì thế, việc sử
dụng AI để hỡ trợ cho con người tìm ra những thơng tin hữu ích một cách nhanh
chóng là một bước đi cần thiết và quan trọng để phát triển ngành y cũng như tăng
khả năng chữa trị thành công cho các bệnh nhân. Cũng giống như bác sỹ cần nhiều
năm học tập và làm việc để có thể tích lũy kinh nghiệm trong việc chẩn đoán và


-13đưa ra phác đồ điều trị tốt cho bệnh nhân, các hệ thống AI cũng cần được “huấn
luyện” để có khả năng sử dụng các thông tin đã học, từ đó để đưa ra kết luận phù
hợp. Theo các nhà nghiên cứu sử dụng các bộ ảnh chụp CT nội tạng đã được các
chuyên gia “đánh dấu” để huấn luyện cho hệ thống AI. Sau khi được huấn luyện,
hệ thống AI có khả năng tự đánh dấu các nội tạng ở các ảnh CT khác với độ chính
xác phù hợp (phụ thuộc vào dữ liệu và phương pháp huấn luyện) mà không cần
sự can thiệp của con người. Không chỉ dừng lại ở việc phân biệt các vùng nội
tạng, mà nhiều nhóm nghiên cứu đã phát triển các chương trình AI khác như:
Đánh dấu các phần có dấu hiệu ung thư trong ảnh gan, phổi … phân biệt các vùng
khác nhau hay phát hiện các vùng bất thường của não trong ảnh MRI thông qua
phân đoạn các vùng trong não. Đặc biệt trong trường hợp ảnh nhiều chiều, nhiều

C

C

lớp ảnh, việc xử lý tất cả các lớp ảnh là một công việc tốn nhiều thời gian và công

R
L
T.

sức đối với bác sỹ. Vì thế, việc sử dụng AI sẽ hỡ trợ họ rất nhiều, đồng thời góp
phần mang lại chất lượng chữa trị tốt hơn cho người bệnh.

DU

Hiện nay, AI đã và đang được ứng dụng trong hỗ trợ chữa trị bệnh ở một
số bệnh viện trên thế giới. Năm 2016 ở Tokyo, hệ thống IBM-Watson (hệ thống
phần mềm AI rất tinh vi của Hãng IBM) đã được sử dụng và chẩn đoán đúng căn
bệnh ung thư bạch cầu ở một bệnh nhân mà các bác sỹ vốn đã mất cả năm để điều
trị mà chưa có kết quả. Nhờ khả năng tổng hợp lượng thông tin lớn trong thời gian
ngắn một cách khách quan, IBM-Watson đã chẩn đốn chính xác ca bệnh hiếm
này, đồng thời hỗ trợ đưa ra phác đồ điều trị phù hợp. Hiện nay, IBM-Watson
đang được sử dụng ở nhiều bệnh viện trên thế giới để giúp các bác sỹ xác định
được các căn bệnh hiếm gặp. Ở Ấn Độ, AI được sử dụng ngày càng phổ biến để
giúp cải thiện tình trạng thiếu bác sỹ ở nước này. Ở các bệnh viện thuộc Tập đoàn
Manipal, IBM-Watson được sử dụng để hỗ trợ các bác sỹ chẩn đoán và chữa trị
bệnh ung thư; ở Bệnh viện mắt Aravind chuẩn bị sử dụng Google Brain vào quy
trình khám chữa cho bệnh nhân. Hãng Microsoft hiện đang cung cấp hệ thống
Azure với AI hỗ trợ bệnh viện và bệnh nhân trong dự đốn và truy vấn thơng tin
dựa trên hồ sơ bệnh án điện tử. Ở Mỹ, Bệnh viện Oxford đang phát triển một hệ



-14thống AI để chẩn đoán bệnh tim và ung thư phổi. Rất nhiều trung tâm nghiên cứu
cũng như bệnh viện khác đang đầu tư nghiên cứu phát triển và sử dụng AI cho
việc chẩn đoán và chữa trị bệnh. Ở Việt Nam, đầu năm 2018, Bệnh viện đa khoa
Phú Thọ đã khai trương phòng ứng dụng AI trong điều trị ung thư sử dụng IBMWatson.
1.3.3. Các cơng trình nghiên cứu của deep learning trong và ngoài nước
Các hệ thống sử dụng AI đã và đang đi sâu vào phục vụ nhiều lĩnh vực
trong cuộc sống như [5] : Điều khiển tự động (máy lạnh, máy giặt biết tự điều
chỉnh cường độ, mức độ vận hành; xe hơi tự lái), an ninh (các hệ thống nhận dạng
khuôn mặt, vân tay, chữ viết, giọng nói, mống mắt), y tế (hỡ trợ chẩn đoán bệnh,
phát hiện khối u, dự đoán bệnh), sinh học (phát hiện gen, tối ưu gen), hóa học (dự

C
C

đốn liên kết hóa học, cấu trúc hóa học), kinh tế, nơng nghiệp... Hiểu một cách

R
L
T.

đơn giản, AI là trí thơng minh do con người tạo ra nhằm giúp máy tính có thể
hiểu, thích ứng, suy nghĩ và xử lý các thơng tin phục vụ mục đích của con người.

DU

Trong những năm gần đây, có rất nhiều nghiên cứu về sử dụng AI trong việc hỡ
trợ chẩn đốn bệnh như phân vùng nội tạng trong cơ thể, phát hiện khối u, hay
xác định ung thư đã được công bố trên nhiều bài báo khoa học. Holger và đồng
nghiệp [14] đã đề xuất một hệ thống sử dụng phương pháp học chuyên sâu (deep
learning) để đánh dấu phân đoạn các vùng nội tạng từ ảnh CT , hay Krzysztof

Pawełczyk và đồng nghiệp [15] đã sử dụng phương pháp học chuyên sâu để phát
hiện các tổn thương ở phổi từ ảnh chụp CT, dự đốn ung thư qua các chỉ số hóa
sinh.
Việc phát triển mạnh mẽ các kỹ thuật dựng ảnh trong y học đã tạo ra một
lượng dữ liệu y học to lớn mà con người khó có thể xử lý tốt được. Vì thế, việc sử
dụng AI để hỡ trợ cho con người tìm ra những thơng tin hữu ích một cách nhanh
chóng là một bước đi cần thiết và quan trọng để phát triển ngành y cũng như tăng
khả năng chữa trị thành công cho các bệnh nhân. Cũng giống như bác sỹ cần nhiều
năm học tập và làm việc để có thể tích lũy kinh nghiệm trong việc chẩn đốn và
đưa ra phác đồ điều trị tốt cho bệnh nhân, các hệ thống AI cũng cần được “huấn


×