NGHIÊN CỨU MƠ HÌNH TRÍ TUỆ NHÂN TẠO DEEP LEARNING
ĐỂ ĐÁNH GIÁ MÔ BỆNH HỌC TỔN THƯƠNG ỐNG THẬN CẤP
I. ĐẶT VẤN ĐỀ
Trí tuệ nhân tạo (Artificial Intelligence)
Thuật ngữ "trí tuệ nhân tạo" (artificial
Language
intelligence: AI) lần đầu tiên được đặt
ra vào những năm 1950, được sử
Cognition
Doing
dụng để mô tả khả năng bắt chước và
mô phỏng hành vi và tư duy phản biện
Human abilities
của con người.
Trong đó khả năng học là khả năng rất
quan trọng và là nền tàng cho những
khả năng khác.
Looking
Listening
Learning
Machine Learning – Deep Learning
Neural
Network
● Machine Learning là tập con của AI, lĩnh vực khoa học này tập trung nghiên cứu và cung cấp cho
máy tính khả năng học từ dữ liệu.
● Deep learning là một tiến bộ của Machine Learning. Do cấu trúc nhiều lớp phức tạp, các mô hình
học sâu cần một tập dữ liệu lớn để thực hiện các diễn giải chất lượng cao và loại bỏ các dao động.
Image source: Internet
4
Machine Learning – Deep Learning
● Trong khi các thuật toán Machine Learning có cấu trúc khá đơn giản, chẳng hạn như decision
tree hoặc linear regression, thì Deep Learning sử dụng một khung thuật toán phức tạp dựa trên
cấu trúc như não người, đan xen và phức tạp, được gọi là mạng nơ-ron nhân tạo (ANN).
● Các thuật toán Deep Learning có thể tự động trích xuất các tính năng mà không cần nhiều sự
can thiệp của con người và chúng có thể học hỏi từ lỗi của chính mình.
5
Image source: Internet
Mạng thần kinh nhân tạo
Neural network
Thông tin sẽ được truyền qua các node dưới dạng số và công thức để máy có thể hiểu và ghi
nhớ. Q trình này là quá trình huấn luyện (training).
6
Mạng thần kinh tích chập - Convolutional Neural Networks
• Cấu trúc của CNN bao gồm nhiều khối đó là các lớp tích chập (convolution layers), các lớp tổng
hợp (pooling layers) và các lớp được kết nối đầy đủ (fully-connected layers)
• Các lớp tích chập và lớp tổng hợp tiến hành trích xuất các đặc trưng của dữ liệu, trong khi lớp kết
nối đầy đủ được sử dụng để xây dựng bản đồ các đặc điểm đã trích xuất vào đầu ra cuối cùng
Yamashita et al. 2018
7
Pubmed - "Artificial Intelligence"[Mesh] count
1951
1
1
1
1
1
1
1
3
6
4
3
2
1
1
1
1
3
1
1
5
1
40
142
177
197
271
358
436
424
595
705
889
833
957
993
1030
1225
1316
1423
1757
1953
1956
1960
1962
1964
1966
1972
1976
1980
1984
1986
1988
1990
1992
1994
1996
1998
2000
2002
2004
2006
2008
2010
2012
2022.08.13
2713
3579
4009
4391
4835
4572
4372
5173
5430
2014
2016
2018
6647
6642
6450
6453
7678
10208
2020
2022
14554
18952
24389
15955
0
5000
10000
15000
20000
8
25000
30000
Ứng dung AI trong y tế
Sự phát triển của các ứng dụng AI trong y tế gắn liền với việc tạo ra các thuật toán AI nhằm hỗ
trợ các bác sĩ chẩn đoán, đưa ra quyết định điều trị và tiên lượng.
Amisha et al. 2019
9
Ứng dụng AI trong bệnh học thận
Một ví dụ về các ứng dụng của AI trong bệnh học thận được trình bày, từ bệnh học tích hợp đến y
học chính xác. Các nhà nghiên cứu bệnh học với sự hỗ trợ của AI đã chứng minh độ chính xác cao
hơn so với chỉ có AI hoặc chỉ có bác sĩ trong việc phát hiện ung thư.
Huo, Y., Deng, R., Liu, Q., Fogo, A. B., & Yang, H. (2021). AI applications in renal pathology. Kidney international.
10
Ứng dụng AI trong giải phẫu bệnh thận
Quy trình ứng dụng AI hỗ trợ trong lĩnh vực thận học
Huo et al. 2021
11
Mơ hình phân loại hình ảnh đã được cơng bố
Huo et12al. 2021
Mơ hình phân vùng hình ảnh đã được cơng bố
Huo 13
et al. 2021
Mục tiêu nghiên cứu
1. Phân loại mô bệnh học của tổn thương ống thận cấp dựa trên mơ
hình Deep Learning
2. Phân vùng hình ảnh dựa trên Deep Learning để xác định bốn cấu
trúc trong tổn thương ống thận cấp tính, bao gồm: “cầu thận”, “ống
thận lành”, “ống thận hoại tử” và “ống thận kèm trụ niệu”
II.ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP
Hình ảnh tồn bộ tiêu bản (Whole slide image)
● Mơ thận thu thập từ chuột bị tổn thương ống
thận cấp do gây độc bằng Cisplatin từ những
nghiên cứu trước đây của cộng sự (Chuột
C57BL/6 đực, 6-8 tuần tuổi, nặng 20–25g)
● Lát cắt mơ thận có độ dày 3 µM được nhuộm
bằng Periodic Acid-Schiff (PAS) Stain Kit
(Abcam,
Cambridge,
MA,
USA;
catalog
no.150680).
● Tiêu bản được quét bằng máy quét tiêu bản
kỹ thuật số Motic EASYSCAN PRO ở độ phóng
đại 40×, 33 WSIs được sử cho mơ hình phân
loại (classification) và 12 WSIs được sử dụng
cho mơ hình phân vùng ảnh (segmentation).
(Kang et al. 2009) (Jung et al. 2020).
Bộ dữ liệu mơ hình phân loại (Classification model)
Grade 0
Class
Grade 0
Training
Test
89
18
Grade 1
Class
Grade 1
Training
Test
143
34
Grade 2
Class
Grade 2
Training
Test
76
25
● Hình ảnh nhu mơ vùng vỏ thận trên mỗi WSI được chia thành nhiều mảnh nhỏ (patch) một cách
ngẫu nhiên và không bị trùng lặp, kích thước 2048 × 2048 pixels.
● Mức độ tổn thương ống thận được đánh giá dựa trên tỷ lệ phần trăm của số ống thận bị tổn
thương: cấp độ 0, khơng có; lớp 1, ≤ 50%; lớp 2,> 50%
Bộ dữ liệu mơ hình phân vùng (Segmentation model)
Số lượng chú thích (annotation) mỗi lớp
Class
B
A
Glomerulus
#F8E71C
Healthy tubules
#7ED321
Training
Test
Glomerulus
254
137
Healthy tubules
5817
2507
Necrotic tubules
1603
1312
Tubules with cast
732
460
C
Necrotic tubules
#FC1A36
Cast and tubules
#4A90E2
● Chú thích đước thực hiện bằng cơng cụ vẽ đa giá trên Supervisely
● Công cụ đa giác cho phép đánh dấu các chú thích phân vùng ảnh bằng cách đặt các điểm tham
chiếu dọc theo ranh giới của các đối tượng mà mơ hình phải phân vùng
Chú thích cho mơ hình phân vùng
• Những hình ảnh bao gồm ground truth
mask bên tay trái và ảnh gốc bên tay
phải được sử dụng để huấn luyện
• Mỗi chú thích được mã hóa thành các
mã số như bên dưới:
0 Background
1 Tubules with cast
2 Glomerulus
3 Healthy tubules
4 Necrotic tubules
Kiến trúc CNNs
• ResNet-18 được sử dụng để phát triển mơ hình phân loại ảnh
• Những siêu tham số trong q trình huấn huyện của mơ hình đã được sử dụng như sau:
learning rate 0.0008, batch size 256, weight decay 0.00000001 và epoch 2000
• Mơ hình phân vùng ảnh sử dụng DeepLabV3 với backbone ResNet-50
• Mơ hình đưa ra những dự đốn ở cấp độ pixel.
• Thuật tốn được xây dựng trong Pytorch framework
• Đào tạo mạng mất khoảng 2 giờ trên đơn vị xử lý đồ họa (GPU) 2080Ti. Các siêu tham số
được cài đặt như sau: learning rate 0.0001, batch size 8, weight decay 0.1 và epoch 2000
Chỉ số để đánh giá hiệu quả của mơ hình phân loại
Giá trị dự đoán (Predicted value)
Confusion matrix
Positive
Negative
Positive
True Positive (TP)
False Negative (FN)
Negative
False Positive (FP)
True Negative (TN)
Giá trị thật
(Actual value)
Confusion matrix được sử dụng để đánh giá kết quả của mô hình phân loại, dựa trên số
lượng hình ảnh được dự đốn đúng và sai của mơ hình trong tập thử nghiệm.
Chỉ số để đánh giá hiệu quả của mơ hình phân vùng cấu trúc
Intersection over Union (IoU)
Chỉ số IoU là chỉ số đánh giá thường được sử dụng trong việc đánh giá hiệu quả của mơ hình phân vùng
ảnh. IoU được tính bằng cơng thức sau:
|𝐴 ∩ 𝐵|
IoU = 𝐽 (𝐴, 𝐵) =
|𝐴 ∪ 𝐵|
Trong đó A là kí kiệu của ground truth (vùng được con người gán nhãn) và B là predicted segmentation
(vùng được mơ hình dự đốn). IoU có giá trị trong khoảng từ 0 đến 1, được tính là giá trị của phần giao A
và B chia cho giá trị phần hợp A và B.
Image source: Internet
Chỉ số để đánh giá hiệu quả của mơ hình phân vùng cấu trúc
Dice coefficient (DC)
Chỉ số DC được dùng để đánh giá mơ hình phân vùng hình ảnh được sử dụng phổ biến trong
phân tích hình ảnh y tế. Được tính theo cơng thức:
2| 𝐴 ∩ 𝐵 |
Dice =
|𝐴|+|𝐵|
Chỉ số này nằm trong khoảng từ 0 (khơng có pixel trùng giữa vùng được con người gán nhãn và
kết quả được máy dự đoán) đến 1 (máy dự đoán đúng hoàn toàn vùng được con người gán
nhãn).
III. KẾT QUẢ
Confusion matrix
• Để đánh giá hiệu suất của thuật tốn phân loại, một tập hợp thử nghiệm độc lập với tập huấn
luyện gồm 77 hình ảnh đã được sử dụng.
• Confusion matrix cho thấy kết quả dự đốn của mơ hình phân loại với ba lớp tương ứng với ba
mức độ tổn thương ống thận cấp tính.