.
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ Y TẾ
ĐẠI HỌC Y DƢỢC TP. HỒ CHÍ MINH
-----------------
VÕ THANH PHONG
PHÂN LOẠI CÁC BỆNH CẢNH Y HỌC CỔ TRUYỀN
TRONG ĐỘT QUỴ NHỒI MÁU NÃO GIAI ĐOẠN CẤP
LUẬN VĂN THẠC SĨ Y HỌC CỔ TRUYỀN
THÀNH PHỐ HỒ CHÍ MINH – NĂM 2018
.
.
BỘ GIÁO DỤC VÀ ĐÀO TẠO
BỘ Y TẾ
ĐẠI HỌC Y DƢỢC TP. HỒ CHÍ MINH
-----------------
VÕ THANH PHONG
PHÂN LOẠI CÁC BỆNH CẢNH Y HỌC CỔ TRUYỀN
TRONG ĐỘT QUỴ NHỒI MÁU NÃO GIAI ĐOẠN CẤP
CHUYÊN NGÀNH: Y HỌC CỔ TRUYỀN
MÃ SỐ: 60 72 02 01
LUẬN VĂN THẠC SĨ Y HỌC CỔ TRUYỀN
NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS. ĐỖ VĂN DŨNG
THÀNH PHỐ HỒ CHÍ MINH – NĂM 2018
.
.
LỜI CAM ĐOAN
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi.
Các số liệu nêu trong luận văn là trung thực và chƣa từng đƣợc ai công bố trong
bất kì cơng trình náo khác.
Số liệu đề tài đƣợc thu thập tại bệnh viện Nhân Dân Gia Định và bệnh viện
Nhân Dân 115 tuyệt đối không sao chép từ bất kì nguồn nào khác.
Tơi hồn tồn chịu trách nhiệm trƣớc Hội đồng về sự cam đoan này.
TP. Hồ Chí Minh, ngày 04 tháng 08 năm 2018
Học viên
Võ Thanh Phong
i
.
.
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................ I
DANH MỤC CÁC CHỮ VIẾT TẮT ........................................................... V
DANH MỤC BẢNG .................................................................................. VIII
DANH MỤC HÌNH VẼ, BIỂU ĐỒ .............................................................. X
ĐẶT VẤN ĐỀ ................................................................................................. 1
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU ....................................................... 4
1.1. PHÂN LOẠI CÁC BỆNH CẢNH YHCT ...................................................... 4
1.1.1. Thu thập dữ liệu.................................................................................................... 5
1.1.2. Khai thác dữ liệu .................................................................................................. 7
1.1.3. Phân tích cụm ..................................................................................................... 13
1.2. TÌNH HÌNH NGHIÊN CỨU PHÂN LOẠI CÁC BỆNH CẢNH YHCT...... 14
1.2.1. Nghiên cứu nƣớc ngoài ...................................................................................... 14
1.2.2. Nghiên cứu trong nƣớc ....................................................................................... 17
1.3. QUAN NIỆM YHHĐ VỀ ĐỘT QUỴ NHỒI MÁU NÃO ............................ 17
1.3.1. Định nghĩa .......................................................................................................... 17
1.3.2. Nguyên nhân ....................................................................................................... 18
1.3.3. Lâm sàng ............................................................................................................ 19
1.3.4. Chẩn đoán ........................................................................................................... 21
1.4. QUAN NIỆM YHCT VỀ ĐỘT QUỴ NHỒI MÁU NÃO ............................. 22
1.4.1. Đại cƣơng ........................................................................................................... 22
1.4.2. Nguyên nhân và cơ chế bệnh sinh ...................................................................... 22
1.4.3. Biện chứng luận trị ............................................................................................. 24
1.4.4. Bệnh cảnh lâm sàng ............................................................................................ 26
CHƢƠNG 2. PHƢƠNG PHÁP NGHIÊN CỨU ........................................ 28
2.1. GIAI ĐOẠN 1 - KHẢO SÁT THỐNG KÊ TÀI LIỆU YHCT ..................... 28
2.1.1. Đối tƣợng nghiên cứu ......................................................................................... 28
2.1.2. Phƣơng pháp nghiên cứu .................................................................................... 28
2.2. GIAI ĐOẠN 2 - KHẢO SÁT LÂM SÀNG .................................................. 28
2.2.1. Đối tƣợng nghiên cứu ......................................................................................... 28
ii
.
.
2.2.2. Phƣơng pháp nghiên cứu .................................................................................... 29
2.2.3. Phƣơng pháp phân tích số liệu ........................................................................... 32
2.3. VẤN ĐỀ Y ĐỨC .......................................................................................... 33
CHƢƠNG 3. KẾT QUẢ NGHIÊN CỨU ................................................... 34
3.1. GIAI ĐOẠN 1 – KHẢO SÁT THỐNG KÊ TÀI LIỆU YHCT..................... 34
3.1.1. Tài liệu ................................................................................................................ 34
3.1.2. Tần suất các bệnh cảnh theo y văn ..................................................................... 36
3.1.3. Tần suất triệu chứng YHCT trong các bệnh cảnh .............................................. 37
3.1.4. Định nghĩa các triệu chứng YHCT ..................................................................... 42
3.2. GIAI ĐOẠN 2 – KHẢO SÁT LÂM SÀNG ................................................. 43
3.2.1. Đặc điểm của mẫu nghiên cứu ........................................................................... 44
3.2.2. Phân tích cụm ..................................................................................................... 49
CHƢƠNG 4. BÀN LUẬN ............................................................................ 60
4.1. KHẢO SÁT Y VĂN ..................................................................................... 60
4.1.1. Số lƣợng và chất lƣợng y văn ............................................................................. 60
4.1.2. Bàn về thống kê thể bệnh và triệu chứng ........................................................... 61
4.1.3. Xây dựng thang giá trị cho các biến số .............................................................. 67
4.2. KHẢO SÁT LÂM SÀNG ............................................................................. 71
4.2.1. Bàn về đặc điểm của mẫu nghiên cứu ................................................................ 71
4.2.2. Bàn về phân tích phân cụm ................................................................................ 79
4.2.3. Bàn về phân tích cụm ......................................................................................... 82
4.3. BÀN LUẬN VỀ PHƢƠNG PHÁP NGHIÊN CỨU ..................................... 89
4.3.1. Xây dựng thang đo các triệu chứng YHCT ........................................................ 89
4.3.2. Phƣơng pháp phân tích số liệu ........................................................................... 89
4.4. TÍNH MỚI VÀ TÍNH ỨNG DỤNG CỦA ĐỀ TÀI ...................................... 91
4.4.1. Tính mới ............................................................................................................. 91
4.4.2. Tính ứng dụng .................................................................................................... 91
4.5. KHĨ KHĂN VÀ HẠN CHẾ ........................................................................ 92
4.6. HƢỚNG NGHIÊN CỨU TIẾP THEO ......................................................... 92
CHƢƠNG 5. KẾT LUẬN – KIẾN NGHỊ .................................................. 94
5.1. KẾT LUẬN................................................................................................... 94
5.2. KIẾN NGHỊ .................................................................................................. 94
iii
.
.
TÀI LIỆU THAM KHẢO.......................................................................... - 1 PHỤ LỤC 1 ............................................................................................... - 14 PHỤ LỤC 2 ............................................................................................... - 17 PHỤ LỤC 3 ............................................................................................... - 19 PHỤ LỤC 4 ............................................................................................... - 26 PHỤ LỤC 5 ............................................................................................... - 29 PHỤ LỤC 6 ............................................................................................... - 34 -
iv
.
.
DANH MỤC CÁC CHỮ VIẾT TẮT
AHA
American Heart Association
Hiệp hội tim mạch Hoa Kỳ
AHA/ASA
American Heart Association/
American Stroke Association
Hiệp hội tim mạch Hoa Kỳ/ Hiệp
hội đột quỵ Hoa Kỳ
aPTT
Activated partial thromboplastin
time
Thời gian thromboplastin từng
phần hoạt hóa
ASCO
Atherosclerosis, small vessel
disease, cardiac causes, other
uncommon causes
Xơ vữa động mạch, bệnh mạch
máu nhỏ, nguyên nhân từ tim,
nguyên nhân không thƣờng gặp
khác
BI
Barthel index
Chỉ số Barthel
BUN
Blood urea nitrogen
Nitơ trong urê máu
CCS
Causative Classification of
Stroke System
Hệ thống phân loại đột quỵ theo
nguyên nhân
CDC
Centers for Disease Control and
Prevention
Trung tâm kiểm soát và phòng
ngừa bệnh Hoa Kỳ
CISS
Chinese Ischemic Stroke
Subclassification
Phân loại đột quỵ nhồi máu não
của Trung Quốc
CRP
C-reactive protein
Protein C phản ứng
CT
Computed tomography
Chụp cắt lớp vi tính
CTA
Computed tomography
angiography
Chụp cắt lớp vi tính mạch máu
DSA
Digital subtraction angiography
Chụp mạch máu số hóa xóa nền
ECG
Electrocardiography
Điện tim
EGFR
Epidermal growth factor
receptor
Thụ thể của yếu tố tăng trƣởng
thƣợng bì
HDLc
High-density lipoproteins
cholesterol
Cholesterol trong lipoprotein tỉ
trọng cao
IgA
Immunoglobulin alpha
IgG
Immunoglobulin gamma
v
.
.
IgM
Immunoglobulin mu
IL-10
Interleukin 10
IL-8
Interleukin 8
INR
International Normalized Ratio
Chỉ số bình thƣờng hóa quốc tế
LDLc
Low-density lipoproteins
cholesterol
Cholesterol trong lipoprotein tỉ
trọng thấp
MRA
Magnetic resonance
angiography
Chụp cộng hƣởng từ mạch máu
MRI
Magnetic resonance imaging
Chụp cộng hƣởng từ
mRS
modified Rankin Scale
Thang điểm Rankin sửa đổi
NIHSS
National Institutes of Health
Stroke Scale
Thang điểm đột quỵ của Viện
sức khỏe Quốc gia Hoa Kỳ
PCA
Principal component analysis
Phân tích thành tố
PLS
Partial least squares method
Phƣơng pháp bình phƣơng tối
thiểu từng phần
PT
Prothrombin time
Thời gian prothrombin
RF
Rheumatoid factor
Yếu tố thấp
SMV
Support vector machine
Vector máy hỗ trợ
TNF-α
Tumor necrosis factor alpha
Yếu tố hoại tử u alpha
TOAST
Trial of ORG 10172 in acute
stroke treatment
Nghiên cứu ORG 10172 trong
điều trị đột quỵ cấp
UPLC/MS
Ultra performance liquid
chromatography - mass
spectrometer
Sắc ký lỏng siêu hiệu năng –
khối phổ
VAT
Visual assessment of cluster
tendency
Đánh giá xu hƣớng phân cụm
trực quan
WHO/WPRO World Health Organization
Tổ chức y tế thế giới khu vực
Western Pacific Regional Office Tây Thái Bình Dƣơng
YHCT
Y học cổ truyền
YHHĐ
Y học hiện đại
vi
.
.
DANH MỤC BẢNG
Bảng 1.1. Tóm tắt các phƣơng pháp khai thác dữ liệu............................................. 12
Bảng 1.2. Các bệnh tim có huyết khối nguy cơ gây đột quỵ thiếu máu não cấp. ..... 18
Bảng 1.3. Những rối loạn tế bào máu và protein thƣờng gặp gây ĐQ NMN. .......... 19
Bảng 1.4. Phân biệt trúng kinh lạc và trúng tạng phủ. ............................................. 24
Bảng 2.1. Định nghĩa các biến số nền. .................................................................... 30
Bảng 3.1. Nhóm tài liệu sách giáo khoa của các trƣờng đại học, học viện .............. 34
Bảng 3.2. Nhóm tài liệu sách chuyên khảo.............................................................. 35
Bảng 3.3. Nhóm tài liệu kinh điển ........................................................................... 35
Bảng 3.4. Các bệnh cảnh trong trúng phong kinh lạc. ............................................. 36
Bảng 3.6. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh Âm hƣ phong động. ...... 37
Bảng 3.7. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh Mạch lạc hƣ trống ........ 38
Bảng 3.8. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh Âm hƣ hỏa vƣợng......... 39
Bảng 3.9. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh Phong đàm.................... 39
Bảng 3.10. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh Khí hƣ huyết ứ............ 40
Bảng 3.11. Tần suất và tỉ lệ các triệu chứng của bệnh cảnh có một y văn miêu tả. . 41
Bảng 3.16. Liệt kê các triệu chứng YHCT trong trúng phong kinh lạc. .................. 42
Bảng 3.17. Các triệu chứng đƣợc đƣa vào gộp biến ................................................ 43
Bảng 3.18. Phân bố đối tƣợng theo tuổi .................................................................. 44
Bảng 3.19. Phân bố đối tƣợng theo giới .................................................................. 44
Bảng 3.20. Phân bố đối tƣợng theo thời gian đột quỵ.............................................. 45
Bảng 3.21. Phân bố đối tƣợng theo BMI ................................................................. 45
Bảng 3.22. Phân bố đối tƣợng theo điểm NIHSS .................................................... 45
Bảng 3.23. Phân bố đối tƣợng theo TOAST ............................................................ 46
Bảng 3.24. Phân bố đối tƣợng theo số lần đột quỵ .................................................. 46
Bảng 3.25. Phân bố đối tƣợng theo tình trạng mất nƣớc ......................................... 47
Bảng 3.26. Phân bố đối tƣợng theo loại bệnh lí kèm theo ....................................... 47
Bảng 3.27. Phân bố đối tƣợng theo số lƣợng bệnh kèm theo................................... 47
Bảng 3.28. Hệ số liên quan giữa khoảng cách cophenetic và khoảng cách gốc ....... 51
viii
.
.
Bảng 3.29. Hệ số tƣơng quan giữa các biểu đồ nhánh ............................................. 51
Bảng 3.30. Kết quả đề xuất số cụm tối ƣu ............................................................... 52
Bảng 4.1. So sánh kết quả thu thập y văn ................................................................ 61
Bảng 4.2. So sánh triệu chứng YHCT trong đột quỵ giữa các nghiên cứu .............. 64
Bảng 4.3. Thang giá trị thiệt chẩn trong nhồi máu não ............................................ 68
Bảng 4.4. So sánh tuổi và giới gữa các nghiên cứu ................................................. 71
Bảng 4.5. So sánh bệnh kèm theo giữa các nghiên cứu ........................................... 72
Bảng 4.6. So sánh điểm NIHSS với các nghiên cứu khác ....................................... 73
Bảng 4.7. So sánh tỉ lệ bệnh nhân theo phân loại TOAST....................................... 74
Bảng 4.8. Đặc điểm của các hệ thống phân loại nhồi máu não ................................ 76
Bảng 4.9. So sánh về tỉ lệ mất nƣớc ........................................................................ 77
Bảng 4.10. So sánh tỉ lệ bệnh nhân béo phì ............................................................. 78
Bảng 4.11. Liệt kê biến số trong từng tổ hợp dữ liệu .............................................. 81
Bảng 4.12. Liệt kê các linkage ................................................................................ 81
Bảng 4.13. Đặc điểm của các cụm của đối tƣợng quan sát ...................................... 83
Bảng 4.14. Ý nghĩa các cụm biến triệu chứng ......................................................... 86
Bảng 4.15. Đặc trƣng chung của các cụm đối tƣợng quan sát ................................. 87
Bảng 4.16. Phối hợp bệnh cảnh trên bệnh nhân NMN trong 1-3 ngày .................... 88
Bảng 5.1. Bệnh cảnh y học cổ truyền trong đột quỵ nhồi máu não cấp ................... 94
ix
.
.
DANH MỤC HÌNH VẼ, BIỂU ĐỒ
Hình 1.1. Tiến trình hiện đại hố phân loại bệnh cảnh YHCT .................................. 4
Hình 1.2. Quá trình phân loại bệnh cảnh YHCT ....................................................... 5
Hình 3.1. Biểu đồ đánh giá tính phân cụm của dữ liệu ............................................ 50
Hình 3.2. Biểu đồ so sánh sự tƣơng quan giữa các biểu đồ nhánh........................... 52
Hình 3.3. Kết quả tính Silhouette width cho đề xuất số cụm tối ƣu. ........................ 53
Hình 3.4. Biểu đồ nhánh phân cụm bằng các linkage ward.D2, single, complete,
average, mcquitty, centroid với 2 cụm. ................................................................... 54
Hình 3.5. Biểu đồ nhánh phân cụm bằng các linkage median (2 cụm), ward.D2 (7
cụm), complete (5 cụm)........................................................................................... 55
Hình 3.6. Biểu đồ nhánh phân cụm bằng mcquitty linkage với 10 cụm .................. 55
Hình 3.7. Biểu đồ phân cụm biến số triệu chứng bằng phƣơng pháp distcor........... 56
Hình 3.8. Biểu đồ phân cụm biến số triệu chứng bằng phƣơng pháp association .... 57
Hình 3.9. Mixheatmap với phƣơng pháp distcor và ward.D2 .................................. 59
Hình 4.1. Thang màu sắc nƣớc tiểu của Armstrong................................................. 67
Hình 4.2. Hình ảnh lƣỡi và biểu đồ tính điểm phần trăm rêu lƣỡi. .......................... 69
Hình 4.3. Minh họa về cách đánh giá xu hƣớng phân cụm bằng VAT .................... 80
x
.
.
ĐẶT VẤN ĐỀ
Y học cổ truyền mang đậm nét văn hóa phƣơng Đơng, có lịch sử lâu đời, tồn tại
chủ yếu trong nền y học các nƣớc Trung Quốc, Hàn Quốc, Nhật Bản, Việt Nam. Ở
một số nƣớc châu Á và châu Phi, 80 % dân số phụ thuộc vào YHCT chăm sóc sức
khỏe ban đầu. Ở nhiều nƣớc phát triển 70 % đến 80 % dân số đã sử dụng một số
hình thức y học thay thế hoặc bổ sung, riêng ở Mỹ, có 158 triệu ngƣời đã sử dụng y
học bổ sung và chi phí chiếm đến khoảng 17 tỉ USD trong năm 2000 [111]. Tại Việt
Nam khoảng 54 % dân số sử dụng y học cổ truyền [112]. Với nhiều phƣơng cách,
Tổ chức Y tế Thế giới vùng Tây Thái Bình Dƣơng đã và đang đóng vai trò tiên
phong trong việc thúc đẩy sử dụng Y học cổ truyền. Chủ đề chính của chƣơng trình
Y học cổ truyền là ―Tiêu chuẩn hóa với phƣơng pháp tiếp cận dựa trên bằng chứng‖
[110]. Trong bối cảnh đó, việc tiêu chuẩn hoá Y học cổ truyền trong khu vực nhƣ
thuật ngữ [113], huyệt vị châm cứu [114], thảo dƣợc [110], nghiên cứu, thực hành
lâm sàng [112] là vấn đề quan trọng phát triển ngành Y học cổ truyền Việt Nam.
Biện chứng là vấn đề cốt lõi của YHCT, kết quả của biện chứng là các bệnh
cảnh YHCT, từ đây sẽ chỉ đạo việc điều trị. Biện chứng là một quá trình phân tích
từ nhóm các triệu chứng và dấu hiệu thông qua bốn phƣơng pháp khám bệnh (vọng,
văn, vấn, thiết). Việc điều trị dựa trên biện chứng là một trong những điểm đặc
trƣng và là ƣu điểm của YHCT trong phòng và điều trị bệnh [86]. Biện chứng giúp
nâng cao hiệu quả lâm sàng, tuy nhiên làm thế nào để thực hành chính xác việc biện
chứng là vấn đề quan trọng [86]. Do các phƣơng pháp chẩn đoán truyền thống
(vọng, văn, vấn, thiết) phụ thuộc vào các quan sát lâm sàng của các bác sỹ YHCT
và chẩn đoán dựa trên kinh nghiệm nên thiếu các tiêu chí khách quan và khả năng
lặp lại [103]. Sự phát triển nhanh chóng của y học hiện đại đã cung cấp sự hỗ trợ kỹ
thuật và cơ hội tốt cho việc đi sâu và mở rộng bốn phƣơng pháp chẩn đoán YHCT
[86]. Trong những năm gần đây, tiêu chuẩn hoá phân loại bệnh cảnh YHCT trở
thành một trọng tâm nghiên cứu và rất nhiều tiêu chuẩn chẩn đoán của các bệnh
cảnh YHCT khác nhau đã đƣợc xây dựng [86].
1
.
.
Hiện nay đột quỵ trở thành mối quan tâm lớn và là gánh nặng của tồn xã hội.
Trong đó, đột quỵ nhồi máu não chiếm tỉ lệ cao (87 %) trong các loại đột quỵ [49].
Năm 2013 có 6,5 triệu ca tử vong do đột quỵ trên toàn thế giới, đột quỵ là nguyên
nhân tử vong hàng thứ hai sau bệnh tim thiếu máu cục bộ, tử vong do đột quỵ chiếm
11,8 % số ngƣời chết trên toàn thế giới, trong đó có 3,3 triệu ca tử vong là do đột
quỵ nhồi máu não [49]. Tại Việt Nam mặc dù đã có nhiều tiến bộ trong điều trị đột
quỵ tuy nhiên tỉ lệ tử vong còn khá cao, tỉ lệ tử vong chung trong 10 năm (20032012) tại bệnh viện Trung ƣơng Quân đội 108 là 7,15 % [31].
Trong hệ thống y học cổ truyền, có rất nhiều sự lựa chọn để điều trị trong giai
đoạn cấp, bán cấp, hoặc mãn tính của đột quỵ nhồi máu não [52] và đã có nhiều
cơng trình nghiên cứu chứng minh lợi ích của YHCT trong đột quỵ nhồi máu não
giai đoạn cấp [52][59] và phục hồi chức năng vận động sau đột quỵ nhồi máu não
[32][33]. Tuy có một vài nghiên cứu về tiêu chuẩn chẩn đoán các bệnh cảnh YHCT
trên bệnh nhân đột quỵ chung và đột quỵ nhồi máu não [1][76][84][62][106] nhƣng
đa số khơng trên ngƣời Việt Nam, hoặc cịn nhiều hạn chế nhƣ mẫu nhỏ, đơn trung
tâm, chƣa phân bậc triệu chứng, khơng chia giai đoạn. Vì vậy chúng tơi tiến hành áp
dụng các kỹ thuật tính tốn khoa học và khách quan để bƣớc đầu nghiên cứu phân
loại các bệnh cảnh y học cổ truyền trên bệnh nhân đột quỵ nhồi máu não giai đoạn
cấp. Từ đó tạo tiền đề cho các nghiên cứu tiếp theo nhằm tạo ra tiêu chuẩn chẩn
đốn giá trị cao góp phần tạo tƣ liệu giảng dạy và tiến tới nâng cao hiệu quả điều trị
bệnh nhân đột quỵ nhồi máu não giai đoạn cấp.
2
.
.
CÂU HỎI NGHIÊN CỨU
Có bao nhiêu bệnh cảnh y học cổ truyền theo y văn và theo triệu chứng lâm
sàng trong đột quỵ nhồi máu não giai đoạn cấp không có rối loạn tri giác?
MỤC TIÊU TỔNG QUÁT
Phân loại các bệnh cảnh y học cổ truyền trong đột quỵ nhồi máu não giai đoạn
cấp khơng có rối loạn tri giác.
MỤC TIÊU CỤ THỂ
Phân loại các bệnh cảnh y học cổ truyền trong đột quỵ nhồi máu não giai đoạn
cấp không có rối loạn tri giác theo tài liệu y học cổ truyền.
Phân loại các bệnh cảnh y học cổ truyền trong đột quỵ nhồi máu não giai đoạn
cấp khơng có rối loạn tri giác theo triệu chứng lâm sàng y học cổ truyền.
3
.
.
CHƢƠNG 1. TỔNG QUAN TÀI LIỆU
1.1. PHÂN LOẠI CÁC BỆNH CẢNH YHCT
Mặc dù y học cổ truyền đã đƣợc thực hành hiệu quả hơn 3000 năm, sự phân
loại các bệnh cảnh YHCT vẫn cịn tranh cãi, bởi vì nó phụ thuộc vào quan sát lâm
sàng và kinh nghiệm của các bác sỹ y học cổ truyền, điều này mang tính chủ quan
và không thể lặp lại. Kể từ khi thành cơng của y học cá thể hố dựa trên các xét
nghiệm chẩn đốn chính xác để xác định bệnh nhân có thể có lợi từ liệu pháp điều
trị nhắm trúng đích, một bƣớc đột phá lớn trong chẩn đốn y học cổ truyền với tính
khách quan và lặp lại là cần thiết. Với mục tiêu này, các nhà nghiên cứu y học cổ
truyền hiện đang làm việc hiệu quả với các cơng nghệ và phƣơng pháp hữu ích,
chẳng hạn nhƣ khai thác tài liệu y văn và phân tích hệ thống sinh học [61]. Tiến
trình hiện đại hố phân loại các bệnh cảnh y học cổ truyền đƣợc trình bày trong
Hình 1.1 và Hình 1.2.
Hình 1.1. Tiến trình hiện đại hoá phân loại bệnh cảnh YHCT
4
.
.
(Nguồn: Guo, Rui, et al. (2010), Bioinformatics and Biomedical Engineering (iCBBE), 2010 4th
International Conference on, IEEE, pp. 1-5.)
Phân tích cụm
SMV
Vector
chuyên biệt
Kết quả chẩn
đốn
Bayesian network
Phân lớp mờ
Hình 1.2. Q trình phân loại bệnh cảnh YHCT
(Nguồn: Guo, Rui, et al. (2010), Bioinformatics and Biomedical Engineering (iCBBE), 2010 4th
International Conference on, IEEE, pp. 1-5.)
1.1.1. Thu thập dữ liệu
Dữ liệu định tính hoặc định lƣợng cần đƣợc thu thập một cách phù hợp kết hợp
với sử dụng các cơng nghệ hoặc phƣơng pháp thích hợp là bƣớc đầu tiên trƣớc khi
phân loại các bệnh cảnh YHCT [61].
1.1.1.1. Thu thập dữ liệu định tính
Các dữ liệu định tính thƣờng lấy từ các tài liệu y văn, bảng câu hỏi điều tra dịch
tễ học và các thơng số bằng bốn phƣơng pháp chẩn đốn truyền thống (vọng, văn,
vấn, thiết). Các dữ liệu này đƣợc sử dụng để mơ tả các đặc tính, sự phân bố, sự diễn
tiến và sau cùng là phân loại các bệnh cảnh YHCT [61].
Tra cứu y văn: Cho chúng ta có cái nhìn xa hơn đứng trên vai của ngƣời tiền
nhiệm, việc tra cứu y văn là một phƣơng pháp khả thi để nghiên cứu phân loại các
bệnh cảnh YHCT. Nghiên cứu của Lui Xin-min và Hua Qiang [117] đã đƣợc thực
hiện để thăm dò các đặc trƣng của các chứng và các yếu tố của chúng phân bố trong
hội chứng buồng trứng đa nang. Các tài liệu từ năm 1994 đến năm 2009 về các
chứng này đã đƣợc tìm kiếm với từ khố và đƣợc phân loại, sau đó cơ sở dữ liệu
đƣợc Excel thiết lập để phân tích dựa trên các dữ liệu thu thập đƣợc. Kết quả là tần
số của 36 chứng và các yếu tố của chúng đã đƣợc phân tích. Việc kiểm sốt chất
5
.
.
lƣợng nên đƣợc thực hiện nghiêm túc trong quá trình thu thập tài liệu. Và không thể
chỉ đơn giản sao chép các tiêu chuẩn phƣơng Tây [61]. Một hệ thống đánh giá phân
loại các bệnh cảnh YHCT nên đƣợc thiết lập, phù hợp với y học cổ truyền; nếu
khơng, nó sẽ hạn chế thậm chí kiềm hãm sự phát triển của y học cổ truyền [61].
Thiết kế dịch tễ học: Nghiên cứu dịch tễ lâm sàng đƣợc sử dụng rộng rãi để thu
thập dữ liệu, với các phƣơng pháp nghiên cứu hồi cứu, cắt ngang, và theo dõi dọc.
Với phân tích hồi cứu, thơng tin chẩn đốn của 438 bệnh nhân viêm gan B mãn tính
nặng đã đƣợc điều tra bởi Peng và cộng sự [73]. Các dấu hiệu cơ bản của các bệnh
cảnh y học cổ truyền đƣợc phân tích theo tần số và các phân tích cụm khác nhau để
phân loại các bệnh cảnh YHCT trên ba giai đoạn lâm sàng. Đặc biệt, nghiên cứu về
sự diễn tiến của "thấp nhiệt", "tỳ hƣ" và "huyết ứ" có thể hỗ trợ sự phân loại các
bệnh cảnh YHCT một cách động học.
Cải thiện tứ chẩn: Tứ chẩn là phƣơng pháp chẩn đoán truyền thống quan trọng,
cần phải phát triển tứ chẩn (vọng văn vấn thiết). Vì nó phụ thuộc vào sự quan sát và
kinh nghiệm lâm sàng của các bác sỹ y học cổ truyền, thiếu sót của các phƣơng
pháp này là khơng có các tiêu chí khách quan và khả năng lặp lại. Yue và Liu [116]
và Pang và cộng sự [51] đã số hố hình ảnh lƣỡi bằng cơng nghệ máy tính, đƣa
quan sát lƣỡi vào phƣơng pháp bán định lƣợng. Và máy dò mạch theo y học cổ
truyền đã đƣợc sử dụng để nâng cao tính chính xác và khả năng lặp lại của chẩn
đoán mạch và cung cấp dữ liệu nhƣng chỉ dựa vào cảm giác [61].
1.1.1.2. Thu thập dữ liệu định lượng
Các dữ liệu trên đều đƣợc thu thập bằng cách quan sát và kinh nghiệm lâm
sàng, nó khơng chỉ là mang tính định tính và khơng thể lặp lại, mà cịn khó thực
hiện phân tích thống kê, nhận dạng mơ hình chứng và sự tích hợp mà khơng có sự
số hố hồn tồn. Do đó, việc thu thập dữ liệu định lƣợng đang đƣợc xem là bƣớc
tiến bộ hơn nữa trong tƣơng lai [61].
Công nghệ "Omics": "Omics" bao gồm genomics, transcriptomics, proteomics,
và metabonomics, với sự phát triển nhanh chóng của các kỹ thuật dị tìm với quy
mơ lớn. Nó trực tiếp tập trung vào các mạng lƣới hoá sinh, các con đƣờng, các chất
6
.
.
chuyển hóa, và các phân tử mục tiêu của tồn bộ cơ thể, theo quan điểm từ trên
xuống dƣới. Với các tính năng khơng phá hủy, tồn vẹn, đa mục tiêu, thơng lƣợng
cao và số hóa, cơng nghệ "Omics" có thể cung cấp tính khả thi để điều tra chứng,
với đặc điểm đa yếu tố, đa kiểu hình và trạng thái động [61].
Công nghệ phát hiện sinh lý và bệnh lý: Các dấu hiệu, triệu chứng và các thông
số sinh hóa của bệnh nhân đƣợc Yuan và các cộng sự [118] thu thập từ các bảng câu
hỏi tự thiết kế về bốn phƣơng pháp chẩn đoán của YHCT. Kết quả cho thấy các
bệnh cảnh khác nhau có các đặc tính bệnh lý khác nhau. Chẳng hạn, hội chứng thấp
nhiệt đƣợc đặc trƣng bởi tình trạng viêm gan rõ rệt, chức năng tổng hợp kém, và
báng bụng nhiều hơn.
Công nghệ phát hiện sinh học phân tử: Sự tƣơng quan giữa chỉ số sinh hóa và
chứng đã đƣợc đánh giá bởi Zhao [87]. Bảy mƣơi bệnh nhân nữ viêm khớp dạng
thấp bị hội chứng hàn hoặc nhiệt đã đƣợc đƣa vào thử nghiệm này. Tuy nhiên, đối
với các biểu hiện của cytokine (TNF-α, IL-10, IL-8), các chỉ số viêm (tốc độ lắng
máu) và chỉ số miễn dịch (IgA, IgG, IgM, RF, C3) ở các đối tƣợng có hội chứng
hàn và nhiệt cho thấy khơng có sự khác biệt có ý nghĩa, ngoại trừ CRP.
1.1.2. Khai thác dữ liệu
Sự phức tạp của y sinh học làm giới hạn các nghiên cứu chỉ dựa trên dữ liệu
thực nghiệm. Do đó, mơ tả chính xác và khách quan về hiện tƣợng và nguyên tắc
trong y học cổ truyền đang có đƣợc từ phân tích thống kê và khai thác dữ liệu, thu
hút sự hỗ trợ từ cơng nghệ máy tính. Khai thác dữ liệu là cơng cụ đa năng kết hợp
trí tuệ nhân tạo, thống kê, nhận diện kiểu mẫu. Khai thác dữ liệu trong cơ sở dữ liệu
tƣơng đƣơng với khám phá kiến thức, ban đầu đƣợc sử dụng cho khai thác về hệ
gen trong y sinh học [61].
Khai thác quy tắc liên kết (Association Rule Mining): Khai thác quy tắc liên kết
là một trong những phƣơng pháp tiếp cận chính của khai thác dữ liệu và là phƣơng
pháp phổ biến của khám phá kiến thức trong các hệ thống học không giám sát. Nó
đƣợc sử dụng để mơ tả các mối quan hệ có ý nghĩa hoặc mối quan hệ tƣơng quan
giữa một tập hợp lớn các mục dữ liệu. Wu và cộng sự [115] đã gắn chức năng gen
7
.
.
từ MEDLNE với các y văn y học cổ truyền và thiết lập mối quan hệ giữa bệnh tật và
các bệnh cảnh, kết hợp với việc xác nhận mối quan hệ giữa các chứng và các gen.
Lý thuyết tập thô (Rough Sets Theory): Là một cơng cụ tốn học mới để giải
quyết các thông tin mơ hồ và không rõ ràng, lý thuyết tập thô đƣợc giới thiệu bởi
Pawlak, đƣợc áp dụng để có đƣợc một số quyết định và phân loại. Bằng cách xóa
các thơng tin khơng liên quan hoặc khơng quan trọng, nó có thể đơn giản hóa thông
tin dựa trên giả thuyết vẫn giữ khả năng phân loại không thay đổi. Thông tin về các
triệu chứng và dấu hiệu từ 287 bệnh nhân xơ gan sau viêm gan đã đƣợc thu thập bởi
Zhang và cộng sự [120] để khám phá việc áp dụng lý thuyết tập thô trong phân loại
các bệnh cảnh YHCT. Kết quả cho thấy mơ hình này có ý nghĩa rất quan trọng đối
với chẩn đoán, với 83% trùng hợp ngẫu nhiên với sáu bệnh cảnh chính trong y học
cổ truyền.
Phân tích cụm (Cluster Analysis): Phân tích cụm là một cách khám phá cách
phân loại, có thể mơ tả một tập hợp các phƣơng pháp và kỹ thuật đa biến. Nó
thƣờng đƣợc sử dụng để phân loại dữ liệu thành các nhóm, loại, thuộc tính, và vân
vân. Với các cuộc điều tra đa trung tâm và mẫu nghiên cứu lớn, phân tích cụm hai
bƣớc đƣợc sử dụng để nghiên cứu quy tắc phân bố bệnh cảnh trong bệnh tăng huyết
áp bởi Gu và cộng sự [66]. So với các tiêu chí phân biệt chứng hiện tại, phƣơng
pháp này có thể thêm hai bệnh cảnh nữa đƣợc sử dụng để phản ảnh yếu tố nguyên
nhân.
Mạng Bayesian (Bayesian Networks): Mạng Bayesian là một loại mạng xác
suất dựa trên lý luận xác suất, với nền tảng của công thức Bayes. Đặc biệt thông qua
khả năng phối hợp các phép suy luận xác suất hai chiều, các mạng Bayesian hiện
nay đƣợc coi là một sơ đồ đại diện chung cho kiến thức không chắc chắn. Qu và
cộng sự [98] sử dụng mạng Bayesian để phân loại bệnh cảnh YHCT trong 611 bệnh
nhân trầm cảm. Các bệnh cảnh của trầm cảm đƣợc phân biệt theo các nguyên tắc
khác nhau hoặc các chứng thứ yếu và các kết hợp của chúng. Các chứng đƣợc mô tả
trong nghiên cứu của này phù hợp với lâm sàng y học cổ truyền và có thể cung cấp
hƣớng dẫn tốt để điều trị.
8
.
.
Cây quyết định (Decision Trees): Cây quyết định đƣợc đặc trƣng bởi một hàm
logic liên tục trên một số vùng hình hộp trong dãy X. Các vùng này thƣờng đƣợc
biểu diễn bởi một cây quyết định nhị phân bao gồm các nút và các phân chia nhị
phân. Nó có thể đƣợc áp dụng phát triển phân loại các bệnh cảnh YHCT. Zhong và
cộng sự [121] đã phát triển một phƣơng pháp cây quyết định kết hợp với các quy tắc
kết hợp để nghiên cứu hội chứng khí uất trong viêm dạ dày, thu đƣợc dự đoán thỏa
đáng.
Mạng lƣới thần kinh nhân tạo (Artificial Neural Network): Với khả năng phù
hợp chức năng ở bất kỳ độ chính xác nào, mạng thần kinh nhân tạo rất mạnh để sử
dụng cấu trúc tƣơng tự nhƣ synape thần kinh não để xử lý thông tin. Nó đã đƣợc
chứng minh thành cơng trong nhiều nhiệm vụ phân loại. Mơ hình mạng thần kinh
đƣợc huấn luyện bởi thuật toán gradient liên hợp đƣợc xây dựng bởi Sun và cộng sự
[104] để phân loại chứng trong bệnh mạch vành, với độ chính xác 89,2%. Nghiên
cứu này đã đạt đƣợc những kết quả khả quan và khắc phục đƣợc những nhƣợc điểm
của thuật toán BP truyền thống một cách hiệu quả.
Phân tích thành phần (Principal Component Analysis - PCA). Bắt đầu với sự
tƣơng quan của các biến, việc phân tích thành phần dựa trên việc giảm kích thƣớc là
một phƣơng pháp thống kê có thể dịch nhiều biến sang các sai số tích hợp khơng
liên quan ít hơn. Metabonomics dựa trên UPLC/MS đã đƣợc thực hiện bởi Lu và
cộng sự [89] để nghiên cứu hội chứng thận dƣơng hƣ và tác dụng điều trị của
Rhizoma Drynariae. Với PCA, đã có sự tách biệt rõ ràng giữa nhóm mơ hình và
nhóm predose. Xu hƣớng hồi quy phụ thuộc vào thời gian thu đƣợc trong nhóm
điều trị Rhizoma Drynariae từ 1 đến 15 ngày, cung cấp một tiến trình trực quan,
tồn thể và năng động.
Phƣơng pháp bình phƣơng tối thiểu từng phần (Partial Least Squares Method PLSs): Phƣơng pháp đƣợc Wold đề xuất, nó trích các đặc tính dựa trên nguyên tắc
tối đa hoá sự hiệp phƣơng sai của biến độc lập và biến phụ thuộc. Nó làm cho các
đặc tính có nhiều liên kết với các biến phụ thuộc, nâng cao độ chính xác của phân
loại các bệnh cảnh YHCT theo sau. Do các mẫu lâm sàng có nhiều biến thể riêng lẻ
9
.
.
hơn các mẫu động vật, các phƣơng pháp đƣợc giám sát nhƣ PLSs tốt hơn về sự khác
biệt liên nhóm chính của các mẫu lâm sàng so với các phƣơng pháp không đƣợc
giám sát nhƣ PCA. Van Wietmarschen và cộng sự [107] dùng phƣơng pháp phân
tích bình phƣơng tối thiểu từng phần để phân biệt các chứng hàn và nhiệt của bệnh
nhân viêm khớp dạng thấp không đƣợc phân biệt bởi PCA, đạt đƣợc kết quả khả
quan về axit 3-oxo-propionic và các chất chuyển hóa khác biệt khác.
Phân tích nhân tố (Factor Analysis): Phân tích nhân tố đƣợc sử dụng để tìm ra
số yếu tố ít nhất để tính đến sự khác biệt chung của một bộ lớn các biến hệ thống
chuyên gia thống kê, ngoại trừ biến đặc biệt (độc nhất). Nó có thể đƣợc áp dụng
trong việc phân tích mối liên quan của nhiều dấu hiệu ban đầu, và sau đó tìm ra các
biến khác biệt có hạn và khơng quan sát đƣợc tiềm ẩn và giải thích sự liên quan.
Nghiên cứu tiền cứu đa trung tâm về chứng ở 815 trƣờng hợp đau thắt ngực không
ổn định đƣợc thực hiện bằng cách sử dụng các phân tích nhân tố với việc giảm kích
thƣớc phi tuyến. Wang và cộng sự [109] đề nghị rằng phƣơng pháp này có thể giúp
phân loại các bệnh cảnh YHCT và thiết lập các tiêu chuẩn chẩn đốn sơ bộ.
Mơ hình phƣơng trình cấu trúc (Structural Equation Modeling): Mơ hình
phƣơng trình cấu trúc dựa trên phƣơng pháp thống kê để nghiên cứu và xử lý các dữ
liệu phức tạp và đa biến. Kỹ thuật này cho phép tính các sai số đo lƣờng cá thể liên
quan đến các đối tƣợng quan sát đƣợc. Ngồi ra, mơ hình cịn cho phép thử nghiệm
các giả thuyết tiên nghiệm về mối quan hệ nhân quả phức tạp giữa các biến tiềm ẩn
bệnh tật và chứng. Ở đây, các chứng và sự thay đổi phạm vi của hội chứng mãn
kinh trên 236 phụ nữ từ việc khảo sát y văn đã đƣợc xác định bằng phân tích nhân
tố thăm dị. Sau khi tìm ra ngun lý chứng của thận dƣơng hƣ và thận âm hƣ bởi
cây tiềm ẩn, mơ hình phƣơng trình cấu trúc đã đƣợc áp dụng để xác nhận kết quả
trƣớc đó [58].
Ngồi ra, các phƣơng pháp khai thác dữ liệu khác nhƣ: phân tích cặp (set pair
analysis), hồi quy logistic (logistic regression), thuật toán cụm entropy (entropy
cluster algorithm), và các máy vector hỗ trợ (support vector machines) đƣợc áp
dụng trong phân biệt chứng với các kết quả khả quan [61].
10
.
.
11
.
.
Bảng 1.1. Tóm tắt các phương pháp khai thác dữ liệu
Phƣơng pháp
Hồi quy logistic
Ƣu điểm
Nhƣợc điểm
Đa chức năng.
Cần kích cỡ mẫu.
Mạng Bayesian
Tận dụng dữ liệu khơng đầy đủ và
Cần có các nghiên cứu trƣớc làm
(Bayesian Networks)
khơng chính xác.
hƣớng dẫn.
(Logistic regression)
Lý thuyết tập thô
(Rough Sets Theory)
Khai thác quy tắc liên kết
(Association Rule Mining)
Không cần thông tin tiền đề; đơn
giản; xử lý đƣợc các thông tin mơ
Cần sự tự phát triển.
hồ và không rõ ràng.
Hỗ trợ khai thác dữ liệu gián tiếp.
Không chọn lựa; mang tính chủ
quan.
Phân tích cặp
Thích hợp cho việc thay đổi hệ
Bất lợi trong xử lý các vấn đề
(Set pair analysis)
thống.
tƣơng đối chính xác.
Mơ hình phƣơng trình cấu trúc
Phân tích mối quan hệ nhân quả
(Structural Equation Modeling)
giữa các biến tiềm ẩn.
Phân tích cụm
Tối thiểu hố các sai số do phán
(Cluster Analysis)
đốn chủ quan.
Cây quyết định (Decision Trees)
Phân tích thành phần (Principal
Component Analysis)
Xử lý số liệu không phải dạng số;
đơn giản.
Giảm kích thƣớc; thống nhất hố.
(Artificial Neural Network)
Thuật tốn cụm entropy (entropy
cluster algorithm)
trong việc phân cụm dữ liệu với
Có thể gây hiểu nhầm.
Ít đặc hiệu.
Hạn chế trong quyết định thành
Đặc hiệu.
phần chính.
Squares Method)
Mạng lƣới thần kinh nhân tạo
Quá nhiều tính tốn; hạn chế
đa chiều và đa cấp.
Phƣơng pháp bình phƣơng tối
thiểu từng phần (Partial Least
Yêu cầu mẫu ít nhất là 200.
Đơn giản; khơng tuyến tính.
Hạn chế trong việc thu đƣợc các
thông tin ẩn.
Nhu cầu nhỏ về các loại biến thể;
phân tích bất kỳ sự phụ thuộc
Cần sự tự phát triển.
thống kê của các sai biệt.
Phân tích nhân tố (Factor
Khả năng hiệu chỉnh; nhìn thấy
Khơng có sự thống nhất và mối
Analysis)
các biến tiềm ẩn.
quan hệ giữa sơ cấp và thứ cấp.
Máy vector hỗ trợ (Support vector
Phân loại mà khơng có đại diện
machines)
cho không gian đặc trƣng rõ ràng.
Thể hiện thông tin phức tạp hơn
thơng tin trƣớc đó; phân tích số
lƣợng mẫu hạn chế.
(Nguồn: Dai, Jianye, et al. (2012), Evidence-Based Complementary and Alternative Medicine [61])
12
.
.
1.1.3. Phân tích cụm
Phân tích cụm (Cluster analysis) là một cơng cụ để khai thác dữ liệu và tìm các
nhóm có những đặc điểm giống nhau. Phân tích cụm cũng có thể ứng dụng để nhóm
các biến có dữ liệu quan sát giống nhau. Mục tiêu của phân tích cụm là xác định các
nhóm dựa vào độ giống nhau. Các cụm đƣợc thẩm định để tìm những đặc điểm có
thể giải thích sự hình thành các nhóm/cụm [39].
Có nhiều thuật tốn cho phân tích cụm, thuật tốn đơn giản và phổ biến nhất là
agglomerative hierarchical clustering method. Phƣơng pháp này xem mỗi dòng dữ
liệu (observation) là một cụm. Khi hai observation giống nhau thì sẽ đƣợc cho vào
một cụm với hai observation. Khi các cụm cịn lại có một observation. Các cụm sau
đó đƣợc nối kết với nhau một cách tuần tự cho đến khi chỉ còn một cụm [39].
Phƣơng pháp phân tích cụm đƣợc thực hiện nhƣ sau (với số observation là n):
Bƣớc 1: Mỗi observation là một cụm.
Bƣớc 2: Xác định một cụm mới bằng cách tìm hai observation rất giống nhau
hay gần nhau. Còn lại n-1 cụm.
Bƣớc 3: Tìm một cụm mới bằng cách nhóm hai cụm gần nhau nhất hay giống
nhau nhất. Còn lại n-2 cụm.
Bƣớc 4: Tiếp tục qui trình nhập các cụm từng bƣớc một cho đến khi chỉ còn hai
cụm.
Bƣớc 5: Hợp nhất hai cụm cịn lại. Sau đó dùng biểu đồ đề tóm lƣợc các bƣớc
hình thành cụm.
1.1.3.1. Đo lường khoảng cách
Khoảng cách giữa các cụm là một hệ số quan trọng trong phân tích cụm. Có
nhiều thƣớc đo giữa các cụm: (a) Single linkage distance là khoảng cách tối thiểu
giữa các điểm của hai cụm; (b) Complete linkage distance là khoảng cách tối đa
giữa các điểm của hai cụm; (c) Average linkage distance là khoảng cách trung bình
giữa các điểm của hai cụm [39].
Với một thƣớc đo khoảng cách, khoảng cách giữa hai cụm đƣợc đánh giá ở mỗi
bƣớc. Hai cụm nào gần nhất đƣợc nhập thành một. Việc lựa chọn thƣớc đo khoảng
13
.
.
cách có thể ảnh hƣởng đến kết quả phân tích. Thƣớc đo single linkage, vì đo khoảng
cách ngắn nhất giữa các điểm của hai cụm, nên có thể cho ra các cụm thất thƣờng.
Thƣớc do complete linkage dùng khoảng cách xa nhất giữa các điểm nên có thể cho
ra những cụm có cùng đƣờng kính. Thƣớc đo average linkage dùng khoảng cách
trung bình giữa các điểm nên có xu hƣớng cho ra những cụm có cùng độ dao động.
Do đó, phải dùng nhiều thƣớc đo khoảng cách để đi đến một kết quả có thể chấp
nhận đƣợc [39].
1.1.3.2. Xác định số cụm
Vấn đề quan trọng của phân tích là nhận ra số cụm trong dữ liệu. Có nhiều
phƣơng pháp thống kê tìm ra số cụm. Tuy nhiên, khơng có phƣơng pháp nào là tốt
nhất. Những phƣơng pháp đề nghị sử dụng các chỉ số nhƣ tiêu chuẩn cubic
clustering criteria (ccc), kiểm định giống nhƣ F, kiểm định giống nhƣ t test, vân
vân. Nhiều chuyên gia đề nghị dùng tiêu chuẩn ccc hoặc kiểm định F tƣơng đối cao.
Trong R, package NbClust có thể dùng cho việc xác định số cụm cần thiết [39].
Phiên bản hiện tại của NbClust có chứa đến ba mƣơi phƣơng pháp xác định số
cụm. Nó cho phép ngƣời dùng đồng thời thay đổi số lƣợng cụm, phƣơng pháp phân
cụm và các chỉ số để quyết định làm thế nào tốt nhất để nhóm các quan sát trong
một bộ dữ liệu. Hơn nữa, đối với mỗi chỉ số (index), NbClust đề xuất số lƣợng các
cụm tốt nhất từ các kết quả khác nhau. Ngƣời sử dụng có thể so sánh tất cả các chỉ
số và phƣơng pháp phân cụm [55].
1.2. TÌNH HÌNH NGHIÊN CỨU PHÂN LOẠI CÁC BỆNH CẢNH
YHCT
1.2.1. Nghiên cứu nƣớc ngoài
Han Jung Kim và cộng sự (2011) [79] đã đánh giá các đặc điểm chung và các
triệu chứng của bệnh nhân liên quan đến việc xác định chứng. Nghiên cứu này
hƣớng đến chuẩn hóa việc nhận dạng chứng y học cổ truyền cho bệnh nhân đột quỵ.
Nghiên cứu tiến hành trên đa trung tâm ghi nhận bệnh nhân đột quỵ trong vòng ba
mƣơi ngày sau khởi phát. Mỗi bệnh nhân đƣợc xác định chứng khi hai bác sĩ có
cùng ý kiến. Để xác định những biến nào ảnh hƣởng đến việc xác định chứng, phân
14
.