Tải bản đầy đủ (.pdf) (94 trang)

VƯƠNG HOÀNG HÙNG NGHIÊN cứu IN SILICO mối LIÊN QUAN GIỮA THÀNH PHẦN HOÁ học và tác DỤNG SINH học ĐỊNH HƯỚNG điều TRỊ COVID 19 của một số cây THUỐC KHÓA LUẬN tốt NGHIỆP dược sĩ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.06 MB, 94 trang )

BỘ Y TẾ
TRƯỜNG ĐẠI
HỌC
BỘ Y
TẾ DƯỢC HÀ NỘI
TRƯỜNG ĐẠI HỌC DƯỢC HÀ NỘI

HỌ VÀ TÊN: VƯƠNG HOÀNG HÙNG
MÃ SINH VIÊN: 1701234

VƯƠNG HỒNG HÙNG
1701234

NGHIÊN
NGHIÊNCỨU
CỨUIN
INSILICO
SILICOMỐI
MỐILIÊN
QUAN
THÀNH
PHẦN HỐ
HỌC
LIÊNGIỮA
QUAN
GIỮA THÀNH
PHẦN
VÀHỌC
TÁC VÀ
DỤNG
HỌC


ĐỊNH
HỐ
TÁCSINH
DỤNG
SINH
HỌC
HƯỚNG
ĐIỀU TRỊ
COVID-19
CỦA MỘT
ĐỊNH HƯỚNG
ĐIỀU
TRỊ COVID-19
SỐ CÂY
CỦA MỘT
SỐ THUỐC
CÂY THUỐC
KHOÁ LUẬN TỐT NGHIỆP DƯỢC SĨ
Người hướng dẫn:
1. PGS.TS Nguyễn Thu Hằng
2. ThS.
Nguyễn Văn Phương
Người hướng
dẫn:
1.
PGS.
Nguyễn Thu Hằng
Nơi
thựcTS.
hiện:

2. Ths.Bộ
Nguyễn
Văn Phương
mơn Dược
liệu
Nơi thực hiện:
Bộ mơn Dược liệu

KHĨA LUẬN TỐT NGHIỆP DƯỢC SĨ

HÀ NỘI - 2022


LỜI CẢM ƠN
Lời đầu tiên, với sự kính trọng và lịng biết ơn sâu sắc, tơi xin được gửi lời cảm
ơn chân thành tới PGS.TS. Nguyễn Thu Hằng – Trưởng bộ môn Dược liệu, Trường
Đại học Dược Hà Nội. Cô là người đã trực tiếp hướng dẫn, chỉ dạy tôi trong q trình
thực hiện khố luận. Nhờ sự hướng dẫn của cơ, tơi đã có thể từng bước giải quyết được
các vấn đề mình gặp phải trong quá trình nghiên cứu. Những lời khuyên của cô không
chỉ về chuyên môn mà còn về tác phong, kinh nghiệm làm việc sẽ là hành trang quý báu
đồng hành cùng tôi trong chặng đường tiếp theo.
Tôi xin được gửi lời tri ân sâu sắc tới ThS. Nguyễn Văn Phương – Giảng viên
Bộ môn Dược liệu, Trường Đại học Dược Hà Nội, người thầy đã luôn đồng hành,
quan tâm giúp đỡ và động viên tơi trong suốt q trình nghiên cứu tại bộ mơn. Sự giúp
đỡ và khích lệ của thầy có ý nghĩa vơ cùng to lớn đối với tơi trong q trình thực hiện
khóa luận này. Thầy đã dành rất nhiều thời gian và tâm huyết để trực tiếp hướng dẫn tơi
tìm hiểu về một mảng kiến thức hoàn toàn mới đối với bản thân trước đó. Qua đó, tơi
đã trưởng thành hơn rất nhiều sau quãng thời gian thực hiện khoá luận này.
Tôi xin chân thành cảm ơn các thầy cô và các anh chị đang công tác tại Bộ môn
Dược liệu đã hết sức tạo điều kiện cho tôi trong q trình thực hiện khóa luận. Cảm ơn

sự đồng hành, chia sẻ và động viên từ các bạn sinh viên đang học tập và nghiên cứu
khoa học tại bộ môn đã giúp tơi vượt qua những khó khăn để hồn thành khóa luận này.
Tơi cũng xin gửi lời cảm ơn sâu sắc tới Ban Giám hiệu Trường Đại học Dược Hà
Nội, cùng các phịng ban và tồn thể q thầy cô giáo đã luôn tạo điều kiện tốt nhất cho
tôi trong suốt quá trình học tập và nghiên cứu tại trường.
Cuối cùng, tơi xin đặc biệt cảm ơn gia đình, bạn bè và những người thân yêu đã
luôn ở bên, là chỗ dựa tinh thần to lớn, ln khích lệ và động viên tôi trong học tập cũng
như trong cuộc sống!
Trong q trình thực hiện khóa luận khơng thể tránh khỏi những thiếu sót, tơi rất
mong nhận được những nhận xét và góp ý từ các thầy cơ và bạn bè để khóa luận được
hồn thiện hơn.
Tơi xin chân thành cảm ơn!
Hà Nội, tháng 06 năm 2022
Sinh viên


MỤC LỤC
LỜI CẢM ƠN ................................................................................................................3
MỤC LỤC ......................................................................................................................4
DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT .........................................................5
DANH MỤC CÁC BẢNG.............................................................................................6
DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ .....................................................................7
ĐẶT VẤN ĐỀ.................................................................................................................1
CHƯƠNG 1. TỔNG QUAN .........................................................................................3
1.1.

Tổng quan về SARS-CoV-2 và COVID-19 .....................................................3

1.2.


Tổng quan về dược lý mạng (Network pharmacology) ....................................5

1.3.

Giới thiệu Gen Ontology - GO .........................................................................9

1.4.

KEGG và làm giàu KEGG (KEGG enrichment)............................................11

1.5.

Mô phỏng tương tác phân tử (Molecular docking).........................................12

1.6. Thành phần hóa học và tác dụng liên quan đến COVID-19 của Xuyên tâm liên,
Thanh cao hoa vàng và Hoàng cầm ...........................................................................12
CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU .......................14
2.1.

Nguyên vật liệu, thiết bị..................................................................................14

2.2.

Nội dung nghiên cứu.......................................................................................14

2.3.

Sơ đồ thiết kế nghiên cứu ...............................................................................14

2.4.


Phương pháp nghiên cứu ................................................................................16

CHƯƠNG 3. THỰC NGHIỆM, KẾT QUẢ VÀ VÀ BÀN LUẬN ..........................19
3.1. Kết quả xây dựng cơ sở dữ liệu về đích tác dụng liên quan đến COVID-19
(CSDL1) .....................................................................................................................19
3.2. Kết quả nghiên cứu cây Xuyên tâm liên (Andrographis paniculata (Burm.f.)
Nees., Acanthaceae) ...................................................................................................19
3.3.

Kết quả nghiên cứu cây Thanh cao hoa vàng (Artemisia annua L., Asteraceae)
........................................................................................................................28

3.4. Kết quả nghiên cứu cây Hoàng cầm (Scutellaria baicalensis Georgi.,
Lamiaceae) .................................................................................................................35
3.5.

BÀN LUẬN ....................................................................................................42

KẾT LUẬN VÀ ĐỀ XUẤT .........................................................................................46
TÀI LIỆU THAM KHẢO...........................................................................................48
PHỤ LỤC .........................................................................................................................


DANH MỤC CÁC KÍ HIỆU, CHỮ VIẾT TẮT
3CLP

3-chymotripsin-like protease

AKT1


AKT serine/threonine kinase 1

BP

Biological process (Quá trình sinh học)

CatL

Cathepsin L

CC

Cellular component (Thành phần tế bào)

CSDL

Cơ sở dữ liệu

DL

Drug likeness (Đặc tính giống thuốc)

EGFR

Epidermal growth factor receptor

FDR

False discovery rate (Tỉ lệ phát hiện sai)


GO

Gene Ontology

HIF1A

Hypoxia-inducible factor 1-alpha

HSP90AA1

Heat shock protein HSP 90-alpha

IL1B

Interleukin-1 beta

IL6
KEGG

Interleukin-6
Kyoto Ecyclopedia of Genes and Genomes

MAPK

Mitogen-activated protein kinase

MF

Molecular function (Chức năng phân tử)


Nsp
OB

Non-structural protein (Protein không cấu trúc)
Oral bioavailability (Sinh khả dụng đường uống)

PDB

Protein databank

PLP

Papain-like protease

PPI

Protein-protein interaction (Tương tác protein-protein)

RdRp

RNA-dependent RNA polymerase

RNA

Ribonucleic acid

SARS-CoV-2

Severe Acute Respiratory Syndrome Coronavirus 2


SKD

Sinh khả dụng

SMILES
STAT3

Simplified Molecular Input Line Entry System
Signal transducer and activator of transcription 3

STD

Swiss Target Prediction

TCM

Traditional Chinese Medicine

TCMSP

The traditional Chinese medicine systems pharmacology database
and analysis platform


DANH MỤC CÁC BẢNG
TT

Kí hiệu


1

1.1

2

1.2

3

3.1

Tên bảng
Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược
lý mạng
Một số phần mềm máy tính và thuật tốn được sử dụng
trong nghiên cứu dược lý mạng
7 hợp chất tiềm năng trong tác dụng định hướng điều trị
COVID-19 của Xuyên tâm liên

Trang
6
8
21


DANH MỤC CÁC HÌNH VÀ BIỂU ĐỒ
TT

Kí hiệu


Tên hình và biểu đồ

Trang

1

1.1

Cấu trúc phân cấp của chú thích GO:0051575

10

2

2.1

Sơ đồ thiết kế nghiên cứu

15

3

3.1

Mạng lưới hợp chất - đích tác dụng tiềm năng của Xuyên
tâm liên

20


Biểu đồ phân tích các tham số của các đích tác dụng
4

3.2

trong mạng lưới tương tác hợp chất – đích tác dụng của

21

Xuyên tâm liên
5

3.3

6

3.4

7

3.5

8

3.6

9

3.7


10

3.8

Mạng lưới tương tác protein-protein (PPI) của Xuyên tâm
liên
Biểu đồ phân tích các tham số của các đích tác dụng
trong mạng lưới PPI của Xuyên tâm liên
Kết quả làm giàu GO – Chức năng phân tử của Xuyên
tâm liên
Kết quả làm giàu GO – Thành phần tế bào của Xuyên
tâm liên
Kết quả làm giàu GO – Quá trình sinh học của Xuyên
tâm liên
Kết quả phân tích các con đường KEGG của Xuyên tâm
liên

22
23
23
24
24
25

Con đường bệnh sinh của COVID-19, trong đó các đích
11

3.9

tác dụng tiềm năng của Xuyên tâm liên được đánh dấu


26

màu đỏ
12

3.10

13

3.11

14

3.12

15

3.13

16

3.14

17

3.15

Biểu đồ nhiệt mô phỏng tương tác của 7 hợp chất tiềm
năng trong Xuyên tâm liên

2 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Xuyên tâm liên
Mạng lưới hợp chất - đích tác dụng tiềm năng của Thanh
cao hoa vàng
Mạng lưới tương tác protein-protein (PPI) của Thanh cao
hoa vàng
Kết quả làm giàu GO – Chức năng phân tử của Thanh
cao hoa vàng
Kết quả làm giàu GO – Thành phần tế bào của Thanh cao
hoa vàng

27
28
29
30
31
31


18

3.16

19

3.17

Kết quả làm giàu GO – Quá trính sinh học của Thanh cao
hoa vàng
Kết quả phân tích các con đường KEGG của Thanh cao

hoa vàng

31
32

Con đường bệnh sinh của COVID-19, trong đó các đích
20

3.18

tác dụng tiềm năng của Thanh cao hoa vàng được đánh

33

dấu màu đỏ
21

3.19

22

3.20

23

3.21

24

3.22


25

3.23

26

3.24

27

3.25

28

3.26

Biểu đồ nhiệt mô phỏng tương tác của 6 hợp chất tiềm
năng trong Thanh cao hoa vàng
3 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Thanh cao hoa vàng
Mạng lưới hợp chất - đích tác dụng tiềm năng của Hoàng
cầm
Mạng lưới tương tác protein – protein (PPI) của Hoàng
cầm
Kết quả làm giàu GO – Chức năng phân tử của Hoàng
cầm
Kết quả làm giàu GO – Thành phần tế bào của Hồng
cầm
Kết quả làm giàu GO – Q trình sinh học của Hồng

cầm
Kết quả phân tích các con đường KEGG của Hoàng cầm

34
34
35
36
37
38
38
39

Con đường bệnh sinh của COVID-19, trong đó các đích
29

3.27

tác dụng tiềm năng của Hồng cầm được đánh dấu màu

40

đỏ
30

3.28

31

3.29


Biểu đồ nhiệt mô phỏng tương tác của 5 hợp chất tiềm
năng trong Hoàng cầm
3 hợp chất quan trọng nhất liên quan đến tác dụng định
hướng điều trị COVID-19 của Hoàng cầm

41
41


ĐẶT VẤN ĐỀ
COVID-19 là bệnh gây ra bởi SARS-CoV-2 (Severe Acute Respiratory Syndrome
Coronavirus 2) [33] với tính chất lây lan nhanh và mạnh. Theo số liệu thống kê của Bộ
Y tế [62], tính đến ngày 25/05/2022, trên thế giới đã có hơn 500.000.000 ca nhiễm, với
6.302.057 trường hợp tử vong. Riêng tại Việt Nam đã có gần 11.000.000 ca nhiễm.
COVID-19 đã gây ra những tổn thất nặng nề ở nhiều quốc gia trên thế giới nói chung
cũng như ở Việt Nam nói riêng.
Bên cạnh các thuốc hóa dược, một số sản phẩm có nguồn gốc tự nhiên đã có
những thành cơng nhất định trong việc phịng chống dịch SARS (2003), H1N1 (2009)
cũng như kiểm soát COVID-19 ở Trung Quốc. Điều này cho thấy phát triển thuốc điều
trị COVID-19 có nguồn gốc tự nhiên là một hướng đi triển vọng. Một số cây thuốc bước
đầu đã được chứng minh có tác dụng ức chế SARS-CoV-2 hoặc giải quyết các triệu
chứng của COVID-19, trong đó đáng chú ý là Xuyên tâm liên [39], Thanh cao hoa vàng
[32] và Hoàng cầm [27], Tuy nhiên, các hoạt chất cũng như cơ chế tác dụng của những
cây thuốc này vẫn chưa được nghiên cứu một cách đầy đủ.
Trên thế giới, cuộc Cách mạng công nghiệp lần thứ tư đang diễn ra với phạm vi,
chiều sâu và tốc độ chưa từng có tiền lệ trong lịch sử. Những tiến bộ về tin sinh học
(bioinformatics), sự bùng nổ của các cơ sở dữ liệu trong đó có các dữ liệu lớn (big data)
cùng với các phần mềm máy tính đã trở thành những cơng cụ đắc lực trong lĩnh vực
nghiên cứu phát triển thuốc.
Dược lý mạng (Network pharmacology) là một phương pháp tiếp cận mới và độc

đáo trong quá trình nghiên cứu phát triển thuốc với sự hỗ trợ của các cơ sở dữ liệu và
máy tính. Dược lý mạng mô tả mối liên quan phức tạp giữa các yếu tố của bệnh, hệ
thống sinh học của cơ thể người và các đích tác dụng của thuốc điều trị thơng qua các
mạng lưới. Từ đó cho phép tìm hiểu cơ chế tác dụng của thuốc, chỉ ra các đích tác dụng
cũng như các q trình sinh học và con đường có sự can thiệp của thuốc liên quan đến
một bệnh cụ thể. Với mơ hình nghiên cứu mạng lưới đa đích tác dụng - nhiều thành
phần, dược lý mạng đã nhanh chóng được ứng dụng rộng rãi trong việc nghiên cứu thành
phần hoạt chất và cơ chế tác dụng của các thuốc gồm nhiều thành phần nói chung cũng
như thuốc thảo dược nói riêng.
Mơ phỏng tương tác phân tử (Molecular docking) là kỹ thuật quan trọng để sàng
lọc các hợp chất có hoạt tính sinh học thơng qua việc dự đoán khả năng liên kết của
protein và phối tử mà không cần tiến hành thực nghiệm. Việc kết hợp dược lý mạng và
mô phỏng tương tác phân tử trong việc sàng lọc hoạt chất và dự đoán cơ chế tác dụng
của các thảo dược giúp giảm thiểu số thí nghiệm cần thực hiện, do đó tiết kiệm đáng kể
thời gian và chi phí so với các phương pháp nghiên cứu truyền thống.

1


Vì những lý do trên, đề tài khóa luận “Nghiên cứu in silico mối liên quan giữa
thành phần hóa học và tác dụng sinh học định hướng điều trị COVID-19 của một
số cây thuốc” được thực hiện với ba mục tiêu sau:
1. Dự đốn các hợp chất và các đích tác dụng tiềm năng theo định hướng điều
trị COVID-19 của Xuyên tâm liên, Thanh cao hoa vàng và Hoàng cầm.
2. Dự đốn các q trình sinh học và con đường liên quan đến các đích tác dụng
tiềm năng định hướng điều trị COVID-19 của ba cây thuốc.
3. Mô phỏng tương tác phân tử của các hợp chất tiềm năng có trong ba cây thuốc
với protein của SARS-CoV-2.

2



CHƯƠNG 1. TỔNG QUAN
1.1.

Tổng quan về SARS-CoV-2 và COVID-19
SARS-CoV-2 (Severe Acute Respiratory Syndrome Coronavirus 2) [33] thuộc

phân họ Coronaviriae, họ Coronaviridae, bộ Nidovirales [4]. SARS-CoV-2 thuộc cùng
phân họ với coronavirus gây hội chứng hơ hấp cấp tính nghiêm trọng (SARS-CoV) và
coronavirus gây hội chứng hô hấp Trung Đông (MERS-CoV). Mặc dù nguồn gốc của
SARS-CoV-2 vẫn chưa được xác định chính xác song phần lớn các nhà khoa học đều
công nhận virus này có nguồn gốc từ động vật và liên quan tới việc lây nhiễm từ động
vật sang người. SARS-CoV-2 có xu hướng tiến hóa di truyền và hình thành các biến thể
có thể có các đặc tính khác so với virus gốc, đặc biệt là việc nâng cao khả năng lây
truyền hoặc độc lực, giảm tác động của các kháng thể thu được từ quá trình nhiễm trùng
tự nhiên hoặc tiêm chủng, từ đó giảm hiệu quả điều trị và/hoặc hiệu lực của vaccin. Một
số biến thể SARS-CoV-2 phổ biến bao gồm Alpha (B.1.1.7 linegae) (12/2020), Beta
(B.1.351 linegae) (10/2020), Gamma (P.1 lineage) (12/2020), Delta (B.1.617.2 linegae)
(12/2020) và Omicron (B.1.1.529 linegae) (11/2021) [6].
1.1.1. Các triệu chứng lâm sàng
Theo Tổ chức Y tế thế giới (WHO), COVID-19 là bệnh truyền nhiễm gây ra bởi
SARS-CoV-2 [66]. Thời gian ủ bệnh thường kéo dài từ 2-14 ngày, trung bình là 5-7
ngày. Khởi phát ban đầu với triệu chứng hay gặp là sốt, ho khan, mệt mỏi và đau cơ.
Một số trường hợp đau họng, nghẹt mũi, chảy nước mũi, đau đầu, ho có đờm, nôn và
tiêu chảy. Hầu hết người bệnh (khoảng hơn 80%) là ca bệnh nhẹ không bị viêm phổi và
thường tự hồi phục sau 1 tuần, một số trường hợp dương tính với virus thậm chí khơng
có biểu hiện triệu chứng lâm sàng [1].
Những trường hợp diễn biến thành ca bệnh nặng bắt đầu xuất hiện triệu chứng
sau khoảng từ 7-8 ngày. Các biểu hiện nặng bao gồm: viêm phổi, viêm phổi nặng cần

nhập viện… Trong đó khoảng 5% bệnh nhân cần điều trị tại các đơn vị hồi sức tích cực
với các biểu hiện hơ hấp cấp (thở nhanh, khó thở, tím tái,…), hội chứng suy hơ hấp cấp
tiến triển (ARDS), sốc nhiễm trùng, suy chức năng các cơ quan bao gồm tổn thương
thận và tổn thương cơ tim, dẫn đến tử vong [1].
1.1.2. Nguyên tắc điều trị
Theo Hướng dẫn chẩn đoán và điều trị COVID-19 của Bộ Y tế [1], các nhóm
thuốc được sử dụng trong điều trị COVID-19 bao gồm: các thuốc kháng virus
(Remdesivir), các kháng thể kháng virus (Casirivimab), thuốc ức chế Interleukin-6
(Tocilizumab), thuốc corticoid (Dexamethason), thuốc chống đông (Heparin). Bệnh
nhân được phân loại dựa theo mức độ nguy cơ và được điều trị kết hợp giữa sử dụng
thuốc và các phương pháp điều trị đặc biệt khác như ECMO, dinh dưỡng và phục hồi
chức năng.
3


1.1.3. Các mục tiêu phân tử của SARS-CoV-2
Các mục tiêu ức chế SARS-CoV-2 tiềm năng được xác định là những mục tiêu
phân tử có vai trị quan trọng trong vịng đời, quá trình xâm nhập hay quá trình nhân lên
của virus.
Main protease (Mpro) hay 3-chymotrypsin-like protease (3CLP) là một protein
được mã hóa bởi gen có trong tất cả các biến chủng SARS-CoV-2 có vai trị quan trọng
trong sự nhân lên cũng như cả vòng đời của virus. 3CLP cũng đã được chứng minh là
một đích tác dụng tiềm năng của thuốc trong các ca nhiễm SARS-CoV và MERS-CoV
trước đó [29, 48].
Protein gai hay S-protein là một đích tác dụng được các nhà nghiên cứu khai
thác để tạo vaccin COVID-19, gồm 2 tiểu đơn vị đóng vai trị quan trọng trong quá trình
gắn kết với tế bào chủ và quá trình xâm nhập của virus vào tế bào [2].
Cathepsin L (CatL) là một protein giúp loại tiểu đơn vị S1 và thúc đẩy q trình
hịa màng của virus, giải phóng RNA và q trình nhân lên của virus. Có ít nhất 7 chất
ức chế chọn lọc CatL cho thấy hiệu quả trong việc ngăn chặn lây nhiễm và có ít nhất 10

thuốc được FDA phê duyệt cho thấy có hoạt động ức chế CatL [28].
ARN polymerase phụ thuộc ARN (RdRp) hay Nsp12 là một enzym quan trọng
trong vòng đời của virus có tác dụng tăng tốc độ sao chép ARN. Remdesivir là một
thuốc có khả năng ức chế cạnh tranh với ATP của RdRp và can thiệp vào quá trình tổng
hợp ARN của virus [25, 29]. Helicase (Nsp13) cùng với RdRp tạo điều kiện thuận lợi
cho quá trình phiên mã và sao chép của ARN, do đó có vai trị hết sức quan trọng quá
trình nhân lên của virus [25].
Papain-like protease (PLP) là một protein quan trọng trong q trình kích hoạt
sự lây nhiễm nhờ tính đối kháng interferon của nó. Ngồi ra PLP cùng với 3CLP là hai
enzym chính chịu trách nhiệm phân tách các polyprotein của SARS-CoV-2 và có vai trò
quan trọng trong sự nhân lên của virus [25, 29].
Furin là một enzym protease liên kết màng loại 1 thuộc họ proprotein convertase
(PPC), có tác dụng kích hoạt các protein ở dạng tiền chất. Furin có thể tác động đến
nhiều loại protein bao gồm cả gycoprotein bề mặt của virus. Đây là một tác nhân quan
trọng để kích hoạt protein gai của SARS-CoV-2 [49]. Ngoài ra, furin cũng tập trung với
số lượng lớn ở phổi nhằm tăng khả năng lây nhiễm của SARS-CoV-2 [25].
Methyltransferase (Nsp16) là một trong số các protein khơng cấu trúc (Nsp)
của SARS-CoV-2 đóng vai trị quan trọng trong quá trình dịch mã và nhân lên của virus.
Methytransferase có chức năng methyl hóa mũ ARN ở vị trí ribose-2’-O giúp bảo vệ
virus khỏi sự phân hủy do 5’-3’-exoribonuclease [30].

4


EndoRNAse là enzym có thể phân cắt cả RNA sợi đơn và sợi kép, đóng vai trị
quan trọng trong q trình nhân lên của virus. Protein này là đích tác dụng của một số
thuốc đang được lưu hành hiện nay như Sempremivir và Nelfinavir [29].
1.2.

Tổng quan về dược lý mạng (Network pharmacology)


1.2.1. Khái niệm dược lý mạng
Trước đây, trong một khoảng thời gian dài, thuốc mới thường được phát triển
thông qua việc sàng lọc, tìm kiếm ngẫu nhiên từ thực vật, động vật và khoáng chất trong
tự nhiên. Năm 2000, việc giải mã thành cơng trình tự bộ gen người đã tạo nên một bước
ngoặt quan trọng trong lĩnh vực nghiên cứu phát triển thuốc mới. Kể từ đây, các thuốc
mới được phát triển dựa theo mục tiêu phân tử cụ thể. Các protein mà thuốc liên kết
hoặc tác dụng được gọi là “đích”. Phương pháp tiếp cận một thuốc - một đích tác dụng
- một bệnh được tiếp tục trong thời gian dài sau đó. Kết quả tạo ra hàng loạt thuốc điều
trị có tác dụng đặc hiệu và chọn lọc tại đích. Tuy nhiên, cách tiếp cận này chưa mang
lại hiệu quả khi nghiên cứu các thuốc thảo dược với thành phần hóa học phức tạp và cơ
chế tác dụng chưa rõ ràng. Tác dụng điều trị của thuốc thảo dược thường liên quan đến
nhiều thành phần, nhiều đích tác dụng, nhiều q trình sinh học và con đường khác nhau,
do đó, cần tiếp cận nghiên cứu dựa trên mơ hình mạng lưới đa đích tác dụng - nhiều
thành phần [7].
Năm 2007, Andrew L. Hopkins lần đầu tiên đưa ra khái niệm về dược lý mạng
(Network pharmacology) [19] - một phương pháp tiếp cận mới tích hợp lý thuyết mạng
(Network theory) và các nguyên lý sinh học hệ thống (system biology principles) trong
lĩnh vực nghiên cứu phát triển thuốc. Thông qua các mạng lưới, mối liên quan phức tạp
giữa các yếu tố của bệnh, hệ thống sinh học của cơ thể người và các đích tác dụng của
thuốc điều trị được mô tả rõ ràng ở mức độ phân tử. Từ đó cho phép tìm hiểu cơ chế tác
dụng của thuốc, chỉ ra các đích tác dụng cũng như các q trình sinh học và con đường
có sự can thiệp của thuốc liên quan đến một bệnh cụ thể.
Kể từ khi ra đời đến nay, dược lý mạng ngày càng thể hiện tính ưu việt và được
ứng dụng rộng rãi trong lĩnh vực nghiên cứu phát triển thuốc. Nhiều nghiên cứu đã sử
dụng dược lí mạng để tìm hiểu và dự đoán cơ chế tác dụng định hướng điều trị COVID19 của Xuyên tâm liên [51, 61], Thanh cao hoa vàng [46] và Hoàng cầm [44].
1.2.2. Xây dựng và phân tích mạng lưới
Mạng lưới là sơ đồ tương tác giữa các nút (node), trong đó, các nút này có thể là
các hợp chất hoặc đích tác dụng (gen/protein). Các nút được kết nối với nhau bằng các
cạnh (edge) để biểu thị mối quan hệ giữa chúng.

Mạng lưới được xây dựng bằng các phần mềm máy tính dựa trên cơ sở các thông
tin về các nút và các cạnh. Thông tin để xây dựng mạng lưới thường được thu thập từ

5


các cơ sở dữ liệu sẵn có. Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược lý
mạng được trình bày ở Bảng 1.1.
Bảng 1.1. Một số cơ sở dữ liệu thường dùng trong nghiên cứu dược lý mạng [57, 59]
TT
1

Tên CSDL
TCM-Mesh

Mơ tả

Đường dẫn truy cập

Mạng lưới tích hợp dữ liệu và hệ .
thống phân tích dữ liệu dược lý microbioinformatics.org
mạng các chế phẩm TCM

2
3

TCM

database Cơ sở dữ liệu các phân tử nhỏ


@Taiwan

trong sàng lọc ảo TCM

TCMSP

Nền tảng hệ thống dược lý mạng />của TCM gồm có các mối quan tcmsp.php
hệ giữa thuốc, đích và bệnh tật

4

HIT

Cơ sở dữ liệu về các tài nguyên />hiện có về các đích protein của hit
thuốc được FDA phê duyệt cũng
như các hợp chất có tiềm năng

5

TCMID

Cơ sơ dữ liệu cung cấp thông tin abionet.
là cầu nối giữa TCM với khoa học org/tcmid
hiện đại

6

ProteinData

Cơ sở dữ liệu cho dữ liệu cấu trúc


Bank

ba chiều của các phân tử sinh học
lớn như protein và acid nucleic

7

ChEMBL

Cơ sở dữ liệu chứa thông tin về />cấu trúc, chức năng và các thông hembl
số dược động học của nhiều hợp
chất có hoạt tính sinh học giống
thuốc

8

PubChem

Hệ thống thơng tin phân tích các i.
hợp chất có hoạt tính sinh học và nlm.nih.gov
các hợp chất phân tử nhỏ

9

STRING

Cơ sở dữ liệu về các tương tác. đã
biết hoặc dự đốn của protein với
protein


10

HPRD

Cơ sở dữ liệu tích hợp nhiều
thông tin liên quan tới chức năng
6


của protein người trong sức khoẻ
và bệnh tật
11

MINT

Cơ sở dữ liệu tập trung vào các roma
tương tác protein-protein đã được 2.it
xác nhận bằng thực nghiệm được
khai thác từ các bài báo khoa học
bởi các hội đồng chuyên gia

12

IntAct

Cơ sở dữ liệu mở và cơng cụ phân />tích các tương tác phân tử

13


HAPPI

tact

Cơ sở dữ liệu trực tuyến về chú orma
thích và dự đoán tương tác tics.uab.edu/HAPPI
protein trong cơ thể người

14

OMIM

Danh mục về gen người cùng các
kiểu hình gen được xác minh và
cập nhật hàng ngày

15

GAD

Cơ sở dữ liệu về các thông tin liên https://geneticassociatio
quan tới gen từ các bệnh và rối ndb.nih.gov
loạn phức tạp

16

TTD

Cung cấp các mục tiêu, protein và />con đường của bệnh tật và các
thông tin thuốc liên quan, được

liên kết với các CSDL khác

17

CTD

Cung cấp các thông tin về tương
tác gen, bệnh tật và các quan hệ
giữa các gen

18

DisGeNet

Gồm thông tin từ cơ sở dữ liệu
công cộng, danh sách động thực g
vật hoang dã tồn cầu, mơ hình
động vật và tài liệu khoa học

19

Drugbank

Cung cấp thơng tin về phân tử hố
học cũng như các tính chất hố lý,
thơng số dược lực học và các đích
tác dụng

20


SwissTarget
Prediction

Chứa thơng tin của hơn 376.000 sstargetp
hợp chất hoạt động thử nghiệm rediction.ch
trên hơn 3000 đích tác dụng đại

7


phân tử, có thể dự đốn các mục
tiêu đại phân tử protein
21

TargetNet

Dự đoán hoạt động của các phân
tử sau khi mơ phỏng qua nhiều m
mơ hình mối quan hệ giữa cấu
trúc và hoạt tính

22

Genecards

GeneCards là một cơ sở dữ liệu ecards.
về gen của con người cung cấp org
thông tin về gen, proteomic,
phiên mã, di truyền và chức năng
về tất cả các gen người đã biết và

được dự đoán

Một số phần mềm máy tính và thuật tốn được sử dụng trong nghiên cứu dược
lý mạng được trình bày ở Bảng 1.2.
Bảng 1.2. Một số phần mềm máy tính và thuật toán được sử dụng trong
nghiên cứu dược lý mạng [57, 59]
TT
1

Tên
Random walk

Mơ tả

Đường dẫn truy cập

Thuật tốn cho phép dự đốn các https:
tương tác thuốc-đích tác dụng //www.rdocumentation.
tiềm năng theo quy mô lớn dựa org/packages/diffusr/
trên giả thuyết rằng các thuốc versions/0.1.4/topics/
tương tự nhau thường tương tác random.walk
với các đích tương tự nhau

2

PRINCE

Thuật toán dựa trên mạng lưới để />ưu tiên các gen gây bệnh và qua fosterlab/PrInCE
đó suy ra các liên kết phức tạp của Vanunu et al.,
protein


3

Cytoscape

201

Môi trường phần mềm cho các
mơ hình tích hợp mạng lưới
tương tác của các phân tử sinh
học

4

DAVID

Cung cấp các chú thích một cách
có hệ thống và dễ hiểu, giúp phân
tích bộ gen đầu vào với số lượng
lớn
8


5

Bioinformatics

Sử dụng để dự đốn và phân tích />
analysis tool for các đích tác dụng tiềm năng của atman-tcm
molecular

Mechanism
TCM

các thành phần TCM, trình bày
of mạng lưới thành phần – đích tác
dụng – con đường – bệnh và làm
nổi bật các con đường sinh học
của đích tác dụng

6

Venny [34]

Cơng cụ giúp phân tích và minh c
hoạ sơ đồ ven

.es/tools/venny/index.ht
ml

7

ShinnyGO [14]

Cơng cụ làm giàu bộ gen và biểu
diễn kết quả dưới dạng đồ họa cho tate.edu/go/
động vật và thực vật

Trong số các phần mềm, Cytoscape [42] là một phần mềm hữu ích để trực quan
hóa các mạng lưới tương tác. Ngồi Cytoscape, có một số cơng cụ khác như Visual
Network Pharmacology, Gephi, Cell Illustrator cũng có thể được sử dụng với mục đích

tương tự.
Mạng lưới sau khi xây dựng và trực quan hố bằng phần mềm Cytoscape sẽ được
phân tích bằng ứng dụng có sẵn trong Cytoscape như CytoNCA hoặc các cơng cụ phân
tích khác.
Nhiều nghiên cứu
1.3.

Giới thiệu Gen Ontology - GO

1.3.1. Một số khái niệm
Ontology (bản thể học) là một thuật ngữ được sử dụng rộng rãi trong khoa học
máy tính và khoa học thơng tin để chỉ một tập hợp các khái niệm và mối quan hệ của
chúng nhằm mô tả một vấn đề cụ thể theo một định dạng có thể mà máy tính có thể hiểu
được, từ đó cho phép ứng dụng trong nhiều lĩnh vực khác nhau như tin sinh học, trí tuệ
nhân tạo, kỹ thuật thông tin… Ontology được đặc trưng bởi nhiều yếu tố như lớp (class),
siêu dữ liệu (metadata), mối quan hệ (relation), định lý (axiom). Trong đó, cách biểu
diễn mối quan hệ (relation) giữa các khái niệm đóng vai trị chính trong việc giúp cho
máy tính có thể hiểu và xử lý được thông tin, đồng thời cũng là yếu tố quan trọng khi
ứng dụng Ontology trong nghiên cứu gen [12].
Mối quan hệ giữa các khái niệm trong bản thể học được sắp xếp theo một hệ
thống phân cấp. Bản thể học giúp việc chú thích các thuật ngữ trở nên có hệ thống và có
thể xử lý được bằng máy tính. Từ đó giúp cho việc diễn giải thuật ngữ liên ngành được
thuận tiện, đặc biệt đối với dữ liệu lớn (big data). Các cơ sở dữ liệu như ChEBI, FMA,
9


Disease Ontology đều là những ví dụ của Ontology. Bản thân Gen Ontology (GO) cũng
đồng thời là một ứng dụng của Ontology.
Gen là một vùng tiếp giáp với ADN, mã hóa cho một hay nhiều đại phân tử khác
nhau [12].

Các đại phân tử (Large molecular/Macromolecular) là các sản phẩm của gen
do được tạo ra nhờ thơng tin từ trình tự gen. Đại phân tử gồm hai loại: một là protein (là
loại phổ biến nhất), và ARN khơng mã hóa (non-coding RNA). Các sản phẩm của gen
này có thể được ví như một cỗ máy phân tử để thực hiện một chức năng nhất định. Các
đại phân tử mã hóa từ nhiều gen khác nhau cũng có thể kết hợp lại để tạo thành một
phức hợp đại phân tử (complex) [12].
Chức năng phân tử (Molecular Function - MF) là một quá trình sinh hóa được
thực hiện bởi đại phân tử hoặc vai trị của đại phân tử trong hệ thống. Ví dụ, thuật ngữ
GO:0051575 - 5'-deoxyribose-5-phosphate lyase activity được định nghĩa là “xúc tác
cho loại bỏ beta của 5’-deoxyribose-5-phosphat tại vị trí base trong DNA nơi DNA(apurinic hoặc apyrimidinic) lyase đã cắt liên kết C-O-P 3’ thành apurinic hoặc
apyrimindinic”. Thuật ngữ này có 7 gen liên quan [63]. Cấu trúc phân cấp cho thuật ngữ
này được thể hiện ở Hình 1.1.

Hình 1.1. Cấu trúc phân cấp của chú thích GO:0051575 [63]
Thành phần tế bào (Cellular Component - CC) là vị trí trong tế bào hoặc các
khoang trong cơ thể mà tại đó các đại phân tử thực hiện các chức năng phân tử. Thành
phần tế bào cung cấp thông tin cho việc chức năng phân tử được diễn ra ở đâu trong cơ
thể. Ví dụ, thuật ngữ GO:0009986 -cell surface được định nghĩa là “phần bên ngoài của
thành tế bào và/hoặc màng sinh chất” [65]. Thành phần tế bào hướng tới khía cạnh giải
phẫu tế bào hơn là đề cập tới các q trình sinh học. Do đó, khi phân tích làm giàu GO
(GO enrichment analysis), hai khía cạnh cịn lại của GO là chức năng phân tử (MF) và
quá trình sinh học (BP) thường được đề cập đến nhiều hơn.
10


Quá trình sinh học (Biological Process - BP) là các mục tiêu cụ thể mà sinh vật
được lập trình về mặt di truyền. Tên của quá trình sinh học thường mô tả kết quả hay
trạng thái khi kết thúc quá trình đó. Ví dụ, q trình sinh học “phân chia tế bào” có kết
quả là sự tạo thành hai tế bào con từ một tế bào mẹ. Trong mỗi quá trình sinh học thường
đi kèm theo nhiều chức năng phân tử và được thực hiện bởi các sản phẩm gen cụ thể.

Đây là khía cạnh lớn nhất, đa dạng nhất trong GO. Các q trình sinh học có thể là q
trình phản ứng của enzym như “phản ứng phosphoryl hóa protein”, là con đường phân
tử như “quá trình đường phân”, hoặc các con đường lớn phức tạp như “sinh sản”.
1.3.2. Làm giàu GO (GO enrichment)
Như đã đề cập ở trên, Ontology là hệ thống các khái niệm có cấu trúc và có thể
sử dụng các cơng cụ tính tốn bằng máy tính. Đối với GO, mỗi một thuật ngữ (GO term)
có thể được xác định dựa trên 3 khía cạnh: chức năng phân tử, quá trình sinh học và
thành phần tế bào. Ví dụ, gen FasR được xác định với chức năng phân tử là một receptor,
gắn với quá trình sinh học apoptosis, và có thành phần tế bào ở màng plasma.
Làm giàu GO (GO enrichment) là một kỹ thuật sử dụng hệ thống chú thích của
GO để diễn giải một tổ hợp gen, từ đó xác định các chức năng phân tử, quá trình sinh
học và thành phần tế bào có liên quan tới nhóm gen đó. Các thuật tốn làm giàu GO
thực chất là một phân tích thống kê để xác định rằng tập hợp các thuật ngữ GO đó có
liên quan tới một bộ gen cho trước hay không dựa trên các tham số thống kê như giá trị
p (p-value) hay tỉ lệ phát hiện sai (False Discovery Rate – FDR).
Có nhiều phương pháp để làm giàu bản thể học gen như: phép kiểm tra độ chính
xác Fisher, phương pháp thống kê Bayes, hay phương pháp đa so sánh - hiệu chỉnh
Bonferroni. Trong đó, phương pháp đa so sánh (multiple testing) được nhiều nghiên cứu
dược lý mạng sử dụng và kiểm soát tham số FDR được Hiệp hội Sinh lý học Hoa Kì
xem xét như một giải pháp thực tiễn nhất cho việc đánh giá kết quả của phương pháp
này [14].
1.4.

KEGG và làm giàu KEGG (KEGG enrichment)

KEGG là viết tắt của Kyoto Encyclopedia of Genes & Genomes – Bách khoa toàn
thư về gen và bộ gen, được xây dựng bởi Trường Đại học Kyoto, Nhật Bản nhằm mục
đích tìm hiểu các chức năng của cơ thể từ các thông tin ở mức độ phân tử, đặc biệt là từ
dữ liệu là kết quả của các nghiên cứu thơng lượng cao như giải trình tự bộ gen.
Một trong số những nội dung của KEGG là con đường KEGG (KEGG pathway)

- một tập hợp các sơ đồ con đường sinh học được vẽ thủ công biểu diễn các thông tin đã
biết về tương tác phân tử, phản ứng và mạng lưới quan hệ của q trình chuyển hóa, q
trình thơng tin gen, q trình tế bào, hệ thống sinh vật, các bệnh trên người (trong đó có
COVID-19), phát triển thuốc và q trình thơng tin mơi trường.

11


Việc phân tích làm giàu KEGG (KEGG enrichment) giúp trực quan hóa các con
đường sinh học có thể liên quan tới tổ hợp gen đầu vào, qua đó giúp tìm hiểu các cơ chế
tác dụng của các hợp chất ban đầu tới các quá trình trong cơ thể [23]. Một con đường
KEGG có thể có sự tham gia của nhiều đích và gồm nhiều q trình sinh học (biological
process) khác nhau.
1.5.

Mô phỏng tương tác phân tử (Molecular docking)
Mô phỏng tương tác phân tử là phương pháp dự đoán khả năng liên kết giữa

protein và phối tử ở các trạng thái (vị trí và hướng trong khơng gian 3 chiều) khác nhau.
Cụ thể, phối tử sẽ được di chuyển xung quanh vùng tìm kiếm định sẵn trong bước chuẩn
bị protein và ứng với mỗi trạng thái của phối tử, năng lượng liên kết protein-phối tử sẽ
được ghi lại, từ đó, xác định trạng thái có năng lượng liên kết thấp nhất. Giá trị năng
lượng liên kết có thể được tính theo nhiều cách như: dựa trên tương tác Van der Waals,
tương tác tĩnh điện; dựa trên tương tác giữa các nhóm thân nước và liên kết hydro; dựa
trên tương tác đã biết của các cặp phức hợp có cấu trúc tương tự trong cơ sở dữ liệu.
Mô phỏng tương tác phân tử là một công cụ quan trọng trong sinh học phân tử
cấu trúc và thiết kế thuốc với sự hỗ trợ của máy tính. Một trong những ứng dụng quan
trọng của mô phỏng tương tác phân tử là sàng lọc các hợp chất có hoạt tính sinh học dựa
trên các mục tiêu phân tử cụ thể.
1.6.


Thành phần hóa học và tác dụng liên quan đến COVID-19 của Xuyên tâm
liên, Thanh cao hoa vàng và Hoàng cầm

1.6.1. Xuyên tâm liên
Tên khoa học: Andrographis paniculata (Burm.f.) Nees., Acanthaceae.
Bộ phận dùng: Bộ phận trên mặt đất
Thành phần hố học chính: Flavonoid, diterpen lacton. Các hợp chất trong Xuyên
tâm liên được trình bày chi tiết ở Phụ lục 2.
Tác dụng ức chế SARS-CoV-2: Xuyên tâm liên và thành phần hóa học chính andrographolid thể hiện tác dụng ức chế SARS-CoV-2 in vitro mạnh và rõ rệt với giá
trị IC50 lần lượt là 0,036 µg/ml và 0,034 µM [39].
Tác dụng chống viêm: Dịch chiết methanol của Xuyên tâm liên thể hiện tác dụng
ức chế đáng kể triệu chứng viêm do carrageenan gây ra ở chuột BALB/c [43]. Dịch chiết
Xuyên tâm liên đã ngăn chặn sự xâm nhập của bạch cầu trung tính và tế bào lympho,
làm giảm đáng kể việc sản xuất quá mức các cytokin và chemokin bao gồm IL-1β, IL6, CXCL-1, MCP-1 và RANTES theo cách phụ thuộc vào liều lượng. Hơn nữa, Xun
tâm liên cịn có thể ngăn chặn sự kích hoạt con đường NF-κB do mầm bệnh gây ra [60].
Tác dụng điều hòa miễn dịch: Nghiên cứu sử dụng 200mg sản phẩm chiết chuẩn
hoá từ Xuyên tâm liên mỗi ngày trong 30 ngày và phân tích thành phần máu bằng đo tế
bào máu dịng chảy, kết quả cho thấy có sự tăng đáng kể tế bào T (T cell) và tế bào T
12


hỗ trợ (T helper cell) tại ngày thứ 7 và ngày thứ 30 đồng thời giảm đáng kể IFN-γ, IL-4
và IL-2 ở ngày thứ 30 [36].
Tác dụng hạ sốt: Dịch chiết Xuyên tâm liên trong nước và cloroform đều cho
thấy tác dụng hạ sốt ở chuột khi so sánh với chiết xuất ete dầu hỏa và methanol, tác dụng
do các thành phần diterpen lacton [9, 11, 45].
1.6.2. Thanh cao hoa vàng
Tên khoa học: Artemisia annua L., Asteraceae.
Bộ phận dùng: Bộ phận trên mặt đất

Thành phần hố học chính: Flavonoid, sesquirterpen lacton. Các hợp chất trong
Thanh cao hoa vàng được trình bày chi tiết ở Phụ lục 5.
Tác dụng ức chế SARS-CoV-2: Cao chiết nước nóng từ Thanh cao hoa vàng có
tác dụng ức chế SARS-CoV-2 trong tế bào Vero E6 in vitro với IC50 là 8,7 µg/ml.
Artemisinin là thành phần chính cũng thể hiện tác dụng với IC50 là 70 µM [32].
1.6.3. Hoàng cầm
Tên khoa học: Scutellaria baicalensis Georgi., Lamiaceae.
Bộ phận dùng: Rễ
Thành phần hố học chính: Flavonoid, alcaloid. Các hợp chất trong Hồng cầm
được trình bày chi tiết ở Phụ lục 8.
Tác dụng ức chế SARS-CoV-2: Cao chiết ethanol 70% của Hồng cầm có tác
dụng ức chế sự nhân lên của SARS-CoV-2 in vitro với giá trị IC50 là 8,5 µg/ml. Thành
phần chính là baicalein cũng có khả năng ức chế SARS-CoV-2 với giá trị IC50 là 0,39
µM [27].
Tác dụng chống viêm: Hoàng cầm đã được nghiên cứu khả năng chống viêm
thông qua việc ức chế tạo ra NO, COX2, PEG2 [56] và các cytokin, chemokin [56, 58].
Tác dụng chống viêm được thử nghiệm in vivo thể hiện thông qua việc làm giảm phù
chân chuột do carrageenan gây ra [20].

13


CHƯƠNG 2. ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.1.

Nguyên vật liệu, thiết bị
Thiết bị sử dụng để nghiên cứu in silico là máy tính.
Các phần mềm: Cytoscape 3.8.0, Microsoft Excel, Venny 2.0, ShinyGO 0.7.4,

MoE 2009.

Các cơ sở dữ liệu: GeneCards, Uniprot, STRING, SwissTargetPrediction.
2.2.

Nội dung nghiên cứu

2.2.1. Thu thập thông tin về đích tác dụng liên quan tới COVID-19 trên người
(CSDL1).
2.2.2. Thu thập thơng tin về thành phần hóa học của Xuyên tâm liên, Thanh cao hoa
vàng, Hoàng cầm và sàng lọc các hợp chất đạt yêu cầu về sinh khả dụng đường
uống.
2.2.3. Thu thập thơng tin về đích tác dụng của các hợp chất trong các cây thuốc
(CSDL2). Xác định các đích tác dụng tiềm năng.
2.2.4. Xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm năng. Từ đó
chỉ ra các hợp chất tiềm năng tác dụng định hướng điều trị COVID-19 của các
cây thuốc.
2.2.5. Xây dựng và phân tích mạng lưới tương tác protein - protein (Protein-protein
interaction - PPI) của các đích tác dụng tiềm năng. Từ đó chỉ ra các đích tác
dụng trung tâm của mạng lưới.
2.2.6. Phân tích làm giàu GO và con đường KEGG.
2.2.7. Mô phỏng tương tác phân tử của các hợp chất tiềm năng với protein của
SARS-CoV-2.
2.3.

Sơ đồ thiết kế nghiên cứu

Sơ đồ thiết kế nghiên cứu được trình bày ở Hình 2.1.

14



Hình 2.1. Sơ đồ thiết kế nghiên cứu
15


2.4.

Phương pháp nghiên cứu

2.4.1. Phương pháp thu thập thông tin về đích tác dụng liên quan tới COVID-19
(CSDL1)
GeneCards [37] ( là một cơ sở dữ liệu về gen của
con người cung cấp thông tin về gen, proteomic, phiên mã, di truyền và chức năng về
tất cả các gen người đã biết và được dự đoán. Các gen liên quan tới COVID-19 trên
người (CSDL1) được thu thập từ cơ sở dữ liệu GeneCards, sử dụng từ khóa “SARSCoV-2, COVID-19”. Tập hợp các gen này sẽ hình thành cơ sở dữ liệu về các đích tác
dụng liên quan tới COVID-19 trên người (CSDL1), được trình bày ở Phụ lục 1.
2.4.2. Phương pháp thu thập thơng tin về thành phần hóa học của cây thuốc và sàng
lọc các hợp chất đạt yêu cầu về sinh khả dụng đường uống
TCMSP (The traditional Chinese medicine systems pharmacology database and
analysis platform) [38] là một cơ sở dữ liệu chứa hơn 499 dược liệu có trong Dược điển
Trung Quốc, với gần 30.000 hoạt chất, 3.400 đích tác dụng và hơn 800 các bệnh liên
quan. Tìm kiếm trên TCMSP với từ khóa là tên khoa học của cây thuốc (Andrographis
paniculata, Artemisia annua, Scutellaria baicalensis). Tuy nhiên, trong TCMSP vẫn
cịn chưa được cập nhật đầy đủ thơng tin về thành phần hóa học của Xuyên tâm liên. Do
đó thành phần hóa học của cây thuốc này sẽ được thu thập thêm từ một số nguồn thông
tin khác như PubMed, Google Scholar.
Các hợp chất thu thập được sẽ được quản lý theo ID và tiến hành dự đốn các
đặc tính về sinh khả dụng đường uống (OB) sử dụng phần mềm ADMETlab 2.0 [53].
Thông số đánh giá sinh khả dụng đường uống là F(30%), nhận các giá trị nằm trong
khoảng từ 0 đến 1. Các hợp chất có giá trị F(30%)  0,3 có xác suất sinh khả dụng
đường uống trên 30% tốt nhất sẽ được lựa chọn [64].

2.4.3. Phương pháp thu thập thơng tin về đích tác dụng của các hợp chất trong cây
thuốc (CSDL2)
SwissTargetPrediction (STD) ( />[15] là một cơng cụ giúp dự đốn chính xác mục tiêu của các phân tử hoạt tính sinh học
dựa trên sự kết hợp của các phép đo độ tương đồng 2D và 3D với các phối tử đã biết.
Các hợp chất đạt yêu cầu về sinh khả dụng đường uống sẽ được chuẩn hóa cơng thức
dưới dạng SMILES (Simplified Molecular Input Line Entry System - hệ thống nhập dòng
đầu vào phân tử được đơn giản hóa) bằng Chemdraw 16.0 và đưa vào STD để thu được
cơ sở dữ liệu các đích tác dụng trên người của những hợp chất này (CSDL2).
Các đích tác dụng cuối cùng được chuẩn hóa tên thơng qua cơ sở dữ liệu Uniprot
( [8] để thuận tiện cho việc phân tích và so sánh.

16


2.4.4. Phương pháp xây dựng và phân tích mạng lưới hợp chất - đích tác dụng tiềm
năng
Với mỗi cây thuốc, tiến hành xác định các đích chung (các đích tiềm năng) của
cơ sở dữ liệu các đích tác dụng trên người của các hợp chất trong cây (CSDL2) và cơ sở
dữ liệu các gen liên quan tới COVID-19 trên người (CSDL1). Mạng lưới hợp chất - đích
tác dụng tiềm năng được trực quan hóa bằng phần mềm Cytoscape 3.8.0 [42].
Phân tích các tham số bậc (degree), độ trung tâm (betweenness) và độ gần
(closeness) trong mạng nhờ ứng dụng CytoNCA tích hợp trong Cytoscape. Trong đó,
tham số Bậc (degree) của một nút là số liên kết của nút đó với các nút khác trong mạng.
Độ trung tâm (betweenness) của nút là số con đường ngắn nhất đi qua nút đó. Độ gần
(closeness) là khoảng cách lý thuyết tới tất cả các nút khác đã kết nối. Các tham số này
của một hợp chất càng lớn thì hợp chất đó càng có vai trị quan trọng trong mạng lưới
[13]. Phân tích chọn ra các hợp chất dẫn đầu về mỗi tham số trên thu được 3 tập hợp
hợp chất. Các hợp chất tiềm năng được xác định là các hợp chất nằm trong vùng giao
của 3 tập hợp trên.
2.4.5. Phương pháp xây dựng và phân tích mạng lưới tương tác protein - protein

(Protein-protein interaction - PPI)
Các đích tiềm năng được nhập vào cơ sở dữ liệu STRING để xây dựng mạng lưới
tương tác protein - protein (PPI). Mạng lưới tương tác được trực quan hố bằng
Cytoscape 3.8.0 và phân tích chỉ ra các đích tiềm năng dẫn đầu về mỗi tham số bậc
(degree), độ trung tâm (betweenness) và độ gần (closeness) bằng CytoNCA thu được 3
tập hợp đích tác dụng. Các đích trung tâm của mạng lưới là các đích nằm trong vùng
giao của 3 tập hợp trên. Các đích này đóng vai trò trong tác dụng định hướng điều trị
COVID-19 của cây thuốc.
2.4.6. Phương pháp phân tích làm giàu GO và con đường KEGG
Các đích tiềm năng được chuẩn hóa danh pháp bằng Uniprot và được đưa vào
phần mềm Shinny GO 0.7.4. Từ đó, xác định được 10 chức năng phân tử (MF), thành
phần tế bào (CC), quá trình sinh học (BP) và 20 con đường chuyển hoá KEGG liên quan
nhất tới danh sách đích tiềm năng đã nhập vào, với giá trị FDR cận biên (false discovery
rate cutoff) là 0,05. Giá trị FDR càng thấp thì kết quả càng chính xác. Giá trị fold
enrichment thu được thông qua so sánh giữa tỉ lệ nền trên tổng số gen trong một loài
nhất định liên quan tới một thuật ngữ GO (GO term) với tỉ lệ thực tế số lượng gen trong
bộ dữ liệu đầu vào liên quan tới thuật ngữ đó [10]. Ví dụ, nếu 40/400 gen (tỉ lệ 10% - tỉ
lệ thực tế) trong bộ gen nhập vào có liên quan tới “hoạt động kinase”; và thông tin nền
(backgroud information) cho biết có tất cả 300/30000 gen (tỉ lệ 1% - tỉ lệ nền) có liên
quan tới “hoạt động kinase”. Như vậy, fold enrichment được tính bằng 10%/1% = 10.
Nhìn chung, giá trị fold enrichment càng cao, thuật ngữ GO đó càng nổi bật đặc trưng
17


cho bộ gen đầu vào. Các kết quả làm giàu GO và KEGG trong nghiên cứu được thể hiện
ở dạng biểu đồ điểm (dotplot) và sắp xếp theo thứ tự giảm dần của giá trị fold
enrichment.
2.4.7. Phương pháp mô phỏng tương tác phân tử (Molecular docking)
Tiến hành mô phỏng tương tác phân tử giữa các hợp chất tiềm năng trong cây
thuốc và các mục tiêu phân tử của SARS-CoV-2 gồm 3CLP, CatL, EndoRNAse, Furin,

Helicase, Methyltransferase, PLP, RdRp và S-protein. Quá trình mơ phỏng tương tác
được thực hiện qua 4 bước: lựa chọn và chuẩn bị protein, lựa chọn và chuẩn bị phối tử,
mô phỏng tương tác và đánh giá kết quả. Phần mềm MoE 2009 được sử dụng để mô
phỏng tương tác giữa hợp chất và protein.
Lựa chọn và chuẩn bị protein: Các phân tử protein của virus với cấu trúc xác
định được thu thập từ Protein Data Bank (PDB) ( PDB là một cơ
sở dữ liệu cho cấu trúc 3D của nhiều hợp chất sinh học, trong đó có protein và các acid
nucleic [35]. Sau khi có được cấu trúc 3D của protein, tiến hành loại các phối tử trong
cấu trúc (nếu có), loại dung mơi, thêm hydro, proton hóa ở pH 7 và gắn trường lực.
Lựa chọn và chuẩn bị phối tử: Các phối tử (hợp chất) có thể lấy từ dữ liệu có
sẵn ở PubChem và tự xây dựng công thức từ ChemDraw. Các phối tử được chuẩn hố
cơng thức SMILES, nhập vào phần mềm mơ phỏng tương tác MoE 2009 thu được cấu
trúc 2D, thêm Hydro, proton hóa ở pH 7 và xác định trạng thái năng lượng tối thiểu
(minimal energy) trong trường lực đã được gắn.
Mô phỏng tương tác: Các phối tử được mô phỏng các trạng thái tương tác với
vùng receptor đã lựa chọn. Kết quả là giá trị năng lượng liên kết được thể hiện ở dạng
biểu đồ nhiệt của phối tử và protein.
Đánh giá kết quả: Kết quả mô phỏng tương tác được đánh giá dựa trên giá trị
năng lượng liên kết giữa phối tử và protein. Năng lượng liên kết càng nhỏ thì ái lực liên
kết giữa hợp chất và receptor càng lớn. Ngồi ra, có thể so sánh năng lượng liên kết của
hợp chất với một chất đối chiếu giúp dự đoán được mức độ ý nghĩa của tương tác.

18


×