Draft version - Confidential
Giáo trình Nmôn tin sinh
1
6
7
9
12
Axít nuclêic và Nuclêôtít 12 1.1.
Prôtêin và axít amin 15 1.2.
16 1.3.
18 1.4.
19 1.5.
20 1.6.
24 1.7.
26
26 2.1.
28 2.2.
30 2.3.
30 2.3.1.
31 2.3.2.
34 2.3.3.
37 2.3.4.
38 2.4.
CSDL Protei 40 2.5.
41 2.6.
42 2.7.
43 2.8.
44 2.9.
46
Draft version - Confidential
Giáo trình Nmôn tin sinh
2
46 3.1.
50 3.2.
53 3.3.
57 3.4.
59 3.5.
64
64 4.1.
65 4.2.
67 4.3.
68 4.3.1.
75 4.3.2.
77 4.4.
80
80 5.1.
80 5.1.1.
81 5.1.2.
82 5.1.3.
84 5.1.4.
86 5.2.
89 5.3.
92 5.4.
92 5.4.1.
93 5.4.2.
94 5.4.3.
94
5.4.4.
96 5.5.
96 5.5.1.
98 5.5.2.
Draft version - Confidential
Giáo trình Nmôn tin sinh
3
99 5.5.3.
100 5.6.
100 5.6.1.
103 5.6.2.
107 5.7.
112
112 6.1.
Cây phân loài 115 6.2.
115 6.2.1.
116 6.2.2.
117 6.2.3.
119 6.2.4.
121 6.3.
122 6.4.
127 6.5.
131 6.6.
131 6.6.1.
132 6.6.2.
133 6.6.3.
134 6.6.4.
134 6.7.
135 6.8.
136 6.9.
139
139
7.1.
141 7.2.
-Joining 145 7.3.
155 7.4.
Draft version - Confidential
Giáo trình Nmôn tin sinh
4
158
158 8.1.
159 8.2.
159 8.2.1.
163 8.3.
-Cantor 163 8.3.1.
164 8.3.2.
166 8.3.3.
167 8.3.4.
168 8.3.5.
171 8.4.
173 8.5.
176
176 9.1.
177 9.2.
ý 183 9.3.
187 9.4.
BLOSUM 187 9.4.1.
188 9.4.2.
Mô hình 189 9.4.3.
190 9.4.4.
191 9.4.5.
192 9.5.
194
194
10.1.
195 10.2.
195 10.2.1.
196 10.2.2.
Draft version - Confidential
Giáo trình Nmôn tin sinh
5
198 10.3.
199 10.4.
200 10.5.
IQPNNI 200 10.5.1.
PhyML 204 10.5.2.
207 10.6.
209
209 11.1.
210 11.2.
-Fasman 212 11.3.
OR 218 11.4.
222 11.5.
222 11.5.1.
224 11.5.2.
226 11.6.
227 11.7.
Draft version - Confidential
Giáo trình Nmôn tin sinh
6
Danh sách ký hiu và kí t vit tt
, ví d là tp các nuclêôtít
Chui nuclêôtít/chui axít amin
Ti
S ng các chui
p hàng
Cây phân loài
ML
MP
(maximum parsimony)
Ma trn t bii tc thì gia các nuclêôtít hay axít amin
n s xut hin ca các nuclêôtít hay axít amin
Ma trn h s i (exchangeability matrix) gia các nuclêôtít
hay gia các axít amin.
Draft version - Confidential
Giáo trình Nmôn tin sinh
7
Bioinformatics
Molecular biology
Nucleic acid
Axít nuclêic
DNA
ADN
RNA
ARN
Nucleotide
Nuclêôtít
Protein
Prôtêin
Amino acid
Axít amin
Gene
Gen
Genome
Chromosome
Nh
Accession number
Substitution
Mutation
Transcription
Phiên mã
Translation
Maximum likelihood
Maximum parsimony
Phylogenetic tree
Cây phân loài
Model
Mô hình
Sequence
Pairwise alignment
Draft version - Confidential
Giáo trình Nmôn tin sinh
8
Local pairwise alignment
Multiple sequence alignment
Rate matrix
Instantaneous substitution rate matrix
Exchangeability matrix
Frequency vector
Distance matrix
Draft version - Confidential
Giáo trình Nmôn tin sinh
9
,
- khoa
. Vin
và ng internet.
bà
. Giáo trình
1
nuclêôtít, axít aminnuclêôtít
nuclêôtít.
ung vào
(NCBI),
Draft version - Confidential
Giáo trình Nmôn tin sinh
10
nhanh chóng
.
T
toán trên
4 trình bày các
nhanh chóng .
bài toán C
. P
.
6
các
-
bày nuclêôtít
nuclêôtít khác nhau
nuclêôtít lý
.
axít amin
bày axít amin
axít amin axít amin
ít amin
.
10
Draft version - Confidential
Giáo trình Nmôn tin sinh
11
prôtêin prôtêin. Bài toán
N
C.
C
các
trong giáo trình.
tìm các
Draft version - Confidential
Giáo trình Nmôn tin sinh
12
(molecular biology) là (biology),
.
nuclêôtít ADN), các
axít amin prôtêin)
khác quá trình
.
ADNtính toán
phân tích
chúng tôi
.
Axít nuclêic và Nuclêôtít 1.1.
Axít nuclêic (nucleic acid) biological
mã hóa
. xít Deoxyribo
Nuclêic (ADN) và ARN (Axít Ribo Nuclêic).
Th axít nuclêic c
nuclêotít (nucleotide). C ADN nuclêôtít khác nhau là: Adenine,
Cytosine, Guanine, và Thymine.
ADN
Adenine, Cytosine, Guanine, và Uracil.
nuclêôtít 1.1.
Draft version - Confidential
Giáo trình Nmôn tin sinh
13
Tên vit tt
Cu trúc
Adenine
A
Cytosine
C
Guanine
G
Thymine
T
Uracil
U
1.1: T nuclêôtít.
Draft version - Confidential
Giáo trình Nmôn tin sinh
14
Hình 1.1ADN.
Các nuclêôtít ADN
Hình 1.1 (cADN
b ). C
ADN
nuclêôtít
nuclêôtít
Nuclêôtít A nuclêôtít T
Nuclêôtít nuclêôtít C.
ADN nuclêôtít
nuclêôtít
ADN
A, C, G, và T nuclêôtít)
CAGTTGACGGCGAACCGTGCGAGCAGACGGTCGTT ADN.
Draft version - Confidential
Giáo trình Nmôn tin sinh
15
ADN và
.
Prôtêin và axít amin 1.2.
in (protein)
,
. Prôtêin axít
amin axít amin
chính là: nhóm amin (NH2), nhóm cacboxyl (COOH) và nhóm
R (xem Hình 1.2).
Hình 1.2
1.2
khác nhau
ESPQIRRDMGRLCATWPSKDSEDGAGTALRAATPLTANGATTTGLSVTLAPK
CQTNWDECWSSPCQNGGTCVDGVAYYNCTCPEGFSGSNCEENVDE
Draft version - Confidential
Giáo trình Nmôn tin sinh
16
STT
Tên axít amin
Tên vit tt (3 ký t)
Tên vit tt (1 ký t)
1
Alanine
Ala
A
2
Arginine
Arg
R
3
Asparagine
Asn
N
4
Aspartic
Asp
D
5
Cysteine
Cys
C
6
Glutamine
Gln
Q
7
Glutamic
Glu
E
8
Glycine
Gly
G
9
Histidine
His
H
10
Isoleucine
Ile
I
11
Leucine
Leu
L
12
Lysine
Lys
K
13
Methionine
Met
M
14
Phenylalanine
Phe
F
15
Proline
Pro
P
16
Serine
Ser
S
17
Threonine
Thr
T
18
Tryptophan
Trp
W
19
Tyrosine
Tyr
Y
20
Valine
Val
V
1.2.
Gen và mADN và prôtêin 1.3.
ADN
, trong khi prôtêin quy
ADN prôtêin
prôtêin
prôtêin ADN ADN thông qua quá trình
prôtêin (Hình 1.3)ADN ADN mang thông tin
prôtêin gen.
ADNgen.
Draft version - Confidential
Giáo trình Nmôn tin sinh
17
Hình 1.3prôtêin ADN
Quá trình tprôtêin ADN : Phiên mã
(transcription) (translation) Hình 1.3.
ADN
prôtêin ARN. ARN có
nuclêôtít
thành nuclêôtít
ARN
ARN
quy tnuclêôtít (codon) ARN
1.3.
axít amin
axít amin, axít aminaxít
aminARN GAG CCA ACU AUU GAU
i axít amin
61
(start codon). AUG mã hóa axít amin Met (M) là
Draft version - Confidential
Giáo trình Nmôn tin sinh
18
T
C
A
G
Codon
Axít
amin
Codon
Axít
amin
Codon
Axít
amin
Codon
Axít
amin
T
TTT
Phe
TCT
Ser
TAT
Tyr
TGT
Cys
T
TTC
Phe
TCC
Ser
TAC
Tyr
TGC
Cys
C
TTA
Leu
TCA
Ser
TAA
STOP
TGA
STOP
A
TTG
Leu
TCG
Ser
TAG
STOP
TGG
Trp
G
C
CTT
Leu
CCT
Pro
CAT
His
CGT
Arg
T
CTC
Leu
CCC
Pro
CAC
His
CGC
Arg
C
CTA
Leu
CCA
Pro
CAA
Gln
CGA
Arg
A
CTG
Leu
CCG
Pro
CAG
Gln
CGG
Arg
G
A
ATT
Ile
ACT
Thr
AAT
Asn
AGT
Ser
T
ATC
Ile
ACC
Thr
AAC
Asn
AGC
Ser
C
ATA
Ile
ACA
Thr
AAA
Lys
AGA
Arg
A
ATG
Met
ACG
Thr
AAG
Lys
AGG
Arg
G
G
GTT
Val
GCT
Ala
GAT
Asp
GGT
Gly
T
GTC
Val
GCC
Ala
GAC
Asp
GGC
Gly
C
GTA
Val
GCA
Ala
GAA
Glu
GGA
Gly
A
GTG
Val
GCG
Ala
GAG
Glu
GGG
Gly
G
1.3 nuclêôtít (codon) thành axít amin
nuclêôtít/axít amin theo IUPAC 1.4.
nuclêôtít axít
amin
nuclêôtít hay axít amin
IUPAC (International Union of Pure ADN
u nuclêôtít 1.4.
Tên vit tt
R
G hoc A
Y
T hoc C
K
G hoc T
M
A hoc C
S
G hoc C
Draft version - Confidential
Giáo trình Nmôn tin sinh
19
W
A hoc T
B
G hoc T hoc C
D
G hoc A hoc T
H
A ho
V
G hoc C hoc A
N
A hoc G hoc C hoc T
1.4nuclêôtít
t
các axít amin 1.5.
Tên vit tt (1 ký t)
Z
Glutamine hoc Glutamic
X
Mt trong 20 loi axít amin
B
Asparagine hoc Aspartic
U
Mt trong 20 loi axít amin
1.5
1.5.
ADNprôtêin histone
ADN ADN trong
nuclêôtít
nuclêôtít (xem Hình 1.4).
Hình 1.4 l
gen khác nhau. Hai
Draft version - Confidential
Giáo trình Nmôn tin sinh
20
Hình 1.4
ADN 1.6.
[1] thì các loài sin
(xem Hình 1.5).
ADN (hay hai
ADN)
ADN ADN
ADN
nuclêôtít
ADN
nuclêôtít
Draft version - Confidential
Giáo trình Nmôn tin sinh
21
Hình 1.5:
ai prôtêin
ADN
prôtêin
Quá trình bN: nuclêôtít
(hay các axít amin axít amin) Ba
Thay th (mutation): nuclêôtít nuclêôtít khác.
Xoá (deletion): nuclêôtít b ADN;
ADN
Chèn (insertion): Mnuclêôtít ADN;
ADN
Draft version - Confidential
Giáo trình Nmôn tin sinh
22
Hình 1.6ADN
Hình 1.6 minh ha quá trình bii ca hai chui =
mt chui ADN t tiên chung . Ta thy
nuclêôtít C v trí th 2 ca chui b xóa khi chui ; và nuclêôtít T v trí
th 8 ca chui b thay th bng nuclêôtít G chui .
Khi so sánh trc tip hai chui và , chúng
t phép bi i gia hai chui và ; hoc mt
nuclêôtít xóa khi chui ; hoc nuclêôtít c chèn thêm vi
chui . Do không có thông tin v chui ADN t tiên chung , chúng ta
n ra v trí
này, vì v i ta gi phép bi i này là phép bi i chèn/xóa
(indel).
Ti v trí th 8 có mt phép thay th nuclêôtít gia hai chui và .
Nuclêôtít T chui nuclêôtít G
Các phép ADN gen
Các
gen khác nhau.
,
gen vào .
.
Draft version - Confidential
Giáo trình Nmôn tin sinh
23
prôtêin: nuclêotít ADN
trong quá trình tin hóa s d n các bi i trên các chui axít amin mà
chúng mã hóa. Các bii gia hai chui prôtêin xut hin trong
quá trình tng hp prôtêin t các chui ADN. Ví d hai chui ADN ng
= CCTGAGCCAACTGAT" s mã
hóa hai prôtêin ng = PEPTV (xem 1.6).
1
2
3
4
5
6
7
Chui ADN
CCT
GAG
CCA
ACT
ATT
GAT
GAA
Chui ADN
CCG
GAG
CCA
ACT
ATT
GTT
Chui prôtêin
P
E
P
T
I
D
E
Chui prôtêin
P
E
P
T
I
V
1.6: Các bii gia hai chui ADN và hai chui prôtêin ng
ca chúng.
So sánh hai chui ADN prôtêin ng ca chúng, ta
nhn thy:
Có mt phép thay th nuclêôtít v trí th 3 ca codon th nht gia hai
chui ADN và
hóa axít amin P).
Có mt phép thay th nuclêôtít v trí th 2 ca codon th 6 gia hai chui
ADN và . Phép thay th này dn s bii ca hai axít amin do
ng; axít amin D trên prôtêin
i prôtêin , hoc li.
Có mt phép chèn/xóa codon v trí th 7 gia hai chui ADN và .
Phép chèn/xóa này dn mt phép chèn/xóa axít amin v trí th 7 gia
hai chui prôtêin ng và
7 trên chui prôtêin ; hoc m xóa khi v trí th 7
trên chui prôtêin .
ADN
các prôtêin
Draft version - Confidential
Giáo trình Nmôn tin sinh
24
1.7.
1. ADN .
ADN.
2. khác nhau i vi mt
nuclêôtít trên mt chui ADN.
3. Cho hai chui ADN
A
GGTGGGCCCTG
Hãy tìm các phép bii khi so sánh hai chui này.
4. Cho hai chui ADN
5. Mnuclêôtít,
6.
nuclêôtít mã hóa cho
7. ADN sang prôtêin
ADN thành prôtêin hay không?
8. Tìm và trình bày các thông tin sau:
9. Tìm và trình bày các thông tin sau:
nhim sc th trong b gen ca con chó
S ng nhim sc th trong b gen ca cây lúa
10. Cho n gen
Draft version - Confidential
Giáo trình Nmôn tin sinh
25
CGCCCCCGTTCCCTGGGTGTT
. Hãy tìm chui axít amin ng vi n này.
11. Cho chui prôtêin = , h kê tt c các n gen có th mã hóa
prôtêin trên.
12. Cho chui prôtêin = , hãy lit kê tt c các n gen có th mã hóa
prôtêin trên.
13.
vào ADN_protein nucleotít
kì (c
).
file ADN_protein
cho các nuclêôtít, thì ra màn hình.
ADN_protein.in
ADN_protein.out
CAGTTGACGGCGAACCGT
QLTANR