PHÂN TÍCH TRÌNH TỰ DNA VÀ
PROTEIN BẰNG
ORF-DNA CLUB
MỤC TIÊU CỦA MÔN HỌC
Xác định một trình tự những nucleotide mã hóa cho protein
Xác định được vị trí bắt đầu và vị trí kết thúc của đoạn gen
Phân tích đoạn antisene theo chiều ngược lại của DNA bổ
sung
Quá trình phiên mã RNA từ DNA
Protein
RNA
DNA
transcription
translation
CCTGAGCCAACTATTG ATGAA
CCUGAGCC A ACUAUUG AUGAA
PEP T ID E
Sự sao chép sinh vật prokaryotic
và eukaryotic
Quá trình phiên mã RNA từ DNA
Dịch mã theo quy tắc một gene một protein
Dịch mã trong Prokaryotes
Promoter Gene1 Gene2 Gene N Terminator
Transcription RNA Polymerase
mRNA 5’ 3’
Translation
Ribosome, tRNAs,
Protein Factors
1 2 N
Polypeptides
N
C
N
C
N
C
1 2 3
Dịch mã protein
Khung đọc mở là gì?
Đoạn trình tự nằm giữa một bộ ba khởi đầu và một bộ ba kết
thúc tương ứng cùng khung đọc được gọi là khung đọc mở
(ORF = open reading frame).
Đặc điểm này được dùng để xác định các trình tự ADN mã
hoá protein trong các dự án giải mã hệ gen.
UAA,UAG
UGA
(TAA, TAG, TGA)
Initiation codon
Initiation codon
Stop codon
Stop codon
Promoter region
Promoter region
•
Shine-Dalgarno box (AGGAGG)
Shine-Dalgarno box (AGGAGG)
•
Pribnow box (TATAAT)
Pribnow box (TATAAT)
•
-35 site (TTGACA)
-35 site (TTGACA)
Prokaryote
Prokaryote
5’
5’ Mở đầu: AUG (ATG, GTG, CTG, TTG)
3’
3’
ORF
Terminator
Terminator
ORF - Khung đọc mở
Trong Di truyền phân tử, một ORF là một bộ phận của
gene của sinh vật mà bao gồm một chuỗi trình tự các base có
khả năng mã hóa cho một protein.
Trong một gene, các ORF nằm giữa trình tự khởi đầu
(codon bắt đầu) và trình tự kết thúc (codon kết thúc).
![]()
•
Các ORF luôn luôn được bắt gặp khi di chuyển vị trí ngang
qua các mẩu DNA trong lúc cố gắng xác định vị trí một gene.
•
Bởi vì các sai khác tồn tại trong trình tự khởi đầu của các sinh
vật với mã di truyền khác nhau, ORF sẽ được xác định khác
nhau.
Ví dụ, nếu một phần của bộ gene
đã được giải trình tự
•
Các ORF có thể được xác định vị trí bằng cách khảo sát
mỗi một trong số 3 ORF có thể có (hoặc 6 đối với DNA
mạch kép).
•
Trong trình tự này hai nằm ngoài 3 khung đọc có thể là
"mở". Đây là một trong hai trình tự mRNA có thể có của
sự phiên mã, và chúng ta thấy rằng nó có thể được đọc
theo 3 cách khác nhau:
1. UCU AAA AUG GGU GAC
2. CUA AAA UGG GUG AC
3. UAA AAU GGG UGA C
Khung đọc mở
•
Mỗi trình tự ADN có thể đọc theo ba khung đọc khác nhau,
phụ thuộc vào bazơ nào được chọn làm bazơ khởi đầu.
•
Trên mỗi phân đoạn ADN mạch kép về lý thuyết có thể có
tối đa sáu khung đọc mở (ORF) khác nhau.
Khung đọc mở
•
Ngoài việc quy định điểm bắt đầu quá trình tổng hợp
protein, bộ ba mã khởi đầu (AUG) còn xác định khung
đọc của trình tự ARN.
•
Có thể có ba bộ ba cho bất kỳ một trình tự bazơ nào, phụ
thuộc vào bazơ nào được chọn làm bazơ bắt đầu của
codon.
CÔNG CỤ VÀ CÁCH THỰC HiỆN
Tìm ORF finder trong google
ORF FINDER (OPEN READING FRAME FINDER)
Nhập trình tự DNA vào khung ORF finder
Nhập trình tự
Kết quả phân tích DNA
Chỉ trình bày khung
đọc mở tổi thiểu 100
acid amin
Ý nghĩa của các khuôn đọc
Khung đọc mở (ORF)
Forward DNA strand
Reverse DNA strand
F1
F2
F3
F6
F5
F4
*
*
*
*
Start signal
Stop signal
*
*
*
*
*
*
*
*
*
Total ORFs in F1: 3
Total ORFs in F2: 2
Total ORFs in F3: 1
Total ORFs in F4: 1
Total ORFs in F5: 3
Total ORFs in F6: 2
Total ORFs: 12
Trình tự DNA có thể được đọc trong 6 khung đọc
ở các sinh vật có DNA mạch đôi; 3 khung đọc trên
mỗi mạch
Chiều dịch mã trong sáu khuôn đọc ORF
5’ AATGGCAATCCGCGTAGACTAGGCA 3’
3’ TTACCGTTAGGCGCATCTGTATCGT 5’
AAT
AAT
GGC
GGC
AAT
AAT
CCG
CCG
CGT
CGT
AGA
AGA
CTA
CTA
GGC
GGC
A
A
A
A
ATG
ATG
GCA
GCA
ATC
ATC
CGC
CGC
GTA
GTA
GAC
GAC
TAG
TAG
GCA
GCA
AA
AA
TGG
TGG
CAA
CAA
TCC
TCC
GCG
GCG
TAG
TAG
ACT
ACT
AGG
AGG
CA
CA
T
T
TAC
TAC
CGT
CGT
TAG
TAG
GCG
GCG
CAT
CAT
CTG
CTG
TAT
TAT
CGT
CGT
TT
TT
ACC
ACC
GTT
GTT
AGG
AGG
CGC
CGC
ATC
ATC
TGT
TGT
ATC
ATC
GT
GT
TTA
TTA
CCG
CCG
TTA
TTA
GGC
GGC
GCA
GCA
TCT
TCT
GTA
GTA
TCG
TCG
T
T
+1
-2
-3
-1
+2
+3
Six reading frames
AAT
AAT
GGC
GGC
AAT
AAT
CCG
CCG
CGT
CGT
AGA
AGA
CTA
CTA
GGC
GGC
A
A
N G N P R R L G
N G N P R R L G
AA
AA
TGG
TGG
CAA
CAA
TCC
TCC
GCG
GCG
TAG
TAG
ACT
ACT
AGG
AGG
CA
CA
W Q S A * T R
W Q S A * T R
T
T
TAC
TAC
CGT
CGT
TAG
TAG
GCG
GCG
CAT
CAT
CTG
CTG
TAT
TAT
CGT
CGT
TT
TT
ACC
ACC
GTT
GTT
AGG
AGG
CGC
CGC
ATC
ATC
TGT
TGT
ATC
ATC
GT
GT
TTA
TTA
CCG
CCG
TTA
TTA
GGC
GGC
GCA
GCA
TCT
TCT
GTA
GTA
TCG
TCG
T
T
+1
-2
-3
-1
+3
A
A
ATG
ATG
GCA
GCA
ATC
ATC
CGC
CGC
GTA
GTA
GAC
GAC
TAG
TAG
GCA
GCA
M A I R V D * A
M A I R V D * A
+2
Click vào