•
Bài báo cáo môn: TIN SINH HỌC
•
Người hướng dẫn: TS Võ Văn Toàn
•
Người thực hiện: Võ Thò Hoanh
•
Lớp Cao học Sinh học TN K13
NỘI DUNG:
1. Tìm kiếm thông tin sinh học trên internet.
2. Tìm kiếm trình tự sinh học
2.1 . Tìm kiếm trình tự ADN
2.2 . Tìm kiếm trình tự protein
3. Tìm kiếm trình tự tương đồng
4. Phân tích trình tự AND, tìm khung đọc mở ORF.
5. So sánh tương đồng và tạo cây phát sinh từ trình tự
AND.
6. Tìm vò trí trình tự AND nhờ phần mềm ADNclub.
I. TÌM KIẾM THÔNG TIN SINH HỌC TRÊN INTERNET
Nếu chúng ta quan tâm đến những thông tin khoa học sinh học
đáng tin cậy, thường là những bài báo khoa học, thì việc tìm
kiếm sẽ có hiệu quả cao nhất khi ta tìm kiếm thông tin trong
những tạp chí khoa học chuyên ngành trên mạng Internet (ví
dụ tạp chí Applied Environmental Microbiology), hoặc những
cơ sở dữ liệu thông tin về Sinh học (NCBI, Medscape,
BioMedNet…).
Trong bài này chúng ta sẽ tìm kiếm thông tin bằng cách sử
dụng cơ sở dữ liệu trong trang chủ NCBI (National Center for
Biotechnology Information -NCBI, USA) tại đòa chỉ Internet là
Khi truy cập vào đòa chỉ này,
chúng ta sẽ nhìn thấy một trang chủ dạng như sau:
Chúng ta thực hiện tìm kiếm thông tin sinh học trong trang Entrez. Trang
Entrez là một trang web của NCBI.
• Nhấn dòng chữ Entrez để vào trang Entrez.
Trong Entrez, bạn có thể tìm kiếm nhiều dạng cơ sở dữ liệu khác nhau.
Mỗi cơ sở dữ liệu là một liên kết được biểu thò bằng dòng văn bản được đổi
màu khi ta di chuyển đến. Ví dụ: PubMed, Protein
Khung nhập
yêu cầu
Các dòng văn bản đổi màu được gọi là các liên
kết siêu văn bản (hay liên kết) và thường mở ra
một trang mới khi ta nhấn vào. Trong Entrez chúng ta
có thể nhập vào những yêu cầu tìm kiếm cơ sở dữ
liệu về các bài báo thuộc lónh vực Y – Sinh học
(PubMed), trình tự nucleic acid (Nucle otide), trình tự
protein (Protein), cấu trúc 3 chiều (Structure), bộ gen
(Genome)… Ở đây, chúng ta sử dụng trang PubMed để
tìm kiếm các bài báo về thông tin liên quan đến cây
lúa.
II. TÌM KIẾM TRÌNH TỰ SINH HỌC
1. MỤC ĐÍCH VÀ NGUYÊN TẮC
Trong nghiên cứu sinh học phân tử, chúng ta thường xuyên phải làm việc
trên các đối tượng là nucleic acid (DNA) và protein. Đây là các dạng trình
tự sinh học được lưu trữ phổ biến trong các cơ sở dữ liệu sinh học. Hiện
nay, các thông tin này được lưu trữ chủ yếu trong các cơ sở dữ liệu lớn trên
thế giới như hệ thống GenBank (NCBI, USA), EMBL (European Molecular
Biology Laboratory, UK), DDBJ (DNA Database of Japan, JP) và một số
hệ thống cơ sở dữ liệu khác trên thế giới. Thông tin trong các cơ sở dữ liệu
này rất lớn và luôn được cập nhật thường xuyên (sau mỗi 24 giờ). Để tìm
những trình tự sinh học này, chúng ta sử dụng công cụ tìm kiếm Entrez
Nucleotide (tìm trình tự DNA) hoặc Entrez Protein (tìm trình tự protein).
2. CÔNG CỤ VÀ CÁCH SỬ DỤNG
2.1. Tìm trình tự ADN
Để tìm những trình tự DNA ta sử dụng Entrez Nucleotide để tìm kiếm
trong hệ thống cơ sở dữ liệu về trình tự DNA. Các cơ sở dữ liệu này bao
gồm hệ thống GenBank (NCBI, USA) và liên kết với cơ sở dữ liệu của
EMBL, DDBJ và một số hệ thống dữ liệu khác trên thế giới.
• Từ trang PubMed, nhấn vào dòng Nucleotide để đưa ta đến trang Entrez
Nucleotide.
• Nhập vào yêu cầu (thường là tên gen như: Bph-10 gene. Đây là gen
kháng rầy nâu ở lúa…) và nhấn nút Go (hoặc nhấn Enter ).↵
• Kết quả sẽ xuất hiện một danh sách trình tự DNA tương tự như sau:
Đây là 3 dạng gen kháng 3 biotype rầy nâu có ở Việt Nam, đây là kết quả
nghiên cứu của Tiến só di truyền học Nguyễn Thò Lang (Việt Nam)
• Nhấn vào các mục bài để xem chi tiết trình tự DNA. Ví dụ nhấp vào 1, sẽ
hiện bảng sau:
Hoặc nhấp vào Fasta ta có được trình tự nucleotit của gen Bph-1
2.2. Tìm trình tự Protein
Để tìm trình tự protein, cũng tương tự việc tìm kiếm trình tự DNA. Việc tìm
kiếm trình tự protein cũng được thực hiện trong hệ thống Genbank, EMBL
và DDBJ.
• Nhấn vào dòng Protein trong trang Entrez để mở trang Entrez Protein.
• Nhập vào yêu cầu (thường là tên protein như: “SSB”, “ST”,…) và nhấn
nút Go (hoặc nhấn Enter ).↵
• Sau vài phút, kết quả sẽ xuất hiện một danh sách trình tự protein tương tự
như trường hợp DNA.
• Nhấn vào mã số truy cập của các mục bài để xem chi tiết trình tự protein.
3. Thực hành
Ví dụ: Tìm thông tin và tìm trình tự nucleotit và protein của gen mới phát
hiện ở lúa.
Xác định được gen quy định chiều cao, sản lượng và thời gian cây
lúa trổ bông.
BTO-CácnhàkhoahọcTrungQuốcđãxácđịnhđượcmộtgenđơnlẻ
cótênlàGHD7,cóvaitròkiểmsoátsảnlượng,cũngnhưchiềucaovà
thờigiantrổbôngcủacâylúa.Đâysẽlàmộttiếnbộvượtbậc,giúpích
rấtnhiềuchonỗlựctoàncầutrongviệctăngnăngsuấtcâytrồng.
Nhữngnghiêncứutrướcđâyđãtừngđịnhdạngđượcmộtvùngtrên
nhiễmsắcthểsố7,đượccholànơiquyếtđịnh3đặcđiểmtrêncủa
câylúa,nhưngkhôngthểtậptrungvàomộtgencụthểnào.
TiếnsĩZhangQifavàđồngnghiệpởTrườngĐạihọcHuazhong,tỉnh
VũHánđãthựchiệncuộcnghiêncứunàyở19đồnglúakhácnhau
trênkhắpchâuÁvàthấyrằng,nhữngcâylúathấphơn,íthạthơnvà
trổsớmhơncódấuhiệuthiếugenGHD7.Saukhiđượcbổsungloại
gennàyđãxuấthiệnsựthayđổitheochiềuhướngtăngrõrệt:tăng
năngsuất,tăngthờigiantrổbôngvàtăng67%chiềucao.
ÔngZhangphântích:“Nghiêncứucủachúngtôichothấymộtgenđơn
lẻcóthểquyđịnhnhữngđặctínhchủchốtcủacâylúavớinhữngảnh
hưởngrấtlớn.Trướcđây,chúngtachỉnghĩrằngcầnphảithayđổi
nhiềugenthìmớithayđổiđượcsảnlượngcâylúa.Nhưngngàynay,
chúngtachỉcầnđiềukhiểnchỉ1genđơnlẻlàcóthểtăngnăngsuất”.
Ởnghiêncứunày,cácnhàkhoahọcđãpháthiệncó5phiênbảnkhác
nhaucủagenGHD7.Phiênbảnhoạtđộngtíchcựcnhấtđãcómặtở
nhữngvùngkhíhậuấmáp,chophépcâylúakhaitháctriệtđểnguồn
ánhsángvànhiệtđộbằngcáchkéodàithờigiantrổhoa.Cònkiểuít
tíchcựchơnhayphiênbảnthụđộngcủagenGHD7thìxuấthiệnởcác
khuvựclạnhhơn,làmchocâylúakhảnăngpháttriểnđượcởnhững
nơicómùagieotrồngngắnhơn.
P.Lan(TheoReuters)
Ta vào trang web của NCBI để tìm thông tin liên quan, để giới hạn thông
tin trong bài này chỉ tìm bài viết liên quan đến gen GHD7 của tác giả
Zhang Qifa
Tìm trình tự protein :
• Trở về trang Entrez hoặc từ trang Entrez Nucleotide, nhấn vào dòng
Protein để mở trang Entrez Protein.
Trang Entrez protein sẽ xuất hiện có dạng:
Chúng ta thực tập tìm kiếm trình tự protein là GHD7 của tác giả Zhang.Q
toxin).
• Nhập dòng “(GHD7) Zhang .Q” vào khung yêu cầu, nhấn Go, và chờ kết
quả.
Thực hiện tìm hiểu chi tiết các mục bài vừa tìm kiếm được bằng cách nhấn
lên các mã số mục bài (tương tự cách dùng với trình tự DNA). Ví dụ Ghd7
ở
vò trí số 1
Nhấp chuột vào FASTA ta có trình tự axit amin của protein Ghd7 như sau:
Tìm kieám trình töï nucleotit töông töï nhö treân :
Nếu tìm kết quả nghiên cứu của tập đoàn lúa ở Nhật Bản thì kết quả là:
Nếu tìm kết quả nghiên cứu có tác giả Zhang.Q thì kết quả là:
Có 4 kết quả nghiên cứu liên quan đến tác giả Zhang.Q, ta vào kết quả
nghiên cứu 1 thì trình tự nu là: