ỨNG DỤNG PHẦN MỀM NTSYSpc ĐỂ THỐNG KÊ ĐẶC ĐIỂM DI
TRUYỀN TRONG KỸ THUẬT DNA TRONG HỌC PHẦN SINH HỌC
PHÂN TỬ
Lê Thị Thu Phương, Võ Văn Thiệp
Tóm tắt. Ngày nay với sự phát triển của công nghệ thông tin rất mạnh mẽ, nó khơng chỉ được sử
dụng khắp mọi nơi mà cịn ở mọi ngành, qua đó việc xử lý các vấn đề diễn ra nhanh hơn, đồng thời thu
được những kết quả chính xác hơn, qua đó tiết kiệm được công sức của con người. Ngành công nghệ sinh
học địi hỏi sự chính xác rất cao và tất nhiên là có nhiều vấn đề rất phức tạp, chính vì vậy việc phát minh
ra các phần mềm ứng dụng trong ngành cơng nghệ sinh học nói chung và sinh học phân tử nói riêng là
rất quan trọng. Numerical Taxonomy and Multivariate Analysis System for personal computer (NTSYScp)
là phần mềm dùng để thống kê đặc điểm di truyền trong kỹ thuật Axit Deoxyribo Nucleic (DNA). Dựa vào
kỹ thuật Phản ứng chuỗi trùng hợp (Polymerase Chain Reaction – PCR) mẫu DNA và sau đó điện di.
Thơng thường trong tự nhiên về mặt hình thái có những động vật hay thực vật có hình dáng bề ngồi rất
giống nhau nhưng về bản chất di truyền thì khác nhau. Nên việc thống kê tính giống và khác nhau của
quần thể hay cá thể là việc rất cần thiết trong việc chọn tạo giống cho sản xuất cũng như việc phịng trừ
sâu bệnh.
Từ khóa: NTSYScp, đặc điểm di truyền, công nghệ DNA
1. GIỚI THIỆU
Học phần “Sinh học phân tử” (Molecular biology) là môn khoa học nghiên cứu giới sinh
vật hay các hiện tượng sinh vật ở mức độ phân tử, được bố trí ở học kỳ 4 của các lớp Sinh học,
hệ Đại học. Mục đích của học phần “Sinh học phân tử” là giúp người học tìm hiểu mối tương tác
giữa các hệ thống khác nhau trong tế bào bao gồm cả mối liên hệ và tương tác giữa các phân tử
DNA, Axit ribonucleic (RNA), quá trình tổng hợp protein cũng như tìm hiểu cơ chế điều hòa
những mối tương tác này. Kiến thức về các mối tương tác trong từng đối tượng tế bào, mô, cơ
quan, hệ cơ quan, cơ thể ... giúp ta tìm hiểu sâu hơn về học thuyết trung tâm (central Dogma)
trong di truyền học từ đó có những can thiệp thích hợp để đưa đến những ứng dụng trong y dược
học, nông nghiệp, công nghiệp, bảo vệ môi trường [3], [5]... Để khai thác tốt các kiến thức này,
đòi hỏi giảng viên cần phải áp dụng các công nghệ hiện đại, khoa học kỹ thuật vào trong các bài
dạy. Tuy nhiên, với thực tế hiện nay ở trường Đại học Quảng Bình thì vấn đề đó là khá khiêm
tốn, chính vì vậy cần phải tận dụng các phần mềm ứng dụng trong ngành cơng nghệ sinh học nói
chung và sinh học phân tử nói riêng là rất quan trọng. NTSYScp (Numerical Taxonomy and
Multivariate Analysis System for personal computer) là một trong các phần mềm có thể giúp
giảng viên và sinh viên trong việc thống kê đặc điểm di truyền trong kỹ thuật DNA [4]. Trong
bài báo cáo này, chúng tôi mạnh dạn đưa ra một số hướng dẫn trong việc vận dụng NTSYScp để
việc thống kê đặc điểm di truyền trong kỹ thuật DNA, từ đó giúp cho các bạn sinh viên có thể
tiếp cận gần hơn với mục đích của học phần.
2. CÁC THỰC HIỆN
2.1. Cửa sổ chính trong NTSYSpc:
Hình 1. Giao diện của NTSYSpc.
Cửa sổ chính của NTSYSpc đượ minh họa ở Hình 1, trên đó chứa các trình đơn mà bạn
có thể lựa chọn, dưới đây là danh sách các lựa chọn:
- File: trong file là các trình đơn con mà bạn có thể lựa chọn, click vào biểu tượng "file"
để tải danh sách các trình đơn cần lựa chọn, để chọn trình đơn nào bạn chỉ cần left click vào biểu
tượng đó [1].
- Options: Chứa đựng danh sách các thực đơn con, từ đó bạn có thể lựa chọn cấu hình
(configurations) mặc định phục hồi (stores default) mục lục cấu hình sẽ đưa ra một cổng váo của
tham số cho những chương trình tùy chọn cấu hình khác nhau, mục lục mặc định phục hồi sẽ lập
lại tham số cấu hình trở về trạng thái ban đầu của nó [1].
- Help: bao gồm các chương trình con tìm kiếm, gúp đỡ cách thức sử dụng, thông tin về
bản quyền đăng ký [1].
2.2. Customization option:
Customization option cho phép dưa ra các tùy chọn về các modul mà bạn muốn, click
vào "customize" để tải chương trình xuống, xuất ra một cửa sổ dao diện, được thể hiện ở Hình 2,
trong cửa sổ bên trái chứa các danh sách lựa chon bạn dùng chuột rê danh sách để lựa chọn click
vào biểu tượng danh sách, muốn thêm vào một danh sách sử dụng trong thư mục bên trái click
vào biểu tượng tương ứng để thay đổi một modul trong thư mục sử dụng right click tên của nó,
chọn "add/remove" nhấn nút OK để đóng chương trình.
Hình 2. Giao diện của Customization option.
2.3. Ứng dụng trong việc thống kê đặc điểm di truyền trong kỹ thuật DNA
2.3.1. Sơ đồ tổng quát của việc thống kê đặc điểm di truyền trong kỹ thuật DNA
Sơ đồ tổng quát của thống kê đặc điểm di truyền trong kỹ thuật DNA được minh họa
trong Sơ đồ 1.
Sơ đồ 1. Tổng quát của NTSYSpc.
2.3.2. Sử dụng tiến trình PCR (Polymera Chain Reaction) và điện di đọc kết quả trên bảng gel
Ví dụ ta có kết quả sau khi chạy điện di được thể hiện ở Bảng 1.
Bảng 1. Kết quả điện di.
A
-
B
C
D
-
E
-
F
-
G
-
H
-
K
M
N
-
O
P
Q
-
1
2
3
4
5
6
7
8
9
Chú thích:
“-“: Vạch phát sáng sau khi chạy điện di hay còn gọi là Band và đó cũng chính là alen.
Để sử dụng chương trình được ta phải mã hóa bảng số liệu trên thành bảng nhị phân. Cụ
thể: So hàng ngang mẫu nào có vạch “-“ thì đánh số 1 và mẫu nào khơng có vạch thì đánh số 0,
và cứ thế đánh cho đến hết số vạch của mẫu.
Với cách làm như trên ta có bảng số liệu mã hóa từ bảng điện di ở Bảng 1 được minh họa
bằng Bảng 2.
Bảng 2. Số liệu mã hóa từ bảng điện di.
A
B
C
D
E
F
G
H
K
M
N
O
P
Q
1
1
0
0
1
1
1
1
1
0
0
1
0
0
1
2
1
1
1
1
0
0
0
1
1
1
1
1
1
1
3
0
0
0
1
1
1
1
1
1
1
1
0
0
1
4
1
1
1
1
1
1
0
0
0
0
1
1
0
0
5
1
0
0
0
1
1
1
1
1
1
1
1
1
1
6
1
1
1
1
0
0
0
0
1
1
1
1
1
1
7
0
0
0
1
1
1
1
1
0
0
0
0
0
1
8
1
1
1
1
0
0
1
1
1
1
1
0
0
0
9
1
0
0
0
1
1
1
1
0
0
1
1
1
1
2.3.3. Nhập số liệu vào Excel.
Trong cửa sổ Excel chúng ta tiến hành nhập số liệu cho ví dụ trên như sau:
- Hàng 3, cột 1: nhập số 1, đó là số hiển thị một bảng chung
- Hàng 3, cột 2: nhập số vạch điện di gọi là band hay alen (số hàng của ma trận)
- Hàng 3, cột 3: nhập số cột trong bảng mã hóa hay số giống cần thống kê
- Hàng 3, cột 4: nếu nhập số 0 có nghĩa là chúng ta xác định thống kê khơng có sự sai sót
cịn nếu nhập số 1 là có sự sai sót.
- Sau khi nhập xong ta lưu tập tin ở nơi dể nhớ để thực hiên các bước tiếp theo.
- Ở ví dụ này chung ta lưu với tên Thiep-NTSYSPC.xtl như Hình 3.
Hình 3. Số liệu mã hóa sau khi nhập vào Excel.
2.3.4. Nhập số liệu vào chương trình NTSYSpc
a. Khởi động chương trình NTSYSpc
b. Chạy chương trình NTSYSpc
- Từ cửa sổ NTSYSPC click chuột vào nút Similarity
- Tiếp theo chọn Qualitative data
Sau khi chọn sẻ xuất hiện cửa sổ minh họa ở Hình 4
Hình 4. Giao diện Qualitative data.
Trong đó:
- Input file: dùng để nhập tên tập tin mà ta đã nhập vào bảng Excel trên.
- By row?: Nếu chúng ta nhập số liệu bằng hàng thì mới khai báo cịn khơng thì để trống.
- Output file: đặt tên và chon nơi để lưu tên tập tin sau khi chạy chương trình.
- Sau khi điền đầy đủ các thông tin cửa sổ xuất hiện như minh họa trong Hình 5.
Hình 5. Giao diện sau khi điền đầy đủ thơng tin Qualitative data.
Tiếp đó chúng ta bấm nút “Compute”, chương trình sẽ xuất hiện cửa sổ Report listing
như Hình 6.
Hình 6. Giao diện cửa sổ Report listing.
Từ cửa sổ Report listing vào file và chọn load notebook và chọn file NTSYSPC đã lưu ở
trên.
Hình 7. Giao diện Load notebook.
Sau đó sẽ xuất hiện bảng Reload notebook file (Hình 7), chúng ta chọn file đã lưu (đuôi
NTS) và Open. Sẽ xuất hiện bảng kết quả như Hình 8.
Hình 8. Kết quả thống kê.
Đây chính là kết quả thống kê theo dạng số. Tuy nhiên, kết quả dạng này rất khó nhìn kết
quả, để đơn giản hơn ta dùng dạng biểu đồ bằng cách sau:
Từ cửa sổ NTSYSPC chọn nút Clustering, sau khi chọn xuất hiện cửa sổ, chúng ta chọn SAHN,
cửa sổ sẽ xuất hiện giao diện như Hình 9.
Hình 9. Giao diện SAHN.
Khi nhập xong nhấn nút compute sẻ xuất hiện cửa sổ Report listing,sau đó quay trở lại
cửa sổ NTSYSPC chọn biểu tượng hình cây (nút Plot tree) gần nút start ở phía dưới góc trái màn
hình, sẽ xuất hiện như Hình 10
Hình 10. Giao diện Plot tree.
Cuối cùng xuất hiện cửa sổ thống kê dạng cây như minh họa ở Hình 11.
Hình 11. Kết quả thống kê dạng cây.
Như vậy, chúng ta đã có một kết quả thống kê dạng cây rất rõ ràng.
3. KẾT LUẬN
Với sự phát triển nhanh chóng của khoa học kỹ thuật thì việc ứng dụng cơng nghệ thông
tin vào trong việc giảng dạy ở các cấp là rất cần thiết. Tùy vào từng môn, học phần khác nhau mà
có thể ứng dụng các phần mềm khơng giống nhau [2]. Trên đây chúng tôi ứng dụng một phần
trong nhiều ứng dụng của phần mềm NTSYSpc, cụ thể dụng trong việc thống kê đặc điểm di
truyền trong kỹ thuật DNA. Dựa vào kỹ thuật PCR mẫu DNA và sau đó điện di. Kết quả cuối
cùng sẽ cho chúng ta một sờ đồ hình cây, giúp cho chúng ta biết được mối quan hệ họ hàng giữa
các sinh vật với nhau, làm cơ sở cho việc chọn tạo giống cho sản xuất cũng như việc phòng trừ
sâu bệnh.
TÀI LIỆU THAM KHẢO
[1]
[2]
[3]
[4]
[5]
Nguyễn Văn Cách (2005), Tin – Sinh học, NXB Khoa học và Kỹ thuật, Hà Nội.
Nguyễn Phúc Chỉnh, Phạm Đức Hậu (2007), Ứng dụng tin học trong nghiên cứu khoa học giáo
dục và dạy học sinh học, NXB Giáo dục.
Hồ Huỳnh Thùy Dương (1997), Sinh học phân tử, NXB Giáo dục
Khuất Hữu Thanh (2006), Kỹ thuật gen, nguyên lí và ứng dụng, NXB Khoa học và Kỹ thuật, Hà
Nội.
Lê Đức Trình (2001), Sinh học phân tử của tế bào, NXB Khoa học và Kỹ thuật, Hà Nội.