Chương 2
Cấu trúc genome
Genome (hệ gen, bộ gen) là thuật ngữ được dùng với các nghĩa khác
nhau như sau:
- Nguyên liệu di truyền của một cơ thể: 1) nhiễm sắc thể trong tế bào
vi khuẩn (hoặc một trong mỗi loại nhiễm sắc thể nếu hơn một loại có mặt, ví
dụ: các nhiễm sắc thể lớn hoặc bé của Vibrio cholerae), 2) DNA hoặc RNA
trong một virion, 3) nhiễm sắc thể cùng với mọi plasmid được kết hợp (ví
dụ: nhiễm sắc thể và hai plasmid nhỏ trong vi khuẩn Buchnera).
- Tất cả các gen (khác nhau) trong tế bào hoặc virion.
- Bộ nhiễm sắc thể đơn bội hoặc genome đơn bội trong tế bào.
Chuỗi genome hoàn chỉnh (nghĩa là trình tự hoàn chỉnh của các
nucleotide trong genome) đã được công bố cho một số loài vi khuẩn. Các
trình
tự
khác
cũng
đã
được
công
bố,
dụ
genome
của
cây
cúc
dại
(Arabidopsis thaliana) và genome người.
Genome chứa toàn bộ thông tin di truyền và các chương trình cần thiết
cho cơ thể hoạt động. Ở các sinh vật nhân thật (eukaryote), 99% genome
nằm trong nhân tế bào và phần còn lại nằm trong một số cơ quan tử như ty
thể và lạp thể. Đa số genome vi khuẩn và phần genome chứa trong các cơ
quan tử thường có kích thước nhỏ và ở dạng vòng khép kín. Ngược lại, phần
genome trong nhân thường rất lớn và phân bố trên các nhiễm sắc thể dạng
thẳng.
Dự án genome là dự án xác định cấu trúc di truyền chính xác của một
genome cơ thể sống, nghĩa là trình tự DNA của tất cả các gen của nó. Dự án
genome của một số sinh vật mô hình (model organisms) đã được hoàn thành
như sau:
-
Các
genome
vi
khuẩn.
Các
trình
tự
hoàn
chỉnh
của
genome
Escherichia
coli
đã
được
xác
định
theo
phương
thức
tổ
hợp/tập
hợp
(consortium) của các phòng thí nghiệm. Năm 1995, hai trình tự genome
hoàn
chỉnh
của
vi
khuẩn
Haemophilus
influenzae
Mycoplasma
genitalium cũng được hoàn thành. Loài M. genitalium có một genome đơn
Sinh học phân tử
26
giản (khoảng 580.067 base), do nó dựa vào vật chủ để vận hành nhiều bộ
máy trao đổi chất của mình. Loài H. influenzae là một vi khuẩn đặc trưng
hơn, và có genome
khoảng 1.830.121 base với 1.749 gen.
- Chuỗi genome hoàn chỉnh của nấm men Saccharomyces cerevisiae
đã được hoàn chỉnh trong năm 1996, nhờ một consortium của các phòng thí
nghiệm. Genome của chúng dài 12.146.000 base.
-
Các
dự
án
genome
động vật
như:
chuột,
cừu,
lợn,
giun
tròn
(Caenorhabditis elegans), ruồi giấm (Drosophila melanogaster)…, hoặc ở
thực vật như: lúa nước, lúa mì, ngô, táo, cúc dại…, mà nổi bật nhất trong số
đó là dự án genome người cũng đã được thực hiện.
Ngày 12. 2. 2001 genome người đã được công bố với khoảng 30.000
gen, ít hơn nhiều so với dự kiến trước đây (hàng trăm ngàn gen), và chỉ gấp
hai lần giun tròn hoặc ruồi giấm. Người ta đã xác định hệ gen người giống
98% so với tinh tinh và có đến 99% là giống nhau giữa các dân tộc, các cá
thể. Do đó, vấn đề hình thành và phát triển nhân cách, chỉ số thông minh...
phải chủ yếu trên cơ sở xã hội và sự rèn luyện của từng người để phát triển
tiềm năng sinh học của bản thân.
Trình tự genome của những sinh vật mô hình rất có ý nghĩa trong
những nghiên cứu của một chuyên ngành khoa học mới đó là genome học
(genomics). Dựa vào đây, các nhà sinh học phân tử có thể phân tích cấu
trúc, hoạt động và chức năng của các gen, làm sáng tỏ được vai trò của
DNA lặp lại, DNA không chứa mã di truyền, DNA nằm giữa các gen... Điều
đặc biệt có ý nghĩa là khi so sánh các genome với nhau, có thể hiểu được
hoạt động của genome trong các cơ thể sống, mối quan hệ giữa chúng, sự đa
dạng sinh học và mức độ tiến hóa.
Kết quả bước đầu so sánh genome giữa các loài sinh vật với nhau đã
cho thấy có ba đặc điểm nổi bật: 1) các gen phân bố trong genome không
theo qui luật, 2) kích thước của genome thay đổi không tỷ lệ thuận (tương
quan) với tính phức tạp của loài, 3) số lượng nhiễm sắc thể cũng rất khác
nhau ngay giữa những loài rất gần nhau.
I. Thành phần đặc điểm của genome
Genome chứa mọi thông tin di truyền đặc trưng cho từng loài, thậm
chí cho từng cá thể trong loài. Genome có thể bao gồm các phân tử DNA
Sinh học phân tử
27
hoặc RNA. Đối với sinh vật bậc cao, kích thước genome thay đổi từ 109 bp
(động
vật
vú)
đến
1011
bp
(thực
vật).
Khác
với
tế
bào
tiền
nhân
(prokaryote), các gen trong genome của eukaryote thường tồn tại nhiều bản
sao và thường bị gián đoạn bởi các đoạn mã mù không mang thông tin di
truyền (các intron). Vì vậy, một trong những vấn đề đang được quan tâm là
cần phải biết số lượng các gen khác nhau có mặt trong genome cũng như số
lượng các gen hoạt động trong từng loại mô, từng giai đoạn phát triển và tỷ
lệ các gen so với kích thước genome...
1. Genome của quan tử
Hầu hết genome của cơ quan tử, nhưng không phải luôn luôn, có dạng
phân tử DNA mạch vòng đơn của một chuỗi duy nhất.
Genome của cơ quan tử mã hóa cho một số, không phải tất cả, các
protein được tìm thấy trong cơ quan tử. Do có nhiều cơ quan tử trong một tế
bào, cho nên có nhiều genome của cơ quan tử trên một tế bào. Mặc dù bản
thân genome của cơ quan tử là duy nhất. Nhưng nó cấu tạo gồm một chuỗi
lặp lại1 liên quan với mọi chuỗi không lặp lại2 của nhân. Về nguyên tắc, các
gen cơ quan tử được phiên mã và dịch mã bởi các cơ quan tử.
1.1. Genome của ty thể
DNA ty thể (mitochondrial DNA-mtDNA) là một genome độc lập,
thường là mạch vòng, được định vị trong ty thể.
- DNA ty thể của tế bào động vật mã hóa đặc trưng cho 13 protein, 2
rRNA và 22 tRNA.
- DNA ty thể của nấm men S. cerevisiae dài hơn mtDNA của tế bào
động vật năm lần do sự có mặt của các đoạn intron dài.
Các genome ty thể có kích thước tổng số rất khác nhau, các tế bào
động vật có kích thước genome nhỏ (khoảng 16,5 kb ở động vật có vú)
(Hình 2.1). Có khoảng một vài trăm ty thể trên một tế bào. Mỗi ty thể có
1 DNA lặp lại mô tả các chuỗi hiện diện hơn một bản sao trong mỗi genome.
2 DNA không lặp lại chứa các chuỗi duy nhất: chỉ có một bản sao trong genome
đơn bội.
Sinh học phân tử
28