一、人类基因组
人类基因组包括细胞核内的核基因组和细胞质内的线粒体基因组。核基因组由3.16×10 9 bp 组成,线粒体基因组由16569 bp组成。正常体细胞(二倍体)基因组包括二个核基因组和多个线粒体基因组。核基因组包含在22条常染色体和X、Y性染色体内,每条染色体大小不等。
人类基因组的组织特点为:①功能相似或相关的基因常常散在分布于不同的染色体上(尔偶聚集在一起);②基因组中各个基因的大小和内部组织的差异极大;③各个基因的大小差异很大,从数百个bp、几个kb到数百个kb不等;④基因组含重复序列,重复序列大多为非编码的,与编码序列相间排列,以此来分散结构基因;⑤每个结构基因都有单独的调控序列。
人类基因组中,存在着大量的非编码序列,如前述的高度重复顺序、内含子、间隔区DNA等。这些序列中,只有很小一部份具有重要的调节功能,绝大部分都没有什么特殊功用。在这些DNA序列中虽然积累了大量缺失,重复或其他突变,但对生物并没有什么影响,它们的功能似乎只是自身复制,因此将这类DNA称为自私DNA(selfish DNA)或寄生DNA(parasite DNA)。自私DNA也许有重要的功能,只是目前我们对其功能还未了解而已。
二、人类基因组计划
HGP的基本任务可用4张图谱来概括,即遗传图谱、物理图谱、序列图谱和基因图谱。
1.遗传图谱
遗传图又称连锁图。即在基因组中寻找可以表明基因之间位置关系的遗传标记。
第一代标记是经典的遗传标记,最初主要是利用蛋白质和免疫学的标记,如ABO血型位点标记、HLA位点标记。70年代中后期建立起来的限制性片段长度多态性(RFLP)方法在整个基因组中确定的位点数目达到105以上,该系统一经建立就广泛应用到基因组的研究中。RFLP最成功的运用是在Hungtington舞蹈症的基因定位。然而,RFLP可提供的信息量很有限,并且有时还需用放射性同位素标记的DNA片段为探针检测RFLP,因而又存在着工作环境和费用等问题。
第二代标记称“小卫星中心”(minisatellite core)和“微卫星标记”(microsatellite marker),这一系统是目前在基因定位的研究中应用最多的标记系统。
STR的遗传学图距是以cM(厘摩尔根)为单位的,反映基因遗传效应的基因组图。STR作为遗传标记使人类基因组的遗传制图与连锁分析发生了革命性的变化。
第三代标记是称作单核苷酸多态性标记(single nucleotide polymorphism,SNP)的遗传标记系统。人类群体有很大的遗传多样性,由这种方式产生的单碱基变异就形成许多双等位型标记。这种标记在人类基因组中可达到300万个,平均每1000个碱基对就有一个。因此,3~4个相邻的这种标记构成的单倍型(haplotype)就可以有8~16种,相当于一个微卫星标记形成的多态性。
2.物理图谱
完整的物理图应包括人类基因组的不同载体DNA克隆片段重叠群图,大片段限制性内切酶切点图,DNA片段(探针)或一段特异DNA序列(STS)的路标图,以及基因组中广泛存在的特征性序列等的标记图,人类基因组的细胞遗传学图,最终在分子水平上与序列图的统一。
以STS位路标的物理图与已建的遗传图进行对比,可以把遗传学信息和物理信息进行互相转换(如某一 区域1cM的遗传间距可以粗略的“折算”成某一区域1cM的物理间距)。片段重叠群则为研究该区域提供了可以操作的基因组材料,及相互重叠、覆盖这一区域的DNA片段,可以在这一区域寻找某一基因或进行这一区域基因组的研究。而作为人类基因组物理图的组成部分的最基本层次的“细胞遗传图”是统一物理图与遗传图的根本之图。
3.序列图谱
人类基因组计划最初的目标是要在15年内完成测定总长度由30亿个核苷酸组成的人类基因组的序列图。目前的策略是把庞大的基因组分成若干有路标的区域后,进行测序分析。
4.基因图谱
在人类基因组中鉴别出占据2%~5%长度的全部基因的位置、结构与功能。涉及办法很多,但最主要的是通过基因的表达产物mRNA反追到染色体的位置,其原理是:所有生物性状和疾病都是由结构或功能蛋白质决定的,而已知的所有蛋白质都是由RNA聚合酶指导合成的带有多聚A尾巴的mRNA编码的,这样就可以把mRNA通过反转录酶合成cDNA或称作EST的部分cDNA片段,然后,再用这种较稳定的cDNA或EST作为“探针”进行分子杂交,鉴别出与转录有关的基因。
(三) 人类基因组计划的延伸——后基因组计划
功能基因组学延伸的内容有:人类基因组多样性计划、环境基因组学、肿瘤基因组解剖学计划及药物基因组学等。其核心问题一般包括:基因组多样性、遗传疾病产生的起因、基因的表达调控的协调作用以及蛋白质产物的功能等。模式生物体在研究功能基因组学中将起到重要的工具作用。此外,HGP及其延伸内容决定性的成功取决于生物信息学和计算机生物学的发展和应用,主要体现在数据库对数据的储存能力和分析工具的开发。这些都将成为人类基因组计划延伸篇中的主要内容。


