基因图
人类基因图谱的完成,是医学上一场革命的开始,但这场革命的成功将需要更长的时间。中国科学家承担了这个工程1%的工作量。 人类基因图谱的绘制完成,给即将广泛推行的全新基因医疗手段打下了坚实的基础,它使人类向真正的“个性化医疗”时代又迈进一步。今后,遗传疾病或是疑难杂症,只要根据患者个人的基因图谱“逮住”其中出了问题的基因,用最直接的办法使基因恢复正常状态,人体就会作出相应调整,从而治愈疾病。人类大约有3万个基因,比科研人员原本预料的少了许多。通过了解人类基因的遗传成分,科研人员就可为个人量身制作预防性疗法并且制造各种新药物,父母也可以检查腹中胎儿是否有遗传缺陷。而有朝一日,像糖尿病、癌症、早老性痴呆症、精神病等过去无法根治的病症,也能根治了。
人类基因图的意义[编辑 | 编辑源代码]
人类基因组序列图是一个了不起的成就,是当代世界最先进的生物、信息等多种学科技术的有机集成。人类基因组计划开始于1990年,来自6国的一大批科研机构先后参与了这一纷繁复杂的工程。在研究项目启动之初,要完全确认一个碱基对需要花费10美元,一名经过严格训练的技术人员一天只能完成1万个碱基对的测序,而随着技术的突飞猛进,目前确认一个碱基对的成本降到了5美分,利用机器人测序,其效率是每秒钟1万个碱基对。在各国专家的精诚合作下,人类基因组计划2000年6月完成了人类基因组序列的“工作框架图”,2002年2月又公布了“精细图”,此次又推出了“完成图”。从“框架图”到“完成图”,人类基因组测序范围从90%提高到了99%,以碱基对为基础的误差率从1/1000降到了1/10000。科学家发现,人类基因数目约为3.4万至3.5万个,仅比果蝇多2万个,远小于原先10万个基因的估计。基因是生命遗传的基本单位,人类基因组包含30亿个碱基对,绘制出人类基因组序列图就意味着掌握了探索人类“生命迷宫”的路标。
人类基因组序列图的完成具有许多重要意义和实用价值。首先,它为人类了解自身提供了一个十分重要的平台。通过研究基因序列可以进一步分辨出人与人之间、族群与族群之间在生理上有何异同。专家称,人类基因组研究的下一个目标是人类基因组单体型图计划,目前美国、英国、日本、加拿大和中国科学家已在着手进行这一工程。人类基因组单体型图计划旨在分析各主要人类群体的差异,并在此基础上进一步分析所有与疾病相关的序列差异,为21世纪的“个人医学”奠定基础。
其次,它会引起生物学研究的“彻底革命”。在基因时代之前,大学生物学系的研究生们几十人花几年时间分析一种基因的功能,而如今只要点击几下电脑键盘,同样的信息即可展现眼前。自从人类基因组计划开始以来,被确定引起人类疾病的基因数量发生了“爆炸”,从1990年的不足100个猛升到了今天的1400多个。
第三,它可能会促使人类社会进入“生物制药的新时代”,为治愈许多疑难病症提供一条捷径。科学家认为,通过对个体病人DNA的分析,将来有可能会设计出不引起副作用的专门药物或是疫苗,从而达到百分之百的对症下药。在不远的将来,基因工程药物、基因治疗、生物芯片诊断技术等都会有极其广阔的应用前景。目前,美国正在这方面加大力度争占制高点,根据基因研究而推出的新药已有350种投入了生产。
第四,它还有利于能源开发和环境保护。美国能源部正在利用人类基因组计划的成果加紧研究单细胞生物的各种功能。比如,利用先进的电脑测序技术寻找某些微生物,看其能否帮助清理核废料,能否让汽油燃烧更彻底,或者干脆让其替代成为产生燃料氢的来源体。
基因图:
早在1990年,美国政府就开始了“人类基因组图谱计划”。2001年2月12日,中、美、日、德、法、英等6国科学家和美国塞莱拉公司联合公布人类基因组图谱及初步分析结果。作为现代生命科学和基因组科学的权威,在沃森(James Watson)等人的推动下,人类基因组计划在过去10多年里成功得以实施。
尽管有了全人类的基因组图谱,但是每个人的基因组仍有不同之处。人们何时能有自己的基因组图谱?答案是2007年。5月30日,时年79岁的沃森成为世界上首位获得自己基因组图谱的个人。此次破译过程发现的人类遗传变异的数量比之前人们所设想的要“丰富”得多。同时,生物科学界的“怪人”文特尔的私人生物技术公司也制作完成了他本人的个人基因组图谱。
1953年3月,沃森与弗朗西斯.克里克发现了DNA的双链分子结构,从此为人类探索生命遗传秘密开辟了道路。沃森因此被称为“DNA之父”。57年后,美国一家基因技术公司交给沃森一张光盘,上面记录有数万个人类基因中30亿个碱基对在沃森细胞内DNA双链上的排列位置。这便是沃森的个人基因组图谱。
而目前哈佛大学的乔治.丘吉尔更是宣布,要在近期内为10位志愿者做他们各自的个人基因组图谱。看来,基因组图谱的个体化正在一步步地扩散。
事实上有了个人基因组图谱,科学家便可以依据其基因排列顺序推断,这个人是否害羞、会不会患上精神疾病等等与基因遗传有关的表象特征。看来,绘制个人基因组图谱有着无比的检测优势。
而除去价格因素,绘制个人基因组图谱与传统的遗传检测相比还有其他方面的优势。美国贝勒大学(Baylor University)遗传学专家理查德.吉布斯就认为,遗传检测针对性和局限性较大,只能确认被检测基因是否是人类已知的基因变异种类之一。如果绘制个人基因组图谱,则能够以之与人类基因组图谱基准相比较,可以发现任何异常。
事实上,沃森、文特尔个人基因组图谱的诞生,意味着普通人不久也能拥有属于自己的基因组图谱,届时关于你的一切,与天性甚或与环境相连的每个基本问题,过去的、现在的、未来的,都将在基因中得到解答,一个个性化、具体化的基因组学时代即将来临。
- 观点
关注0.1%的差异
在科学家完成人类基因组图谱后,个体化的基因组图谱便成为一个的目标。毕竟人类基因组图谱是很多人的,有参照基因,但没有个体的具体信息。地球上所有人的基因组99.9%的部分都是相同的,这份基因组图我们称为参考序列。但是影响个体的也许就在0.1%的差异中。
由此,2007年基因学界最大的突破不是在技术上,而是在个体化上。去年科学家完成的是从概念中的人到具体化个体的突进。这样,就可以有针对性地预防、治疗疾病等。类似沃森基因组图谱公布后,我们就可以知道沃森有患老年痴呆症的可能。这样就可以提早做准备,做些预防。
尽管现在获得个人基因组图谱的个体还极少,但这已经给我们预示了一个向,对于我们每个人的信息都将一一得到对应。而且以后,基因组测序的技术也在不断得到提高,费用在不断减少。
现在中国人也有了自己的个人基因组图谱,那就是“炎黄一号”。“炎黄一号”尽管没有对外声称具体到哪个中国人个体,但是华大基因院www.genomics.org.cn已经有技术和能力做到一个个体的基因组图谱。
———白玉杰(浙江大学迪诺遗传与基因组医学研究中心教授)
- 备选
首张亚洲人全基因序列图谱
2007年10月11日,深圳华大基因研究院召开新闻发布会,宣布他们成功绘制出第一幅完整的中国人基因组图谱,又称“炎黄一号”。这是第一个亚洲人全基因序列图谱。
此前,我国科学家承担了国际人类基因组计划1%的任务、国际人类单体型图谱10%的任务。而近年来随着测序技术新的进步,极大加速了解码生命的进程,成本降低了几个数量级,时间也大为缩短。在此前提下,该合作研究团队提出了“炎黄计划”,即绘制中国人基因组序列图谱和多态性图谱的研究设想。
在研究人员看来,不同族群的基因图谱必不可少。因为遗传保证了生命的延续,而突变产生了不同物种以及人与人之间的差异。不同族群便有着各自独特的遗传背景,对不同病的易感性也可能不一样。只有真正了解基因与疾病的关系,才能根据每个个体的基因进行疾病预测和检测,及早做出预防方案或进行针对性治疗。
由此,到2007年10月初,科学研究人员用新一代测序技术独立完成了第一个100%中国人基因组图谱。专家表示,这项在基因组科学领域里程碑式的科学成果,对于中国乃至亚洲人的DNA、隐形疾病基因、流行病预测等领域的研究具有重要作用。而科学研究人员也规划好了下一步研究工作,将是进行上百个乃至更多的个体基因组分析,发现亚洲人基因组多态性的规律。
小鼠H-2基因图[编辑 | 编辑源代码]
MHC指某一物种的某一号染色体(如人HLA在第6号染色体,小鼠H-2在17号染色体)上一组密切连锁的基因,它在主要组织相容性抗原识别以及清除外来和内在抗原起重要作用。人的MHC称为HLA,在小鼠称为H-2。其余灵长类和某些非灵长类动物的MHC有了新的命名规定与建议,原MHC的后两个字母HC改为小写,即Mhc。
各种动物MHC的作用基本相似,包括:(1)MHC编码的抗原广泛分布于淋巴细胞和其它有核细胞的表面,与同种内移植排斥有关,也是刺激混合淋巴细胞反应(MLR)和移植物抗宿主反应 (GVHR)的主要刺激抗原;(2)控制机体对抗原的免疫应答或免疫抑制, 以及免疫活性细胞之间相互作用;(3)编码补体系统中的某些组分;(4) MHC中某些抗原出现的频率与对某些疾病的易感性有关。
小鼠的组织相容性抗原有几十种以上,由常染色体H-1、H-2、H-3……、H-30等基因编码(H表示组织相容性histocompatibility),此外,还受小鼠性染色体基因(雄性为XY,雌性为XX)控制。其中H-2抗原为小鼠主要组织相容性抗原系统,而其他抗原均系次要组织相容性抗原系统。MHC在小鼠即为H-2,目前对H-2系统研究得较为清楚,位于第17对染色体内, 长度约占0.5分摩。H-2抗原具有高度多态性。用血清学方法检出H-2Ⅰ类抗原特异性在100个以上,可分为私有抗原(private antigen)和公有抗原(public antigen)。 私有抗原是某一近交系(inbred strain)小鼠特有的抗原标志,在某一特定近交系小鼠只能检出一个K区和一个D区的私有抗原。公有抗原是在不同品系小鼠中都可检出的一些交叉抗原, 每一品系小鼠通常都可检出多个公有抗原特异性。根据血清学检定抗原的反应格局,可将近交系小鼠分为不同单体型的品系,用H-2右上方小写的英文字母表示,如H-2x、H-2d和H-2b等。
H-2基因群中可分为K、I、S和D四个区,I区又可分为I-A、I-E等亚区。按其编码抗原结构和功能不同,又可将H-2复合体分为三类基因:(1)Ⅰ类基因,位于K区和D区,包括K、 D基因座,最近又增加了K2、L和L2(?)新的基因座;(2)Ⅱ类基因,位于I区,包括Aβ、Aα、Eβ和Eα等基因座;(3)Ⅲ类基因,包括补体C4、C2、Bf和编码雄性激素结合蛋白性限蛋白 (sex limited protein, Slp)基因座(图6-1)。由于小鼠H-2基因群含有Ⅰ(罗马字)类基因,不同区中有I(英文大写)区,应注意鉴别,切勿混淆。此外,H-2中有些基因位于Qa和TL区,可能参与H-2多态性的形成以及TCRγδ T细胞识别抗原时的遗传限制。
人HLA基因图及其遗传特征[编辑 | 编辑源代码]
在人类MHC称为HLA(human leucocyte antigen), 是迄今为止所知的人类最复杂的基因族。除成熟的红细胞外,HLA抗原几乎分布于人体的各种有核细胞以及血小板。 由于此组抗原首先在人外周血白细胞上发现,同时表达抗原水平较高,目前多采用外周血淋巴细胞来检测这类抗原的型别,故称为人类白细胞抗原(HLA)。
(一)HLA基因定位
至1991年底,HLA基因座位已确定近60个,正式命名的等位基因278个。这些基因分类的方式主要有以下两种。(1)传统的分类法,即把HLA分为与小鼠H-2相似的Ⅰ类、Ⅱ类和Ⅲ 类基因,(2)1991年Bodmer建议将它重新划分的三类: 第一类包括传统分类中的HLA-Ⅰ类和Ⅱ类,还包括一对DMA和DMB;第二类称为免疫功能相关基因,包括C4、Bf、C2、TNFA、TNFB、HSP70、TAP1、TAP2、LMP2和LMP7等;第三类是一些与上述无关的基因。 本章仍按传统分类法进行讨论。
HLA占第6号染色体很窄的一个区带, 估计占人体整个基因组的1/3000,长约3500kb。
利用交换率越大基因座位距离越远,交换率越小基因座位距离越近的原理,可以通过交换率的计算作基因图,经过家谱分析和交换率的计算作基因图,A-B座位的交换率为0.8分摩 (centi Morgan, cM。是基因交换率在基因图上的图距单位,重组频率在1%的两个连锁基因之间的距离为1cM),A-C为0.6cM,B-C为0.2cM,B-D为0.8cM,HLA基因群全长距离约为4cM。
自1964年以来,每隔3~4年召开一次国际组织相容性工作讨论会(International Histocompatibility Workshop, IHW), 最近一次于1991年11月在日本横滨召开,并预定于1995年在法国召开第12次IHW。经过这些会议陆续报告了HLA的许多基因及大量的等位基因。现知在HLA-Ⅰ类基因区中,除已知的HLA-A、-B、-C座位外,还发现了-E、-F、-G,-H和-J,新发现的这些Ⅰ类基因座位大多数为伪基因。现在A座位已发现等位基因41个,B座位61个, C座位18个,E座位4个。在HLA-A与-E之间可能存在着重组热点。在HLA-Ⅱ类基因中,已发现了近30个基因座位,等位基因更多,其中DR、DQ、DP均由一条A链与一条B链组成异源二聚体分子(参后述),而A链基因与B链基因及其等位基因为数甚多,后者如DRB1座位60个,DRB3座位4个,DRB5座位4个,DRB6座位3个;DQA1座位14个,DQB1座位19个;DPA1座位8个,DPB1座位38等等。 DRA编码DRα链;DRB1编码β1链,决定的特异性为DR1、DR2、DR3、DR4、DR5等; DRB2为伪基因;DRB3编码DRβ3链,决定DR52及Dw24、Dw25、Dw26等特异性;DRB4编码DRβ4链,决定DR53特异性;DRB5编码DRβ5链,决定DR51特异性; DRB6、B7、B8、B9均为伪基因。 DQA1编码DQα链;DQB1编码DQβ链;DQA2、B2尚未得知其表达; DQB3为伪基因。DOB编码DOβ链。DMA编码DMα链;DMB编码DMβ链。DNA编码DNα链、DPA1编码DPα链;DPB1编码DPβ链;DPA2和DPB2为伪基因。此外与肽运转至内质网有关的基因TAP1(transporter of antigen peptides)、TAP2和与抗原加工有关的基因称之为低分子量多肽或称大的多功能蛋白酶LMP2 (low molecular weight polypeptides or large multifunctional protease-2)、LMP7也位于Ⅱ类基因区。Ⅲ类基因区包括补体C2、C4、B因子,此外, 21羟化酶A与B、HSP70(heat shock protein70, 热休克蛋白70)和肿瘤坏死因子α、β基因也在这里。21A是假基因,21B具有编码21羟化酶功能。21羟化酶是肾上腺皮质合成皮质醇和醛固醇必不可少的酶,如此酶缺乏,可导致先天性肾上腺皮质增生症。
HLA和H-2基因的比较见图6-5。小鼠H-2的Tla为存在于胸腺细胞和某些胸腺白血病细胞上的抗原(thymus-leukemia antigen); Tla与H-2D之间还有Qa区。Qa区中有17个Qa基因,还有12个Qa基因在Tla区,但大部分Qa基因是静息基因(silent gene)。目前已测得6个Q基因有表达,其中Qa2、Qa3、Qa4、Qa5由Qa区基因编码,Qa1和Qa6由Tla区编码。
(二)HLA血清学抗原的命名
目前已确定的HLA血清学抗原共有161个,其中A有27个,B有59个,C有10个,D有26个, DR有24个,DQ有9个,DP有6个。C座位上的抗原编号是公认的,为了避免与补体C相混淆特标以“W”。某些抗原数字后带有括号的抗原编号, 表示括号前的抗原为括号内抗原的裂解产物,如A23和A24是A9抗原的裂解产物(表6-4)。
(三)HLA的家系遗传及多态性
1.HLA的家系遗传 HLA单体型可作为一个单位遗传给子代。a、b、c、d是双亲或子代HLA单体型的代号;1、2、3是HLA-A抗原,?为未检出HLA-A抗原;5、7、8、12是HLA-B抗原。
基因频率和基因平衡定律 基因频率指在群体中某一等位基因出现的机率与该群体全部等位基因 之比。基因平衡定律指如果群体足够大又是随机交配,在没有新的突变和自然选择的情况下,基因频率 可以世代维持不变。HLA基因频率亦符合这一定律。在群体中,一个抗原频率反映了控制这一抗原的基因频率。
HLA 中的基因之间也有一定的交换和重组机率,一般取决于两个基因之间的距离。但HLA多基因座组成的单体型并非完全随机,有些基因比其它基因更多地连锁在一起,称为连锁不平衡(linkage disequilibrium)。换句话说,实际观察到的两个或更多基因出现在同一条单倍体上的频率大于按照独立分配规律所预期的频率。如在白种人中A1的基因频率为0.12,B8的基因频率为0.17, A1和B8基因出现在同一条单倍体上的预期频率为0.12×0.17=0.02, 但实际观察到的频率为0.09。HLA 的连锁不平衡与对某些疾病的易感有关。
已被检出的众多的HLA抗原在不同人种甚至不同地区的人群中的分布存在着很大的差别。如白种人HLA-A1、A3、D8检出率较高;黄种人以A24、B46、B54的检出率较高,黑种人以HLA-A36、A43、B53检出率最高。在单体型的检出率也同样有差别,如北欧人以HLA-A1、B8,HLA-A8、B7两个单体型最常见,黄种人以HLA-A9、B15和HLA-A2、B空白抗原的单体型较常见,我国汉族人以HLA-A2、B46,HLA-A11、B40和HLA-A2、B40单体型最常见。 在研究HLA系统与疾病之间的关系时必须与所研究同一地区正常人群作为对照。
2.HLA的多态性(polymorphism)现象 多态性指在同一相互交配的群体中, 同一基因座可编两种以上的基因产物。HLA的多态性主要是由于复等位基因和共显性所致: (1)复等位基因(multiple alleles),位于一对同源染色体上对应位置的一对基因叫等位基因。由于群体的突变,同一基因座的基因系列称为复等位基因,对某一个体来说一个基因座只有一对等位基因,复等位基因是群体的概念。HLA存在为数众多的复等位基因。(2)共显性(codominant),共显性状态就是每一世代中无论是纯合状态还是杂合状态, 这一对等位基因所控制的性状都能表现出来,HLA每个基因座上的等位基因都是共显性的。