基因与基因组的结构与功能.ppt
《基因与基因组的结构与功能.ppt》由会员分享,可在线阅读,更多相关《基因与基因组的结构与功能.ppt(144页珍藏版)》请在课桌文档上搜索。
1、第三章 基因与基因组的结构 和功能,structures and functions of gene and genome,内容提纲,第一节、基因的概念和结构第二节、基因组第三节、基因组的包装第四节、遗传图谱、物理图谱和基因图谱第五节、人类基因组,第一节 基因的概念和结构,基因的概念,基因是原核生物、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。包括编码蛋白质和tRNA、rRNA的结构基因,以及具有调节控制作用的调控基因。,一、基因的生物学定义,基因的发展简史,从遗传学史的角度看,基因概念大致分以下几个阶段:,基因的发展简史,泛基因阶段,指1860年以前的发
2、展时期。主要进展是光学显微镜的发展、细胞理论的阐明和1859年达尔文的物种的起源的发表。,基因的发展简史,基因概念的提出,孟德尔提出的遗传因子是基因的雏形名词。萨顿和鲍维里提出了遗传的染色体理论。1909年约翰逊提出了“基因”概念。,孟德尔,1866年,孟德尔在植物的杂交试验文中提出:“生物体的某一特定性状是受一个遗传因子(genetic factor)所控制的,也就是一个因子决定一个性状”。,基因的发展简史,结构基因与功能的探索,1926年摩尔根出版的基因论建立了著名的基因学说,通过绘制果蝇基因位置图,首次完成了当时最新的基因概念描述。,摩尔根,1926年,Morgan在基因论中提出:“基因
3、既是携带生物体遗传信息的结构单位,又是控制一个特定性状的功能单位”,基因的发展简史,顺反子学说的提出,1957年本滋尔提出了“顺反子学说”。顺反子由多个突变位点组成,这些位点间可发生交换。一般而言,一个顺反子就是一个基因。,基因的发展简史,操纵子学说的提出,1961年雅各布和莫诺提出了操纵子学说。从此根据功能基因把基因分为结构基因、调节基因和操纵基因。,雅各布与莫诺,基因的发展简史,基因概念的进一步发展,断裂基因,1977年,Berget等首先发现,在真核生物基因组中,基因是不连续的,在编码区域内部含有大量的不编码序列,从而隔断了对应于蛋白质的氨基酸序列。这种不连续的基因又称断裂基因或割裂基因
4、。,基因的发展简史,基因概念的进一步发展,可变剪接与反式剪接,在细胞发育过程中,一个基因的RNA原始转录本可以经过不同的剪接程序,把不同的外显子连接起来形成不同的信使RNA,从而产生不同的蛋白质异型满足发育的需要。,基因的发展简史,基因概念的进一步发展,重叠基因,小鼠淀粉酶在不同组织中mRNA的选择性剪接,基因的发展简史,基因概念的进一步发展,其他,管家基因与奢侈基因转座子组装基因信使RNA的编辑蛋白质修饰和剪接反式翻译,即:基因决定遗传性状的表达,它存在于染色体和线粒体上,呈直线排列并世代相传。基因的颗粒性表现在世代相传的行为和功能表达上具有相对的独立性。,基因有多种存在形式:,1、断裂基因
5、(split genes)是指基因的编码序列在DNA分子上是不连续的,被一些不编码的序列所隔开。即真核生物的结构基因是由若干个编码序列和非编码序列镶嵌排列而成的。(外显子、内含子、相对),2、重叠基因(overlapping genes)仅存在于病毒和噬菌体中。指一个基因与另一个基因在同一DNA分子上部分或完全重叠。分三种重叠方式:一个基因全部位于另一个基因中、部分基因重叠、只有一个碱基重复。,重叠类型:重叠一个核苷酸:5 T A A T G 3 正链 3 A T T A C 5 负链 5 U A A U G 3 RNA UAA为D基因的终止码,AUG为J基因的 起始码,两个基因重叠一个核苷酸
6、 重叠两个核苷酸:5 A T G A 3 正链 3 T A C T 5 负链 5 A U G A 3 RNA A基因的终止码UGA与C基因的起始码AUG 重叠两个核苷酸,部分重叠:K基因与A基因重叠83个核苷酸,与C基因 重叠85个核苷 酸 K 51 218 A 3973 133 C 390 完全重叠:E基因在D基因中,重叠322个核苷酸 E 518 840 D 390 845,B基因在A基因中,重叠388个核苷酸 B 5046 48 A 3973 133 三重重叠:1978年,有人发现Sv40病毒3个外壳蛋白基 因 Vp1、Vp2、Vp3三重重叠。有5234bp,环状双链基因组分成10分钟长
7、.Vp1 7-1.5 Vp2、7-9.8 Vp3 7-9.8,3、复等位基因(multiple alleles)基因存在可变形式,称为等位基因(allele)。每一条染色体由线性排列的基因组成。每条基因位于染色体的特殊位点上,称为遗传基因座(genetic locus)。等位基因就是该基因座上所发现的不同形式。,在一种生物群体中,某一个基因座位上的不同等位基因的数目是相当大的,称之为复等位基因(multiple alleles)。,但一个二倍体生物在一个基因座位上只有其中一对等位基因。两份拷贝中一份是来自父本的等位基因,另一份是来自母本的等位基因。,如,人类ABO血型系统有3个复等位基因,IA
8、、IB、i。IA和IB互为共显,但对i显性。,4、假基因(pseudogene,)假基因(pseudogene,)是指与某些有功能的基因结构序列非常相似,但不能表达基因产物,或转录生成无功能蛋白质的基因。假基因在高等哺乳动物基因组中是一种普遍现象,许多多基因家族中的部分成员为假基因。5、结构基因(structure genes)结构基因(structure genes)是指基因中编码RNA或蛋白质的DNA序列。,二、基因的现代分子生物学概念,基因是核酸的中贮存遗传信息的遗传单位,是贮存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列。包括编码序列、编码外序列的侧翼序列及
9、插入序列。,从生物化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单位或1个突变单位。,严格地说,一个完整的基因应包括:,前导区(leader):RNA起始密码5端的非编译序列。,尾部区(trailer):RNA分子3端终止密码子后的非翻译部分。,内含子(intron):指一个基因中编码mRNA序列之间的序列。,外显子(exon):指一个基因中编码mRNA的序列。,三、基因的功能,基因是使其自身永存的单位,通过蛋白质或多肽的形式表达其功能。,基因的遗传信息通过转录、翻译和翻译后加
10、工的过程成为具有生物功能的多肽和蛋白质。,转录(transcription):指将DNA分子上的核苷酸序列的遗传信息转变为RNA分子上的核苷酸序列。,翻译(translation):指将RNA分子上的核苷酸序列的遗传信息转变为蛋白质和多肽分子的氨基酸序列。,四、基因的结构,原核生物的结构基因是连续的。真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成,编码序列不连续,称为断裂基因(interrupted gene)。,1、结构基因,基因中编码RNA或蛋白质的DNA序列。,真核基因中RNA剪接的识别信号,内含子的 5端以GT开始,3端以AG结束。,GT-AG法则,intron
11、2,intron1,2、转录调控序列,前导序列,尾部序列,结构基因编码区两侧的一段不被翻译的DNA片段(侧翼序列),参与转录调控。,原核生物基因的调控序列,真核生物基因的调控序列,反式作用因子(trans-acting factor)能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA。,顺式作用元件(cis-acting element)能影响基因表达,但不编码RNA和蛋白质的DNA序列。,顺式作用元件,TATA盒(TATA Box):位于-25-30bp,TATAAAA/TATATAT,启动基因转录。,启动子和上游启动子元件,-25,+1,-30,-30,-25,+1,-80
12、,-70,CAAT盒(CAAT Box)位于-70-80bp,GG C/T CAATCT,决定启动子转录效率。,GC盒(GC Box)位于-35bp,GGCGG,与转录因子SP1结合,促进转录的过程。,-35,+1,增强子(enhancer),CAAT box,与转录因子特异性结合,增强转录活性,在基因任意位置都有效、无方向性。,TATA box,enhancer,promoter,5,3,exon intron,Poly(A)加尾信号,含有II类启动子的基因,基因末端保守的AATAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA 3端加约200个A。,CAAT box,T
13、ATA box,Enhancer,promoter,真核生物基因的结构,exon,exon,5,3,intron,intron,exon,开放阅读框:open reading frame,ORF,response element,3、中心法则(central dogma),原核生物的mRNA是多顺反子mRNA,多顺反子mRNA(polycistronic mRNA):原核生物的一个mRNA分子带有几个 结构基因的遗传信息,利用共同的启动 子及终止信号,组成操纵子的基因表达 调控单元。,单顺反子mRNA(monocistronic mRNA):,真核生物的一个编码基因转录生成一个mRNA。,五、
14、癌基因和抑癌基因,1910年Rous发现鸡肉瘤病毒(RSV:RNA反转录病毒)。1963年Dulbeco发现正常细胞感染病毒可恶变为癌细胞。1970年Baltimore发现病毒感染宿主时,RNA经逆转录酶合成DNA并整合到宿主DNA,从而导致宿主细胞的恶性转化。1970年Marein证明细胞恶性转化与RSV基因组中一个特定的基因src相关,该基因被命名为病毒癌基因。1976年Bishop证明正常细胞中存在与v-oncogene同源序列细胞癌基因(cellular oncogene,c-onc)。80年代初Weinberg 等几个实验室通过转染实验证明人体细胞中的癌基因H-ras。现已发现100
15、多种的oncs。,癌基因的概念,在致瘤病毒、人体和动物肿瘤中发现的可以导致细胞恶性转化的核酸片断,称为癌基因。根据其来源可以分为三类。病毒癌基因、原癌基因、细胞癌基因 无论病毒癌基因还是细胞癌基因被激活后均有诱导肿瘤发生的作用,所以有时候我们又将肿瘤细胞中的癌基因称为肿瘤癌基因。,病毒癌基因(virus-oncogene;v-onco)指病毒核酸能够使细胞恶性转化的片断。原癌基因(proto-oncogene,pro-onco)在人类、哺乳动物如大鼠、小鼠,乃至酵母、果蝇中发现的与肿瘤病毒癌基因的同源顺序。这种基因是正常的细胞基因,其表达产物的功能在于维持细胞的正常生长发育。但是,这种基因一旦
16、被某些因素激活就会转变成有转化能力的癌基因。,细胞癌基因概述,细胞癌基因是细胞正常生长、分化所必需的,是生长发育过程中所不可缺少的。这些细胞癌基因在发育过程中的一定时间、一定组织中定量的表达,产生生命活动中所必需的蛋白质,促进某些生命过程的进行,使生长发育得以实现。这些细胞癌基因在机体生长发育过程完成后多处于关闭状态,即不表达或低表达。一旦在错误的时间,不恰当地点,不适量表达即可能导致细胞无限制的增长而趋于恶性转化。,病毒癌基因与细胞癌基因非常相似,主要不同之处在于:细胞癌基因:含有内含子或者插入顺序。病毒癌基因:不含有内含子。二者在外显子序列中仅有非常微小的差别,他们的外显子在进化过程非常保
17、守,这表明他们编码的蛋白质产物在进化上的重要性。,病毒癌基因与细胞癌基因的差别:,根据癌基因编码蛋白质功能、性质进行分类。1.蛋白激酶类 酪氨酸蛋白激酶:src、fgr、yes。丝氨酸/苏氨酸蛋白激酶:raf、mos、2.生长因子类 sis PDGF-2;int-2 EGf 的相似物;erb-B EGf 受体3.GTP结合蛋白类 产物具有GTP酶的活性 ras(H-ras;K-ras)4.核蛋白类 产物与DNA 结合,与复制启动有关 myc;fos;jun;erb-A,癌基因的分类,癌基因的激活机制:,点突变(point mutation)病毒诱导与启动子插入激活基因扩增(gene ampli
18、fication)染色体易位或重排(chromosome translocation or recombination),抗癌基因(antioncogene),又名抑癌基因(tumor suppressor gene TSGs)、隐性癌基因。是一种抑制细胞生长和肿瘤形成的基因。在生物 体内与癌基因功能相抵抗,共同保持生物体内正负信号相互作用的稳定。已发现10种抗癌基因,如Rb(Retinoblastoma视网膜母细胞瘤),p53蛋白。许多TSGs产物是细胞周期调节因子或是生长相关基因的转录抑制子。它的非活性形式能促进肿瘤生长。,第二节 基因组,基因组(genome)指细胞或生物体中,一套完整单
19、倍体的遗传物质的总和。如人类基因组包含22条染色体和X或Y两条性染色体上的全部遗传物质(核基因组),以及胞浆线粒体上的遗传物质(线粒体基因组)。,基因组,一、基因组的概念,对细菌和噬菌体而言,其基因组指单个染色体上所含的全部基因;而真核细胞的基因组则是维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。,基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况,基因组的功能是贮存和表达遗传信息。,不同生物体基因组的大小和复杂程度不同.,(一)原核生物基因组结构,二、基因组的结构特点,以大肠杆菌(Escherichia coli)为例,类核(nucleoid):细菌染色体在
20、 细胞内形成的一个致密区域,大肠杆菌细胞结构,大肠杆菌染色体结构,(一)由一条环状双链DNA分子组成,通常只有一个DNA复制起点。,C-Value:4.6106bp,大肠杆菌染色体DNA,(二)结构基因大多组成操纵子,乳糖操纵子 lac operon,-galactosidase半乳糖苷酶 z,-galactoside permease透酶 y,-galactoside transacetylase半乳糖苷乙酰转移酶 a,多个功能相关的结构基因成簇串联排列,与上游共同的调控区和下游转录终止信号组成的基因表达单位。,操纵子operon:,(三)其它结构特点,C 值:4,639,221 bp基因数
21、:4288基因大小:950bp/gene基因间隔:118bp/gene,1.基因密度非常高,编码区在 基因组中所占比例大;,2.结构基因没有内含子,多为 单拷贝,rRNA基因为多拷贝;,3.重复序列很少,重复片段为 转座子;,4.有编码同工酶的同基因(isogene),分支酸别构酶,ilvBN acetolactate synthase I ilvIH acetolactate synthase III,乙酰乳酸合酶,entC isochorismate synthase entB isochorismatase,5.不同的原核生物基因组的GC含量(GC content)变化很大(25%-75
22、%),支原体,(四)非编码区主要是调控序列:,复制起始区(OriC)复制终止区(TerC),转录起动区转录终止区,原核细胞基因结构示意图,复制起始区(OriC),大肠杆菌强启动子,TTGAC TATAAT 转录起始,(五)质粒(plasmid),质粒是存在于细菌染色体外的,具有自主复制能力的环状双链DNA分子;大小为2-3 kb。,质粒的特性,在宿主细胞内可自主复制;,所携带的遗传信息能赋予宿主特 定的遗传性状;,细胞分裂时恒定地传给子代;,质粒可以转移。,原核生物基因组的特点(1)大肠杆菌的染色体基因组通常仅由一条环状双链DNA分子组成细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为
23、类核(nucleoid)。(2)具有操纵子结构其中的结构基因为多顺反子。(3)蛋白质结构基因在大肠杆菌染色体基因组中都是单拷贝,但是编码rRNA的基因往往是多拷贝的,并由16S,23S,5SrRNA基因组成一个转录单位,其间有的还插有tRNA基因,tRNA基因有单、双、多拷贝的形式。,原核生物基因组的特点(4)和病毒的基因组相似,不编码的DNA部份所占比例比真核细胞基因组少得多。(5)与复制有关的酶和蛋白质基因分散排列在整个染色体的不同区域中,具有编码同工酶的同基因(isogene)。(6)在基因组中具有各种功能的识别区域,如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。(7)
24、在基因或操纵子的终末具有特殊的终止顺序,它可使转录终止和RNA聚合酶从DNA链上脱落。,(二)真核生物基因组结构,染色体DNA四大特点:C 值矛盾 断裂基因 单顺反子 重复序列,(一)真核基因组结构庞大,但C值矛盾:,1、C值的概念:一个单倍体基因组的DNA含量总是恒定的,它通常称为该物种DNA的C值(C value)。,随着生物的进化,生物体的结构与功能越来越复杂,需要的基因产物种类也越来越多,也就是需要的最小基因组也越大,因而C值就越大。比如酵母菌的DNA含量约为2.3107bp,是细菌DNA含量的5倍左右;而哺乳动物的基因组DNA约为3109bp。,2、C值矛盾:在真核生物中,物种进化的
25、复杂程度与DNA含量C值并不完全一致,称之为C值矛盾(C value paradox)。,一些植物和两栖类动物,它们的DNA含量高达10101011bp,而人类DNA含量仅为109bp,显然这是无法解释的基因组大小与遗传复杂性没有必然联系。,在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,其C值可以相差数10倍乃至上百倍。如两栖类动物中,C值小的低至109bp以下,C值大的高达1011bp。,DNA的量远远大于编码蛋白质所需的量。如哺乳动物的基因组由3109bp组成,假定哺乳动物每个基因平均是10000bp,那么哺乳动物基因组应该有300000个基因。但核酸杂交测定哺乳动物
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因 基因组 结构 功能
链接地址:https://www.desk33.com/p-875772.html