欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > PPT文档下载  

    基因与基因组的结构与功能.ppt

    • 资源ID:875772       资源大小:7.82MB        全文页数:144页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    基因与基因组的结构与功能.ppt

    第三章 基因与基因组的结构 和功能,structures and functions of gene and genome,内容提纲,第一节、基因的概念和结构第二节、基因组第三节、基因组的包装第四节、遗传图谱、物理图谱和基因图谱第五节、人类基因组,第一节 基因的概念和结构,基因的概念,基因是原核生物、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。包括编码蛋白质和tRNA、rRNA的结构基因,以及具有调节控制作用的调控基因。,一、基因的生物学定义,基因的发展简史,从遗传学史的角度看,基因概念大致分以下几个阶段:,基因的发展简史,泛基因阶段,指1860年以前的发展时期。主要进展是光学显微镜的发展、细胞理论的阐明和1859年达尔文的物种的起源的发表。,基因的发展简史,基因概念的提出,孟德尔提出的遗传因子是基因的雏形名词。萨顿和鲍维里提出了遗传的染色体理论。1909年约翰逊提出了“基因”概念。,孟德尔,1866年,孟德尔在植物的杂交试验文中提出:“生物体的某一特定性状是受一个遗传因子(genetic factor)所控制的,也就是一个因子决定一个性状”。,基因的发展简史,结构基因与功能的探索,1926年摩尔根出版的基因论建立了著名的基因学说,通过绘制果蝇基因位置图,首次完成了当时最新的基因概念描述。,摩尔根,1926年,Morgan在基因论中提出:“基因既是携带生物体遗传信息的结构单位,又是控制一个特定性状的功能单位”,基因的发展简史,顺反子学说的提出,1957年本滋尔提出了“顺反子学说”。顺反子由多个突变位点组成,这些位点间可发生交换。一般而言,一个顺反子就是一个基因。,基因的发展简史,操纵子学说的提出,1961年雅各布和莫诺提出了操纵子学说。从此根据功能基因把基因分为结构基因、调节基因和操纵基因。,雅各布与莫诺,基因的发展简史,基因概念的进一步发展,断裂基因,1977年,Berget等首先发现,在真核生物基因组中,基因是不连续的,在编码区域内部含有大量的不编码序列,从而隔断了对应于蛋白质的氨基酸序列。这种不连续的基因又称断裂基因或割裂基因。,基因的发展简史,基因概念的进一步发展,可变剪接与反式剪接,在细胞发育过程中,一个基因的RNA原始转录本可以经过不同的剪接程序,把不同的外显子连接起来形成不同的信使RNA,从而产生不同的蛋白质异型满足发育的需要。,基因的发展简史,基因概念的进一步发展,重叠基因,小鼠淀粉酶在不同组织中mRNA的选择性剪接,基因的发展简史,基因概念的进一步发展,其他,管家基因与奢侈基因转座子组装基因信使RNA的编辑蛋白质修饰和剪接反式翻译,即:基因决定遗传性状的表达,它存在于染色体和线粒体上,呈直线排列并世代相传。基因的颗粒性表现在世代相传的行为和功能表达上具有相对的独立性。,基因有多种存在形式:,1、断裂基因(split genes)是指基因的编码序列在DNA分子上是不连续的,被一些不编码的序列所隔开。即真核生物的结构基因是由若干个编码序列和非编码序列镶嵌排列而成的。(外显子、内含子、相对),2、重叠基因(overlapping genes)仅存在于病毒和噬菌体中。指一个基因与另一个基因在同一DNA分子上部分或完全重叠。分三种重叠方式:一个基因全部位于另一个基因中、部分基因重叠、只有一个碱基重复。,重叠类型:重叠一个核苷酸:5 T A A T G 3 正链 3 A T T A C 5 负链 5 U A A U G 3 RNA UAA为D基因的终止码,AUG为J基因的 起始码,两个基因重叠一个核苷酸 重叠两个核苷酸:5 A T G A 3 正链 3 T A C T 5 负链 5 A U G A 3 RNA A基因的终止码UGA与C基因的起始码AUG 重叠两个核苷酸,部分重叠:K基因与A基因重叠83个核苷酸,与C基因 重叠85个核苷 酸 K 51 218 A 3973 133 C 390 完全重叠:E基因在D基因中,重叠322个核苷酸 E 518 840 D 390 845,B基因在A基因中,重叠388个核苷酸 B 5046 48 A 3973 133 三重重叠:1978年,有人发现Sv40病毒3个外壳蛋白基 因 Vp1、Vp2、Vp3三重重叠。有5234bp,环状双链基因组分成10分钟长.Vp1 7-1.5 Vp2、7-9.8 Vp3 7-9.8,3、复等位基因(multiple alleles)基因存在可变形式,称为等位基因(allele)。每一条染色体由线性排列的基因组成。每条基因位于染色体的特殊位点上,称为遗传基因座(genetic locus)。等位基因就是该基因座上所发现的不同形式。,在一种生物群体中,某一个基因座位上的不同等位基因的数目是相当大的,称之为复等位基因(multiple alleles)。,但一个二倍体生物在一个基因座位上只有其中一对等位基因。两份拷贝中一份是来自父本的等位基因,另一份是来自母本的等位基因。,如,人类ABO血型系统有3个复等位基因,IA、IB、i。IA和IB互为共显,但对i显性。,4、假基因(pseudogene,)假基因(pseudogene,)是指与某些有功能的基因结构序列非常相似,但不能表达基因产物,或转录生成无功能蛋白质的基因。假基因在高等哺乳动物基因组中是一种普遍现象,许多多基因家族中的部分成员为假基因。5、结构基因(structure genes)结构基因(structure genes)是指基因中编码RNA或蛋白质的DNA序列。,二、基因的现代分子生物学概念,基因是核酸的中贮存遗传信息的遗传单位,是贮存有功能的蛋白质多肽链或RNA序列信息及表达这些信息所必需的全部核苷酸序列。包括编码序列、编码外序列的侧翼序列及插入序列。,从生物化学上来说指的是一段DNA或RNA(病毒)顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。从遗传学上来说代表1个遗传单位、1个功能单位、1个交换单位或1个突变单位。,严格地说,一个完整的基因应包括:,前导区(leader):RNA起始密码5端的非编译序列。,尾部区(trailer):RNA分子3端终止密码子后的非翻译部分。,内含子(intron):指一个基因中编码mRNA序列之间的序列。,外显子(exon):指一个基因中编码mRNA的序列。,三、基因的功能,基因是使其自身永存的单位,通过蛋白质或多肽的形式表达其功能。,基因的遗传信息通过转录、翻译和翻译后加工的过程成为具有生物功能的多肽和蛋白质。,转录(transcription):指将DNA分子上的核苷酸序列的遗传信息转变为RNA分子上的核苷酸序列。,翻译(translation):指将RNA分子上的核苷酸序列的遗传信息转变为蛋白质和多肽分子的氨基酸序列。,四、基因的结构,原核生物的结构基因是连续的。真核生物结构基因:由外显子(编码序列)和内含子(非编码序列)两部分组成,编码序列不连续,称为断裂基因(interrupted gene)。,1、结构基因,基因中编码RNA或蛋白质的DNA序列。,真核基因中RNA剪接的识别信号,内含子的 5端以GT开始,3端以AG结束。,GT-AG法则,intron2,intron1,2、转录调控序列,前导序列,尾部序列,结构基因编码区两侧的一段不被翻译的DNA片段(侧翼序列),参与转录调控。,原核生物基因的调控序列,真核生物基因的调控序列,反式作用因子(trans-acting factor)能识别和结合特定的顺式作用元件,并影响基因转录的一类蛋白质或RNA。,顺式作用元件(cis-acting element)能影响基因表达,但不编码RNA和蛋白质的DNA序列。,顺式作用元件,TATA盒(TATA Box):位于-25-30bp,TATAAAA/TATATAT,启动基因转录。,启动子和上游启动子元件,-25,+1,-30,-30,-25,+1,-80,-70,CAAT盒(CAAT Box)位于-70-80bp,GG C/T CAATCT,决定启动子转录效率。,GC盒(GC Box)位于-35bp,GGCGG,与转录因子SP1结合,促进转录的过程。,-35,+1,增强子(enhancer),CAAT box,与转录因子特异性结合,增强转录活性,在基因任意位置都有效、无方向性。,TATA box,enhancer,promoter,5,3,exon intron,Poly(A)加尾信号,含有II类启动子的基因,基因末端保守的AATAAA顺序及下游GT或T富含区,被多聚腺苷酸化特异因子识别,在mRNA 3端加约200个A。,CAAT box,TATA box,Enhancer,promoter,真核生物基因的结构,exon,exon,5,3,intron,intron,exon,开放阅读框:open reading frame,ORF,response element,3、中心法则(central dogma),原核生物的mRNA是多顺反子mRNA,多顺反子mRNA(polycistronic mRNA):原核生物的一个mRNA分子带有几个 结构基因的遗传信息,利用共同的启动 子及终止信号,组成操纵子的基因表达 调控单元。,单顺反子mRNA(monocistronic mRNA):,真核生物的一个编码基因转录生成一个mRNA。,五、癌基因和抑癌基因,1910年Rous发现鸡肉瘤病毒(RSV:RNA反转录病毒)。1963年Dulbeco发现正常细胞感染病毒可恶变为癌细胞。1970年Baltimore发现病毒感染宿主时,RNA经逆转录酶合成DNA并整合到宿主DNA,从而导致宿主细胞的恶性转化。1970年Marein证明细胞恶性转化与RSV基因组中一个特定的基因src相关,该基因被命名为病毒癌基因。1976年Bishop证明正常细胞中存在与v-oncogene同源序列细胞癌基因(cellular oncogene,c-onc)。80年代初Weinberg 等几个实验室通过转染实验证明人体细胞中的癌基因H-ras。现已发现100多种的oncs。,癌基因的概念,在致瘤病毒、人体和动物肿瘤中发现的可以导致细胞恶性转化的核酸片断,称为癌基因。根据其来源可以分为三类。病毒癌基因、原癌基因、细胞癌基因 无论病毒癌基因还是细胞癌基因被激活后均有诱导肿瘤发生的作用,所以有时候我们又将肿瘤细胞中的癌基因称为肿瘤癌基因。,病毒癌基因(virus-oncogene;v-onco)指病毒核酸能够使细胞恶性转化的片断。原癌基因(proto-oncogene,pro-onco)在人类、哺乳动物如大鼠、小鼠,乃至酵母、果蝇中发现的与肿瘤病毒癌基因的同源顺序。这种基因是正常的细胞基因,其表达产物的功能在于维持细胞的正常生长发育。但是,这种基因一旦被某些因素激活就会转变成有转化能力的癌基因。,细胞癌基因概述,细胞癌基因是细胞正常生长、分化所必需的,是生长发育过程中所不可缺少的。这些细胞癌基因在发育过程中的一定时间、一定组织中定量的表达,产生生命活动中所必需的蛋白质,促进某些生命过程的进行,使生长发育得以实现。这些细胞癌基因在机体生长发育过程完成后多处于关闭状态,即不表达或低表达。一旦在错误的时间,不恰当地点,不适量表达即可能导致细胞无限制的增长而趋于恶性转化。,病毒癌基因与细胞癌基因非常相似,主要不同之处在于:细胞癌基因:含有内含子或者插入顺序。病毒癌基因:不含有内含子。二者在外显子序列中仅有非常微小的差别,他们的外显子在进化过程非常保守,这表明他们编码的蛋白质产物在进化上的重要性。,病毒癌基因与细胞癌基因的差别:,根据癌基因编码蛋白质功能、性质进行分类。1.蛋白激酶类 酪氨酸蛋白激酶:src、fgr、yes。丝氨酸/苏氨酸蛋白激酶:raf、mos、2.生长因子类 sis PDGF-2;int-2 EGf 的相似物;erb-B EGf 受体3.GTP结合蛋白类 产物具有GTP酶的活性 ras(H-ras;K-ras)4.核蛋白类 产物与DNA 结合,与复制启动有关 myc;fos;jun;erb-A,癌基因的分类,癌基因的激活机制:,点突变(point mutation)病毒诱导与启动子插入激活基因扩增(gene amplification)染色体易位或重排(chromosome translocation or recombination),抗癌基因(antioncogene),又名抑癌基因(tumor suppressor gene TSGs)、隐性癌基因。是一种抑制细胞生长和肿瘤形成的基因。在生物 体内与癌基因功能相抵抗,共同保持生物体内正负信号相互作用的稳定。已发现10种抗癌基因,如Rb(Retinoblastoma视网膜母细胞瘤),p53蛋白。许多TSGs产物是细胞周期调节因子或是生长相关基因的转录抑制子。它的非活性形式能促进肿瘤生长。,第二节 基因组,基因组(genome)指细胞或生物体中,一套完整单倍体的遗传物质的总和。如人类基因组包含22条染色体和X或Y两条性染色体上的全部遗传物质(核基因组),以及胞浆线粒体上的遗传物质(线粒体基因组)。,基因组,一、基因组的概念,对细菌和噬菌体而言,其基因组指单个染色体上所含的全部基因;而真核细胞的基因组则是维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。,基因组的结构主要指不同的基因功能区域在核酸分子中的分布和排列情况,基因组的功能是贮存和表达遗传信息。,不同生物体基因组的大小和复杂程度不同.,(一)原核生物基因组结构,二、基因组的结构特点,以大肠杆菌(Escherichia coli)为例,类核(nucleoid):细菌染色体在 细胞内形成的一个致密区域,大肠杆菌细胞结构,大肠杆菌染色体结构,(一)由一条环状双链DNA分子组成,通常只有一个DNA复制起点。,C-Value:4.6106bp,大肠杆菌染色体DNA,(二)结构基因大多组成操纵子,乳糖操纵子 lac operon,-galactosidase半乳糖苷酶 z,-galactoside permease透酶 y,-galactoside transacetylase半乳糖苷乙酰转移酶 a,多个功能相关的结构基因成簇串联排列,与上游共同的调控区和下游转录终止信号组成的基因表达单位。,操纵子operon:,(三)其它结构特点,C 值:4,639,221 bp基因数:4288基因大小:950bp/gene基因间隔:118bp/gene,1.基因密度非常高,编码区在 基因组中所占比例大;,2.结构基因没有内含子,多为 单拷贝,rRNA基因为多拷贝;,3.重复序列很少,重复片段为 转座子;,4.有编码同工酶的同基因(isogene),分支酸别构酶,ilvBN acetolactate synthase I ilvIH acetolactate synthase III,乙酰乳酸合酶,entC isochorismate synthase entB isochorismatase,5.不同的原核生物基因组的GC含量(GC content)变化很大(25%-75%),支原体,(四)非编码区主要是调控序列:,复制起始区(OriC)复制终止区(TerC),转录起动区转录终止区,原核细胞基因结构示意图,复制起始区(OriC),大肠杆菌强启动子,TTGAC TATAAT 转录起始,(五)质粒(plasmid),质粒是存在于细菌染色体外的,具有自主复制能力的环状双链DNA分子;大小为2-3 kb。,质粒的特性,在宿主细胞内可自主复制;,所携带的遗传信息能赋予宿主特 定的遗传性状;,细胞分裂时恒定地传给子代;,质粒可以转移。,原核生物基因组的特点(1)大肠杆菌的染色体基因组通常仅由一条环状双链DNA分子组成细菌的染色体相对聚集在一起,形成一个较为致密的区域,称为类核(nucleoid)。(2)具有操纵子结构其中的结构基因为多顺反子。(3)蛋白质结构基因在大肠杆菌染色体基因组中都是单拷贝,但是编码rRNA的基因往往是多拷贝的,并由16S,23S,5SrRNA基因组成一个转录单位,其间有的还插有tRNA基因,tRNA基因有单、双、多拷贝的形式。,原核生物基因组的特点(4)和病毒的基因组相似,不编码的DNA部份所占比例比真核细胞基因组少得多。(5)与复制有关的酶和蛋白质基因分散排列在整个染色体的不同区域中,具有编码同工酶的同基因(isogene)。(6)在基因组中具有各种功能的识别区域,如复制起始区OriC,复制终止区TerC,转录启动区和终止区等。(7)在基因或操纵子的终末具有特殊的终止顺序,它可使转录终止和RNA聚合酶从DNA链上脱落。,(二)真核生物基因组结构,染色体DNA四大特点:C 值矛盾 断裂基因 单顺反子 重复序列,(一)真核基因组结构庞大,但C值矛盾:,1、C值的概念:一个单倍体基因组的DNA含量总是恒定的,它通常称为该物种DNA的C值(C value)。,随着生物的进化,生物体的结构与功能越来越复杂,需要的基因产物种类也越来越多,也就是需要的最小基因组也越大,因而C值就越大。比如酵母菌的DNA含量约为2.3107bp,是细菌DNA含量的5倍左右;而哺乳动物的基因组DNA约为3109bp。,2、C值矛盾:在真核生物中,物种进化的复杂程度与DNA含量C值并不完全一致,称之为C值矛盾(C value paradox)。,一些植物和两栖类动物,它们的DNA含量高达10101011bp,而人类DNA含量仅为109bp,显然这是无法解释的基因组大小与遗传复杂性没有必然联系。,在结构、功能很相似的同一类生物中,甚至在亲缘关系十分接近的物种之间,其C值可以相差数10倍乃至上百倍。如两栖类动物中,C值小的低至109bp以下,C值大的高达1011bp。,DNA的量远远大于编码蛋白质所需的量。如哺乳动物的基因组由3109bp组成,假定哺乳动物每个基因平均是10000bp,那么哺乳动物基因组应该有300000个基因。但核酸杂交测定哺乳动物一个细胞中的mRNA种类约为10000个,考虑不同细胞基因表达的不同,推算哺乳动物基因组约有3000040000个基因,这样来看,基因组DNA量是已知基因的10倍,余下那么多DNA有什么功能?,有资料表明人类编码蛋白质的基因约有3.4万个。最近资料2.45万个,占整个基因组的1.5%。,(二)基因的不连续性断裂基因,不连续基因(interrupted genes;discontinuous genes):指基因的编码序列在DNA分子上是不连续的,被一些不编码的序列所隔开,也称为断裂基因(split genes)。即真核生物的结构基因是由若干个编码序列和非编码序列镶嵌排列而成的。,编码序列称外显子(exon);非编码序列称内含子(intron)。,内含子序列有一共同特征:5端总是以GU开始,3端总是以AG结束,在AG前还有一段富含嘧啶的序列,这些特征就是mRNA加工时的剪接信号。,不同生物的同源基因,其内含子的位置是保守的。,外显之序列保守,而内含子序列变化多端。根据外显子的保守性,可以鉴定多种生物中出现的片段即为编码序列。,外显子通常短小,编码不到100个氨基酸。但相应内含子的长度变化很大.高等真核生物内含子的长度变化范围在几十kb之间。,一条基因的总长度主要由它的内含子所决定。,外显子与内含子的概念是相对的。,外显子突变影响蛋白质的序列,内含子突变影响RNA的剪接。,真核细胞基因结构示意图,(三)单顺反子(monocistron),与原核生物不同,真核基因转录产物为单顺反子,即一个编码基因转录生成一个mRNA分子,翻译生成一条多肽链。,真核细胞基因是转录单位的同义词,顺反子可被内含子插入而分割。基因与顺反子不等价,即顺反子等价于真核基因的外显子。,(四)重复序列(重复基因结构),在真核细胞DNA中发现某些核苷酸序列大量重复出现,这些核苷酸序列叫重复序列,但在原核细胞基因组中几乎不存在。核苷酸序列的重复次数越高,DNA复性速度就越快。,非重复DNA序列在不同种属基因组中所占的比例变化较大。,Alu家族:在Alu序列家族中,大部分序列有限制性内切酶Alu的识别位点(AGCT),故而得名。Alu家族是人类基因组中最多的中度重复序列DNA,约占人类基因组的310。大约每5kbDNA中就有一个Alu序列,每个重复序列长约300bp,在单倍体基因组中重复30万50万次。,1、中度重复序列:,拷贝数小于106,多为103104。每个重复序列为数百至几千个碱基对大小,分布于单拷贝的DNA大片段之间。,卫星DNA(satellite DNA):将基因组DNA切成数百个片断进行超速离心时,常会在DNA主峰旁形成一个次要的小峰。这些小峰在主峰边上就象卫星一样,故命名为卫星DNA,也叫随机DNA、随体。跃进式复制成串联重复序列是形成卫星DNA的基础。卫星DNA分三类:大卫星、小卫星、微卫星DNA,2、高度重复序列:拷贝数在106以上,重复单位短小,也称为简单序列DNA。典型的高度重复序列有卫星DNA和反向重复序列。,大卫星DNA形成的原因:DNA的浮力密度与它的GC碱基对含量有关,GC含量高,浮力密度大,反之亦然。当DNA分子的GC含量变化超过5%时,即可通过密度梯度离心将其区分开来。真核细胞基因组中的大部分DNA GC含量在30-50%,密度梯度离心图谱形成一个主峰。有一些高度重复序列DNA的GC含量较少,AT含量很高(可高达97%),由于AT浮力密度较小,因而在将基因组DNA切成数百个片断进行超速离心时,常会在DNA主峰旁形成一个次要的小峰。,主带 卫星DNA,浮力密度,光 吸 收,1.701 1.690,大鼠DNA CsCl密度梯度离心图谱,小卫星DNA:,由中等大小的串联重复序列构成,分布在所有染色体。,两种,高度可变的小卫星DNA:重复单位924bp,重复次数变化很大,呈高度多态性。核心序列是GGGCAGGAXG。与DNA同源重组有关。,端粒DNA:由重复序列(TTAGGG)n组成的220kb的DNA区段。与末端DNA复制、保护有关。,小卫星和微卫星DNA呈高度多态性,可作为遗传标记。,注意:卫星DNA在体内是不能表达的,因为在这些极其简单的核苷酸序列上缺少转录所必需的启动子。原位杂交实验表明,卫星DNA定位于染色体的异染色质区,与染色体着丝点相连。,隐蔽型卫星DNA(cryptic satellite DNA):有的高度重复序列的碱基组成与基因组总体碱基组成差异不大,因此密度梯度离心就不能形成卫星DNA,有时把这种高度重复序列称为隐蔽型卫星DNA。,反向重复序列(inverted repeats):又称为回文结构(palindrome),概念:是指两个顺序相同的拷贝在DNA链上呈反向排列;即按一定方向读反向重复序列的两条链,其碱基序列一样。有时两个反向重复的DNA序列不一定邻接,中间可以夹杂一些非重复的DNA序列,称为间断的反向重复序列。反向重复序列占人类基因组的5%,主要位于基因调控区。,较短的回文结构常作为一种特别信号,如限制性内切酶的识别位点;较长的回文结构其转录产物易形成发夹结构,在DNA中可能形成十字形结构。,注意:,5 CATGAACGTCCTATTGTCGGACGTTCTGA 33 GTACTTGCAGGATAACAGCCTGCAAGACT 5,5 CAT TGA 3 3 GTA ACT5,C G,G C,G C,C G,C G,T A,T A,G C,A T,G C,G C,十字形结构,镜像重复序列(mirror repeats):由反方向完全相同的两个DNA片断组成。,直接重复序列(direct repeats):由同一方向完全相同的两个DNA片断组成,这是最常见的重复序列形式。,(五)原核和真核细胞中基因与顺反子的关系,原核生物基因与顺反子等价。细菌中,基因是编码区的同义词,而操纵子是细菌的转录单位,所以多顺反子就是操纵子的转录产物。,真核细胞基因是转录单位的同义词,而顺反子可被内含子插入而分割。高等真核基因与顺反子不等价,即顺反子等价于真核基因的外显子。,真核生物与原核生物基因组的比较:,1)真核生物基因分布在多个染色体上,而原核生物只一个染色体。2)真核生物在基因组转录后的绝大部分前体RNA必须经过剪接过程才能形成成熟的mRNA,而原核生物的基因几乎不需要转录后加工。3)真核生物细胞中DNA与组蛋白和大量非组蛋白结合,并有核膜将其与细胞质隔离,结果真核细胞的转录和翻译在时间上和空间上都是分离的,而原核细胞的基因转录和翻译是同步的。4)真核生物的基因是不连续的,中间存在不被翻译的内含子序列,而原核生物几乎每一个基因都是完整的连续的DNA片段。,细胞器基因组,线粒体基因组,线粒体与能量转换有关,属于半自主性的细胞器,它的基因组除了编码rRNA和tRNA外,主要编码它所需要的与能量转换有关的蛋白质,如ATPase基因、细胞色素COXase基因。,细胞器基因组,叶绿体基因组,叶绿体基因组较大,在低等真核生物中高达200kb。不同高等植物的叶绿体基因组长度不同,通常为140kb。,第三节 基因组的包装,包装比(packing ratio):用以描述DNA的浓缩程度,即DNA的原始长度除以包装后的长度。如人类最小的染色体(Y):DNA拉直约为1.4 cm,在有丝分裂最致密状态下,这条染色体长度约为2m,因此包装比可以大到7000。,(一)病毒基因组的包装,病毒在解决基因组包装时的两种方案,(1)蛋白质外壳沿着核酸组装,在组装过程中利用蛋白质和核酸之间的相互作用来浓缩DNA或RNA,烟草花叶病毒(tobacco mosaic virus,TMV),(2)用各种组分构建成一个中空的壳体,然后装入核酸,此时核酸被浓缩,噬菌体(phage lambda),核酸物质高度浓缩丝状RNA病毒在组装头部时浓缩其RNA基因组球状DNA病毒将其DNA插入预先组装好的蛋白质外壳中,有关病毒包装的几个知识点,(二)细菌基因组的包装,Bacterial DNA is a compact nucleoid,细菌遗传物质表现为相当致密的小块(拟核:nucleoid),或一串小块占细胞体的1/3,但没出现真核生物细胞染色体形态特征。,Bacterial DNA is tightly coiled thread,大肠杆菌(E.coli)的拟核在菌体破碎后以环状纤维的形式被释放出来。但没有伸展为游离双链体。,细菌基因组共同结构特征:拟核有约100个这样独立的负超螺旋结构域。每个结构域是一个DNA环(40 kb),其两端以某种(未知的)方法固定住,使旋转不会从一个结构域波及另一个结构域。,拟核可从极性沉降的复合物中直接分离出来,DNA约 80%;拟核能被作用于RNA或蛋白质的试剂解聚。因此,蛋白质能够稳定拟核结构的证据很明显,但专门负责浓缩DNA的蛋白质还未发现;RNA的作用难以分析。,关于拟核,(三)真核生物基因组的包装,DNA 核小体染色质染色体,1 核小体的概念,核小体(nucleosome):染色质的基本结构亚基,由约200 bp的DNA和约等量的组蛋白所组成。,当分裂间期的细胞核悬浮于低离子强度的溶液中时,它们膨胀破裂,释放出染色质纤维(电镜图),染色质是一串核小体,用微球菌核酸酶处理染色质可以释放出单个核小体,2 核小体的结构组成,每个核小体含有约200bp的DNA,核心组蛋白H2A、H2B、H3和H4各2份拷贝,1份拷贝的H1组蛋白位于核小体外侧。微球菌核酸酶(micrococcal nuclease)处理染色体可得到单个核小体。,The DNA ladder corresbonds to multimers,Extracted DNA and electrophorese,用蔗糖密度梯度离心分级核小体时,产生一系列分级峰值,分别与单体、二聚体、三聚体、四聚体等对应。,提取DNA电泳时也存在这样的对应关系,微球菌核酸酶将核小体修整成核心颗粒,核小体含有200 bp DNA和组蛋白,核小体由等量的DNA和组蛋白(包括H1)组成,每个核小体有2圈DNA,核小体可能呈圆柱状,两圈DNA缠绕在它的表面,DNA圈之间相互靠近,核小体上DNA长度与“典型”的200 bp有些出入。对于某种特定类型的细胞来说,其染色质都有一个特征性的平均值(5bp),最常见的平均值为180 200 bp。但在一些极端情况下,可以低至154bp(在一种真菌中)或高至260bp(在一种海胆的精子中)。在成体器官的不同组织之间、单个细胞基因组的不同部分之间,其平均值都可能不同。,3 核小体上DNA长度的谨慎理解,4 真核生物染色体DNA组装不同层次的结构,DNA(2nm),核小体链(10nm,每个核小体200bp),纤丝(30nm,每圈6个核小体),突环(150nm,每个突环大约75000bp),玫瑰花结(300nm,6个突环),螺旋圈(700nm,每圈30个玫瑰花结),染色体(1400nm,2个染色单体,每个染色体单体含10个螺旋圈),从DNA到染色体,10nm纤维,30nm纤维,第四节 遗传图谱、物理图谱、基因图谱,(一)遗传图谱(genetic map),遗传图谱又称连锁图谱(linkage map)或遗传连锁图谱(genetic linkage map).它是以具有遗传多态性的遗传标记为“路标”,以同一染色体上两点间的相对距离和位置关系而构建的图谱.,遗传距离通常由基因或DNA片断在染色体交换过程中分离的频率厘摩(cM)来表示。1厘摩表示每次减数分裂的重组频率为。厘摩值越高表明两点之间距离越远,厘摩值越低表示两点间距离越近。,1.经典遗传图谱 经典遗传学时代的遗传连锁图谱主要以家系分析或不同性状个体间杂交为基础,根据同源染色体上等位基因的变化,通过计算重组率,确定染色体上基因座位的顺序和距离,构建基因的连锁图谱。,绘制经典遗传图谱主要通过家系分析,对不同性状之间、性状与标记之间、标记与标记之间的连锁遗传频率进行计算,最终绘制遗传连锁图。包括家系分析法、体细胞杂交定位法等,其中染色体易位作图、染色体缺失作图是体细胞杂交定位中较为精细的方法。,2.现代遗传图谱,遗传图谱的第一代标记是限制性片段长度多态性RFLP。第二代标记位点是大量的可变数量串联重复(VNTR),包括微、小卫星(MS)或短串联重复(STR 或SSLP)。第三代标记是位点极其丰富的单核苷酸多态性(SNP)。,现代遗传图谱是指用基因组内的基因以及多态性DNA标记位点构成的图谱。,多态性DNA标记 多态性DNA标记是指众多的多态性区域及其相应的检测区域的DNA探针。群体中的不同个体DNA区域序列大多数都是完全相同的,只有约1%的DNA序列在不同个体间存在差异,这些差异区域又称为可变区域,可变区域可以作为DNA多态性位点,通过多样性探针对其进行检测。这样的可变区域与能够检测该区域序列的多样性探针一起被称为多态性标记。DNA标记图谱是从DNA水平寻找基因位点、研究基因结构和功能的切实可行的方法。,几种多态性DNA标记:(1)限制性片段长度多态性(RFLP)RFLP是指不同个体基因组内的核苷酸序列因某种原因产生碱基突变后,改变了某种限制性内切酶的剪切位点,使此酶在该位点不能剪切,形成了长度不等的限制性片段。这些限制性片段在人类不同个体间呈现的多态性现象称为限制片段长度多态性。,(2)可变数量串联重复(VNTR)小卫星DNA的核心序列一般为几个到几十个核苷酸,不同个体的不同基因座位重复次数不同,每个重复单位的组成可略有变异。这类重复单位数目分布有限,有些染色体上还未发现这类小卫星DNA。它的位置一般在染色体端粒部位。业已证明,这一序列广泛存在于人体基因组中。,微卫星DNA 微卫星DNA是继小卫星DNA后另一类更简短的核苷酸重复序列。分析微卫星DNA长度多态性的基本方法有两个步骤:第一步是用PCR方法扩增所需的双核酸重复顺序;第二步是在DNA顺序胶上进行分析。微卫星分析的微量点样技术使标记检测向微型化、全自动化、高效率、高精确性方向迈进了一大步,这是RFLPs所无法比拟的。由于微卫星DNA的上述诸多优点,使它很快成为取代RFLPs的理想遗传图谱标记。,最近发表的遗传图谱有GENETHON图和CEPH图,前者包括了5264个微卫星标志,后者含有7950个微卫星标志。,(3)单核苷酸多态性标记(SNP)单核苷酸多态性(SNP)作为遗传图谱第三代标记的开发和利用的意义已经超出了遗传作图的标记范围。由于SNP在不同个体间和不同组织、细胞间高度多态性,使其成为研究基因多样性和识别、定位疾病相关基因的一种新型手段。,3.多态性标记连锁图谱的应用 多态性标记连锁图谱的构建是人类基因组计划的核心。(1)多态标记为染色体行为研究提供依据(2)多态标记与连锁分析和基因定位.(3)多态标记与个体差别.,(二)物理图谱(physical map),-物理图谱(physical map)是指以一段已知核苷酸序列的DNA片断为“路标”,以Mb或kb为图距的基因组图.DNA序列上两点的实际距离,通常由DNA的限制酶片段或克隆的DNA片段有序排列而成。,物理图谱反应的是DNA序列上两点之间的实际距离,而遗传图谱则反应这两点之间的连锁关系。在DNA交换频繁的区域,两个物理位置相距很近的基因或DNA片段可能具有较大的遗传距离,而两个物理位置相距很远的基因或DNA片段则可能因该部位在遗传过程中很少发生交换而具有很近的遗传距离。,物理图谱的应用物理图谱是进行DNA分析和基因组织结构研究的基础。限制酶物理图还是基因组结构的重要特征。例如,每个基因都有特定的限制酶谱,每一条染色体,每一个个体的基因组都具有其特异的限制酶物理图。,物理图谱绘制根据物理图谱的原定目标,首先要获得分布于整个基因组的3万个序列标记位点(sequence tagged site,STS)。标记位点是指染色体定位明确,并且可用PCR扩增的单拷贝序列。每隔100kb距离就有一个标志。然后,在此基础上构建能够覆盖每条染色体的大片段DNA连续克隆系。,到1995年为止,已经完成了几张基因组水平的人类STS图,即由Genethon制作的包含5264个遗传标志的图谱、由Genethon和剑桥大学制作的含有850个STS的RH(radiation hybrid)图和麻省理工学院与Genethon制作的有15086个STS的整合YAC-RH图。另外,由法国人类多态性研究中心(CHPH)制作的225个YAC连续克隆群已可覆盖整个人类基因组的75,该图上有2061个STS。这些图谱为进一步定位其它基因座位提供了详细的框架。,(三)基因图谱(gene map),-基因图谱(gene map)鉴别和表示某个基因核苷酸序列的图谱。它是人类基因组计划的终极目标.,第五节 人类基因组,(一)人类基因组定义,-指人类一个细胞内所包含的全部基因的核苷酸序列。,(二)人类基因组计划(human genome project,HGP),-人类基因组计划是在80年代在全球范围内广泛参与和合作的一项旨在测定人类基因组的全部DNA序列,从而解读所有遗传密码,揭示生命的所有奥秘的庞大计划。,人类基因组计划的沿革,诺贝尔奖获得者杜伯克于1986年在科学(Science)杂志上率先提出了这个计划。1988年,该计划正式获得2790万美元的美国国会拨款,并于1990年10月1日正式启动。其总体规划是:拟在15年内至少投资30亿美元,进行对人类基因组的分析。不久,该计划发展成一个由多国政府支持的国际项目,先后有美、英、日、德、法及中国等6个国家参加,有16个实验室及1100名生物科学家、计算机专家和技术人员参与。,人类基因组计划启动于1990年,原计划用15年时间即到2005年完成全部30亿碱基对序列测定,但由于它在科学上的巨大意义和商业上的巨大价值,使得这一计划完成时间一再提前。1998年对原计划进行了修改,宣布提前两年即2003年完成序列测定。2000年5月9日,国际人类基因组宣布完成第一阶段人类基因组序列“工作框架图”的构建。200

    注意事项

    本文(基因与基因组的结构与功能.ppt)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开