1 病毒和进化 讲稿.ppt
《1 病毒和进化 讲稿.ppt》由会员分享,可在线阅读,更多相关《1 病毒和进化 讲稿.ppt(76页珍藏版)》请在课桌文档上搜索。
1、病毒与进化Virus and Evolution,病毒的起源 分子进化 病毒的进化 病毒进化与新病毒的出现 几种重要病毒的变异与进化,病毒的起源,假说一 病毒是地球上生物进化过程中最为原始的生命 物质它产生于化学进化之后,地球生命演化的过程表现为无机物有机物化学大分子病毒原核生物真核生物;纯粹的假设,缺乏任何进化上的证据;,假说二 病毒是高级微生物的退行性生命物质,细菌类似立克茨体类的生物类似衣原体类的生物病毒;无法找到在细胞内寄生的小型细胞生物,并且在立克茨体和衣原体中未发现病毒,证据不足;,“virus”一词源于拉丁文,原指一种动物来源的毒素。,病毒的起源,假说三 病毒来源于正常细胞的核酸
2、(内源性假说)!,病毒与质粒是相似的;DNA病毒结合到细胞染色体上正好是细胞核酸外逸的逆过程;正常细胞中存在较广泛的逆转录型可动遗传因子和逆转录型重复序列,提示正常的细胞中含有RNA所介导的DNA合成反应,而这与逆转录病毒的核酸的复制行为相一致;,可部分解释DNA病毒的起源,但要说明RNA病毒的起源则相当困难。,1999年在古细菌中发现了所谓“反转子”的遗传单位 进化的模式如下:反转子反座子反转录转座子反转录病毒副反转录病毒DNA病毒,启示:病毒起源是复杂和多元化的,不同病毒有着不同的起源,至少在DNA病毒和RNA病毒之间是如此,这方面的结论尚有待于更多研究资料的积累。,分子进化 基本理论,达
3、尔文的进化学说 从生物与环境相互作用的观点出发,认为生物的变异、遗传和自然选择作用能导致生物的适应性改变。二十世纪50年代以前,对于进化的研究,主要是以古生物学、分类学、胚胎发生学、比较解剖学、生物地理学、生理学和群体遗传学等方面为主。分子进化 分子生物学和分子遗传学的兴起使得进化学家开始从分子水平来研究生物进化的原理和机制。在核酸和蛋白质分子组成的序列中,蕴藏着大量生物进化的遗传信息。生物大分子的进化 基因或生物个体的演化历史的重构,分子进化研究有助于进一步阐明物种进化的分子基础,探索基因起源机制,从基因进化的角度研究基因序列与功能的关系。系统发育分析可用于示踪快速变化的物种(如病毒、细菌等
4、),对于种群内变化类型的分析可以说明一个特定基因是否处于选择压力之下,这是流行病学应用的重要信息。,推论1:个体间存在着生存斗争,事实4:个体间普遍存在差异(变异),事实5:许多变异是可以遗传的,推论2:具有有利变异的个体,生存并留下后代的机会多,推论3:有利变异逐代积累,生物不断进化出新类型,过度繁殖,生存斗争,遗传变异,适者生存,分子进化,达尔文的自然选择学说,分子进化,综合进化论(现代达尔文主义),种群是生物进化的单位,进化机制研究属于群体遗传学范畴。突变和基因重组产生进化的原材料。自然选择决定生物进化的方向。隔离导致物种的形成。,引起种群基因频率改变的因素,突变 方向是随机的,给自然选
5、择提供了原材料。如果突变性状被选择,这一突变基因就在基因库中积累增多。遗传漂变 在一个小种群内,基因频率由于偶然的机会(不是自然选择的原因)而随机增减的现象。一个种群中的几个或几十个个体迁移到另一地区而定居下来,自行繁衍后代,造成基因频率发生改变的现象。基因迁移 一个种群的个体迁入到另一个种群中去的现象。不管是老个体的迁出还是新个体的加入,都会使种群基因频率发生变化。自然选择 通过自然选择对基因型的影响和基因重组的作用,从而定向改变群体的基因频率。结果使生物类型发生改变。青霉素对细菌抗性的选择 DDT对家蝇抗性的选择选择压 指在2个相对性状之间,其中一个性状被选择而生存下来的优势。它是经选择以
6、后发生效果的一个标准。,分子进化,通过比较不同生物的某些功能相同的蛋白质或核酸的氨基酸或核苷酸序列的差异,与物种的表型进化情况基本一致。分子进化至少有3个显而易见的特点:一是多样性程度高,与表型多态(即在一相互交配的群体中存在着两种或多种基因型的现象)相比,分子多态更为丰富(例如细胞色素C在有氧呼吸的不同物种中就有种种不同的分子结构;乳酸脱氢酶LDH可形成5种LDH同工酶:H4、M4、H3M1、H2M2和HM3,其中M型在骨骼肌,H型在心肌);二是各种同源分子对选择大都是中性或近中性的,它们都有完整的高级结构,能很好地完成各自的功能(如脊椎动物的血红蛋白分子都能运氧、各种生物的细胞色素C都能在
7、氧化磷酸化中完成电子的传递等);三是随着生物从低级向高级演化,同源分子中逐年发生氨基酸或核苷酸的替换,且大致按每年每位置替换数恒定速率进化;由此说明,自然群体在分子水平上存在着意想不到的多态性,而这正是综合进化论所解释不通的。,1968年,日本的木村资生提出了分子进化的中性学说,分子进化,分子钟,某一蛋白在不同物种间的取代数与所研究物种间的分歧时间接近正线性关系,进而将分子水平的这种恒速变异称为“分子钟”。,The protein,haemoglobin,Fish,Goose,Pig,Human,Worm,Looking at beta-globin,The structure of a hu
8、man haemoglobin molecule,A human beta-globin(Hbb)unit,All of the animals pictured above produce beta globin.It follows that they all must have a gene for beta globin.We can look at relationships between these animals by comparing their beta globin genes.,分子进化,分子进化,分子的异速进化现象被广泛的观察到,例如:分子序列证据与化石证据在人类起
9、源时间上的差异,分歧3000万年的物种氨基酸序列差异的应达45%、非重复序列DNA差异应约为8%,但实测值分别为0.8%与1.1%,存在6倍左右的差别。,许多人类学家倾向于怀疑钟的存在,并认为在高等灵长类中分子进化速率下降。总之,虽然大部分分子进化学家同意序列进化与分歧时间密相关,但进化是以年限还是以代限为刻度则仍有分歧与争议;而且因为众多因素的影响,与分子钟相左的数据,无论是用氨基酸、核苷酸序列差异、免疫学距离,还是用DNA杂交复性等参数,均不断有所报道,其论争预计将继续下去。,分子进化中性学说,分子进化,分子进化速度的一定性,即同一生物大分子在不同物种中的进化速度是一样的;功能上对生命生存
10、制约性低的分子或一个分子中不那么重要的部分,较之对生命生存制约性高的分子或分子中重要的部分,其突变置换率高;进化过程中,对分子功能不损害或损害轻的突变(置换)较之损害严重的突变容易发生;具有新功能的基因一般起源于基因重复;中性突变包括有害程度轻微的突变;分子进化中遗传漂变对中性突变在群体中的固定发挥着重要作用,即遗传漂变是分子进化的基本动力;,无法解释物种的形成;无法解释表现型水平上的进化;,中性学说面临的两大难题,比较现代达尔文主义和中性学说对生物进化解释的差异。,自然选择,中性突变本身,随机自由组合,环境和生物世代,恒定的,自然选择,分子进化,达尔文主义和中性学说是两种完全不同的机制,如何
11、实现这两者的统一:,分子水平上的进化主要是由中性突变与遗传漂变导致的基因频率的固定所造成的;表现型水平上的进化则是适应性进化,自然选择对此是最合理的解释。“中性进化恐怕不应该说是非达尔文式进化,而是应该说是进化中间的非达尔文式变化。”两者关键在于对选择对象的解释不同。中性学说:基因即碱基对,分子进化 达尔文主义:个体,种群进化,分子进化,在理解生物进化上可把中性学说看作是附加在自然选择学说中的一个原理,是在分子水平上对达尔文主义的补充和发展。,序列对位排列,在序列对位排列时,通过插入间隔(gap)的方法使不同长度的序列对齐,达到长度一致。优化的对位排列应使间隔的数目最小,同时序列间相似区域最大
12、。X:CGATCAGY:CC-TCAGX:CG-ATCAGY:CG-TCAGZ:CGGAATCAG,起始空位和延伸空位罚分(Gap Openning and Gap extension Penalties)在序列比对过程中无限地引入空位可使两个序列具有最高的相似性,但却无生物学意义,因此引入空位罚分。对于起始空位的罚分与延伸空位不同。X:-AGCTGAG-G-AC-G-ACY:CAGCTGA-CCTGCACAGTAC,多数比较涉及全长序列的比较,因此不能简单理解为如何减少间隔的数目,还要考虑对位排列后的生物学意义。记分矩阵(scoring matrix)广泛用于评价序列对位排列的质量。通常用得
13、分(+)、无分(0)或罚分来综合评价。取代矩阵 上述比对方法仅仅用相同或不同来描述两个残基的关系,而取代矩阵考虑到特定位置不同性质的氨基酸取代对蛋白质的结构与功能会产生截然不同的影响。如异亮氨酸(Isoleucine)和缬氨酸(Vaine)(体积小,疏水)、丝氨基酸和苏氨酸(极性)之间可以很能容易地相互取代而不用改变它们的生理生化性质,而谷氨酸对异亮氨酸的取代则会对蛋白的理化性质产生重要影响,对这两类不同取代应给予不同的打分,可大大提高比对的敏感性和生物学意义。,Dayhoff突变数据矩阵:点突变记分矩阵称为MD(mutation data)或PAM(point accepted mutati
14、on)矩阵。一个PAM进化距离为每100个氨基酸中一个点突变被接受的概率。适用于相似性较高的序列比对(通常达85%以上),其后的数字表示进化距离的大小,数值越小,相似性越高。而进化距离较远的矩阵如PAM250的准确性受到限制。,大于0的值表示突变的可能性大,等于0是中性的(随机突变),小于0则表示突变的可能性较小。,BLOSUM(BLOCKS Substitution Matrix),用于远源序列间的分析。高于或等于80%相同残基的序列组成的模块组可用BLOSUM80矩阵来构建,BLOSUM62,不同记分方法的特点,1.基于一致性的记分(高度相似,不一致无体现)2.基于化学相似性的记分3.基于
15、遗传密码的记分。4.基于观察的记分。,点标方法,点标法是两序列比较最基本和最直观的方法,全局排列和局部排列,序列对位排列可分为全局(global alignment和局部排列(local aglinment)两大类全局排列是对序列的全长进行最优对位排列,由Needleman和Wunsch于1970年提出.局部对位排列由Smith和Waterman于1981年提出,以在局部区域内寻找最优的对位排列.序列对位排列的用途:1.构建系统发育树;2.结构预测;3.序列基序鉴定;4.功能预测;5.数据库搜索;6.起源或进化分析;,系统树及其构建,系统发生树(phylogenetic tree)是描述一群有
16、机体发生或进化顺序的拓扑结构,进化树给出分支层次或拓扑图形,它是产生新的基因复制或享有共同祖先的生物体的歧异点的一种反映,树枝的长度反映当这些事件发生时就存在的蛋白质与现在的蛋白质之间的进化距离。,系统树及其构建,有权值的树(或标度树,scaled tree,树中标明分支的长度);无权值树(或非标度树,unscaled tree);,系统树及其构建,系统发育树重建分析步骤,1,2,3,4,5,Sequence data,Align Sequences,Phylogenetic signal?Patternsevolutionary processes?,Test phylogenetic re
17、liability,Distances methods,Choose a method,MB,ML,Characters based methods,Single tree,Optimality criterion,Calculate or estimate best fit tree,LS,ME,NJ,Distance calculation(which model?),Model?,MP,Wheighting?(sites,changes)?,Model?,Alignment-building the data model and extracting a dataset多序列比对(自动、
18、人工),Determining the substitution model-consider sequence variation 建立取代模型(建树方法),Tree building建立进化树Tree evaluation进化树评估,系统树及其构建,系统发育树重建的基本方法,系统发生树的构建方法分为两大类:基于距离的构建方法 非加权组平均法(Unweighted Pair Group Method with Arithmetic mean,UPGMA)邻近归并法(Neighbor Joining)Fitch-Margoliash法 最小进化方法 基于离散特征的构建方法 最大简约法 最大似然
19、法 进化简约法 相容性方法,基于距离的系统发生树构建方法,系统树及其构建,给定一种序列之间距离的测度,在该距离测度下构建一棵系统发生树,使得该树能够最好地反映已知序列之间的距离。,计算序列的距离,建立距离矩阵,通过距离矩阵建进化树,系统树及其构建,10条核酸序列的距离矩阵,根据距离矩阵构造系统发生树,系统树及其构建,连锁聚类方法及非加权分组平均法,选择距离最小的一对序列 将这两个序列合二为一,形成一个新的对象(代表这两个序列的祖先)重新计算这个新的对象与其它序列的距离。,假定的前提条件是:在进化过程中,核苷酸或氨基酸的替换速率是均等且恒定的,在每一次分歧发生后,从共同祖节点到两个分类单元间的分
20、支长度一样。,在构建系统发生树时,首先用n个叶节点表示n个分类单元(序列),每个分类单元自成一类,然后通过反复的聚类使所有的分类单元都聚为一类,并将进化过程中的祖先赋予树的内部节点,最终得到一个完整的系统发生树。得到一棵有根的系统发生树,从树根到任何叶节点的分支长度全都一样,即所有物种的突变速率相同,存在一个固定节律的“分子钟”,各个物种从树根出发,踏着同样的节律,沿不同的路径,演化成为当前的形式。,系统树及其构建,非加权分组平均法 在平均连锁聚类过程中,一个新类到其它类之间的距离就是简单的原距离平均值。这样的计算非常简单,但是,如果各个类中分类单元个数不一样,原距离矩阵中各个距离值对新距离计
21、算的贡献就不一样,或者说是经过“加权”的,称这样的聚类为加权分组平均(Weighted pair group method with Arithmetic mean,WPGMA)。在非加权分组平均法中,在计算新分类到其它分类之间的平均距离时按照各分类中分类单元的数目进行加权处理。,UPGMA算法的执行过程如下:初始化:使每个物种自成一类,如果有n个物种,则开始时共有n个类,每个类的大小为1,分别用n个叶节点代表每个类;执行下列循环:寻找具有最小距离Dij的两个类i、j;建立一个新的聚类(ij)连接i和j形成新节点(ij),生长两个新的分支,将i 和j 连接到(ij),分支的长度为Dij/2;计
22、算新分类到其它类的距离 其中ni、nj、(ni+nj)分别为i类、j类、(ij)类的元素个数;l 在距离矩阵中删除与类i和类j相应的行和列,为类(ij)加入新的行和列;重复循环,直到仅剩一个类为止。,系统树及其构建,d=e=10/2=5,c=19/2=9.5g=c-d=9.5-5=4.5,a=b=22/2=11,f1+a=f2+c=40.5/2=20.25f1=9.25,f2=11.75,系统树及其构建,Fitch-Margoliash方法,找出关系最近的序列对,如D和E将剩余的序列作为一个简单复合序列,分别计算D、E到所有其他序列的距离的平均值用这些值来计算D和E间的距离将D、E作为一个单一
23、的复合序列DE,计算与每一个其他序列的距离,生成新的距离矩阵确定下一对关系最近的序列,重复前面的步聚计算枝长从每个序列对开始,重复整个过程对每个树计算每对序列间的预测距离,发现与原始数据最符合的树,DE距离=d+e D到ABC间的平均距离=d+mE到ABC间的平均距离=e+m d=4,e=6,c+g+(e+d)/2=19 c+f+(a+b)/2=40(e+d)/2+(a+b)/2+f+g=41得:c=9,系统树及其构建,基于特征的系统发生树构建方法,分类单元特征矩阵,一般问题:给定n个物种 m个用以描述物种的特征 每个物种所对应的特征值 构建一棵系统发生树,使得某个目标函数最大。,最大简约法
24、最大似然法 进化简约法 相容性方法,系统树及其构建,系统发生树的可靠性,在距离法中,连锁聚类方法比较简单,非加权分组平均法比较实用,当使用的距离数据是来源于多个基因的分析结果时,利用非加权分组平均法能得到可靠的系统发生树。对于离散特征分析方法,如果序列趋异程度较小、核苷酸替换的速率或多或少的恒定,最大简约法是一种较好的系统发生树构建法。,无论是基于距离的系统发生树重建方法,还是基于特征的系统发生树重建方法,都不能保证一定能够得到一棵描述比对序列进化历史的真实的树。,总规则是 用截然不同的距离矩阵法和简约法分析一个数据集,如果能够产生相似的系统树,这样的树可以被认为是相当可靠的。,我们需要评价一
25、棵系统发生树的可靠性,这涉及两个问题,即整棵树和它的组成部分(分支)的置信度是多少?,系统树及其构建,自举检验(bootstrap test),基本方法是:从原数据集中抽取(同时替换)部分数据组成新的数据集,然后用这个新的数据集构造系统发生树。重复该过程,产生成百上千的重采样数据集,并同时生成对应的自举树,进而检验自举树对最终系统发生树各个分支的支持率。具体做法是,将最终系统发生树与各个自举树进行比较,其中,在各个自举树中都有出现或大量出现的那些部分将具有较高的置信度。产生相同分组的自举树的数目常常标注在系统发生树相应节点的旁边,表示树中每个部分的相对置信度。,系统树及其构建,目前已经发现许多
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 病毒和进化 讲稿 病毒 进化
链接地址:https://www.desk33.com/p-876280.html