第06章 网络可靠性设计[增强版].ppt
《第06章 网络可靠性设计[增强版].ppt》由会员分享,可在线阅读,更多相关《第06章 网络可靠性设计[增强版].ppt(151页珍藏版)》请在课桌文档上搜索。
1、,第1页 共150页,第6章 网络可靠性设计,6.1 可靠性设计概述6.2 网络冗余设计【重点】6.3 存储网络设计【重点】6.4 高可用集群系统设计,第2页 共150页,6.1 可靠性设计概述,第3页 共150页,6.1 可靠性设计概述,6.1.1 网络可靠性分析与计算网络可靠性指网络自身(设备、软件和线路)在规定条件下正常工作的能力。人为攻击(如黑客)或自然破坏(如雷击)造成的网络不稳定性属于网络安全问题。可靠性约束条件:预算限制,部件失效,不完善的程序代码,人为失误,自然灾害,不可预见的商业变化,都是达到100%可用性的障碍。,第4页 共150页,6.1 可靠性设计概述,1.网络可靠性参
2、数如何定义网络结构的可靠性参数,网络业务可靠性参数,如何度量网络整体可靠性,是当前正在研究解决的问题。目前网络工程项目的可靠性验收,只能在双方商定好的具体网络应用案例上,进行测试。如连通性测试,流量测试,拥塞测试,广播风暴测试等。,第5页 共150页,6.1 可靠性设计概述,2.网络可靠性计算方法可靠性用平均无故障工作时间(MTBF)衡量。MTBF是一个统计值,它通过取样、测试、计算后得到,它与真实测试值有一定的差异。MTBF值的计算方法:MIL-HDBK-217(美国国防部可靠性分析中心提出的军工产品标准)GJB/Z299B(中国军用标准)Bellcore(AT&T Bell实验室提出的民用
3、产品标准)。,第6页 共150页,6.1 可靠性设计概述,4.网络可靠性的成本分析网络系统的可靠性是以各种投入为代价而实现的,并不是越高越好。各种业务对服务中断的容忍度不同。如银行业务数据与办公数据属于不同的业务等级。减少损失需要考虑的因素:网络系统发生故障时对业务带来的损失;故障发生的可能性。,第7页 共150页,6.1 可靠性设计概述,6.1.2 网络可用性分析与计算1.可用性计算方法可用性是衡量网络系统提供持续服务的能力。系统可用性计算方法:系统年停机时间=一年总时间(1-系统可用性)以上计算的是严重失效,即那些需要恢复程序数据,重新加载程序,重新执行等情况的失效,一般小的问题不计算在内
4、。,第8页 共150页,6.1 可靠性设计概述,P133表6-1 网络通信系统可用性类型,第9页 共150页,6.1 可靠性设计概述,2.通信系统可用性指标国家通信标准规定:具有主备用系统自动切换功能的数字通信系统,允许5000km双向全程每年4次故障;对于420km数字段,允许双向全程每3年1次故障。市内数字通信系统假设链路长度为100km,允许双向全程每年4次故障;50km数字段双向全程每半年1次故障。,第10页 共150页,6.1 可靠性设计概述,3.网络可用性计算(1)串联型网络结构可用性计算在串联系统中,可用性最差的单元对系统的可用性影响最大。串联型网络的可用性按(6-4)式计算。(
5、6-4),第11页 共150页,6.1 可靠性设计概述,【案例6-2】网络拓扑结构如图6-1所示,计算路由器A至路由器B之间的可用性。AB之间的可用性=0.9990.99990.9950.98 0.950.980.9950.99990.999=90.1%,第12页 共150页,6.1 可靠性设计概述,(2)并联型网络结构可用性计算并联型网络的可用性按(6-5)式计算。(6-5)【案例6-3】网络拓扑结构如图6-2所示,计算路由器ABCD整体的可用性。,第13页 共150页,6.1 可靠性设计概述,路由器ABC之间的可用性=0.990.970.98=94.1%路由器B+D并联体的可用性=1-(1
6、-路由器B的可用性)(1-路由器D的可用性)=1-(1-0.97)(1-0.95)=99.85%路由器ABCD整体可用性=A可用性(B+D可用性)(C可用性)=0.990.99850.98=96.9%,第14页 共150页,6.1 可靠性设计概述,4.网站可用性分析【案例6-4】国外知名微型博客网站Twitter(推特)2008年前4个月的可用性只有98.72%,有37小时16分钟不能提供服务,连2个9都达不到。国外电子商务巨头eBay在2007年的可用性是99.94%,考虑到eBay网站的规模与应用的复杂程度,这是个很不错的可用性指标了。不同业务类型决定不同网站对可用性的要求不同。,第15页
7、 共150页,6.1 可靠性设计概述,提高网络可用性的常规策略:消除单点故障部署冗余设备(或集群)设计高可用集群网络等电信级传输网中,通信设备的可用性要求达到99.999%,这要求系统在一年的连续运行中,因各种可能原因造成停机维护时间少于5分钟。,第16页 共150页,6.1 可靠性设计概述,6.1.3 网络可靠性设计原则网络最重要的两个特性是速度和可靠性。高可用性的7R原则(1)冗余(Redundancy)主控设备冗余,交换设备冗余,存储设备冗余,电源冗余,风扇冗余,多处理器等;在结构设计中,采用双机热备系统等;在存储设计中,采用磁盘阵列技术等;在链路设计中,将网络负载分散到两条链路上。冗余
8、虽然提高了网络的可靠性,但是增加了系统成本和网络的复杂度。,第17页 共150页,6.1 可靠性设计概述,(2)品牌(Reputation)品牌指产品供应商一贯的良好记录。可以通过以下方法衡量厂商的品牌:占有市场分额的百分比;专家的测试分析报告;在该领域内的历史记录;客户中的良好口碑。,第18页 共150页,6.1 可靠性设计概述,(3)可靠性(Reliability)可靠性分析经验:检查并分析故障管理日志;从操作人员那里获得反馈信息;从支持人员那里获得反馈信息;从供应商的维修人员那里获得反馈信息;专家的分析报告等。操作人员的反馈通常是公正的,而且有很好的参考作用,能够反映出设备真正的性能和问
9、题。,第19页 共150页,6.1 可靠性设计概述,(4)维修能力(Repairability)衡量这项能力的标准是:完成维修的时间长短,维修工作多长时间就要进行一次。(5)恢复能力(Recoverability)重新对磁盘进行读取或者写入网络的重新传输热插拔技术等,第20页 共150页,6.1 可靠性设计概述,(6)响应(Responsiveness)供应商和网络工程师对问题做出快速有效的反应时间;对资源(备用部件)的备用冗余准备情况。(7)活力(Robustness)硬件和软件的发展前途和兼容性设计。一个有活力的系统经受过长时间不同的考验。,第21页 共150页,6.1 可靠性设计概述,2
10、.网络设计中的可靠性要素(1)无故障运行时间按故障后果的严重程度分为:致命故障严重故障轻度故障(2)环境条件(3)规定的功能,第22页 共150页,6.1 可靠性设计概述,6.1.4 可靠性设计案例分析系统优化改造思路网络设备的冗余配置。冗余线路。提高故障的快速恢复能力。在现有防火墙的基础上增加策略路由的功能。,第23页 共150页,6.2 网络冗余设计,第24页 共150页,6.2 网络冗余设计,6.2.1 冗余设计的基本原则1冗余设计的目的冗余设计是网络可靠性设计最常用的方法。冗余设计的目的:提供网络链路备份;提供网络负载均衡。链路备份和负载均衡在结构上完全一致,但是完成的功能不同,工作模
11、式也不同。冗余链路用于网络备份时,2条冗余链路只有一条工作,另一条处于热备监控状态;冗余链路用于负载均衡时,多条冗余链路同时工作,不存在备份链路。,第25页 共150页,6.2 网络冗余设计,2单点故障网络冗余设计的原因是网络中存在单点故障。单点故障是指网络某一节点或某一链路发生故障时,可能导致用户与核心设备或网络服务的中断。链路冗余防止了服务丢失,第26页 共150页,6.2 网络冗余设计,P138图6-4 单点故障与冗余链路,第27页 共150页,6.2 网络冗余设计,3冗余设计的内容冗余设计包括:链路冗余(端口冗余,双绞线冗余,光纤冗余)设备冗余(交换机冗余、路由器冗余、服务器冗余、电源
12、系统冗余等)软件冗余(远程备份,软件镜像,虚拟机等)最好的冗余方式是多台主机互为热备,但这种方案投资大,而且冗余控制需要一定的开销,对网络性能有一定影响。,第28页 共150页,6.2 网络冗余设计,5冗余设计要求冗余设计要求:只在网络正常链路中断时,才使用冗余备份链路。尽量不要将冗余链路用于负载均衡,否则当发生网络故障需要使用冗余链路时,网络由于负载失衡而产生不稳定性(性能颠簸)。一般在核心层采用链路聚合技术。尽量减少路由器的路由数量,减少路由跳数。,第29页 共150页,6.2 网络冗余设计,6.2.2 网络结构的冗余设计1核心层全网状冗余设计全网状结构的优点:提供多个到任意目的地的可用路
13、径;到任意目的地只需要1跳;在最坏情况下,到核心层最大为3跳。,第30页 共150页,6.2 网络冗余设计,全网状的缺点:投资与节点数量呈现几何增长关系。随着节点数量的增加,增加了路由器选择最佳路径的计算量,加大了收敛时间。随着路由器数量的增多,处理广播消息的带宽和CPU资源也会增加。,第31页 共150页,6.2 网络冗余设计,P139图6-5 核心层全网状冗余结构,第32页 共150页,6.2 网络冗余设计,2核心层部分网状冗余设计部分网状结构结合了网络冗余,路由收敛以及线路投资等方面的考虑。部分网状结构在网络设计中得到了大量应用,成为主干网络中最流行的一种形式。部分网状结构的连接不是随意
14、设计的,要综合考虑网络结构特点,灵活应用其他冗余设计技术。缺点:某些路由协议不能很好地处理多点对多点的部分冗余网状设计。,第33页 共150页,6.2 网络冗余设计,P139图6-6 核心层部分网状冗余结构,第34页 共150页,6.2 网络冗余设计,3汇聚层与核心层之间的双归冗余设计双归链路提供了很好的冗余,当一条链路出现故障时,不会削弱汇聚层路由器的可到达性。双归接入的缺点:使汇聚层路由器通往核心层设备的路径比单连接增加了一倍,从而会降低网络路由收敛速度。强迫使用某一路径时,需要使用浮动静态路由。双归路由器的“升级”问题。如果核心层路由器R3-R2之间的链路中断,双归路由器R4就会升级到核
15、心层,路由器R4承担了核心层路由器的功能,在性能上有可能达不到要求。,第35页 共150页,6.2 网络冗余设计,P140图6-7 汇聚层与核心的双归冗余结构,第36页 共150页,6.2 网络冗余设计,6.2.3 网络链路的冗余设计【案例6-6】如图6-9所示,某公司总部与分部之间有三条链路相连,DDN与FR之间的路由器配置动态路由协议选路,并配置策略路由从而实现负载均衡;另外还通过PSTN提供静态路由备份。,第37页 共150页,6.2 网络冗余设计,6.2.4 网络设备的冗余设计1.网络设备和部件冗余技术设备端口的冗余。主控冗余技术。在交换机、路由器等网络设备中,提供两块主控制板,互为备
16、份。主控板与备用从控板之间的切换检测方法可采用硬件心跳线或其他方式。,第38页 共150页,6.2 网络冗余设计,2.不间断转发技术路由器进行主备切换时,在路由协议层面会与邻居路由器之间发生信号震荡。这种邻居关系的震荡将导致路由震荡,进而导致业务出现暂时中断。NSF(不间断转发)技术可以保证路由器控制层面出现故障(如系统重启或路由震荡)时,数据转发不间断地正常进行,保护网络流量不受影响。具备NSF的路由协议有:OSPF、IS-IS、BGP、LDP(标记分发协议)等。,第39页 共150页,6.2 网络冗余设计,3.设备热插拔技术热插拔包括:热替换热添加热升级。通过热插拔功能,用户可以在不影响业
17、务的情况下,对组件进行维护更新。,第40页 共150页,6.2 网络冗余设计,6.2.5 HSRP热备份路由设计VRRP(虚拟路由器冗余协议)是一种容错协议。VRRP在网络边界布置2台路由器或3层交换机,然后在2台路由器上配置VRRP和静态路由,如果其中一台路由器发生故障,另一台路由器马上可以及时工作,从而保持通信的连续性和可靠性。HSRP(热备份路由器协议)是Cisco公司私有协议。HSRP功能与VRRP完全一致。,第41页 共150页,6.2 网络冗余设计,1.HSRP工作原理HSRP协议利用优先级决定哪个路由器成为主动路由器。如果一个路由器的优先级比其他路由器的优先级高,则该路由器成为主
18、动路由器。刚开始工作时,各个路由器广播自己的HSRP优先级,HSRP协议选优先级最高的路由器为当前的主动路由器。HSRP指定一个虚拟IP地址作为缺省网关地址,网络中的主机将缺省网关指向该虚拟地址,主动路由器负责转发由主机发到虚拟地址的数据包。,第42页 共150页,6.2 网络冗余设计,2.三层交换机的HSRP配置命令格式(1)设置端口 IP 地址。命令格式:Router(config-if)#ip address(2)启用HSRP功能,设置虚拟IP地址。命令格式:Router(config-if)#standby ip(3)设置HSRP抢占模式。命令格式:Router(config-if)#
19、standby preempt,第43页 共150页,6.2 网络冗余设计,(4)设置路由器的优先权值。命令格式:Router(config-if)#standby priority,第44页 共150页,6.3 存储网络设计,第45页 共150页,6.3 存储网络设计,6.3.1 SCSI与SAS接口技术1SCSI接口技术SCSI(小型计算机系统接口)是连接存储设备与服务器最通用的方法。SCSI接口可以连接硬盘、光驱、磁带机和扫描仪等外设。目前SCSI技术已经逐步被SAS技术替代。,第46页 共150页,6.3 存储网络设计,2SAS接口技术SAS(串行连接SCSI)是SCSI总线协议的串行
20、版。SATA标准是SAS标准的一个子集,因此SAS和SATA在物理上和电气上有一定的兼容性。SAS接口与SATA(串行ATA)接口很相似,SAS接口是双端口设计,SAS硬盘无法插入SATA插座,而SATA硬盘可以安全插入SAS接口的第1端口。,第47页 共150页,6.3 存储网络设计,P140图6-12 SAS硬盘接口与SATA硬盘接口比较SAS与SATA有相同的物理层,因此它们的线缆与连接器很相似,但电气上有些差别。SATA信号电压不到SAS信号电压的一半,因此SAS接口传输距离可达6m,SATA只能达到1m。,第48页 共150页,6.3 存储网络设计,案例 SAS接口硬盘,第49页 共
21、150页,6.3 存储网络设计,P145表6-3 SAS、SATA和PATA硬盘接口性能对比,第50页 共150页,6.3 存储网络设计,6.3.2 RAID磁盘阵列技术改进磁盘存取速度的方法:磁盘高速缓存技术RAID(廉价磁盘冗余阵列)技术。1RAID技术的类型(1)软件RAIDWindows及Linux均支持软件RAID。所有操作由服务器CPU处理,系统资源利用率很高,从而使服务器系统性能降低。软件RAID的优点是不需要添加硬件设备。,第51页 共150页,6.3 存储网络设计,(2)硬件RAID硬件RAID通常采用PCI-E接口的RAID控制卡,RAID卡上有处理器及内存,不占用系统资源
22、。硬件RAID可以连接内置硬盘或外置存储设备。无论连接那种硬盘,都由RAID卡控制。,第52页 共150页,6.3 存储网络设计,P146图6-13 磁盘阵列机外观与系统结构,第53页 共150页,6.3 存储网络设计,案例 磁盘阵列机内部结构,第54页 共150页,6.3 存储网络设计,(3)大型磁盘阵列机磁盘阵列机是一台独立的精简型服务器(如IBM TotalStorage DS4500)大型磁盘阵列机的控制部分与磁盘阵列部分采用分开的设备,存储容量可达到数百TB。磁盘阵列机采用精简型操作系统,如Linux等。磁盘阵列机可以通过自带的网卡接连到网络中。,第55页 共150页,6.3 存储网
23、络设计,P146图6-13 大型磁盘阵列机,第56页 共150页,6.3 存储网络设计,案例 大型磁盘阵列机技术参数,第57页 共150页,6.3 存储网络设计,3RAID的级别RAID级别是一种工业标准。广泛应用的RAID级别有4种:RAID 0RAID 1RAID 01RAID 5,第58页 共150页,6.3 存储网络设计,RAID级别大小并不代表技术的高低。RAID 0没有安全保障,但速度快;RAID 1适用于需安全性又要兼顾速度的系统;RAID 2及RAID 3适用于大型视频等处理;RAID 5多用于银行、金融、股市、数据库等大型数据处理中心。,第59页 共150页,6.3 存储网络
24、设计,4RAID 0条带技术 RAID 0采用无数据冗余的存储空间条带化技术。如图6-14所示,这里用4个硬盘组成一个RAID 0阵列,在存储数据时,由RAID控制器将文件分割成大小相同的数据块,同时写入阵列中的磁盘。连续存储的数据块就像一条带子横跨所有的磁盘,每个磁盘上的数据块大小都是相同的。软件RAID 0中,数据块大小为64KB。硬件RAID 0中,数据块大小有1KB、4KB、8KB等,甚至有1MB、4MB等大小。,第60页 共150页,6.3 存储网络设计,P147图6-14 RAID 0结构,第61页 共150页,6.3 存储网络设计,RAID 0写入和读取数据时,4个磁盘可以同时进
25、行,读写性能虽然不能提高300%,但比单个硬盘提高200%的性能是可能的。RAID 0没有数据冗余和校验恢复功能,所以阵列中任何一个硬盘损坏,就可能导致整个阵列数据的损坏,因为数据分布存储在多个硬盘中。RAID 0最低必须配置2块或以上的相同规格硬盘,但是多于4块硬盘的配置是不必要的。,第62页 共150页,6.3 存储网络设计,5RAID 1镜像技术RAID 1采用两块硬盘数据完全镜像技术,这等于内容彼此备份。阵列中有两个硬盘在写入数据时,RAID 1控制器将数据同时写入两个硬盘。这样,其中任何一个硬盘的数据出现问题,可以马上从另一个硬盘中进行恢复。两个硬盘不是主从关系,而是相互镜像的关系。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 增强版 第06章 网络可靠性设计增强版 06 网络 可靠性 设计 增强
链接地址:https://www.desk33.com/p-679595.html