服务器基础与日常运维.ppt
服务器基础与日常运维,培训提纲,分公司服务器现状,分公司服务器现状,信通系统管理部机房有两个主机房,分别有各类应用系统服务器100多台,包括区域中心托管服务器和分公司自建系统服务器。服务器类型有x86服务器(Windows操作系统)和小型机(UNIX操作系统,如SUN Solars、IBM AIX等)。西南区域中心机房正在建设中,建成以后为西南区域各单位重要业务系统服务器及核心网络设备集中管理。,分公司服务器现状,集团公司托管服务器:管道生产管理系统(A3)电子邮件系统(Email)桌面安全系统(SEP)身份认证与管理系统 即时通信系统 区域中心网管系统,分公司服务器现状,分公司自建项目服务器:生产运行系统 企业信息门户系统 营销管理系统 规划计划系统 运维监控系统 域名解析系统,分公司服务器现状,基础设施建设情况,服务器部署方面:目前分公司各类服务器基本实现了分公司级集中部署。,培训提纲,PC服务器基础知识,服务器基础知识,服务器是指在网络环境下运行相应的应用软件,为网上用户提供共享信息资源和各种服务的一种高性能计算机,英文名称叫做SERVER。服务器是一种高性能的计算机,高速度的运算能力、长时间的可靠运行、强大的外部数据吞吐能力等。因而服务器又与微机(普通PC)在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面存在很大的区别。而最大的差异就是在多用户多任务环境下的可靠性上。,服务器分类,目前,按照体系架构来区分(CPU),服务器主要分为三类:一部分是IA(Intel Architecture,Intel架构)架构服务器,又称CISC(Complex Instruction Set Computer复杂指令集)架构服务器,即通常我们所讲的PC服务器,它是基于PC机体系结构,使用Intel或与其兼容的处理器芯片的服务器,也称为X86服务器(如:Intel、AMD)主要操作系统为Windows、linux一部分是比IA服务器性能更高的服务器,即RISC(Reduced Instruction Set Computing精简指令集)架构服务器,这种RISC型号的CPU一般来讲在我们日常使用的电脑中是根本看不到的,它完全采用了与普通CPU不同的结构。使用RISC芯片并且主要采用UNIX操作系统的服务器。(SUN SPARC、HP PARISC、IBM Power PC)主要操作系统为SUN solaris、HP UNIX、IBM AIX VLIW是英文“Very Long Instruction Word”的缩写,中文意思是“超长指令集架构”,这种构架叫做IA-64架构。基于这种指令架构的微处理器主要有Intel的IA-64和AMD的x86-64两种(支持64位操作系统的PC服务器),服务器分类,按机箱结构分类:塔式服务器 机架式服务器刀片服务器,服务器分类,按处理器(CPU)个数分类 应用层次1路服务器(最多插1个CPU)入门级服务器 2路服务器(最多插2个CPU)工作组级服务器 4路服务器(最多插4个CPU)部门级、企业级多路服务器(可插多个CPU)部门级、企业级,机架式服务器按高度分类,1U服务器 2U服务器 4U服务器8U服务器 1U=4.445cm,服务器组成结构,服务器的特点,CPU数量多(核数多)、主频高、缓存大;内存数量多、可扩展性强、容错、双通道;硬盘数量多、容量大、容错;多电源冗余;,服务器的CPU,CPU-中央处理器,服务器的大脑PC 服务器CPU 基于Intel架构PC 服务器CPU主要类型:Intel Xone、AMDCPU的技术参数:核数、主频、缓存,服务器的硬盘,硬盘的技术参数:容量、转速、接口类型硬盘容量:72G、146G、300G、600G、1T等硬盘转速:7.2K、10K、15K(转每分钟)硬盘类型:iSCSI、SSD、FC、SATA、SAS不同接口的硬盘:iSCSI 早期服务器硬盘,容量小、转速低 SSD固态硬盘,容量小、转速快、价格昂贵 FC光纤硬盘,容量小、转速快、价格贵 SAS容量小、转速快、价格中等 SATA容量大、转速低、价格便宜,服务器前视图,前部/后部视图,3.5寸HDD,Power按钮,可选光驱,USB 接口,UID LED,电源,PCIe 插槽,VGA接口,串口,USB 接口,NIC,FlexLOM 接口,iLO 接口,内部视图,Internal view,风扇,电源,内存插槽,I/O 接口,处理器,处理器导流板,前视图/内部 技术细节,后视图 技术细节,服务器各项指示灯介绍,服务器最基本的指示灯1、内部健康状态指示灯2、外部健康状态指示灯3、以太网卡健康状态指示灯4、UID指示灯(维护、蓝色)5、电源开关结合硬件日志信息判断服务器 硬件故障6、硬盘健康状态指示灯,服务器各项指示灯介绍,现在服务器除以上基本指示灯,还将内部各部件健康状态灯做在服务面板上,大部分可以直接从面板指示灯判断服务器硬件故障。,磁盘的Raid技术,RAID:冗余磁盘阵列,就是将N块硬盘通过RAID Controller(分Hardware,Software)结合成虚拟单台大容量的硬盘使用,其特色是N块硬盘同时读取速度加快及提供容错性。Hot spare:热备盘。当一个正在使用的磁盘发生故障后,一个空闲、加电并待机的磁盘将马上代替此故障盘,此方法就是热备用。热备用磁盘上不存储任何的用户数据,未使用时磁盘指示灯处于熄灭状态。,常见的Raid技术,Raid0:条带化,将2个以上的磁盘组成条带化,数据分布在不同磁盘上,提高数据传输速率。Raid0的速度是最快的,但是RAID0没有冗余功能的,如果一个磁盘(物理)损坏,则所有的数据都无法使用。Raid1:镜象结构,由2块、4块或成双数磁盘组成。拿2块磁盘组成镜象为例,2块磁盘保存一模一样的数据,1块磁盘损坏,另外1块磁盘可以继续使用,数据不会丢失。缺点是速度慢,损失50%容量的磁盘空间。,常见的Raid技术,RAID5:分布式奇偶校验的独立磁盘结构。奇偶校验码在不同的磁盘上,所以提高了可靠性,允许单个磁盘出错。任何一个硬盘损坏,都可以根据其它硬盘上的校验位来重建损坏的数据。硬盘的利用率为n-1。(至少3块盘)RAID6:RAID6是RAID5的扩展,主要是用于要求数据绝对不能出错的场合,允许2块磁盘同时损坏,数据不会丢失,硬盘的利用率为n-2。(至少4块盘),常见的Raid技术,Raid10:高可靠性与高效磁盘结构。这种结构是一个带区结构加一个镜象结构,因为两种结构各有优缺点,因此可以相互补充,达到既高效又高速还可以的目的,主要用于容量不大,但要求速度和差错控制的数据库中。(例如系统盘)Raid+Hot spare:Raid与热备盘组合。根据需求选择做不同的Raid,再留1块磁盘热备盘,热备盘未使用时磁盘指示灯处于熄灭状态。,x86服务器安装系统,服务器加电自检,确认各项健康状态灯正常;各厂商都有服务器引导光盘,插入引导光盘,光盘启动后进入安装页面,按需求做磁盘阵列。(通常2块盘做Raid10;4块盘做Raid5;8块盘:用2块盘做Raid10安装操作系统,5块盘做Raid5存放数据,剩1块盘做热备盘;磁盘阵列做好后,划分磁盘空间,系统盘、数据盘等。按提示安装服务器驱动程序及操作系统;操作系统安装后,更新补丁、安装防病毒软件。,培训提纲,PC服务器日常运维,运维体系,为了保障核心关键业务应用安全、稳定可靠运行,满足集团公司信息系统运维管理的工作要求,分公司借鉴了ITIL(信息技术基础架构库)和GCC(信息系统总体控制)标准,开展包括组织架构、制度体系及技术平台的建设,初步实现了集中管理、集中维护、集中监控。,运维体系建设情况,服务器运维目标,运维目标 保证公司重要信息系统724小时稳定运行,实现各系统年度正常运行率99%以上;确保各应用系统数据安全、网上相关业务可靠、平稳开展。运维内容服务器硬件巡检维护工作服务器操作系统巡检维护工作。服务器安全:补丁更新、防病毒、防攻击。每月运维分析会年度运维分析会,服务器硬件日常运维,服务器硬件巡检内容:服务器及存储整体外观情况;服务器及存储电源和风扇健康状态指示灯;服务器及存储系统面版健康状态指示灯;服务器及存储硬盘健康状态指示灯;服务器及存储硬件报警日志;服务器及存储电源线、网线、光纤连接线情况;服务器及存储整体运行情况。,服务器前面板细节,1、机箱内部各部件状态灯2、UID指示灯(维护用蓝色)3、内部健康状态指示灯4、外部健康状态指示灯5、6、以太网卡健康状态指示灯7、电源开关8、视频接口9、USB接口,常见硬件故障,硬盘故障,常见硬件故障,内存故障,常见硬件故障,网络连接故障,常见硬件故障,电源故障,注意事项,对于热插拔硬件的故障处理可以在不用关机断电的情况下在线更换常见的热插拔硬件包括:硬盘、电源部分服务器还包括了内存盒,取出内存盒可以更换内存操作人员需戴防静电手环,注意事项,对于非热插拔硬件的故障处理非热插拔硬件指需要打开机箱才能操作的硬件非热插拔硬件故障处理的关键点:关机断电并拔下电源插头操作人员需戴防静电手环,服务器操作系统日常运维,服务器操作系统巡检内容:检查操作系统补丁更新情况;检查操作系统防病毒软件病毒库更新情况;检查操作系统防病毒软件扫描日志;检查操作系统日志报错情况;检查操作系统系统磁盘、数据盘剩余空间;检查服务器CPU、内存使用率;检查数据库备份情况。,分公司运行监控系统,运行监控系统登录方式:http:/10.89.1.207,1.首页,1.1资源一览,1.首页,1.2 BSM Dashboard,2.TopN,看主机、网络和应用的CPU和内存利用率排名.,4.策略,服务,监控系统展现层次,设置阀值,产生事件,影响资源的整体状态,4.策略,指标分类,4.策略,一、资源选择 那些资源应用某项策略。二、指标定义 指标定义中可以设置那些指标是否监控,在是否监控的前提下才设置这些监控指标中那些是关键指标。而关键指标才能设置指标阀值,只要有一个关键指标有问题就会影响到资源的整体状态。黄色告警是叫超警戒,红色告警是叫超负荷。三、事件定义 定义那些指标和资源产生事件,事件的查看在监控-事件管理。四、报警定义 配置是否激活报警,配置报警接收人员、选择那些资源事件发生才发送报警、发送报警的时间段。报警的查看在监控-报警管理。,5.监控,一、资源监控二、日志监控日志监控是通过设置关键字(可以是与或者或的两种方式来配置关键字)和日志级别进行事件过滤,从而产生日志文件预警的功能。三、事件管理,6.服务,一、服务定义建立业务服务系统拓扑二、事件定义设置那些服务事件可以产生事件,服务事件的查看在监控-事件管理三、报警定义设置那些服务事件可以产生报警,报警的查看在监控-报警管理四、计划不在线时间针对具体某个资源,计划不在线时间段内,系统依旧会产生事件,只是不触发报警。,7.报表,2、故障类报表,1、资源类报表,3、服务类报表,培训提纲,Windos服务器安全与配置,PC服务器安全,服务器注意事项:服务器要求不接入外网及时更新系统安全补丁安装防病毒软件,及时更新病毒库不要任意接入移动存储操作系统安全基线配置,系统采用三级架构,分别在总部、区域数据中心部署服务器和管理软件,各企事业单位负责安装客户端软件。,在总部部署病毒定义码和补丁更新服务器、电子文档保护服务器、存储和日志分析服务器 在区域数据中心部署防病毒、补丁分发、端点准入服务器和后台管理服务器各企事业单位安装客户端软件,系统部署架构,中石油防病毒软件部署架构,防病毒软件SEP11简介,赛门铁克终端安全保护系统(SEP 11+SNAC11)1个终端软件(SEP 11客户端),1个服务器管理平台(策略管理服务器)多层次计算机终端保护(防病毒,防间谍软件,防火墙,入侵防护IPS,应用程序控制,设备控制)局域网强制设备(Symantec LAN Enforcer 6100)+接入层802.1x 交换机强制网关设备(Symantec Gateway Enforcer 6100)外网、门户等客户端遵从公司安全策略才能访问网络,否则访问受限并进入修补网站,59,功能模型,Symantec端点保护管理器,Peter_,59,60,60,非常6+1,防病毒,防间谍软件,防火墙,入侵防护,设备控制,应用程序控制,防病毒模块,网络访问控制,网络访问控制模块,防火墙,入侵防护,设备控制,应用程序控制,Peter_,60,SEP11客户端界面,Peter_,61,操作系统安全配置-帐号管理,管理缺省账户-重命名管理员账户 Administrator-禁用来宾账户 Guest-删除或锁定与工作无关的账户 操作:进入“控制面板-管理工具-计算机管理”,进入“系统工具-本地用户和组-用户,操作系统安全配置-口令管理,密码复杂度至少包含以下四种类别的字符:-英文大写字母(A 到 Z)-英文小写字母(a 到 z)-阿拉伯数字(0 到 9)-非字母字符(例如!、$、#、%),操作系统安全配置-口令管理,密码长度最小值:8 位密码最长使用期限:不长于 90 天强制密码历史:5 次(含5 次)账户锁定阈值:6 次(含6 次)操作:进入“控制面板-管理工具-本地安全策略”,在“帐户策略-密码策略,操作系统安全配置-认证授权,远程系统强制关机只指派给 Administrators 组本地系统强制关机只指派给 Administrators 组取得文件或其它对象的所有权“只指派给 Administrators 组 操作:进入“控制面板-管理工具-本地安全策略”,在“本地策略-用户权利指派,操作系统安全配置-日志审核,以下审核策略均勾选“成功”与“失败”两项。审核登录 审核策略更改 审核对象访问 审核目录服务访问 审核特权使用 审核系统事件 审核帐户管理 审核过程追踪 日志文件大小(400M)操作:进入“控制面板-管理工具-本地安全策略”,在“本地策略-审核策略,操作系统安全配置-系统服务,关闭自动播放功能,防止从移动设备(或光盘)感染恶意代码。1)对于 Windows XP 与 Windows 2003,开始-运行-gpedit.msc,打开组策略编辑器,选择“计算机配置-管理模板-系统-关闭自动播放“,查看其状态。2)对于 Windows 7 与 Windows 2008,开始-运行-gpedit.msc,打开组策略编辑器,“计算机配置-管理模板-Windows 组件-自动播放策略”在中,选择“关闭自动播放”,查看其状态。,操作系统安全配置-系统服务,服务与端口安全管理,关闭不必要的服务与端口。操作:在“控制面板-管理工具-计算机管理”中,选择“服务和应用程序-服务”检测操作参考可根据具体应用情况,筛选不必要的服务。,操作系统安全配置-补丁与防护软件,系统安全补丁管理:服务器安装补丁前应进行测试。防病毒管理:对于服务器,安装桌面安全安全管理系统中的防病毒软件即可。,操作系统安全配置-共享文件夹及访问权限,关闭默认共享,在非域环境下,关闭 windows 硬盘默认共享,例如 C$,D$设置共享文件夹访问权限,只允许授权的账户拥有权限共享此文件夹 进入“控制面板-管理工具-计算机管理”,在“系统工具-共享文件夹”下,查看每检测操作参考个共享文件夹的共享权限,只将权限授权于指定账户。,操作系统安全配置-远程维护,远程协助安全管理:如果无特别需要,建议关闭远程协助。远程桌面安全管理:终端计算机如无特别需要,建议关闭远程桌面。操作:鼠标右键点击“我的电脑”,选择“属性”,选择“远程”标签,培训提纲,服务器虚拟化技术介绍,今天IT架构的现状,Data Center Management,Server,OS,Application,Service,Storage,Client,Developer,NETWORK,Database,Database,AppServer,MailServer,AppServer,服务器平均利用率只有5%到 15%,但高峰时又不能满足需要,服务器泛滥难以管理,每台服务器支持单一应用,能源成本持续上升,解决方案云计算,云计算,云计算,云计算,新的IT运营模式:自动化随需应变及时性,虚拟化之旅,BC-DRC,安全,法规遵从,管理自动化,组织结构优化,流程优化,梳理应用,虚拟化,整合平台,整体优化,节省成本,提高效率,降低风险,私有云转变之旅,虚拟化,云计算的关键技术-虚拟化,将物理资源隔离,提供一个标准化的统一的资源池,以提供自动化、按需及时的分配资源的能力,不同类型的虚拟化技术,UNIX系统分区技术RAS特性价格昂贵灵活度较低不能跨服务器移动技术门槛高,X架构集群实现RAS特性价格低廉灵活度高轻松实现跨服务器移动技术门槛低,虚拟化平台,虚拟机,虚拟机,虚拟机,虚拟机,操作系统,应用,应用,应用,虚拟化平台,基础服务虚拟计算-服务器虚拟化虚拟存储虚拟网络应用服务可用性安全性伸缩性,虚拟化资源平台,ESX/ESXi使用革命性的技术回收利用虚拟内存:内存页面共享Ballooning内存压缩虚拟层交换,虚拟计算虚拟内存技术,虚拟层,分布式资源调度(DRS):按需自动资源调配,功能跨资源池动态调整计算资源基于预定义的规则智能分配资源优势使IT和业务优先级对应 动态提高系统管理效率自动化的硬件维护,动态负载均衡和连续智能优化,保证所有应用需要的的资源,资源池,业务需求,围绕业务进行组织和规划而不是您的硬件!,虚拟计算分布式电源管理(DPM),资源池,业务需求,下电,当整个群集需要资源减少时,整合所有负载到少数几台服务器上将不需要的服务器置于备用模式当负载增加时,DPM自动将处于备用状态的服务器唤醒,在确保服务级别的同时,最大限度降低了数据中心服务器的耗电量虚拟机没有中断或停机,虚拟存储存储访问协议、存储,虚拟网络分布式虚拟交换机,虚拟化平台,基础服务虚拟计算虚拟存储虚拟网络应用服务可用性安全性伸缩性,可用性:用VMotion减少计划内宕机时间,VMotion是什么?通过VMware VMotion可以实现虚拟机的动态迁移,而服务不中断客户优势零宕机时间:进行有计划的服务器维护和升级迁移工作负载,资源利用率最大化服务器的持续可用性,完整的交易集成支持Fibre Channel和iSCSI SAN环境以及NAS,VMotion迁移虚拟机,SAN、iSCSI或NAS,VMware HA提高了系统的可用性,功能当服务器故障时,自动重新启动虚拟机优势经济有效的适用于所有应用的高可用不需要独占的stand-by 硬件没有集群软件的成本和复杂性,经济有效的适用于所有应用的高可用解决方案,X,应用服务可用性:容错 Fault Tolerance,应用服务可用性:VMware Site Recovery Manager,简化并自动化灾难恢复工作流:设置、测试、故障切换和业务恢复对来自 VirtualCenter 的恢复计划提供集中管理将手动恢复过程转换为自动恢复计划简化与第三方存储复制的集成,实现快速、可靠、易于管理且价格合理的灾难恢复,应用服务VMware虚拟环境备份,挑战备份降低虚拟化的ROI较高的服务器利用率带来备份时的资源冲突不能满足SLAs 限制服务器整合,增加了成本,VirtualServerA,Virtual Server B,Virtual Server C,整合前,整合后,20%资源利用率,80%资源利用率,100%,80%,40%,0%,60%,20%,CPU Utilization,100%,80%,40%,0%,60%,20%,CPU Utilization,ServerA,ServerB,ServerC,Shared Physical Resources,虚拟机之间的数据消重排除瓶颈,Avamar虚拟机之间的数据消重,同样数据从不备份两次vCenter全面集成高达90%快速备份 高达95%减少数据移动确保大规模的服务器整合降低运维成本,减少主机服务器需要高效运维管理管理更多的数据,一步恢复,应用服务安全性:vShield,DMZ,PCI 遵从,HIPAA 遵从,虚拟数据中心端到端安全:从边界到终端,虚拟数据中心 1,虚拟数据中心 2,Web,测试及研发,vShield Endpoint简化了AV,提高了安全方案的性能和效率 卸载AV活动到Security VM(SVM)消除桌面代理和AV风暴全面的桌面虚拟机保护跨虚机集中管理AV服务并记录活动细节与合作伙伴集成,EPSEC API-Trend Micro,应用服务伸缩性:通过VMware DRS动态获得硬件资源,负载分配规则设定一次,永远有效,自动执行易于添加更多的资源避免业务繁忙时段的过载,动态添加硬件,资源池CPU 36GHz,Mem 58GB优先级:高,资源池CPU 50 GHz,Mem 70GB优先级:高,谢谢!,