机房运维服务方案.docx
机房运维服务方案目录1 .运维服务计划31.1. 故障的发现31.2. 故障的处理31.3. 故障的记录31.4. 故障的升级上报31.5. 报告内容41.6. 应急处置41.7. 故障处理后的测试验收51.8. 故障书面报告51.9. 故障报告填写及报告52 .运维服务保障措施52.1. 运维服务保障目标52.2. 运维服务保障原则62.3. 运维服务保障策略62.4. 运维服务保障体系72.5. 运维服务保障措施83 .重点难点保障措施103.1. 运维机制部署103.2. 运维机构部署113.3. 重点难点工作具体保障处理方案12一、运维服务计划(一)故障的发现工作人员在发现故障或接到故障报告后,首先要记录故障发生时间和发现时间,以及发现部门、发现人及联系电话,对故障的等级进行初步判定,并报告相关人员进行处理。(二)故障的处理1.发生故障的应用区域为故障处理部门,故障处理部门领导负责通知和落实相应身位人员到达现场,故障处理部门应首先指定现场指挥人员,指挥人员应先询问了解设备和配置近期的变更情况,查清故障的影响范围,从而确定故障的等级和发生故障的可能位置;3.4. 一般性故障按照故障升级上报要求进行上报,并在处理过程中及时向主管领导通报故障处理情况。3.5. 重大故障按照故障升级上报要求进行上报,并在处理过程中及时向主管领导通报故障处理情况。(三)故障的记录在故障处理中,应对其过程进行详细记录,其中包括故障处理的负责人,检查的内容及结果,对故障的判断及处理办法,以及故障处理过程中各步骤及执行人员。(四)故障的升级上报根据故障等级和发生的时限,要对故障的情况进行及时的上报,并对报告人,告知人及时间及内容进行记录。重大故障由处领导负责上报,一般性故障由故障处理部门负责上报。故障处理部门是负责受理和处理网络和信息安全突发事件的具体行政机构,在接到突发事件报告后,要按下列工作程序处置:1 .一级故障的报告程序(1)发现故障岗位人员根据故障初级判断结果,立即向主管领导汇报;(2)主管领导根据故障初级判断结果,迅速将有关情况报告安全应急领导小组或本处领导,报告时限不能超过30分钟;(3)经排查故障无法在1个小时内排除,将该突发事件形成书面汇报材料呈报给主管领导,同时向上一级主管部门上报情况。2 .二级故障的报告程序(1)发现故障岗位人员根据故障初级判断结果,将故障有关情况向技术部部长汇报,报告时限不能超过30分钟;(2)技术部根据故障初级判断结果,迅速将有关情况报告信息系统安全应急领导小组,报告时限不能超过60分钟;(3)经排查故障无法在4个小时内排除,将该突发事件形成书面汇报材料呈报给主管领导。3 .三级故障的报告程序(1)发现故障岗位人员根据故障初级判断结果,将故障有关情况向技术部部长汇报,报告时限不能超过1小时;(2)技术部根据故障初级判断结果,迅速将有关情况报告信息系统安全应急领导小组或主管领导,报告时限不能超过4小时;(3)经排查故障无法在8个小时内排除,将该突发事件形成书面汇报材料呈报给主管领导,做故障升级处理。4 .四级故障的报告程序(1)发现故障岗位人员根据故障初级判断结果,将故障有关情况向技术部部长汇报,报告时限不能超过24小时;(2)将有关情况报告部门负责人,必、要时向办公室主任、技术处长汇报。(五)报告内容报告内容包括突发事件发生的时间、地点、过程、状况、原因及影响等。(六)应急处置1 .根据故障情况立即进行应急处理,防止事件进一步扩大,同时由信息系统安全应急处置工作小组分析该故障的起因,判断需要的处理时间,并根据判断结果按故障升级上报程序,逐级上报;2 .根据突发事件的性质、级别,决定启动相关系统技术应急预案;3 .根据事件级别以及对业务影响程度的评估结果,向信息系统安全应急领导小组报告,应急领导小组决定是否启动业务应预案,配合业务部门开展应急处置工作;4 .应急领导小组授权办公室或责任人通过内外网站、传真等媒介通报突发事件有关信息;5 .根据故障可能产生的原因尽早联系上一级技术部门、设备供应商请求技术支持,并将联系外协支持的情况记录在案。(七)故障处理后的测试验收故障的处理后,故障处理部门要进行自测,然后提交用户进行确认,当用户对处理结果认同后,故障最终确认解决。(八)故障书面报告对于重大故障和拖延时间较长的一般性故障,在处理过后,应对故障及处理的全过程进行总结,以文字形式进行报告。对于影响较小的一般故障处理,在维护日志中做完整的说明和记录。(九)故障报告填写及报告故障报告应包括以下几方面的内容:故障处理过程的原始记录,故障情况描述及故障处理情况说明,报告中要明确说明故障处理是否准确和及时,有无明显的失误,有无违反规定行为。语言应简明扼要,对情况描述要清楚、有条理。故障处理部门的技术部部长将对故障报告进行全面审核,无误后签字并报领导(签字),重大故障报告需报主管领导。二、运维服务保障措施(一)运维服务保障目标运维服务保障的目标是保障本项目相关应用系统始终在良好的状态下运行,尽量及时发现和消除故障隐患,在系统发生问题时,能以最快的速度得到响应并修复,让用户满意。秉承如下质量保证宗旨和目标:为本次项目相关应用系统数据及应用系统的硬件软件运行提供及时、高效、全方位的技术支持与服务;以热情、诚挚的态度,优质、过硬的技术服务于用户;不但要理解用户提出的要求,还要力求预知用户潜在的要求;不仅要为用户提供一流的产品,而且还要提供一流的服务;以先进的管理提高服务的效率;以出色的服务态度建立良好的服务界面;以多样的媒介方式提供方便的服务接入;以科学的方法为用户提供满意的服务;通过对受理的服务请求进行归档整理,针对系统形成常见问题解决手册,为系统的正常运行提供经验支持;在对用户的服务过程中,重视用户对服务质量的满意度。在技术支持与运维服务工作中,一贯遵循以下准则:确保系统的正常运行;充分保护用户的投资和效益;充分满足用户的需要充分减轻项目单位的负担。(二)运维服务保障原则实效性原则即时响应,将会根据系统的硬件配置、应用需求、地理环境等因素,采取电话、远程诊断和现场服务的方式及时解决应用系统各种突发的故障、技术错误、操作问题等。前瞻性原则将会对问题做出预见性分析,并为用户系统未来的发展和扩展提供专业的建议。顾问性原则将为用户提供免费咨询服务。对于用户使用系统过程中遇到的问题,进行收集和分类,并进行有效的改进。完整性原则将会为所提供的设备进行服务支持,并对用户与系统相关的其它设备提供必要服务。规范性原则的服务过程将会全面公开,用户可随时进行监督,从而保证服务的质量。(三)运维服务保障策略服务标准化基于IS09001质量控制体系的技术服务标准,形成标准化的作业流程、追溯制度、文挡、服务用语及资格认证等。服务体系化建立热线用户服务体系,让用户能够以最简单的方式直接反映使用系统遇到的问题。服务主动化制定定期的回访制度,针对用户问题比对历史案例,预先提出解决方案,并保证服务在短时间内到位。服务电子化针对具备上网条件的用户,提供远程登录、WEB互动、在线支持等电子化服务内容,逐步建立完善的电子化服务渠道。服务现场化在项目附近设立建立运维团队,确保服务即时响应快速解决。(四)运维服务保障体系1 .技术支持服务规范为了保证在技术支持服务中工作的规范性及相关信息的反馈,特制订技术支持服务规范。所有支持人员必须经过严格的资格认定,并承诺遵守保密协定、遵守技术支持人员工作规范、响应条例。2 .技术支持服务体系优质服务有赖于一个完善的服务机制。的服务体制由专项方案制定、服务热线支持、服务工程U币现场支持、客户定期回访、以及服务质量跟踪管理等方面组成,确保客户得到优质服务。技术支持服务体系针对本次项目相关应用系统,将配备专门的技术支持服务小组在现场,对进入服务期后的系统安装、调试、试运行及正常运行提供完备的技术支持服务,确保系统稳定运行。技术支持服务小组由经验丰富的咨询专家、工具软件工程师、应用开发工程师、业务专家、运维工程师等组成。的运维服务机构经过长期的发展,积累了大量丰富的实践经验和雄厚的技术力量。技术咨询专家组由软件开发、系统集成、应用系统架构的技术人员组成。配合运维服务应用开发组、运维服务工具软件组进行故障诊断和技术支持等。服务工具软件组由精通项目中所使用的产品的相关技术工具的工程师组成。配合解决发现的工具软件的使用问题和故障。服务应用开发组由熟悉软件开发及硬件集成技术的人员组成,负责解决本次项目相关应用系统运行中出现的需要进行软件调整的问题。服务技术实施组由熟悉应用硬件、软件、数据交换整合软件的工程师组成,配合解决运行过程中出现的一般问题和故障。(五)运维服务保障措施为保证前端设备及机房内设备的安全、稳定、无故障运行,提供物理环境管理和维护服务。为保证服务器、路由设备、网络交换设备等网络基础设施的安全性、可靠性、可用性和可扩展性,保证网络结构的优化,提供网络基础设施运维服务。为保证数据存储设施的安全性、可靠性和可用性,保证存储数据的安全,提供数据存储设施保障服务。为保证操作系统、数据库系统、中间件、其它支撑系统应用的软件系统及网络协议等的安全性、可靠性和可用性,提供系统平台运维服务。为保证在系统平台上运行的应用软件系统的安全性、可靠性和可用性,提供应用系统运维服务。为保证物理环境和系统运行的安全,提供安全管理和维护服务。为相关应用系统软硬件提供运维保障服务。全系统运行监控、系统性能调优,以确保整个系统的安全、高效运行。对所有应用系统提供升级服务。1 .本地化支持和服务可为客户提供本地化的支持和服务。根据客户要求提供定制化服务。2 .7*24小时服务热线如遇紧急情况提供现场紧急服务,并提供7*24小时服务热线。3 .远程在线诊断和故障排除对于电话咨询解决不了的问题,经用户授权后的工程师、技术专家经过用户授权后通过远程诊断软件远程登录到用户网络系统进行故障诊断和故障排除。对于一些设置上的问题,在远程诊断时即可解决;对于无法解决的问题,将立即派有关领域的技术专家去现场解决。远程诊断服务可以根据客户的实际情况,每周七天,每天24小时均可以进行。4 .快速的现场服务提供驻场工程师,一般故障排除时间不超过1小时,重大故障排除时间不超过4小时。系统出现出现故障和缺陷后,用户将出现故障的现象(症状)、部位和性质、工作日志和有关记录通知本维护工程师,经双方分析,如认为关联到第三方所提供的产品,则通知第三方,由三方一起派员检查并对故障进行分析,寻求解决问题的方法。每次故障处理完毕后,填写”故障诊断表”以及相关的处理记录。5 .定期预防性巡查维护定期对系统进行有关安全性、可管理性以及系统性能进行检查分析,对网络设备环境和系统进行性能检测,系统健康检测的结果将转化为简明易懂的报告,由专业系统健康检测的服务专家跟进用旨出系统潜在的问题以及推荐解决方法。客户服务工程师定期对系统的运行进行例行检查,并做出巡杳记录。6 .设备保障建立设备常用备件库,当硬件设备出现故障时,在维护或更换零部件之前,动用备件库中的备件替换故障零件,保证系统的持续运行。7 .系统软件维护将在系统运营过程中和管理®务过程中,根据资源分配和效率分析,制定出改进建议,针对相关系统的扩充、版本升级、功能更新等功能提供良好的优化配置建议、技术咨询、服务咨询等服务。8 .顾问咨询根据系统运行实际状况,结合客户对今后系统发展规划和需求,提出软硬件技术咨询的技术服务。三、重点难点保障措施(一)运维机制部署1 .系统运维机制从长远角度讲,一个信息系统要保障其能够真正实现长效运行,必须建设一支合格的运维队伍,并建立完善的运维制度,系统的良好和稳定运行才能够得到保障。系统必须针对各种可能出现的故障,综合考虑技术服务、维护响应等诸多因素,排除系统中的单点故障隐患,优化系统结构,实现系统全面监控,使系统发生故障的可能性尽可能的减小。对各种可能出现的紧急情况,应制定应急的工作方案或对策,一旦发生系统故障,备用的系统或者应急预案将发挥作用,这样才能将系统危害性降到最小,并在最小的时间内恢复系统。因此我们建议从运营维护的角度出发,针对本项目信息运行系统,要制定完整的系统维护管理制度和各种异常情况的应急措施。制定严格的规章制度及其监督执行措施,是信息系统正常运行的根本保证。2 .应急响应机制本系统建设在进行过程中会受到各方面外部因素的影响,不确定因素不能够完全考虑到风险管理计划中去,因此,建立必要的应急响应机制是必要的。不仅要有对已经识别的风险的应对措施,还要有防范其它意外的应对措施,这主要就是建立一种管理上的措施和机制,一旦出现事先没有考虑到的情况,仍要按照预先确定的原则和框架能够有条不紊的应对。一旦出现问题,对于出现的问题应该及时报告并预留畅通的汇报和沟通渠道,明确对各类问题作出判断和决策的责任归属,并且对问题的处理方法能够及时决策,从而及时采取行动。也就是说,要具备一套能够应对各种风险的报告、决策和响应机制,确保各种资源保持就位,各方面人员保持有序状态,随时注意发现异常情况,及时决策及时处理。3 .日常业务服务是运行维护服务的重点日常业务服务是运行维护工作的重点工作之一,做好日常业务的服务,也就是为整个运行维护工作起到了至关重要的作用。4 .巡检服务是避免故障发生、提供服务质量的关键巡检服务的目的在于发现已发生的及潜在的系统故障,对于已发现的系统故障,及时联系相关原厂商授权服务商技术人员或运维服务人员予以解决,对于潜在的问题,在故障发生之前,采取相关措施,或安排好升级、更换工作,以避免故障的发生。健康巡检服务的范围针对的是维持业务正常运行的所有支撑系统,包括网络及安全设备、服务器及存储设备等。5 .软件系统维护及再开发是确保平台实用价值的支撑软件系统维护阶段是软件生存周期中时间最长的一个阶段,所花费的精力和费用也是最多的一个阶段。严格又适应项目实情的维护流程是必不可少的,按照流程不仅可以提高维护质量更能为今后的软件维护工作提供参考。为保证平台的正常运行,我们将软件系统维护分为校正性维护,适应性维护,完善性维护和预防性维护。(二)运维机构部署6 .项目组织协调由于系统建设涉及的厂家较多,所以项目必须有一个行之有效的项目管理的组织形式,明确各方面的职责分工的原则,在决策层和执行单位之间,在技术部门和业务部门之间,必须建立严格的组织架构,要有明确的职责边界划分和领导与汇报关系,之后项目成员才能够进行有效的沟通、协调和指挥,这往往是项目成败的关键。根据我们的经验,像本项目,在横向的项目管理和纵向的职能管理的各个管理体系中,都要建立起沟通和协调的通路,不留空白,这样才能保证各项工作决定得到有效的贯彻执行。7 .项目沟通机制信息系统运维项目的成功与否,很大程度上取决于该项目的组织、管理和协调是否到位,也就是业界经常提到的"三分靠技术,七分靠协调"。这足以说明协调管理在信息系统建设过程的重要性。本项目在业务上涉及到方方面面的业务管理部门,在技术上可能会涉及到不同单位的服务商和软件开发商。这些复杂的横向关系会给整个项目的协调管理带来很大的难度,尤其是如何协调各业务部门对维护服务的全力配合和支持,以及对其他项目相关方的管理力度和协调力度都有可能会对项目运维的进展造成巨大的影响。所以在整个项目中,全面的沟通是至关重要的。因此就需要提前做好沟通计划,明确各自分工,明确各类问题的沟通路线,在各种问题上尽可能得到大家的共识。在项目的执行过程中,需要定期报告,将报告汇总起来,对于项目中出现的问题,及时作出调整。为此,在沟通计划中要制定一些相对固定的报告文档模板,各种报告有时间周期或里程碑的要求,各类报告都有指定的报告对象,在电子邮件系统中应配合开设用户组,并对报告和反馈的情况进行跟踪和督促。8 .安全体系评估本项目信息系统意义重大,涉及到个人隐私和公共安全信息,如果系统被非法侵入、数据被篡改、泄露,那将会造成重大的社会影响和严重的经济损失。由于系统需求和业务流程复杂,在运维系统业务功能的同时,必须强化对系统安全性的考虑,在项目建设初期进行信息系统整体规划和设计时,必须遵循有关信息安全标准,在网络、主机、数据库、应用软件、管理制度等多层面提供多种方式、多层次、多渠道的安全保密措施,防止各种形式和途径的非法侵入和机密信息的泄漏。在加强安全保障体系建设的同时,一定做好灾难备份,同时加强安全管理。对重要计算机系统和网络的灾难备份及其应急方案应给予高度重视,要提高计算机主要业务系统的抗灾能力。(三)重点难点工作具体保障处理方案1 .设备硬件故障的质量保证处理(1) 小型机、服务器等关键设备损坏后,技术人员应立即向技术部负责人报告;(2) 技术部负责人立即组织技术人员查明原因,联系维保单位更换受损部件;(3) 如果设备一时不能修复,应向分管领导T报,并告知各应用部门暂缓上传上报数据。2 .电力系统故障的质量保证处理(1) 外电中断后,技术部值班人员应立即检查中心机房UPS电源是否正常供电,并杳明中断原因,及时向技术部负责人报告;(2)如因楼内线路故障,要求物业管理部门迅速恢复供电;(3) 如因供电部门因素导致供电中断,立即向供电部门联系,请供电部门迅速恢复供电;(4) 如告知需要长时间停电,应作如下安排:预计停电1小时以内,由UPS供电;预计停电1小时以上2小时以内,由UPS供电,同时备用启动柴油发电输电;预计停电超过2小时,启动柴油发电输电。(5) 电力系统恢复供电后,技术部管理人员按照规定流程开启相关设备。3 .消防系统质量保证处理当出现火情、火灾时,发现人员应在最短时间内通知安全员,并通知技术部及分管相关领导,通报物业管理部门。若火情严重时,应迅速拨打119电话报警,并尽可能采取一些简单可行的方法做初步的处理,如:科学使用周围的灭火器材或采用其他灭火措施、手段。在灭火的同时,立即疏散灾情范围的工作人员。进展情况随时向技术部及主管领导报告。(1)上班工作时间发生火警,听到自动消防系统发出报警后,还在机房工作的人员应及时紧急撤离,避免气体自动消防系统启动后,消防气体对人员造成人身伤害,确认火警后,立刻拨打119报警,并说明尽量使用气体灭火器进行灭火,减少电子设备的损坏。(2)非工作时间或节假日休息时间收到机房自动报警电话,应立刻向领导汇报及与办公楼内值班人员联系,要求值班人员马上到现场确认火警情况,确认火警后,立刻拨打119报警,并使用气体灭火器进行灭火,减少电子设备的损坏。(3)发生火警后,中心机房相关人员应马上赶赴现场,并向有关领导汇报。同时立即联系各设备供应商等相关,及时评估事故损失情况,研讨恢复网络系统正常运行的最佳解决方案。4 .网络中断质量保证处理(1) 故障排查:网络中断后,技术部技术人员要迅速判断故障节点,查明故障原因;(2) 故障排除:如属线路故障,应重新安装线路。如属路由器、交换机等网络设备故障,技术部技术人员立即检修并调试通畅。如路由器、交换机配置文件破坏,信息安全员应迅速按照要求重新配置,调试通畅。必要时,请有关供货单位、设备厂商协助调测畅通。如需更换设备,应上报分管领导,经批准后马上更换故障设备,尽快恢复系统运行。如发现属于外部线路的问题,应与线路运营商联系,敦促尽快恢复故障线路。技术部无法及时修理时,应立即通知相关供应商及维护人员,在最短时间内安排修理。(3) 特殊情况,如故障判断、网络恢复需要1小时以上,技术部负责人因及时将相关情况汇报至分管领导处,并在领导同意的情况下,采用紧急恢复措施,绕过故障设备,先行恢复网络的联通性,并及时督促及落实设备供应商抵达现场,及时判断故障并恢复正常;(4) 故障处理完毕,恢复正常后,应立即进行故障现象的回归测试,测试结果确认无问题后,再进行总结及评估,并将处理过程形成故障处理文档的知识库,进行统一归档管理。5 .业务系统故障的质量保证处理(1) 软件系统平时必须存有备份,与软件系统相对应的数据必须有多日的备份;并将它们保存于安全处;(2) 软件系统发生故障后,技术人员应立即向技术部负责人或分管领导汇报,经确认后停止该系统的运行并切换至备份系统,保证业务正常进行;(3) 技术部及时组织本部门技术人员,并同时通知软件系统主要应用部门做好软件系统和有关翔S的恢复工作;(4) 信息安全员检杳日志等资料,确定故障原因;(5) 技术部会同相关人员将实施处理的过程和结果备案存档,并向有关领导汇报。6 .其他网络故障质量保证处理(1) 故障的发现负责人员在发现故障或接到故障报告后,首先要记录故障发生时间和发现时间,以及发现部门、发现人及联系电话,又撤障的等级进行初步判定,并报告相关人员进行处理。(2) 对重大故障的处理当网管人员通过网络监控到诸如链路意外中断、核心路由(交换机)宕机。非法入侵及病毒入侵使网络传输性能下降,WEB门户网站、核心数据库等系统关键服务器性能下降,严重影响正常业务运行的情况时。网管人员应及时记录故障发生时间、地点等。同时立即报知主管领导。在此过程中网管人员应向所发生故障部门技术员询问所发生故障设备和配置近期的变更情况,查清故障的影响范围,从而确定故障的等级和发生故障的可能部位,随后网管人员根据判定故障发生区域情况向该故障所在区域主管网络技术人员通告并安排进一步的检查。如故障有可能涉及其他部门,应联系相关部门,请求协助调查及处理。在处理过程中要及时向主管领导通报故障的处理情况。(3) 对一般性故障的处理一般性故障的处理由相关部门负责,一般由技术部负责人负责故障的处理;负责人员应先询问了解设备和配置近期的变更情况,查清故障的影响范围,从而确定故障的等级和发生故障的可能部位,随后网管人员根据判定故障发生区域情况向该故障所在区域主管网络技术人员通告并安排进一步的检查。如故障有可能涉及的其他部门,应及时联系相关部门,请求协助调查及处理。在处理过程中网管人员应及时向主管领导汇报故障的处理进展情况。(4) 故障的记录在故障处理中,网管人员应对其过程进行详细记录,其中包括故障处理的负责人,检杳的内容及结果,对故障的判断及处理办法,以及故障处理过程中各步骤及执行人员。(5) 请求外协支持对一时不能查清原因的重大故障,应尽早联系原厂商请求技术支持。对4小时内无法解决的一般性故障,也应联系原厂商请求技术支持,并要将联系外协支持的情况记录在案。(6) 故障处理后的测试验收故障处理后,故障处理部门要进行自测,如有可能请用户进行确认,当使用部门对处理结果认同后,故障最终确认解决。(7) 故障书面报告对于重大故障和拖延时间较长的故障,在处理过后,应对故障及处理的全过程进行总结,以文字形式进行报告。对于影响较小的一般故障处理,在维护日志中做完整的说明和记录。故障报告应包括以下几方面的内容:故障处理过程的原始记录,故障情况描述及故障处理情况说明,报告中要明确说明故障处理是否准确和及时,有无明显的失误,有无违反规定行为。语言应简明扼要,对情况描述要清楚、有条理。故障处理部门的高级技术岗位人员将对故障报告进行全面审核,无误后交主管领导做进一步处理。(8) 机房停电的质量保证处理机房长时间停电登陆设备,备份数据;记录当前设备端口状态;统一艇到专用网管机F:/质量保证/停电质量保证/时间/设备数据备份;派专职工程师每三分钟查看一次设备运行状态,详细记录一级网设备板卡状态和设备温度;用风扇等制冷设备使核心交换机和核心路由器进行人工降温。设备因温度过高重启如果因为温度原因,导致设备不断重启,报告质量保证技术部负责人,然后手动关闭设备,并用质量保证降温设备对设备进行局部降温。当设备附近温度低于30度,再手动开启设备。数据检查:D对比当前数据和备份数据是否一致;2)对比设备当前端口状态是否和停电前一致;3)对比当前配置信息和备份前是否一致;如果不一致,则报告技术部负责人和分管领导,按照设备故障来处理。(9) 机房漏水质量保证处理发生机房漏水时,第一目击者应立即通知,并及时报告技术部负责人,技术部负责人接报后应立即前往事发地;若精密空调系统出现渗漏水,技术部负责人应立即通知工程部进行处理,及时清除机房积水;及时通知精密空调设备厂商,联系专业人员前往现场进行漏水点排查及修复;若墙体或窗户渗漏水,现场领导小组应立即采取有效措施确保机房安全,同时通知物业管理处及工程部,及时清除积水,维修墙体,消除渗漏水隐患。(IO)设备发生被盗或人为损害事件质量保证处理发生设备被盗或人为损害设备情况时,使用者或管理者应立即报告技术部负责人,同时保护好贩;技术部负责人接报后,通知安保部门、分管领导,一同核实审定现场情况,清点被盗物资或盘查人为损害情况,做好必要的影像记录和文字记录;事件发现人应当积极配合相关部门进行调查,并将有关情况向分管领导汇报;指定专人负责,及时恢复设备正常运行,并对事件进行调查;应在调查结束后一日内书面报告区局分管领导;必要时,质量保证领导小组还应及时上报至省局质量保证响应领导组和相关部门。(三)雷击事故质量保证处理遇强雷暴天气或接上级部门强雷暴气象预警,应关闭所有服务器,切断电源,暂停内部计算机网络工作。强雷暴天气结束后,及时开通服务器,恢复内部计算机网络工作。因雷击造成的损失,应及时进行核实、报损;如设备因雷暴、雷击影响,烧毁部件,应及时联系维保单位,进行备件更换,并将详细情况向部门领导汇报。