1.林业信息化系统运维和服务规范.docx
《1.林业信息化系统运维和服务规范.docx》由会员分享,可在线阅读,更多相关《1.林业信息化系统运维和服务规范.docx(24页珍藏版)》请在课桌文档上搜索。
1、ICS添加ICS号CCS添加CCS号DB43湖南省地方标准DB 43/T XXXX-XXXX林业信息化系统运维和服务规范Hunan Province forestry information system operation and peacekeepingservice specification(征求意见稿)20XX-XX-XX 发布20XX-XX-XX 实施 湖南省市场监督管理局目次目录前言II1范围32规范性引用文件33术语和定义34运维服务支撑规范35运维服务流程规范46机房运维管理规范15附录17本标准依据林业信息化标准化指南,结合湖南省林业信息化系统运维和服务实际需求制定。本文件
2、规定了湖南省林业信息化系统运维和服务流程,包括服务内容、服务一般要求、服务方式、 应急管理、问题管理、变更管理、配置管理、发布管理、服务级别管理、能力和可用性管理、持续性管 理、知识管理,以及运维服务支撑和运维保障的标准化内容。本标准主要适用于湖南省林业信息化系统运维和服务的规范性操作及各类组织。本标准由湖南省林业局提出。本标准由湖南省林业局归口。本标准起草单位:湖南省林业局、湖南省农林工业勘察设计研究总院、航天宏图信息技术股份有限 公司。本标准主要起草人:徐海文、汪丽、谢玉成、王宇翔、范磊、李丹彤、文兆能、贾大鹏。林业信息化系统运维和服务规范1范围本文件规定了湖南省林业信息化系统运维和服务流
3、程,包括服务内容、服务一般要求、服务方式、应 急管理、问题管理、变更管理、配置管理、发布管理、服务级别管理、能力和可用性管理、持续性管理、 知识管理,以及运维服务支撑和运维保障的标准化内容。本文件适用于湖南省林业信息化系统运维和服务的规范性操作及各类组织。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。GB/T24405.12009信息技术服务管理第1部分:规范GBZT 28827.32012信息技术服务运行维护GB17859计算机信息系统安全保护等级划分准3术语和定义
4、3.1 运维服务采用信息技术手段及方法,根据需方(指湖南林业信息化管理部门)提出的服务级别要求,对其所使 用的信息系统运行环境、业务系统等提供的综合服务。3.2 应急响应组织为预防、监控、处置和管理应急事件所采取的措施和活动。3.3 应急事件导致或即将导致运行维护服务对象运行中断、运行质量降低的故隙。3.4 运维团队运维项目日常运维涉及的服务台、一线、二线运维人员。4运维服务支撑规范运维服务支撑以面向使用机构提供运维服务为主旨,对运维服务的服务内容和服务方式进行规定,对 林业信息化平台的资源监控、资源优化、资源配置和安全保障等日常运行服务进行要求,确保为用户提供 安全可靠的主动运行保障服务。4
5、.1 服务内容1)信息资产运维:包括掌握平台运行所需软件资源信息和相关配置信息等;2)网络系统运维:包括设备基础信息性能监测、网络带宽及实时流量监测及网络链路状态监测等;3)硬件设备运维:包括主机(集群)运行情况、存储设备监控与报警监测、设备运行状况及故障排查及 处理、设备管理日常维护。4)软件系统运维:包括对平常基础环境、功能模块、数据库、运用系统、安全系统的安装部署及调试 等。4.2 服务一般要求1)服务的分级,由高到低,分为一到四级服务,分别包括2小时恢复、4小时恢复、8小时恢复、24小 时恢复系统正常运行。2)建立信息资产台账,对信息新增、维护、转运、报废情况进行统计,并持续性进行更新
6、管理。3)建立审批机制,对程序进行变更、版本升级、参数调整、硬件设备调整等工作时,需对林业部门相 关主管单位进行报备审批。4)进行系统漏洞扫描,不定时对系统进行扫描,关闭可疑端口与服务,顶扫查看系统日志,对可能性 攻击进行排查并对系统磁盘及内存进行排查防止由于内存问题导致系统怠机或崩溃。5)人员管理,指定平台管理员及数据库管理员,对平台的安装、部署、运行、管理、维护和安全负责, 并要求相关平台负责人对平台数据定时进行备份与恢复。严格要求按照岗位要求刷选平台负责人,系 统运维服务公司需有完善的人才培养机制及相关运维管理规范说明书。6)软件进行备份、升级、或新系统发布,实时人员需严格按照平台运维操
7、作手册执行,详细记录相关 过程,包括原始信息状态、目标结果状态,并形成操作日志。7)机房监控,维护人员需对机房硬软件日常进行监控,包括硬件网络、主机资源、存储资源等,软件 包括运用系统运行日志、信息系统运行情况等,日常安全包括防火、空调温湿度、漏水告警、电流电 压等。8)数据安全及数据完整性保证,保证林业相关系统数据安全,服务元数据填写正常及完整;运维人员 对相关数据进行备份处理,如:热备(不具备热备条件的必须一周进行一次备份),每年至少对数据 进行一次灾备。4.3 服务方式为了保证项目所有软硬件设备的正常运行,服务方式应包括以下几种:1)服务台一一提供技术咨询、服务请求受理、任务分派、意见受
8、理、快速通道、服务查询等服务。2)现场服务一一为终端用户提供现场技术维护服务。3)远程支持服务为现场未能解决的问题提供技术支持、远程或者现场二线技术人员维护服务。4)服务报告一一向服务使用机构提供运行服务报告,包括例行服务报告、响应服务报告、优化服务 报告和评估服务报告四类报告。5运维服务流程规范湖南省林业信息化系统运维和服务标准规范参考ITIL最佳实践,基于湖南省林业局自身信息化运维服 务特点,并遵循ISO/IEC 20000-1:2005、ISO/IEC27001: 2005以及国内相关的信息安全技术标准,实现IT 服务管理的标准化管理。通过流程的有效应用改善服务,监控和提高服务质量,采用
9、严格的运维服务管理 体系保护用户的各项权益。流程是指按照一个既定的目标组织起来的一组逻辑上相关的活动。一个流程是将输入转化为输出的一 组活动。首先要定义流程的目标,即通过流程活动所要达成的结果。流程要指定负责人,对流程的结果负 责。衡量结果或衡量阶段性结果的是一系列关键绩效指标,用以衡量结果与目标的吻合。同时,在设计流 程时也要考虑到对流程的支持,如相应的资源、参与的其他角色。5.1 应急管理5.1.1 目的规范运维故障应急预案的策划、管理和推进,降低由于运维故障处置不力而产生的风险,提高运维故 隙应对处置能力和效率,保证和提升运维服务质量,提升针对自然灾害、任务破坏或不可预警等突发事故 的即
10、时响应。5.1.2 处理要求1)建立应急小组建立应急响应领导小组,结合林业信息相关系统业务领域常见的时间,指定应急响应处理预案,配置 相关运维保证人员或资源,开展日常培训及演练。应急组织分为应急响应领导小组、项目经理和运维团队 三个层次,如图1所示。图I应急管理组织架构2)应急响应预案处理应急响应预案处理,包括应对林业相关信息平台常见的危险状况及必须处置方式,明确有关人员在紧 急情况下的职责。3)建立监测、预警制度主要包括应急事情发生及发现时间和位置、时间级别、状态描述、影响访问和程度、初步原因分析、 采用的专线应对预案(处理措施)、处理结果等。对相关结果、记录及报告即时进行整理与归档。5.1
11、.3 流程1)事件发现通过日常的巡检巡查、机房传感器短信报警及声光报警、停电通知、灾害预报、系统监控、用户上报等手段,及时发现异常运行事件,进行有效预警。2)应急决策根据所发现应急事件类型和对应的应急预案,进行应急指挥决策。再必要时做出断网断电,人力动员, 上报上级或报警出来等决策,并形成相应的书面记录。应急事件处理过程中,按照如下表1规则开展故障指挥:表1故障指挥故障处理时间指挥者一级小于15分钟维护方公司领导二级小于10分钟项目经理二级10-20分钟项目经理二级30分钟内项目经理三级小于20分钟项目经理三级20-30分钟运维主管三级40分钟内运维主管应急事件处理过程中,按照如下表2规则进行
12、故障信息通报:表2故障信息通报故障类别处理时间通报对象运维方林业局一级小于20分钟维护方公司领导林业部门领导二级小于30分钟项目经理林业部门领导二级30-40分钟项目经理林业部门领导二级1小时内项目经理林业部门领导三级小于40分钟项目经理林业部门领导三级40-60分钟内运维主管林业部门领导三级2小时内运维主管林业部门领导3)应急处置根据应急决策内容和紧急程度、重要程度、服务时段,影响程度等方面相应处理优先级。安装实现应 急预案采用必要手段,排查与诊断事故,从而使得系统恢复正常运行。4)总结改进应急事件处理结束后,应急响应组织应对应急工作进行总结和提出改进要求,督促相关责任部门和人员进行整改。每
13、年至少一次,组织应急预案评估,确认应急预案的有效性,针对发现的问题,提出纠正措 施。5.2 问题管理5.2.1 目的运维机构应建立问题管理流程,在用户提出服务请求时通过合理的方式和流程解决客户问题, 提升服务效率。5.2.2 范围问题管理应包括:1)监测、记录、识别、分析系统出现的或潜在的问题,建立问题处理流程,查找引起问题的原因,降 低系统运行的风险;2)根据问题的性质分类,确定问题的影响和程度,按照优先级定义排队,制定问题解决方案;3)跟踪问题处理流程,及时改进和完善;4)在运维服务管理过程中,对历史故障的现象、原因、处理方法等经验进行收集和分析,形成问题知 识库。5.2.3 流程问题管理
14、分为两个流程:问题控制和错误控制:1)问题控制流程(1)作业流程问题的确定和记录题跟和制问的踪控问题的分类错误控制图1问题管理图流程活动问题控制负责找出问题并调查其根源,其目标是通过确定问题根源并采取应急措施来把问题转化成已 知错误。问题控制流程有以下活动:确认和记录:要确认问题并确定这个问题需要解决,这除了技术上的,有时也要考虑财务上的原因。问题的分类:如同故障类似,问题也要相应的分级,作为优先安排或投入资源处理的依据。调查和诊断:发现问题的真正根源,将问题变成已知错误。为彻底解决问题奠定基础。同时要找到临 时解决问题的方法,为以后出现同类故障时提供一个快速恢更的手段。同时要将这个已知错误与
15、问题数据 库中的信息对比、更新。RFC及问题解决:当将问题转变成已知错误后,在解决问题时如遇到提出变更,就要提出变更申请, 通过变更流程解决问题。2)错误控制(1)作业流程问趋捽制错误的确定利记求图2错误控制流程图(2)作业流程说明错误控制指监控和管理已知错误直到其尽可能地得到适当的处理。错误控制需要向变更管理提交变更 请求(RFC),并在实施变更后对变更进行实施后评审以评估其效果。错误控制对已知错误从被确认到被 解决的整个生命周期进行监控。错误控制流程有以下活动:错误确认和记录:找到问题的根源和与此问题相关联的配置项,以及处理它的应急措施,就可将其状 态转变为“已知错误,或者与某个现有的已知
16、错误相关联。然后就可以开始进行错误控制。错误评估:评估解决问题和已知错误时所需资源和解决方案。解决问题或已知错误的所有活动都应该 加以记录以便对其进行监控和确定它们不同时期的状态。记录解决方案:根据服务级别协议、处理事件和己知错误所需成本和所可能获得的收益、变更请求的 影响度和紧急度等因素来比较不同的解决方案。解决问题(或已知错误)的所有活动都应该加以记录以便 对其进行监控和确定它们不同时期的状态。终止错误和相关问题:用于解决问题、已知错误及相关事件的变更一旦实施后,在终止有关记录工作 之前必须对变更进行实施后评审,如果变更成功实施,那么对所有问题和已知错误及相关事件的记录工作 都可以终止了。
17、跟踪与监控:在问题和已知错误的整个生命周期内对他们的发展情况进行监控。这些工作在问题控制 和错误控制中都要实施。5.3 变更管理5.3.1 目的变更管理的目的是确保标准方法和过程可以得到使用,通过对服务最小的干预来提高服务质量。变更 管理应记录并对所有要求的变更进行分类,应评估变更请求的可行性、合理性、工作量、影响范围和效益。5.3.2 范围变更管理将建立一个完整的变更管理体系,从而实现:1)管理和引导用户变更需求;2)通过对所有变更的正确评估,可以维护生产/运行环境的完整性;3)变更和变更实施得到正确记录,并提供审核统计;4)减少或消除由于变更实施准备不当等原因出现的对IT环境的破坏;5)提
18、供了一致性的变更实施质量;6)提高资源使用率(如,未得到正确控制和授权的变更需要更多的后续资源);7)确保实施的变更不会超出预定的系统利用限值。5.3.3 流程1)作业流程图3变更管理图她准/拒绝A功运计划2)流程活动记录:所有的变更请求必须被完整地记录下来,变更请求设计运维服务中的每个流程,变更请求应包 含以下信息:(1)变更请求标识码。(2)相关联的问题/已知错误码。(3)相关配置项的描述和验证。(4)包括调整和商业利益的变更的原因。(5)要被变更的配置项当前的和新的版本。(6)提交该变更请求的人的姓名,地点和电话号码。(7)提交建议的时间。(8)估计的资源和时间计划。审查:对变更请求做出
19、初步评估以检查是否有变更请求不清楚、不合理、不可行或者不必要。如果拒 绝这项请求,需要说明原因;并给予提交请求的人解释的机会。归类:应该按类别和优先级对变更请求进行分类。优先级显示一项变更请求相对于其他变更请求的重 要程度。来源于时间紧急度和变更的业务需求。规划和批准:变更必须被规划和批准,规划变更是应考虑变更窗口、人员、资源的可用性、成本和对 服务的影响;确保要求的资源可用;并确保用户的参入,必要时提交林业局相关部门负责人。变更的批准 应考虑财务批准、技术批准和林业部门相关领导批准。变更应该有相应的变更策略。协调:被批准的变更应告知与此变更相关的人员,包括客户人员。回撤计划、变更实施和变更的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 林业 信息化 系统 维和 服务 规范

链接地址:https://www.desk33.com/p-173290.html