欢迎来到课桌文档! | 帮助中心 课桌文档-建筑工程资料库
课桌文档
全部分类
  • 党建之窗>
  • 感悟体会>
  • 百家争鸣>
  • 教育整顿>
  • 文笔提升>
  • 热门分类>
  • 计划总结>
  • 致辞演讲>
  • 在线阅读>
  • ImageVerifierCode 换一换
    首页 课桌文档 > 资源分类 > DOCX文档下载  

    XX省公安厅智慧运维管理系统建设内容.docx

    • 资源ID:780800       资源大小:131.12KB        全文页数:39页
    • 资源格式: DOCX        下载积分:5金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要5金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    XX省公安厅智慧运维管理系统建设内容.docx

    XX省公安厅智慧运维管理系统建设内容一、需求分析(一)业务功能、业务流程和业务量分析业务功能分析本次项目的功能包括以下内容:()统一资源配置建立分级分类管理的统一资源配置库;支持资源自动发现、批量导入、第三方接入;支持资源模型自定义和表单自定义;可通过自动化或人工方式监理资源关联关系;支持资源历史版本记录。从全局角度实现图形化的配置项、配置关系展现,真实地反映业务系统、主机(云服务器)、存储、数据库、中间件等资源的关联关系。同时,配置管理不仅需要实现对IT软硬件资源的管控,还可以从业务角度出发,建立面向业务的架构图,直观地描述系统边界、内部结构和组件依赖关系,帮助运维团队快速排查故障根源。()集中监控管理具备云环境及传统架构下大规模实时监控和数据采集能力,实现现有全部软硬件、基础设施等运维资源全覆盖;支持通用协议、AgCnt、第三方接入、日志分析等多种监控方式;采用易扩展、可视化方式集中展现运维资源监控结果;支持监控策略、监控参数自定义配置和分级分类管理。信息包括实时或历史的性能信息、状态信息、事件信息、告警信息、报表信息等,实现各类监控数据的准确、灵活可视化呈现。()统一告警管理从资源和应用视角实时展现告警状态,提供清晰的、集中的告警事件管理,基于资源配置的关联关系和规则配置,提供场景化告警关联和交互分析能力;支持告警策略和参数配置,将各种设备或业务系统产生的事件作为原始事件,按照预定义的事件规则,经过过滤、分类、分级、转换等处理环节,形成有效的预警或故障告警信息;支持短信、X政钉等多种告警推送方式,按预定的方式通知管理人员或自动响应;支持第三方告警接入;对生成的告警提供升级、自动或手工消除等管理手段。监控系统能够将告警传递到告警视图、拓扑图、业务影响度视图中。()智能故障分析实现多源数据采集、高效实时分析能力,支持监控告警的去重、降噪、静默;利用大数据量的采集、预处理、存储、分析工具,采用智能算法、关联分析等方式自动进行故障根因分析,支持可视化告警追踪和影响分析,提供故障原因推荐和处置建议;自动化生成、关联运维任务工单。()运维流程管理具备流程配置引擎,支持自定义运维流程;具备可视化流程业务规则配置功能,支持人工/自动节点混排;自动化生成、关联运维任务工单;支持运维流程与资源配置项关联。(§)自动化运维具备自动化巡检和巡检报告发布功能;支持自动化策略配置和低代码脚本编制功能,内置常用脚本库;支持监控告警故障联动。()运维管理信息化具备运维项目全流程信息化管理功能,并支持资源配置、监控告警关联;具备运维人员基础信息、工作成果、考勤考核等管理功能;具备运维值班编排、展现和监控告警、运维流程关联功能;提供运维信息发布展示功能;提供运维知识库并支持故障告警关联。()数字化运营提供监控、配置、流程等各类数据的可视化呈现能力,通过可视化工具快速定义各类视图,面向不同层次管理人员、不同场景、不同业务系统,设计、定义层次化、多维度的展现视图;具备可视化应用拓扑和资源展示功能;具备可视化机房基础设施和设备管理功能;具备运维项目绩效可视化展现功能;支持基于监控告警、资源数据的可定制专题数字大屏配置;丰富可配置的统计分析报表。业务流程分析本次项目的项目的核心流程包含,监控告警运作流程、事件/故障运作流程、数字化运营运作流程。()监控告警运作流程监控告警的流程分为监控采集、资源配置管理、监控告警、消息存储、告警通知推送等环节。监控采集:通过基础设施监控、前端监控、应用监控、业务监控等监控能力获取数据,并向相应的网关进行监控消息的投递,监控采集是整个告警运作的神经末梢。资源配置管理:主用于收一个集群或应用系统中所有监控日志数据并对数据行清洗、结构化处理,结合CMDB建立关系归属,完成数据归集后进入监控告警引擎。监控告警引擎:整个监控系统的核心,负责监控任务执行、处理监控数据并将处理好的结果数据以监控指标的形式进行消息存储。告警通知:告警的监控指标会经由故障/事件处理流程做告警判断并生成告警事件,对相同类型的告警事件进行聚合处理,然后根据告警规则将告警消息推送到指定的用户。Web页面:监控系统与用户的交互界面为用户提供监控配置和展示界面,承载告警监控工作台的职能。()事件/故障运作流程事件/故障的运作包含故障发现、故障处理、故障恢复、故障复盘四个阶段,由业务部门、运维部门、服务方三类角色参与协同。故障发现:监控或其他渠道接收到故障申报时,根据结构化故障等级定义模块配合指标计算,形成告警通知运维支持人员与应用责任民警。故障处理:当事件响应升级达到故障响应级别标准时,通过事件自动化通告、人工故障通告等方式发起事件工单,可以根据已有的应急预案,匹配出相应的处置模板及流程,并进行恢复。故障恢复:由开发商发起环节恢复确认,系统分析各环节均完成恢复后由应急响应人员确认应用系统的最终恢复状态。确定应用完成恢复后,由平台下发恢复通知给相关部门。故障/事件复盘:故障/事件处理全流程由系统进行记录、建档存留。并按需组织专家进行复盘分析,必要时通过问题或变更等流程对发现的问题和产生的变更进行分析记录。()数字化运营运作流程数字化运营来源支持对接多种渠道多业务模块的运行数据、管理指标数据,通过离线计算计算将数据进行分析计算,依托统计分析报表工具、低代码大屏工具将指标进行聚焦,最终形成各类运营分析报告。业务量分析实现对政法云、萧山云资源及厅信息中心服务器、网络设备、虚拟化服务器、软件系统、机房动环消控设备及云平台资源的设备信息、运行状态、性能状态、业务关系等进行实时检测采集、分析、告警等功能。与X警智治等综合系统关联“X警智治”平台是以公安部“六统一”标准为原则,遵循数字使用三大理念,全量整合各业务警种的系统、数据、服务、算法等资源,实现纵向、横向及各专项业务的一体化,建成功能贯通、系统融合、综合集成、全省统一的中枢平台。本次项目建设的智慧运维平台是“X警智治”平台四横四纵体系中的运维体系部分,用以支撑“X警智治”内能力及基于“X警智治”体系的智慧应用的运维保障体系。(二)信息量传输量和存储量分析与预测本系统主要传输和存储数据为应用系统运行监测、告警数据及相关分析结果数据、日志采集数据等,预计存储应用元数据及业务数据2.2T,日志分析数据1T,历史数据存储及综合使用率计算分析数据5T。(三)系统功能和性能分析和网络安全需求分析系统功能系统功能体系,容包含:用户管理、授权管理、角色管理、角色组管理、部门管理、口志管理。()用户管理对接X警智治用户体系进行建设。()授权管理结合X警智治体系从组织、资源、应用等维度对用户操作权限进行授权,各级管理员只负责管理自己直属管理员以及其管辖范围内的用户权限,做到管理员不越级、不跨级管理,提高数据安全性。提供授权管理能力,包括新增、修改、删除和查询展示授权列表能力。()日志管理提供日志管理能力,包括应用系统日志查看、操作审计日志查询。性能分析1.用户数:支持平台用户数500人以上,并支持同时在线100人;2 .并发查询:大于100个,平均响应时间1-3秒;3 .平台查询服务接口响应时间:不超过10秒。4 .平台要求7X24小时不间断运行,年故障时间比小于95%o5 .告警监控收敛率大于80%;6 .知识库文档数量5000,钉群服务机器人在线率90%;项目网络安全情况分析本项目建设过程中,主要涉及公安网,不涉及视频专网和互联网等网络,为了保障系统的安全,数据的流转需采取相应的安全措施。各系统对于安全要求较高,根据公安部信息安全等级保护管理办法(公通字200743号)本项目信息系统受到破坏后,会对公民、法人和其他组织的合法权益产生特别严重损害,或者对社会秩序和公共利益造成严重损害,或者对国家安全造成损害,建议方案总体考虑按照等级保护第三级的相关要求进行建设。(四)数据结构与信息资源共享需求分析数据结构本系统数据主要包括运维监控数据、告警数据、资源库数据、运维项目数据、运维人员数据等。1.运维监控数据。包括监控点位配置、监控策略、运行状态等;2 .告警数据。主要为标准化的告警结果数据,包括主动监测告警和第三方推送告警;3 .资源库数据。包含云上及云下所有运维对象等资源的分级分类可灵活扩展的配置管理数据库。4 .运维项目数据。包括项目档案、项目流程、项目文档等数据;5 .人员数据。包括人员档案、进出管理、考勤管理工作记录等数据。(五)信息资源共享需求1.产生数据。本项目产生的运维监测告警、资源库等数据可共享给相关业务警种用以进一步分析系统故障原因、优化完善系统功能。6 .数据需求。(1)地市数据归集。级联市级运维管理平台,实现全省运维数据的一站式管理和分析。(2)应用效能数据归集。通过对接X警智治系统,调取警综平台、资源综合服务平台等系统平台数据获取应用系统用户活跃度、数据贡献度等数据,强化应用系统效能评测能力。二、建设需求(一)总体思路本系统需按照“统一标准,智慧运维”的原则,建设具备规范有序的系统及应用运行保证能力、优质高效的服务提供能力、精细灵敏的态势掌控能力、智能高效的应用支撑能力。(二)技术路线(1)应用监控技术应用监控技术,主要监控应用信息,例如JVM的GC,线程,应用异常、Error错误量、中间件指标、应用的集群热力图、应用的变更历史、应用的黄金指标信息等。其通过对MCtric、Trace>Log三个可观测维度数据的清洗整合。这三类数据的特点、转化方式以及适用场景大致如下:1.ogs:记录事/物变化的载体,对于常见的访问日志、交易日志、内核日志等文本型。日志在调用链场景结构化后其实可以转变为Trace,在进行聚合、降采样操作后会变成Metrics0Metrics:是聚合后的数值,相对比较离散,一般有name、IabeIs、time、values组成,MetriCS数据量一般很小,相对成本更低,查询的速度比较快。Traces:是最标准的调用日志,除了定义了调用的父子关系外(一般通过TraceID>SpanIDParentSpanID),一般还会定义操作的服务、方法、属性、状态、耗时等详细信息,通过Trace能够代替一部分Logs的功能,通过Trace的聚合也能得到每个服务、方法的Metrics指标。通过将三个指标进行组合,以满足各类监控、告警、分析、问题排查等需求的技术成为应用监控技术。应用监控技术可帮助运维监控系统形成对业务完整链路每个关键节点的可视化监测能力,从用户体验直到代码性能,逐级下钻、引导分析,帮助快速发现问题、定位问题,缩短MTTR0(2)链路跟踪技术链路跟踪技术即跟踪请求在分布式系统中的流转路径与状态。而单链路诊断,顾名思义,就是基于单次请求关联的调用轨迹数据,定位问题原因,属于链路追踪的核心功能之一。技术实现链路上包括:核心接口埋点。对接口进行插桩,在执行前、后添加埋点,是为了记录调用经过接口时的链路唯一标识(TraceId),调用层级标识(SpanId或RPCId)、时间、状态、IP、接名称等信息;然后再通过TraceId和RPCId(或SpanId)将一次请求的所有接口信息关联在一起,并以调用链的形式进行可视化展现。自动关联数据。大部分场景下,只依赖接口埋点数据,不足以定位根因。此时,我们还需要记录DB执行的SQL,接口调用的入参与出参信息(比如用户ID、事项ID、错误码等)以及调用过程中抛出的异常堆栈,来进一步缩小问题范围,提高排查效率。主动关联数据。接口调用与业务行为并不是完全对等的,比如一次购买行为由于条件不满足而执行失败,这在业务语义上无疑是失败的,但是在系统调用层面却是成功的。因此,为了更有效地诊断业务问题,可以将业务数据与链路数据进行主动关联,比如在业务日志中记录当次调用的TraceId与RpcId,从而实现业务轨迹与调用链路的串联,这就全息业务排查。链路跟踪技术相较于探针采集技术具有更强的业务属性。而与日志分析技术相比,日志分析技术具有通过日志文件筛查关键字定位出具体问题,链路跟踪技术通过traceld.或者用户id、时间段来搜索,在业务链路上更加的清晰,可实现请求链路追踪、故障快速定位、可视化、依赖优化等功能,具有更强的开发线性逻辑。7 3)JavaAgent探针采集技术java探针agent技术构建一个独立于应用程序的代理程序(即为Agent)。JavaAgent是一个不能独立运行jar包,它通过依附于目标程序的JVM进程,进行工作。启动时只需要在目标程序的启动参数中添加-javaagent参数添加ClassFileTransformer字节码转换器,相当于在main方法前加了一个拦截器。实现在“加载JaVa字节码之前拦截并对字节码进行修改”、“在Jvm运行期间修改已经加载的字节码:在业务场景中其定位是在对代码的无侵入性添加修改,通过增加前后监听器采集代码运行时性能表现以及业务数据。常用来协助监测、运行甚至替换其他JVM上的程序。这一技术在监控系统、链路追踪系统、性能诊断工具上都有着大量的运用。(4)日志数据分析技术日志分析技术是为应用所产生的Log、Metric、TraCe等数据提供数据采集、加工、查询与分析、可视化、告警、消费与投递等功能。日志技术通过LOgtai1、SDK、协议等多种方式采集数据。支持数据实时查询与分析,具备查询运算符、机器学习函数、SQL函数能力。支持可视化展示查询与分析结果,并支持基于统计图表自定义仪表盘。并支持数据实时消费,适用于StOnn消费、FlUnle消费、FIink消费等场景;支持数据实时投递,适用于将数据投递至0SS、时序数据库等数据载体内。探针技术倾向于数据的采集,日志技术倾向于汇聚日志后的分析能力,相较探针技术具有无入侵性、数据覆盖范围广,源头多,采集大多无需改变源端,影响较小的特点。日志分析技术中若人员标记链路标识,可通过特定方法串联链路信息,在区日志中提取分析,但探针侧重跟随业务系统调用的进行实时更新业务调用拓扑并关联相关性能数据,两者使用不同的运维数据对应用系统进行监控和分析,故障分析模型、监控方式虽不同,但工作目的却是相同,都可以对运维监控中工程数据(如基础资源/故障率)、业务数据(业务指标/trace)实现监控与预警。(5)监控数据存储技术(时序数据库)监控数据存储技术普遍选用时序数据库作为载体。一个典型的时序数据由两个维度来表示,一个维度表示时间轴,随着时间的不断流入,数据会不断地追加。另外一个维度是时间线,由指标和数据源组成,数据源就是由一系列的标签标示的唯一数据采集点。例如指标cpu.usage的数据来自于机房,应用,实例等维度组合成的采集点。在传统关系型数据库上加上时间戳作为监控数据存储载体的方式存在展现的纬度有限、无法解决时序模型的热点存储问题、不支持倒排索引等问题。而专业的时序数据库内数据结构由时间戳(time)、标签(tags)、数据(fields)三部分组成,数据存储采用LSMtree替换Btree的方式,时序数据写入和更新时首先写入位于内存里的数据结构,为了避免数据丢失也会先写到WAL文件中,内存里的数据结构会定时或者达到固定大小会刷到磁盘,这些磁盘上的文件不会被修改,随着磁盘上积累的文件越来越多,会定时的进行合并操作,消除冗余数据,减少文件数量。通过这种存储机制提升数据的存储效率。基于时序数据库建设的存储引擎,能够用一套引擎存储各类可观测的数据、支持包括写入、查询、分析等功能。LogSTraces关键词查询、Tag过滤TrdCelD查询、Tag过滤查询命中少数据离散Metrics单一指标、指标聚合一范围查询数据聚合搜索引擎倒排索引高吞吐写入一超大数据查询时序引擎LSMTree 时间特性(6)监控数据分析技术(指标聚合、离线分析)监控数据的分析具备很强的业务属性与广泛的技术路线选择,难用一种语法/语言去实现所有的功能并且具有非常好的便捷性,因此数据分析技术选择去兼容关键词查询、在线SQL的查询、离线数据聚合分析技术。在线数据分析:通过时序数据的能力基于SQL进行数据分析,在SQL的基础上,实现了可以连接关键词查询、PromQL,外部的DB、ML模型的能力,让SQL成为顶层分析语言,实现数据的融合分析能力。流式数据分析:通过BIink/Flink流式分析引擎、流式SQL自动编排的能力,将实时产生的监控数据进行流式的分析,实时的将异常结果向应用进行推送,实现高时效性监控分析能力。离线数据分析:通过MaXCOmPUte离线分析引擎的能力、数据分析模型算法的能力,将系统所产生的监控、日志、业务数据进行聚合分析,形成业务波动基线、使用率分析、业务大屏聚合指标等能力。(三)建设目标(1)总体目标建成一套集资源管理、性能监测、智能分析、运维流程、数字化运营为一体的全覆盖、自动化、智能化智慧运维管理系统,实现运维资源、项目和人员的一体化管理,提升故障发现和处置能力,降低故障损失和运维管理成本。(2)项目支持的用户、业务内容和数据规模目标本项目主要用户为全省应用系统运维责任民警、辅警和技术服务人员;业务内容包括应用系统运行情况监测、告警、任务流转和可视化展现等;数据规模估算为13T。(3)项目在改进服务、提高效率、加强监管等方面的预期量化绩效目标提升公安各警种应用系统运行稳定性,提高故障处置效率,建立运维事件态势感知和应用效能评测能力,促进公安信息化服务高效开展。(4)项目在业务流程规范、业务机制规范及信息资源建设管理方面的目标进一步完善公安信息化运维管理体系,规范运维流程,提升运维效能。(四)建设内容项目围绕X警智治需求下,应用系统的运营运维体系进行建设,同时兼顾自动化工具、运维信息化管理等维度,强化现有应用的管理、运维、运营、安全能力。包括以下几项主要内容:1、统一资源配置建立支持自动化采集和可视化维护的配置管理数据库,实现各类运维资源配置信息的集中采控和统一纳管。2、集中监控管理具备云环境及传统架构下大规模实时监控和数据采集能力,实现对现有运维资源监控全覆盖。3、统一告警管理基于资源关联关系和规则配置,提供场景化、一站式的告警关联和交互分析能力,有效缩短故障发现和处置时间。4、智能故障分析采用智能基线、关联分析等方式有效提升告警精准度,提供故障跟因推荐和修复建议,提升故障分析和处置能力。5、运维流程管理采用支持流程定制、灵活部局的可视化流程编辑引擎,通过流程再造有效提升运维处置效能。6、自动化运维通过自动化巡检和自动化故障处置等方式进一步释放运维资源,降低运维成本。7、运维管理信息化实现运维项目、人员的信息化管理,有效提升维保项目全生命周期信息化管理能力。8、数字化运营提供运维数据数字化展现和智能化调度能力,通过运维指标指数体系动态评估信息系统应用效能,有效提升应用系统运维运营水平。(五)总体框架基础设施层IDC网络安全保障体系 组织保障体系 标准规范体系 运堆保障体系业务应用层应用支撑层外部同步数据 警综平台教殿I遁层物理设备云环境运营管理数据项目按照四横四纵的体系进行设计总体架构可分为基础设施层、数据资源层、应用支撑层、业务应用层四横,运维保障体系、标准规范体系、组织保障体系、安全保障体系四纵。基础设施层:承载监控数据获取的功能,主要包括云环境、物理设备、网络等基础环境的感知及基于锚点、日志的应用环境感知,为监控、预警、联动等提供基础数据支撑。数据资源层:数据层承载本平台数据存储、融合的功能,主要包括CMDB数据、监控数据、运维流程数据、运维管理数据、外部数据等综合而成的分析型数仓及相关基础数据结合自身实例关联数据而形成的内部关系表。应用支撑层:支撑层承载引擎能力服务的职责,包括资源配置管理、监控告警引擎、告警推送引擎、监控管理等模块。为业务应用提供共性引擎能力。业务应用层:应用层为对用户的应用模块能力,主要包括运维流程管理、全链路监控、数字化运营、运维自动化功能等模块。本系统提供业务所使用的工作台将与X警智治体系进行结合,支持定制用户界面和功能模块,同时对外标准APl的服务接口。标准规范体系:系统建设过程中将归纳总结业务成果同时参考业内相关规范形成省级一体化运维规范,进一步加强全省一体化运维管理效能,健全上下联动、定期调度、快速响应、处置高效的一体化运维工作机制。运维保障体系:本系统在鉴权体系上与警综平台进行打通,资源关联数据向公安综合资源服务平台进行共享,采用标准应用运维体系同时作为X警智治的运维体系服务全省公安。安全保障体系:系统按照安全保护三级进行系统建设,安全体系与厅内既定标准进行打通。组织保障体系:组织树与公安厅组织树进行打通,同时由厅科信局、科研所共同保障应用的建设。一屏两端:本项目建设应用页面端建设,配套移动端轻应用复用X警智治能力。(六)业务系统建设需求(1)统一资源配置建立支持自动化采集和可视化维护的配置管理数据库,实现各类运维资源配置信息的集中采控和统一纳管。1、资源分级管理根据业务系统相关资源的层次结构进行模型的设计。配置模型从业务出发分为:业务层、系统层、设备层、网络层、环境层等层次。支持对不同的资源类型进行不同的建模,以便基于资源配置管理CMDB对每一个资源进行适配性管理,CMDB模型支持实例化数据和关系,基于此模型构建支持为多变的场景提供数据基础。2、资源分类管理配置管理库(CMDB)系统应当建立覆盖所有的IT资源的配置管理模型,易于理解和使用,并支持用户进行快速扩展,建立契合实际需求的配置模型。配置模型应当能够覆盖现有云上基础设施、云外的物理设备及应用软件及业务系统等软件设施,至少包括以下配置项类型:1)机房设施,包括:机柜、UPS、精密空调、配电柜、视频摄像头等;2)网络与安全设备,包括:防火墙、路由器、交换机、IDS/IPS、负载均衡设备、安全网关等;3)服务器,包括:云上虚拟服务器、云下物理服务器等;4)存储设备,包括:云上存储产品、云下设备;5)操作系统,包括:Windows、各类LinUX等操作系统;6)数据库,包括:云上MySq1、PostgreSqKPIOarDB、OceanBase>ADB>MongoDB,及云下DB2、Sybase>Informix、OracleCaSSanCIra等数据库;7)中间件,包括:云上MQ>EDAS>CSB及云下Weblogic、Websphere>MQ、pache>Nginx等;8)虚拟化,包括:云外VMWARE等虚拟化设施;9)应用软件,包括:云外FTP、LDAP、AD、EmailSerVer等;10)应用系统,与X警智治系统进行级联,导入应用系统相关信息。3、资源自动发现全网扫描:系统提供网络扫描工具。具备IP网段扫描能力,自动发现IP及设备。支持对接客户资产管理系统,打通资产数据,获取设备和资产清单。4、资源批量导入为了方便使用和维护,支持配置项信息的EXEeL格式导入和导出功能,可以根据管理需要,选定所需的配置项进行导出;同时也可以将编辑好的EXECL文件直接导入到系统中,实现配置信息的批量导入支持调用第三方APl接口的方式,完成资源数据自动发现和自动同步功能。5、自定义模型支持配置模型及类别的自定义,可以根据管理需要或数据模型的设计结果定义符合管理需要的配置模型、类别等,以实现模型的快速扩展和调整。模型管理会展示所有的模型分类和模型信息,模型分类支持新增、编辑和删除。支持模型自定义,支持字段分组,字段类型定制。模型支持新增、编辑和删除。通过新增模型增加用户自定义模型,支持多种类型字段。通过资源管理录入相关值并与应用进行关联。6、自定义表单支持配置项属性类型包括:文本、富文本、下挂菜单、单选、多选、整数、小数、图片、附件、时间日期、人员、引用、表格、加密数据等。支持配置类型属性与表单的可视化展示,采用所见即所得的可视化设计方式进行设计。7、配置项关联系统能够在Web页面上以图形化的形式直观展现所管理的各个配置项之间的关联关系,以应用系统为视角形成资源关联关系拓扑图,直观地查看到当某个环节出现问题时的影响范围。通过查看详情页可以看到关联Cl模型直接的关系。用户可以自定义Cl之间的关系,并提供APl接口,由用户进行自动化接入。系统支持手动逐一绑定和批量绑定的方式设置配置项间的关联关系,形成资源关系拓扑。系统支持自定义搭建模型间的层级和关联关系,支持用户设定从属、包含、运行等多种关联,形成资源间的关系结构,便于统一进行管理如人员管理资源、资源属于部门、项目包含应用等多种逻辑关系。8、配置项版本支持配置版本管理,能够按照时间轴的方式来查看配置数据的历史版本,帮助运维人员直观了解某个配置项的变更情况和版本信息,通过对配置属性、配置类型、配置关系的审计功能,来确保配置版本的精准性。提供资源目录清单页面,可以汇总云上、云下资产,按在线、离线或维保状态分类统计和展示各种资源的实例数量。提供按自定义条件如资源名称、上架时间、资源责任人等多种维度进行资源搜索功能,方便快速完成资源查找和定位。系统记录配置项的新增、编辑、上下线等敏感操作日志,生成审计记录,提供资源生命周期管理功能。操作审计日志不可删除,每条日志固化存储在CMDB本地,满足长期追溯需求。以防因人员操作不当导致模型不可用时,可通过审计日志排查修改记录,完成配置回滚。9、第三方配置项接入支持第三方配置项接入,数据来源支持EXCel数据导入和第三方接口集成,支持多个第三方系统数据接入。CMDB对所有接入的数据按照统一标准进行数据合法检查、数据标准化、数据多来源调和、数据变更审核、数据变更时有变更动态和变更通知。10、应用资源配置模块对接X警智治“一本账”模块,统一管理需运维的应用资源,支持将资源汇聚至应用层面,支持应用的创建、编辑、删除、管理,支持应用及业务的关联、关联,支持应用及资源的关联、管理。(2)集中监控管理具备云环境及传统架构下大规模实时监控和数据采集能力,实现对现有运维资源监控全覆盖。1、云上实例监控1)云服务器云服务器监控分为基础监控、操作系统监控和进程监控。2)云数据库监控维度包括但不限于:数据库服务可用性监控、数据库性能监控、数据库资源监控等。3)对象存储实现对对象存储基本运行状态、性能以及计量等方面的监控。实现对对象存储全生命周期的监控。4)云上网络资源实现对云上网络资源的监控,从业务全链路出发,对链路上的网络设备进行性能和稳定性的监控,保证业务链路畅通。5)大数据产品实现对云上大数据产品性能的监控,便于实时掌握大数据产品工作状态,留意性能、内存消耗、容量和产品整体健康状态,保证大数据产品稳定运行。2、应用监控系统可实现应用性能监控,支持主流的开发框架和中间件数据采集,将服务请求、错误和延迟等应用性能指标与业务、基础设施指标、日志数据无缝关联,形成对业务完整链路每个关键节点的可视化监测能力,从用户体验直到代码性能,逐级下钻、引导分析,帮助快速发现问题、定位问题,缩短故障修复时间。前端主要监控前端的性能指标,包括可用率和响应时间。可用率是指拨测点成功访问的服务站点的比率,响应时间是探测请求的总体耗时;能够实时获取监控目标的可用率、响应时间、告警及故障明细信息,从而快速发现和解决问题。后端支持从客户端、服务端、中间件、数据库等端到端对应用进行性能分析、分布式服务链路追踪、系统拓扑分析、应用拓扑分析、应用业务监控、服务异常溯源的应用性能分析。具备自动识别应用的服务、组件、代码及关键业务性能问题,并进行性能、故障根因分析,帮助运维人员进行快速定位解决应用性能瓶颈。1)页面访问速度监控:系统前端监控可测量多种页面性能指标,包括首次渲染时间、首屏时间、DOMReady时间、资源加载时间等。系统通过探针,实时采集用户访问前端各页面,页面加载和渲染时长,页面报错次数和报错类型等指标,具体指标如下:各页面的用户访问次数,按分钟统计;并形成当前服务各页面的访问热点排行。各页面的错误率和错误次数,按分钟统计;并形成当前服务各页面的错误率及错误数排行。各页面的访问性能黄金指标,按每个页面单独展示,展示指标如下:FPT时延TTL时延DOM渲染时延加载时延首包时延FMP时延页面的性能指标数据同样按时间跨度展示区间内的趋势走向,用户可切换展示的前端服务、服务下的各页面的详细性能监控数据。2) API请求监控:系统前端监控能提供应用中每个API的调用情况,包括调用成功率、返回信息、成功或失败的平均耗时等。3) JS错误监控:系统前端监控的JS错误诊断功能可展示JS错误的基本信息和分布情况。各页面的报错数分布。错误类型包含:Ajaxerror/Resourceerror/Jserror/Unknownerror各页面的耗时指标,形成聚合视角的耗时趋势图,直观展示页面耗时影响最大的指标类型:Redirect:重定向平均耗时Dns:DNS查询耗时Tcp:TCP连接耗时TTFB:请求响应耗时Trans:内容传输耗时DOM:DOM解析耗时FPT:首次渲染时间(白屏时间)DOMReady:HTML加载完成时间Firstbyte:首包时间1.oad:页面完全加载时间TTI:首次可交互时间Res:资源加载耗时SSL:安全连接耗时FMP:首次有效绘制耗时TTL:包存活时间4)前后端链路追踪:系统前后端链路追踪功能可将APl请求从前端发出到后端调用的链路串联起来,真实还原代码执行的完整现场。5)后端服务能力监控:系统可实现对某一云产品实例服务能力的监控,包括性能指数、平均响应时长、请求成功率、吞吐量等。系统支持按服务/实例/端点为最小粒度,采集请求、响应、线程及时延等多种指标数据。并支持逐级向上聚合,从服务维度、实例维度和端点维度分别展示各维度核心指标数据。6) JVM监控:系统基于标准化的探针部署,可实现对JVM的监控,以便云实例提供更好的服务,监控包括JVMCPU使用率、JVM内存使用率、JVMGC时长、JvMGC次数、JVM线程数。JVMCPU使用率:针对实例虚拟机的CPU使用率每分钟波动曲线。JVM内存使用率:针对实例虚拟机的内存使用率每分钟波动曲线。JVMGC时长:针对实例虚拟机每分钟yonggc和。Idgc时长。JVMGC次数:针对实例虚拟机的younggc和。Idgc次数。JVM线程数:针对实例虚拟机的存活线程数、CIaemOn线程数以及活跃峰值线程数。JvM线程状态:针对实例虚拟机的运行线程、休眠线程、指定休眠时间线程以及排队线程数统计。JVM类:针对实例虚拟机的当前下载、未完成下载以及历史所有下载统计。7)端点监控:系统基于业务链路的分析,可实现对端点的监控,包括端点负载、响应慢的端点、请求成功率、平均响应时长、响应延迟、请求成功率趋势。详细指标如下:端点负载:当前服务的所有端点每分钟请求量。响应时长:当前各端点的平均响应时长,并形成响应时长最长的端点排行。请求成功率:每个端点的请求成功率,并形成成功率最低的端点排行。端点负载趋势:每个端点的每分钟请求量趋势。平均响应时长趋势:每个实例的每分钟响应时长趋势,单位ms。响应延迟:每个端点的响应延迟,单位ms。请求成功率趋势:每个端点的请求成功率。8)分布式链路跟踪:系统能够分析分布式系统的每一次系统调用、消息发送和数据库访问,从而精准发现系统的瓶颈和隐患。9)服务调用监控:系统能够针对应用的服务调用情况,对服务的QPS、响应时间和出错率进行全方面的监控10)服务链路追踪:通过链路分析的功能,可以准确的描绘出上层一次用户请求,所经历的所有系统,服务,调用所花的时间,是否有错误。通过链路分析功能,可以很好的管理大型分布式应用,并进行问题定位。II)APl日志写入:系统支持通过APl将服务器基础监控指标/日志进行写入,提供分布式日志实时分析能力。12)组件日志写入:对于没有接入监控系统的业务系统,支持多种不同方式接入:SLS接入方式、消息队列接入、流式处理平台接入方式、人工上报方式等。3、云下监控操作系统监控:可监测众多的服务器操作系统,包括:WindoWs、Debian、UbUntu、CentOS、Redhat>Fedora、CoreOS>AIX>HP-UNIX等。支持通过远程或者本地方式监控操作系统。各类性能指标,包括:CPU、RAM、磁盘、负载、文件系统、网络、监测、服务等指标。数据库监控:支持传统关系型数据库与NoSQL数据库的监控,可监测各类传统关系数据库,包括:MySQL、PostgreSQL、SQLServerOraCle等;可监测各类NOSQL数据库,包括MongoDB等。中间件监控:支持对各类中间件进行监控:Web服务中间件,包括:Apache、Tomcat、Nginx>JBossNWeblogic;缓存中间件,包括:Redis、Memcached;消息中间件,包括:ActiveMQ、RabbitMQ、Kafka;大数据中间件,包括:HAProxy>ElasticsearchHadoop(HDFS、MapReduce、Zookeeper)0服务器硬件监控:对IBM、DELL、HP、华为、浪潮、联想等国内外主流品牌的服务器硬件监控,支持通过IPMl协议实现监测。存储监控:支持对主流存储设备的监控,包括:HP、IBM、EMC、华为、HDS.Netapp等,技术手段包括:SMI-S>SNMPo监控指标包括:存储阵列、物理磁盘、存储池、存储卷等。网络链路:对于以太网链路的流量可以通过SNMP轮询的方式进行定期采集和入库。对于所采集的网络链路流量,运维人员可以结合网络设备监控模块所采集的网络设备端口流量以及详细的IP和应用流量,借助系统对上述数据进行个性化的统计分析,为带宽监控、故障诊断和带宽容量规划提供全面的决策依据。动力环境监控集成:对IDC机房的动力、环境等监控,数据集成和接入。集中监控展示:提供从应用或资源维度的运行状态监控展示界面,支持以应用拓扑或可视化资源展示方式实时获取各类资源运行状态及应用的可用性、可靠性数据。1)全链路监控能力串联和展示,按应用维度汇聚云监控、业务监控、应用探活、前后端应用性能、线下设备等。2)增加应用面板及每个应用独立的详情查看入口,实现按责任人/应用关联的数据控制查看权限。3)展示当前各应用的稳定状态,可下钻查看当前应用的实例资源拓扑和报警状态分析拓扑。4)系统支持用户自定义绘制实例拓扑,拓扑节点可关联云上实例、服务,并绑定业务监控项、云资源监控项和APM监控项,当产生业务报警时,可通过警示色标识实例状态。自定义拓扑适用于用户结合业务,添加资源实例、服务实例及其他类型实例等CMDB模型实例,绘制业务框图。在此业务框图上,一屏总览业务运行状态和报警信息。监控策略配置:提供定义各类报警策略,以便实现无人值守,由监控产品自动巡检资源状态,对存在问题的资源实现实时报警,报警的准确率高,更大程度的降低了误报率。监控参数配置:系统提供图形化监测策略配置,支持快速定义各类资源监测策略

    注意事项

    本文(XX省公安厅智慧运维管理系统建设内容.docx)为本站会员(夺命阿水)主动上传,课桌文档仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知课桌文档(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-1

    经营许可证:宁B2-20210002

    宁公网安备 64010402000986号

    课桌文档
    收起
    展开