随着信息系统及网络的快速发展,各种信息网络不安全事件也层出不断,电力行业现有的信息管理系统在日常的工作中,碰到了越来越多的问题,为了更好地确保电力行业的信息系统网络安全,确保能及时地发现各种不安全现象,依据IT运维过程中的困扰和难题,根据电力行业的实际情况,实现对机房设备的统一监控和大屏展现的统一管理。
在管理大区部署一套IT综合运维管理平台,生产大区部署数据采集引擎装置,该采集引擎负责对生产大区管理对象进行IT设备状态基础数据采集,管理大区IT综合运维管理平台负责对生产大区基础设施资源统一监控和集中管理,预留扩展需要,并且能够实现对管理大区管理对象直接监控。实现网络设备、安全设备、网络流量分析、服务器存储管理、机房环境管理,以此各类被管对象预警分析及维护管理水平,量化提高IT基础设施及其状态的可靠性、利用率、性能质量、安全性等指标,并减少管理和控制运营成本,提供一套实现IT资源集中运维管理平台。
生产大区监控管理控制操作均在安全区域内,当生产大区采集引擎有数据需要更新时,则通过正向隔离装置协议将数据反馈到管理大区的IT综合运维管理平台。这样,对于各个安全区被管对象的管理就都集中在管理大区的IT综合运维管理平台上进行,实现跨区域的统一、集中监控管理。但是目前还存在以下问题:
技术拓扑如下图所示:
IT综合运维管理平台应在不改变采购方现有单向隔离装置的前提下实现穿透,采集数据能够以报文形式转发,并能实现不低于5分钟完成数据更新和穿透。能够实现生产区基础设施性能数据、日志数据以及服务器硬件信息穿透,完成在管理控制区统一展示。
3.2.1网络管理
通过网络管理系统的整体监控能很方便地了解到当前整个网络的运行情况和当前的网络设备、服务器及应用等当天信息和历史信息,以便从多方面了解网络的历史和实时运行情况。
集成CMDB功能,了解基本信息、配置信息、物理信息、设备信息,在查看设备信息,或者在设备更新换代时有这重要作用,节省了运维管理人员的时间;也方便可管理人员的操作。
3.2.2服务器硬件管理
支持主流网络设备(Cisco、华为、H3C、锐捷、Dptech、Nortel、迈普)等硬件监控,监控指标包括网络设备电源、电源、温度、风扇等的状态及性能指标。
支持主流安全设备等硬件监控,监控指标包括网络设备电源、电源、温度、风扇等的状态及性能指标。通过自定义SNMP OID 脚本,采集特殊的服务器特殊指标项。
3.2.3数据库管理
数据库是客户信息系统中的核心应用,系统提供数据库监控功能对数据库进行管理,保证数据库的安全,优化数据库的性能。
支持的数据库类型sqlserver2005,sqlserver2008,sqlserver2012,oracle、mysql、DB2、达梦数据库、人大金仓数据库等。
3.2.4机房管理
结合网络机房动力环境系统,能够提供温湿度感应探测器对环境状况的监测,实时监测环境温度、湿度,并对监测环境温湿度提供预警功能,防止失控;针对生产区小机房,可提供温湿度探针的方式收集当前机房温湿度状态。
系统平台应能实时显示并保存各UPS通讯协议所提供的能远程监测的运行参数和各部件状态。实时判断UPS的部件是否发生报警,当UPS的某部件发生故障或越限时,及时发出报警。
3.2.5存储管理
电力行业对于存储的需求极高,网强管理软件支持对不同厂商、不同型号的存储设备进行监控,并且支持对存储池、存储LUN 物理磁盘进行实时监控,全方面掌握存储设备的性能指标。同时可以对存储容量的智能化预测,容理使用分析、性能分析、故障定位等,保障存储的稳定运行。
IT综合监控管理平台需要提供统一的告警管理平台,根据运维人员不同时间段不同监控的需要。当某IT资源在高负载时间段(即高峰时段,如某网络设备于周六或周末晚上某一时间段的CPU使用率比平时高很多,而高峰时间段过去后,则将自动恢复平时的阈值),运维人员则可以通过系统的异常过滤和告警过滤的设置。当出现网络故障时,迅速定位网络故障发生的位置,分析出现网络故障的原因,提供解决网络故障的思路和方案,使网络与业务系统运行正常。
根据不同的网络环境以及用户多种多样机房网络拓扑样式,设计出了一套能够按照物理图谱,对应机柜和设备的安装位置,画出真实的机房拓扑图机的机柜摆放图,帮助在设备发生故障的时候快速定位设备的物理位置,同时也能够在设备上架的时候,对机柜内的存放位置有所规划,确保全方位的对机房中的设备运行情况和环境使用情况清楚明了。
网络管理系统可将异常分为4个等级,当某个资源的监控指标如平均CPU利用率、ICMP响应时间或平均内存利用率等匹配规则大于系统默认的阈值90%时将产生紧急异常、大于70%时为重要异常、大于50%时为一般异常、而大于30%时则为提示异常。同时,运维人员也可以按照个人需求通过阈值设置来对异常等级进行自定义,并可根据不同的异常等级分别设置紧急告警、重要告警、一般告警及转发邮件等告警方式,使运维人员可以更加清晰地了解到当前网络中所有异常的轻重缓急,有效处理网络异常。
从用户实际关注的角度出发,把网络IT数据进行高效、可视化的管理,对数据进行整合分析,通过可视化大屏展示来帮助业务人员发现、诊断业务问题。数据实时采集、数据处理、数据分析、数据异常等相关性,帮助用户解决业务问题,满足不同用户业务、IT资源、网络结构等各种场景的展示需求。
用户可以设定时间段内的数据报表以及自定义类型报表的实时报表;支持报表一览(网络设备、服务器、应用、链路、业务、网页、服务)、报表模板(模块一览、内建模板、新建模板)、自定义报表(自定义报表一览、自定义报表模板、新建自定义报表)三大模块。
管理大区的IT综合运维管理平台需要能够支持对生产大区安全设备日志的收集管理展示,还支持将告警数据、配置数据以及性能数据发送给第三方系统,运维人员只需通过浏览器就可访问IT综合监控系统和第三方系统,实现各个系统的互联互通、有效整合与统一展现。
系统支持对登录过程中的数据加密,以保障管理员远程登录网管系统的安全性;把多个重要的网络设备、服务器、虚拟化、存储、应用、防火墙、业务、网站等等设为我的关注,显示这些设备的实时运行情况和历史运行情况。
网强成立2003年,17年时间不变初心,砥砺前行,致力于电力行业运维工作,不断提高自己,为用户提出科学可行的解决方案,协助用户在网络运维工作中的人员配比,时间安排,经济投入与产出等方面有了系统性的提升。以下为部分案例:
浙江浙能乐清发电责任有限公司
【关于网强】
网强信息技术(上海)有限公司成立于2003年,是一家专业从事网络管理和IT综合管理软件开发的高新技术企业。经过17年技术积累与实践经验,目前已成为国内市场高占有率、国内最大的网络管理、IT综合管理软件开发与解决方案等服务提供商之一。
智能管理专家
免费体验 无需等待