400-612-6085
您的位置:首页>新闻中心>热门文章

运维:本手、妙手、俗手

发布时间:2023-02-17 作者:网强 浏览:433

运维管理目标

      作为运维工作者最关心的首先是如何通过预防性手段减少设备出现宕机、故障等问题造成业务中断,其次是如何实现发现问题马上告警或是重点链路重点保障,定期引导查看,这样就算出现问题也可以避免重大事故,最后就是一旦发生故障,如何快速精准的排障,将损失降到最低。

       以业务为视角,以服务为核心,以智能化运维平台为支撑,通过专业化的咨询设计、转型实施和平台场景化整合交付,助力客户实现高效运营目标并持续提升业务创新能力。

      依托先进的技术、运营管理技术,为客户提供各类数据中心升级服务,满足动态需求。

运维管理背景

       运维的工作较为繁杂,大型的互联网公司通常将运维方向分为:应用运维(SRE)、系统运维(SYS)、运维研发(DEV)、数据库运维(DBA)、运维安全(SEC)五大方向。但无论在运维的哪个岗位,都逃离不开资产相关工作。


      系统运维工作职责包含负责数据中心基础服务的建设以及资产管理,网络基础设施选型、交付和维修。对应的需要管理到所有网络基础设施的物理信息,包括数据中心网络基础设施分布情况、设备配置信息、对应厂商资料、设备IP等各种资源情况,以此确保数据中心建设可以满足业务需求。


      应用运维同样也离不开服务及资源管理,要时刻掌握负责业务及业务之间的关联关系,业务依赖资源关系,以便可以及时发现故障问题产生预警,又或是出现问题第一时间响应,安排相关人员联合排障。不仅如此,还要对各设备资源进行管理,梳理资源状况、业务承载,要做到合理分配使用,根据不同业务的需求,分配不同配置的网络基础设施,确保资源能被充分利用。并在日常工作中要不断排查点位,发现问题,及时追查,排除隐患。


现状--“本手”运维

      目前大部分数据中心选用都是excel表格结合CAD图纸、手工记录数据等方式对网络基础设施资源进行记录,这种“人工记录”的管理方式,我们可将其称之为“本手”。但是“本手”的操作也随之暴露一些问题,比如设备量大、资源信息维度广、人员流动性大,如想实现网络基础设施物理层精细化管理,势必要投入大量的人工成本,最终造成过度依赖资深运维工程师、人工时间成本消耗巨大、记录方式差异化、数据口口相传等问题。 


       那么针对运维管理,有没有“妙手”呢?更大限度的减少设备故障,重点业务更加精准的保障,发现故障更加及时的告警。答案是肯定的,随着数据中心行业发展,本手的管理方式虽能勉强满足管理需求,但其成本代价高昂,如果有智能化手段介入配合管理方式的优化,那么是不是可以更加高效、快速的实现运维管理,我们可将其称之为“妙手”。


如何实现“妙手”运维

现在针对有源设备状态管理已经有网管软件的接入,“妙手”真正要解决的问题其实是无源设备以及资产各个维度信息的管理,在现有运维模式上优化,比如如何减少设备故障?如何快速的将设备端接信息记录清楚?如何快速的为排障、保障工作实现数据支撑?如何将网络基础设施资源充分利用、合理优化?如何在保障业务安全平稳运行的同时,实现“更安全、更准确、更及时”的目标。

可以利用专业管理工具结合网管软件相辅相成,实现以物理层为基础,结合逻辑层管理,物理+逻辑双腿走路,将原先记录在excel表格上的资产信息,以可视化的形式展现在网络基础设施管理平台,通过智能化手段管理,从而实现减少故障,提高系统安全可靠性,排障更加精准,效率大大提升。


关于“俗手”的思考

      最后,再浅谈一下目前运维工作的“俗手”,其实针对网络基础设施物理层管理的痛点问题一直存在,有很多单位也想到了引入智能化手段,尝试减轻运维工作压力,但是选用的确是增加硬件设备,如电子配线架。目前我国数据中心建设已经发展到了一定规模,存在很大体量的老旧数据中心,增加硬件设备势必要中断业务,且由于电子配线架需要双配,在数据中心等同于增加了一个故障点,只实现了对设备直接链路连接关系的管理,对流程、事件、历史故障、变更信息、发布信息、运行情况、知识记录、综合分析等方面还是缺乏管控,最后还提高了建设成本,这样的管理方式是不是可以称之为弄巧成拙的“俗手”呢,值得我们探讨。


期待每一位运维工程师都能找到属于自己的“妙手”,为企业提供“更安全、更准确、更及时”的运维服务。


 
在线客服  
咨询电话:400-612-6085
 
 
免费
试用