在市场竞争日益白热化的形势下,如何屹立不倒仍是很多企业头痛的问题。那么一个企业想要扩大版图,实现帝国规模扩张,在内部运作里必然是少不??网络运维系统作为支撑后盾,而企业拥有了一个全面的运维系统后也可以减轻运维工程师的负担。那么一个全面的运维系统应该是怎么样的?应该怎么???从哪里开始呢?来看看网强公司总结的经验??
HOW—怎样的运维系统才算全???
一个全面的运维系统,应该包括五个要素:效率、稳定、安全、体验和成本??
在这5个要素中,效率和稳定应是每个运维人最基础的本职工作,在此前提下,再进行安全、体验和成本3个要素考量,一个全面的运维系统将应运而生??
WHAT—具体内容以及执行操作方??
1.效率
这里重点指的是日常运维例行工作的效率,这些是指运维最基础的工作:资源分配与回收、域名配置、VIP配置、持续集成与发布、应用部署、应用扩容与缩容等。而我们提过的运维自动化,大多是集中在这些工作上,因为这些工作偏日常和重复??
2.稳定(质量)
可以通过监控、全链路、强弱依赖、限流降级、容量评估、预案平台等措施,让业务运行更加稳定。做好这一点,需要有相对比较独立、专业的监控和稳定性平台来支持??
这部分目标是最大程度地保障系统的稳定性和运行质量。即使出现问题,也能够快速发现、快速响应、快??(自动)恢复??
3.安全
安全,是横向与运维同等甚至更加重要的专业领域。但同时又是跟运维紧密相关的,运维同样要关注安全,因为安全出现导致的问题,往往也会给运维带来沉重的防护和修复成本。我们经常提到的安全类关键词,各类主机安全、DB安全、Web安全、应用安全等等,与此相关的还有漏洞、DDos、CC等??
4.体验
这里提到的体验,指的是终端用户的访问体验。对于非功能或非产品的使用体验,运维最需要关注的是访问速度。开发人员,可能更多的注意力会放在自己负责的代码以及该部分的性能问题,不会关注到端到端全流程的性能和体验。而运维可以站在全局的角度来审视和治理整个端到端的全链路性能情况,并给出对应的性能优化建议??
5.成本
成本问题,也就是技术ROI(投入产出??)的问题。当系统规模和体量变大之后,掌控在运维手中的各类资源,将成为整个研发团队支出的主要占比。如果没有很好的成本控制意识和策略,资源体量将会持续增大,甚至是翻倍或指数级的增长,对于公司成本会是非常大的负担和压力??
那么运维工作者需要考虑到服务器CPU资源利用率的提升(引申出来各种虚拟化、容器或云资源的使用)、IDC&CDN流量带宽使用的管控,还有人力的投入和成本的管控。如何使得系统能够更高效地被充分利用起来,如何能够最大限度的减少成本支出,是我们必须要去考虑的问题??
以上可以发现网络运维范畴其实能够延伸到很大的范围;或者这样来说,只要最终是跟线上业务运行相关的工作,都是运维要关注的焦点。如果运维仅仅是片面和狭隘地给自己限定一个范围,无法做到提前统筹和规划,会很容易变成被动响应的角色??
下一条:关于运维工程师岗位的定义和思??