服务器运维人员对容量规划的一些工作



    服务器容量管理的目标和优势。虽然我们可以从QA中得到各个应用模块的性能数据,但是每

次在原有的基础上启动或者扩展新项目时,仍然需要对服务的稳定性进行评估,这说明我们在

正常工作中对服务系统的容量并没有非常直观的了解,需要对系统资源的可用率进行量化。
 
 
 
为了让大家更直观的看到系统的使用率和剩余可用率,这里进行容量管理的相关工作。容量管

理的主要目标是评估当前和未来流量下每个集群模块的容量状态。为了便于表述,我们这里所

指的容量管理是指服务器容量管理。容量管理的基本目标是以合理的硬件成本满足业务需求。

事实上,我们通常会做很多工作来实现这个目标,例如开发人员改进程序算法和增强处理能力

。运维人员根据业务类型定制专用服务器。从表面上看,我们的容量管理就是管理服务器。事

实上,容量管理一方面节省了硬件成本,另一方面节省了人力成本。
 
 
 
每个季度做预算的时候,都是公司所有技术人员头疼的问题。虽然服务器运维和开发者关系不

大,但是按照以前的做法,运维人员需要向开发者询问申请机器的原因,开发者要给出一套理

由来辩解,运维人员则要根据申请的机器数量来删减,这样才能向上面说明,大家都在走形

式。有了容量管理系统,我们就可以用数据说话了,需要多少台机器不是我们的事,技术人员

才能专心工作。
 
 
产能管理也可以节省人力,体现在服务拓展上。扩展是在集群中添加节点,这意味着包括以下

任务:

 
(1)服务环境部署;(2)相关模块的配置;(3)同步计时任务;(4)向数据中心注册;(5)向运营中心

注册;(6)内部系统权限申请;

 
(7)代码同步;(8)数据同步;(9)开通服务;(10)质量保证回归试验;(11)应用上线。以上只是添

加节点时的基础工作,每一个环节都不能出错。此外,向内部系统申请许可需要时间和成本

,通常需要一两天。这意味着,为了扩大紧急情况造成的容量,需要提前在备用池中准备一

些已经申请许可的机器,听起来很累。这些都是运维人员的工作。
分享: