Costos Directos: A medida que crece la solución
aumenta linealmente el staff
Costos Indirectos: Dos grupos con diferentes aproximaciones,
objetivos y skills. La división entre los grupos puede convertirse
fácilmente no solo en incentivos, sino también en comunicación,
metas y, finalmente, confianza y respeto.
2) Google’s Approach to Service Management: Site Reliability Engineering
Equipo que se encarga de ejecutar
nuestros productos y crear sistemas para
realizar el trabajo que, de otro modo, los
administradores de sistemas realizarían, a
menudo de forma manual.
50% Ops / 50% Mejoramiento y
automatizaciones de tareas recurrentes
manuales
La nuevas hiring van a
Mejoramiento no ha tareas
recurrentes
Los equipos de SRE se caracterizan por una
rápida innovación y una gran aceptación del
cambio.
3) Principios del SRE
En general, un equipo de SRE es responsable de la
disponibilidad, latencia, rendimiento, eficiencia,
administración de cambios, monitoreo, respuesta a
emergencias y planificación de la capacidad de sus
servicios.
El objetivo es mantener el enfoque en el trabajo
de ingeniería, en contraposición al trabajo de
operaciones.
Garantizar un enfoque duradero en la ingeniería
Perseguir la velocidad máxima de cambio sin violar el SLO de un servicio
Monitoreo
Alertas
Tickets
Logging para posterior análisis forence
Respuesta a Emergencias MTTF - MTTR
Gestión de Cambios
Previsión de la demanda y planificación de la capacidad
Aprovisionamiento: combina la gestión de
cambios y la planificación de la capacidad