Definición: Metrica cuantitativa que mide un aspecto especifico del nivel de servicio, como la latencia o la tasa de errores, sirviendo como base para definir SLOs y SLAs.
— Fuente: NERVICO, Consultoría de Desarrollo de Producto
Que es un SLI
Un Service Level Indicator (SLI) es una metrica cuantitativa cuidadosamente elegida que mide un aspecto concreto del servicio desde la perspectiva del usuario. Es el dato crudo sobre el que se construyen los SLOs y, en ultima instancia, los SLAs. Los SLIs tipicos incluyen la latencia de respuesta, la tasa de exito de peticiones, el throughput y la disponibilidad del servicio.
Como funciona
Un SLI se define como una proporcion de eventos buenos sobre el total de eventos validos. Por ejemplo, el SLI de latencia se podria definir como “el porcentaje de peticiones HTTP completadas en menos de 300ms”. El SLI de disponibilidad seria “el porcentaje de peticiones que devuelven un codigo de estado exitoso (2xx o 3xx)”. Estos indicadores se recopilan continuamente mediante herramientas de observabilidad como Prometheus, CloudWatch o Datadog, y se agregan en ventanas de tiempo definidas para evaluar el cumplimiento de los SLOs.
Casos de uso principales
- Medicion continua de la experiencia real del usuario mediante indicadores de latencia y tasa de errores
- Base cuantitativa para definir SLOs realistas alineados con las expectativas del usuario
- Alimentacion de dashboards de fiabilidad que muestran el estado del error budget en tiempo real
- Deteccion automatica de degradacion del servicio mediante alertas basadas en umbrales de SLI
Ventajas y consideraciones
Los SLIs proporcionan una medida objetiva y cuantificable de la calidad del servicio, eliminando las evaluaciones subjetivas. Al definirse desde la perspectiva del usuario, garantizan que las metricas reflejen la experiencia real. La principal consideracion es seleccionar los SLIs correctos: demasiados indicadores dispersan la atencion, mientras que indicadores mal elegidos pueden ocultar problemas reales. Se recomienda comenzar con pocos SLIs de alto impacto y expandir gradualmente.