Definición: Dispositivo o servicio de red que distribuye el tráfico entrante entre múltiples servidores para mejorar la disponibilidad, escalabilidad y tolerancia a fallos.
— Fuente: NERVICO, Consultoría de Desarrollo de Producto
Qué es un balanceador de carga
Un balanceador de carga es un dispositivo de red o servicio que distribuye automáticamente el tráfico entrante entre múltiples servidores backend. Su función principal es garantizar que ningún servidor individual se sobrecargue mientras otros permanecen inactivos. Actúa como un punto de entrada único que los usuarios ven, mientras que por detrás distribuye las peticiones entre un pool de servidores.
Es un componente fundamental en cualquier arquitectura que necesite alta disponibilidad o escalabilidad horizontal.
Cómo funciona
Cuando un usuario envía una petición, esta llega al balanceador de carga en lugar de a un servidor específico. El balanceador aplica un algoritmo de distribución para decidir a qué servidor backend enviar la petición. Los algoritmos más comunes son round-robin (rotación secuencial), least connections (servidor con menos conexiones activas), weighted (distribución proporcional a la capacidad) e IP hash (mismo usuario siempre al mismo servidor).
Los balanceadores modernos realizan health checks periódicos contra los servidores backend. Si un servidor deja de responder, el balanceador lo retira del pool automáticamente y redistribuye el tráfico entre los servidores sanos. Cuando el servidor se recupera, se reincorpora al pool.
Existen como hardware dedicado (F5, Citrix), software (Nginx, HAProxy) o servicios gestionados en la nube (AWS ALB, Google Cloud Load Balancing, Azure Load Balancer).
Por qué importa
Sin un balanceador de carga, un único servidor es un punto único de fallo: si cae, todo el servicio cae. El balanceador proporciona redundancia automática y permite escalar horizontalmente añadiendo más servidores al pool sin cambios en la configuración del cliente.
Ejemplo práctico
Una aplicación web recibe 10,000 peticiones por segundo durante una campaña de marketing. Un solo servidor soporta 3,000 peticiones por segundo antes de degradarse. El equipo configura un balanceador de carga con cuatro servidores backend. El balanceador distribuye las peticiones equitativamente: cada servidor recibe aproximadamente 2,500 peticiones por segundo, operando dentro de su capacidad. Si un servidor falla, los tres restantes absorben la carga temporalmente mientras se recupera o se aprovisiona uno nuevo.