Glosario Técnico

Escalado horizontal

Definición: Estrategia de escalabilidad que consiste en anadir mas maquinas para distribuir la carga de trabajo entre multiples servidores.

— Fuente: NERVICO, Consultoría de Desarrollo de Producto

Que es el escalado horizontal

El escalado horizontal, tambien conocido como scale-out, es una estrategia de escalabilidad que consiste en anadir mas maquinas o instancias a un sistema para distribuir la carga de trabajo. En lugar de hacer mas potente un unico servidor, se reparte el trafico entre multiples servidores identicos que trabajan en paralelo. Es el modelo de escalabilidad predominante en arquitecturas cloud-native modernas.

Como funciona

Cuando la carga de una aplicacion aumenta, se aprovisionan nuevas instancias identicas a las existentes. Un balanceador de carga distribuye las peticiones entrantes entre todas las instancias disponibles. Cada instancia procesa peticiones de forma independiente, sin compartir estado en memoria con las demas. Servicios de auto-scaling como AWS Auto Scaling o Kubernetes Horizontal Pod Autoscaler monitorizan metricas de uso (CPU, memoria, peticiones por segundo) y ajustan automaticamente el numero de instancias segun la demanda. Cuando el trafico disminuye, las instancias sobrantes se eliminan para reducir costes.

Por que importa

El escalado horizontal elimina el techo fisico del escalado vertical. Mientras un servidor individual tiene un limite maximo de CPU y RAM, el numero de servidores en un cluster no tiene limite teorico. Ademas, proporciona redundancia natural: si una instancia falla, las demas absorben la carga sin interrupcion del servicio. Los costes escalan de forma lineal (el doble de instancias cuesta el doble) y el proceso se automatiza completamente, lo que permite responder a picos de trafico sin intervencion manual.

Ejemplo practico

Una plataforma de comercio electronico experimenta un aumento de trafico del 400% durante Black Friday. Su configuracion habitual es de cuatro instancias detras de un balanceador de carga. El auto-scaling detecta que el uso de CPU supera el 70% y aprovisiona automaticamente doce instancias adicionales en tres minutos. El trafico se distribuye entre las dieciseis instancias, manteniendo tiempos de respuesta por debajo de 200ms. Pasado el pico, el auto-scaling reduce gradualmente las instancias a la configuracion base en un plazo de treinta minutos.

Terminos relacionados

  • Escalado vertical - Estrategia alternativa que aumenta los recursos de una maquina existente
  • Balanceador de carga - Componente que distribuye el trafico entre las instancias escaladas horizontalmente
  • Escalabilidad - Concepto general que engloba tanto el escalado horizontal como el vertical

Ultima actualizacion: Febrero 2026

¿Necesitas ayuda con desarrollo de producto?

Te ayudamos a acelerar tu desarrollo con tecnología puntera y mejores prácticas.