Definición: Servicio de almacenamiento de objetos de AWS disenado para guardar y recuperar cualquier cantidad de datos con durabilidad y disponibilidad elevadas.
— Fuente: NERVICO, Consultoría de Desarrollo de Producto
Que es Amazon S3
Amazon Simple Storage Service (S3) es el servicio de almacenamiento de objetos de AWS que permite guardar y recuperar cualquier cantidad de datos en cualquier momento desde cualquier lugar. S3 almacena datos como objetos dentro de buckets (contenedores), donde cada objeto puede tener hasta 5 TB de tamano. Esta disenado para ofrecer una durabilidad del 99,999999999% (11 nueves), lo que significa que la probabilidad de perder un objeto es practicamente nula. S3 es uno de los servicios mas utilizados de AWS y sirve como base para almacenamiento de archivos, backups, data lakes y distribucion de contenido estatico.
Como funciona
Los datos se organizan en buckets con nombres unicos a nivel global. Cada objeto se almacena con una clave unica dentro del bucket y puede incluir metadatos personalizados. S3 ofrece varias clases de almacenamiento optimizadas para diferentes patrones de acceso: Standard para acceso frecuente, Intelligent-Tiering para patrones variables, Glacier para archivado a largo plazo y Glacier Deep Archive para datos que rara vez se consultan. Las politicas de ciclo de vida permiten mover objetos automaticamente entre clases segun reglas de antiguedad. El control de acceso se gestiona mediante politicas de bucket, ACLs y roles IAM.
Por que importa
S3 resuelve el problema del almacenamiento escalable sin limites practicos de capacidad. No requiere planificacion previa de espacio en disco ni gestion de sistemas de archivos. Para aplicaciones web, S3 combinado con CloudFront proporciona una solucion completa de hosting de contenido estatico con distribucion global. Para equipos de datos, funciona como data lake donde se almacenan datos en bruto que luego se procesan con servicios de analitica. El modelo de pago por uso lo hace viable tanto para almacenar unos pocos gigabytes como petabytes de informacion.
Ejemplo practico
Una plataforma de gestion documental almacena todos los archivos de sus clientes en S3 Standard. Los documentos accedidos en los ultimos 30 dias permanecen en Standard, los de 30-90 dias migran automaticamente a Intelligent-Tiering, y los mayores de un ano se archivan en Glacier. Esta estrategia de ciclo de vida reduce el coste de almacenamiento un 60% sin ningun esfuerzo operativo. Los documentos recientes se sirven a traves de CloudFront con latencia inferior a 50ms.