Escalabilidad y Desempeño

La arquitectura de JAAK está diseñada para soportar un crecimiento dinámico y adaptable a medida que las demandas de los servicios aumentan. A través del uso de tecnologías avanzadas como KEDA (Kubernetes Event-Driven Autoscaling), podemos asegurar que nuestros sistemas escalen de manera eficiente en función de eventos específicos, optimizando el uso de recursos en entornos de nube, asegurando que el sistema mantenga un rendimiento óptimo sin importar el número de usuarios o transacciones simultáneas.

Escalabilidad

Escalabilidad Horizontal basada en Eventos: A diferencia del escalado tradicional basado en métricas de CPU o memoria, utilizamos KEDA para escalar nuestros microservicios en función de eventos. Esto nos permite ajustarnos a escenarios más complejos, como el procesamiento de colas de mensajes o retrasos en consumidores. KEDA facilita el autoescalado dinámico basado en la demanda y soporta la capacidad de escalar a cero cuando no hay carga, reduciendo los costes de la nube.
Multi-Cloud: Al estar preparados para funcionar en entornos multi-cloud, podemos escalar en diversas plataformas como GCP, Oracle Cloud y Azure, distribuyendo los recursos en diferentes regiones y proveedores, lo que permite una redundancia y disponibilidad global.
Autoescalado Dinámico: Con KEDA, podemos gestionar el escalado de pods en Kubernetes basado en métricas no tradicionales, como el retardo en colas de mensajes o el consumo de eventos. Esto garantiza que nuestro sistema esté siempre optimizado para el rendimiento y el costo, sin importar la fluctuación en la carga.

Desempeño

Monitoreo Proactivo: Utilizamos herramientas como Prometheus y Grafana para monitorizar el rendimiento del sistema en tiempo real, recolectando métricas clave sobre latencia, uso de recursos, tiempo de respuesta, y disponibilidad de servicios. Esto nos permite identificar y corregir problemas de rendimiento de manera proactiva, estas herramientas se integran con KEDA para generar alertas cuando se detectan cuellos de botella o demandas inesperadas.
Optimización del Uso de Recursos: JAAK asigna recursos como CPU, GPU y memoria de manera dinámica, permitiendo que los servicios más críticos reciban prioridad en momentos de alta demanda. Esto incluye la asignación de GPUs para el procesamiento de modelos de reconocimiento biométrico intensivo.
Balanceo de Carga: Los balanceadores de carga distribuyen las solicitudes entrantes entre múltiples instancias de servicios, lo que garantiza una distribución uniforme y evita la sobrecarga de servidores individuales. Esto se combina con caching inteligente para mejorar los tiempos de respuesta en tareas repetitivas.
Tolerancia a Fallos y Alta Disponibilidad: JAAK implementa una arquitectura multi-región con replicación de datos y servicios, lo que garantiza una alta disponibilidad. En caso de fallo en una región o proveedor, los servicios pueden ser rápidamente redirigidos a una región alternativa, minimizando el impacto para los usuarios.
Pruebas de Carga y Stress: El equipo técnico realiza pruebas periódicas de carga y stress en nuestros sistemas para simular escenarios de alto tráfico. Esto nos permite garantizar que la infraestructura puede soportar un gran número de solicitudes simultáneas sin degradar el desempeño.

Diagrama de Escalabilidad

A continuación, se presenta un diagrama que muestra cómo el sistema redirecciona las peticiones en función de la demanda, region y disponibilidad:

Dentro de una Región de un proveedor de Cloud nuestros sistemas se distribuyen de la siguiente manera usando keda: