Informe técnico: interrupción de servicios en SYSCOM.MX

Análisis técnico de la incidencia en los servicios en línea de SYSCOM.MX tras la migración a AWS, medidas correctivas implementadas y mejoras en la infraestructura de base de datos.

Jorge Saad

El día de ayer y esta mañana experimentamos diversas incidencias técnicas en SYSCOM.MX. Lamentamos los inconvenientes ocasionados y agradecemos su paciencia.

Nuestro compromiso es mantener los servicios de SYSCOM disponibles y optimizados para usted y su equipo en todo momento. Reconocemos que en esta ocasión no cumplimos con ese estándar de servicio.

El problema ha sido resuelto. Actualmente, nuestro equipo se encuentra enfocado en corregir la causa raíz de la interrupción e implementando controles y monitores adicionales para prevenir que este tipo de situaciones se repita en el futuro.

A continuación, detallamos la explicación técnica de lo ocurrido y las acciones correctivas realizadas.

Cronología de la incidencia

El viernes trasladamos todos los servicios en línea de SYSCOM.MX a nuevos servidores alojados en AWS. Durante el sábado, los servicios operaron con normalidad y sin detalles.

El martes registramos un volumen inusual de peticiones al sitio web, lo que provocó el colapso del servidor de la base de datos.

Ese mismo martes, a las 5:00 PM, incrementamos la capacidad del servidor de base de datos, logrando restaurar las operaciones exitosamente. Sin embargo, se detectó una incidencia secundaria relacionada con la gestión de sesiones de usuario.

El miércoles, a las 11:00 AM, identificamos y corregimos el detalle en las sesiones, restaurando completamente la visualización correcta de precios e inventarios para todas las cuentas afectadas.

Medidas correctivas y preventivas

Para garantizar la estabilidad del plataforma y evitar recurrencias, hemos implementado las siguientes acciones:

  1. Escalabilidad y corrección inmediata: Se aumentó la capacidad técnica del servidor de base de datos y se resolvió el incidente en la gestión de sesiones.
  2. Mejora en protocolos de actualización: Se han implementado validaciones más estrictas y mejores prácticas técnicas durante las actualizaciones de hardware e infraestructura.
  3. Monitoreo avanzado: Se ha añadido un sistema de monitoreo más preciso y detallado para la base de datos, permitiendo una detección temprana de anomalías.