El 19 de julio de 2024, una actualización defectuosa del software de seguridad Falcon de CrowdStrike provocó un colapso masivo en millones de PCs con Windows, generando mensajes de Pantalla Azul de la Muerte (BSOD) en todo el mundo. Este desastre tecnológico afectó gravemente a bancos, aerolíneas y otros sectores clave, poniendo en evidencia la necesidad urgente de mejorar la gestión de actualizaciones de software y la seguridad cibernética.
El impacto global: Aerolíneas, bancos y más afectados
En la madrugada del viernes, poco después de la medianoche en Nueva York, el problema comenzó a expandirse rápidamente. En Australia, los compradores se encontraron con mensajes de Pantalla Azul de la Muerte en las cajas de autopago. En el Reino Unido, Sky News tuvo que suspender su transmisión después de que los servidores y las PC comenzaron a fallar. En Hong Kong e India, los mostradores de facturación de los aeropuertos también se vieron afectados. Para cuando llegó la mañana en Nueva York, millones de computadoras Windows habían fallado, marcando el inicio de un desastre tecnológico global.
Cómo la actualización defectuosa de CrowdStrike provocó el colapso
El software Falcon de CrowdStrike opera a nivel de kernel en Windows, el núcleo del sistema operativo con acceso completo a la memoria y hardware. La mayoría de las aplicaciones funcionan a nivel de usuario y no tienen acceso especial al kernel. El software de CrowdStrike usa un controlador que permite una detección más profunda de amenazas, pero también incrementa el riesgo de problemas cuando las actualizaciones no están bien formateadas.
Patrick Wardle, CEO de DoubleYou y fundador de la Fundación Objective-See, explica que el problema surgió cuando una actualización defectuosa no fue procesada correctamente por el controlador, causando corrupción de memoria y resultando en el colapso de los sistemas.
Medidas para prevenir futuros desastres tecnológicos
CrowdStrike detectó el problema rápidamente y emitió una solución 78 minutos después de la actualización original. Sin embargo, el daño ya estaba hecho. Los administradores de TI tuvieron que reiniciar máquinas repetidamente y, en muchos casos, visitar manualmente las máquinas afectadas para eliminar la actualización defectuosa.
La principal teoría es que el controlador contenía un error latente que no se había detectado antes. Se recomienda actualizar los procedimientos de verificación de errores para evitar problemas similares en el futuro. CrowdStrike debería haber probado la actualización con un grupo reducido de usuarios antes de su lanzamiento global.
El rol de Microsoft y las posibles soluciones
Aunque Microsoft no causó el problema, la forma en que Windows maneja estas situaciones contribuyó al colapso. Los mensajes de Pantalla Azul de la Muerte, tan comunes en errores de Windows desde los años 90, inicialmente llevaron a algunos titulares a atribuir el fallo a Microsoft. Para evitar futuros incidentes como el de CrowdStrike, Microsoft podría considerar restricciones más estrictas en el acceso al kernel de Windows para prevenir que los controladores de terceros causen bloqueos del sistema.
La reacción contra el bloqueo de Windows
Microsoft podría intentar restringir el acceso al kernel, similar a lo que hizo Apple con macOS en 2020. Sin embargo, esto enfrentaría una fuerte resistencia de proveedores de seguridad y competidores. Microsoft también debe equilibrar la presión de los reguladores y las críticas por posibles problemas de seguridad.
La solución a este problema requiere un enfoque equilibrado entre proteger la seguridad del sistema y permitir a los proveedores de seguridad ofrecer sus servicios. Es esencial que Microsoft y los proveedores de seguridad colaboren para mejorar la seguridad y evitar futuros desastres tecnológicos globales.