Caída masiva de Google Cloud deja fuera de servicio a populares plataformas de IA como Replit y LlamaIndex

Droids

Updated on:

Una importante interrupción en los servicios de Google Cloud Platform (GCP) ha provocado este miércoles un efecto dominó que ha dejado inoperativas a numerosas plataformas de inteligencia artificial y otras herramientas web de uso generalizado. El incidente, que comenzó a sentirse alrededor de las 10:00 de la mañana (hora del Pacífico), ha puesto de manifiesto la creciente dependencia del ecosistema digital de un reducido número de proveedores de infraestructura en la nube, afectando a empresas como OpenAI, Replit y LlamaIndex.

Google confirmó la interrupción y aseguró estar trabajando para restaurar la normalidad lo antes posible, mientras miles de desarrolladores y usuarios en todo el mundo se veían afectados por la paralización de servicios críticos.

El epicentro de la interrupción: una falla en Google Cloud

La raíz del problema parece localizarse en los servicios de identidad de Google Cloud. Según la información proporcionada por la propia compañía, la interrupción afectó a una larga lista de productos esenciales. Un portavoz de GCP confirmó la incidencia a VentureBeat, remitiendo a los usuarios a su panel de estado público para seguir las actualizaciones.

En un comunicado publicado en la red social X, Google Cloud reconoció la situación: «Somos conscientes de una interrupción del servicio en algunos servicios de Google Cloud y estamos trabajando arduamente para que vuelva a funcionar lo antes posible».

Entre los servicios afectados se encuentran herramientas fundamentales para el desarrollo y la operación de aplicaciones modernas, como API Gateway, Cloud Data Fusion, Google App Engine, Google BigQuery, Google Cloud Storage, Identity Platform, servicios de conversión de texto a voz y viceversa, y Vertex AI, la plataforma de Google para el desarrollo de inteligencia artificial. Además, Firebase, la popular plataforma de desarrollo móvil de Google, también sufrió una caída completa.

Un efecto dominó en el universo de la inteligencia artificial

La dependencia de muchas empresas tecnológicas de los servicios de Google Cloud provocó que la caída se extendiera rápidamente por todo el sector de la inteligencia artificial. Esta situación se produce, irónicamente, pocos días después de que OpenAI y Google Cloud anunciaran una asociación estratégica para dar soporte a la creciente demanda de plataformas de IA generativa.

Varias de las empresas más destacadas del sector comunicaron problemas:

  • OpenAI, la creadora de ChatGPT, reconoció que sus servicios se vieron afectados por problemas en proveedores externos, lo que dificultó el inicio de sesión (SSO) en sus plataformas. Más tarde, la compañía actualizó su página de estado para informar de que el problema había sido resuelto.
  • Anthropic, la compañía detrás del modelo de IA Claude, indicó en su página de estado que estaban experimentando «tasas de error elevadas en la API, la consola y Claude AI».
  • Replit, una popular plataforma de desarrollo colaborativo en la nube, publicó en X: «Nuestros proveedores de nube ascendentes están experimentando una interrupción importante. Estamos trabajando lo mejor que podemos para restaurar los servicios de Replit».
  • LlamaIndex, una herramienta clave para desarrolladores que trabajan con modelos de lenguaje, también se vio afectada. Su cofundador, Jerry Liu, informó en X que su servicio LlamaCloud estaba caído debido a la «interrupción global de AWS/GCP/Firebase».
  • Otras plataformas como Weights & Biases, Supabase y Character AI también anunciaron estar sufriendo las consecuencias de la caída.

El alcance de la caída más allá de la IA

La interrupción no se limitó al sector de la inteligencia artificial. Cloudflare, un gigante de la infraestructura de internet, también sintió el impacto. Un portavoz de la compañía explicó a VentureBeat que «un número limitado de servicios en Cloudflare utilizan Google Cloud y se vieron afectados», pero aclaró que «los servicios principales de Cloudflare no fueron impactados».

A lo largo de la jornada, usuarios en plataformas como Down Detector reportaron problemas con otros servicios populares como Spotify y Discord, lo que sugiere un impacto más amplio de la interrupción de Google.

En medio de la confusión, algunos usuarios llegaron a pensar que Amazon Web Services (AWS), el principal competidor de Google Cloud, también estaba experimentando problemas. Sin embargo, AWS emitió un comunicado en su página de estado de salud afirmando que sus servicios, incluyendo sus plataformas de IA como Bedrock y Sagemaker, permanecían totalmente operativos.

Una llamada de atención sobre la dependencia de la nube

Este incidente sirve como un crudo recordatorio de la fragilidad de un internet cada vez más centralizado. La dependencia de miles de empresas, desde startups hasta grandes corporaciones, de un puñado de proveedores de nube como Google, Amazon y Microsoft, crea puntos únicos de fallo que pueden tener consecuencias catastróficas. Cuando uno de estos pilares se tambalea, arrastra consigo a una porción significativa del ecosistema digital.

El evento pone de relieve la importancia crítica de la redundancia, es decir, la práctica de tener sistemas de respaldo, a menudo con diferentes proveedores, para garantizar la continuidad del negocio en caso de que uno falle. Aunque Google Cloud ha ganado una cuota de mercado considerable en el ámbito de la IA empresarial, este tipo de caídas pueden hacer que las organizaciones reconsideren sus estrategias de nube única.

No se trata de un suceso aislado. El artículo de VentureBeat recuerda una interrupción masiva ocurrida en julio del año pasado, cuando un error de la empresa de ciberseguridad CrowdStrike afectó a millones de usuarios de Microsoft Windows en todo el mundo. Estos eventos demuestran que las interrupciones, lamentablemente, ocurren con demasiada frecuencia.

Reacciones en la red: entre la frustración y el humor

Como es habitual en estos casos, las redes sociales se llenaron de comentarios que iban desde la frustración por la paralización del trabajo hasta el humor sobre la «desconexión forzada». El usuario Greg Isenberg bromeaba en X sobre la caída generalizada: «Gran parte de la internet de la IA está caída ahora… por fin es hora de ponernos al día con las 87 herramientas, 14 modelos y 12 ideas de startups de IA que queremos construir».

Otro usuario, Adam Bahm, publicó en la red social Bluesky: «Gracias, GCP. No encontraba una razón para ausentarme de un par de reuniones esta tarde, ¡y ahora la tengo!».

Mientras Google continúa investigando la causa raíz del problema, el incidente deja una lección clara para el sector tecnológico: en un mundo digitalmente interconectado, la resiliencia y la diversificación no son un lujo, sino una necesidad imperiosa.

Deja un comentario