Miles de repositorios privados de GitHub siguen expuestos a través de Microsoft Copilot

Droids

Miles de repositorios privados de GitHub siguen expuestos a través de Microsoft Copilot

Una investigación ha revelado que miles de repositorios de GitHub que fueron configurados como privados siguen siendo accesibles a través de Microsoft Copilot, incluso después de que sus propietarios los hayan protegido. Este hallazgo pone de manifiesto cómo los datos expuestos brevemente en internet pueden permanecer accesibles a través de chatbots de inteligencia artificial mucho después de que se hayan privatizado.

El descubrimiento

La empresa israelí de ciberseguridad Lasso descubrió el problema cuando encontró que el contenido de su propio repositorio de GitHub seguía siendo accesible a través de Copilot, a pesar de que había sido configurado como privado. Según explicó Ophir Dror, cofundador de Lasso, a TechCrunch, el repositorio había sido expuesto públicamente por error durante un breve período.

"Sorprendentemente, encontramos uno de nuestros propios repositorios privados en Copilot", señaló Dror. "Si navegara por la web, no vería estos datos. Pero cualquier persona en el mundo podría hacer la pregunta correcta a Copilot y obtener estos datos".

Alcance de la exposición

Tras este descubrimiento inicial, Lasso realizó una investigación más profunda:

  • Identificaron más de 20,000 repositorios que habían sido públicos en algún momento de 2024 y posteriormente fueron eliminados o configurados como privados
  • La vulnerabilidad afecta a más de 16,000 organizaciones
  • Los repositorios contienen código fuente, propiedad intelectual, datos corporativos sensibles y tokens de acceso

Empresas afectadas

Entre las organizaciones afectadas se encuentran algunas de las empresas tecnológicas más importantes del mundo:

  • Google
  • IBM
  • PayPal
  • Tencent
  • Microsoft (la propia empresa propietaria de GitHub y Copilot)

La respuesta de Microsoft

Lasso informó a Microsoft sobre sus hallazgos en noviembre de 2024. La respuesta de la compañía fue clasificar el problema como de "baja gravedad", indicando que este comportamiento de caché era "aceptable".

A pesar de que Microsoft dejó de incluir enlaces a la caché de Bing en sus resultados de búsqueda en diciembre de 2024, Lasso señala que Copilot aún mantiene acceso a estos datos, aunque no sean visibles a través de búsquedas web tradicionales.

Implicaciones y medidas de seguridad

Dror indicó que Lasso se ha puesto en contacto con todas las empresas "severamente afectadas" por esta exposición de datos y les ha aconsejado:

  • Rotar o revocar cualquier clave comprometida
  • Revisar la información sensible que pudiera haber quedado expuesta
  • Implementar medidas adicionales de seguridad para prevenir futuras exposiciones

Es importante destacar que Lasso logró recuperar, utilizando Copilot, el contenido de un repositorio de GitHub que Microsoft había eliminado por alojar una herramienta que permitía la creación de "imágenes ofensivas y dañinas" usando el servicio de IA en la nube de Microsoft.

Conclusión

Este incidente subraya una preocupación creciente en la era de la IA generativa: los datos que se exponen en internet, aunque sea brevemente, pueden permanecer accesibles a través de sistemas de IA mucho después de que se hayan intentado proteger. Las empresas deben ser especialmente cuidadosas con la información que publican, incluso temporalmente, ya que podría quedar almacenada en la memoria de los modelos de IA.

Deja un comentario