Google se prepara para dar un giro significativo en su estrategia de inteligencia artificial al planear la finalización de su multimillonario contrato con Scale AI, una de las startups más prominentes en el campo del etiquetado de datos. La decisión, que implica trasladar estas operaciones críticas de forma interna, subraya una tendencia creciente entre los gigantes tecnológicos de buscar un control total sobre su cadena de suministro de IA, desde el hardware hasta los datos que alimentan sus modelos.
Según un informe publicado por The Information, que cita a personas familiarizadas con el asunto, Google ha decidido no renovar su acuerdo con Scale AI, valorado en cientos de millones de dólares. Este movimiento representa un cambio drástico en la relación entre ambas compañías y podría tener importantes repercusiones tanto para Scale AI como para el ecosistema de la inteligencia artificial en general.
Un giro estratégico para el gigante tecnológico
La decisión de Google de internalizar el etiquetado de datos parece estar motivada por dos factores principales: la reducción de costes y la obtención de un mayor control sobre un componente fundamental de su desarrollo de IA. Durante años, empresas como Google han dependido de proveedores externos como Scale AI para realizar la ingente y laboriosa tarea de anotar datos, un proceso esencial para entrenar algoritmos de aprendizaje automático.
Estos contratos, a menudo de cifras astronómicas, han permitido a las tecnológicas escalar rápidamente sus proyectos de IA. Sin embargo, a medida que la inteligencia artificial se convierte en el núcleo de su negocio, la dependencia de terceros presenta riesgos y costes que Google parece ya no estar dispuesto a asumir. Al gestionar el proceso internamente, la compañía no solo podría optimizar los gastos a largo plazo, sino también garantizar una mayor seguridad, confidencialidad y personalización en el tratamiento de sus datos.
El contrato con Scale AI era uno de los más grandes en la industria del etiquetado de datos. Aunque no se han revelado las cifras exactas, fuentes del sector lo sitúan en el rango de los cientos de millones de dólares. Una pérdida de esta magnitud evidencia que Google considera que sus herramientas y equipos internos han alcanzado la madurez necesaria para asumir esta tarea a gran escala.
¿Qué es el etiquetado de datos y por qué es fundamental para la IA?
Para comprender la importancia de esta noticia, es crucial entender qué es el «etiquetado de datos» o «anotación de datos». En esencia, es el proceso de añadir etiquetas o metadatos informativos a datos brutos, como imágenes, audios o textos, para que los modelos de inteligencia artificial puedan aprender de ellos.
Piense en ello como el proceso de enseñar a un niño. Para que un niño aprenda a reconocer un gato, le mostramos muchas imágenes de gatos y le decimos «esto es un gato». El etiquetado de datos hace exactamente eso, pero a una escala masiva y para un ordenador. Por ejemplo:
- En el desarrollo de coches autónomos, los trabajadores humanos dibujan cajas alrededor de peatones, coches y señales de tráfico en miles de horas de vídeo, etiquetando cada objeto.
- Para entrenar a un asistente de voz, se transcriben y etiquetan fragmentos de audio para que el modelo entienda las órdenes y matices del lenguaje.
- Para un modelo de análisis de sentimiento, se clasifican miles de reseñas de productos como «positivas», «negativas» o «neutrales».
Este trabajo, aunque a menudo repetitivo, es la base sobre la que se construyen los sistemas de IA más avanzados. La calidad del etiquetado determina directamente la precisión y fiabilidad del modelo final. Por ello, la decisión de quién realiza esta tarea es de máxima importancia estratégica.
Un duro golpe para Scale AI
Para Scale AI, la noticia supone un revés considerable. Fundada en 2016 por Alexandr Wang, la startup se convirtió rápidamente en un líder del sector, alcanzando una valoración de 7.300 millones de dólares (unos 6.700 millones de euros) en su última ronda de financiación en 2021. La compañía se enorgullece de su capacidad para proporcionar datos de alta calidad a una velocidad y escala que pocos pueden igualar.
Perder a un cliente del calibre de Google, que no solo aportaba ingresos significativos sino también prestigio, obligará a Scale AI a reajustar su estrategia. En una publicación en la red social X, el CEO Alexandr Wang se dirigió a la situación, afirmando que «los mejores modelos se ganan con los mejores datos» y que la compañía sigue enfocada en construir la «fábrica de datos para la IA» más avanzada del mundo.
A pesar del golpe, Scale AI mantiene una cartera de clientes de primer nivel que incluye a otras grandes tecnológicas como Meta y Microsoft, al pionero de la IA generativa OpenAI, y a importantes entidades gubernamentales como el Departamento de Defensa de Estados Unidos. Esta diversificación podría ser clave para amortiguar el impacto de la decisión de Google. No obstante, el mercado estará atento a cómo la empresa gestiona esta transición y si es capaz de suplir el vacío dejado por el gigante de las búsquedas.
La tendencia de la integración vertical en la carrera por la IA
La decisión de Google no es un hecho aislado, sino que forma parte de una estrategia más amplia conocida como integración vertical. Al igual que Apple diseña sus propios chips de la serie M para sus ordenadores o Tesla fabrica sus propias baterías, los gigantes tecnológicos buscan ahora controlar cada eslabón de la cadena de producción de la inteligencia artificial.
Esta estrategia les permite:
- Optimizar el rendimiento: Al controlar el hardware (chips como las TPU de Google), el software (modelos como Gemini) y ahora los datos, pueden afinar la interacción entre todos los componentes para lograr una eficiencia máxima.
- Reducir la dependencia: Disminuyen los riesgos asociados a depender de proveedores externos, que pueden sufrir interrupciones, cambiar sus precios o trabajar con la competencia.
- Proteger la propiedad intelectual: Mantienen sus datos y métodos de entrenamiento más sensibles dentro de casa, reduciendo el riesgo de fugas.
Este movimiento podría marcar el comienzo de una nueva fase en la industria de la IA, donde las grandes corporaciones con recursos casi ilimitados internalizan cada vez más funciones, dejando a las empresas especializadas en una posición más vulnerable. Si bien esto puede impulsar la innovación interna, también corre el riesgo de consolidar aún más el poder en manos de un pequeño número de actores dominantes, dificultando la competencia para las startups más pequeñas. La era de la subcontratación masiva de datos podría estar llegando a su fin para los titanes de la tecnología.