El cofundador de Anthropic, Dario Amodei, ha publicado un análisis detallado que cuestiona la narrativa surgida tras el reciente anuncio de la empresa china DeepSeek sobre su nuevo modelo de inteligencia artificial. La noticia, que sugería que la compañía había logrado desarrollar un sistema de IA comparable a los estadounidenses por solo 6 millones de dólares (5,5 millones de euros), provocó una importante caída en los mercados tecnológicos.
El impacto inicial del anuncio
La semana pasada, DeepSeek anunció su nuevo modelo de lenguaje DeepSeek-R1, aparentemente capaz de igualar las capacidades de los sistemas estadounidenses líderes a una fracción del coste. El anuncio provocó una caída en el mercado que borró casi 184.000 millones de euros del valor de mercado de Nvidia.
Las cuatro revelaciones clave de Amodei
1. El mito del modelo de bajo coste
En su blog personal, Amodei explica que la narrativa del modelo de 5,5 millones de euros es engañosa. Según detalla, el propio modelo Claude 3.5 Sonnet de Anthropic costó "algunas decenas de millones" de dólares en entrenamiento, una cifra que sigue siendo competitiva considerando que fue desarrollado hace 9-12 meses.
2. La verdadera innovación: DeepSeek-V3
Amodei señala que la innovación más significativa de DeepSeek no fue el modelo R1, sino su predecesor, el DeepSeek-V3. Este modelo representó avances genuinos en ingeniería, especialmente en la gestión de la memoria caché y la implementación del método de "mezcla de expertos".
3. La inversión total revela otra historia
Quizás la revelación más importante concierne a la inversión total de DeepSeek. Según informes citados por Amodei en el New York Times, la empresa posee aproximadamente 50.000 chips de generación Hopper, con un coste estimado de mil millones de dólares (920 millones de euros). Esta inversión total se acerca mucho a la de las principales empresas estadounidenses de IA.
4. Un momento temporal de paridad
Amodei describe el momento actual como un "punto de cruce" temporal, donde varias empresas pueden producir modelos de razonamiento competentes. Sin embargo, advierte que esta situación cambiará rápidamente a medida que las empresas aumenten la escala de sus modelos.
Implicaciones para el futuro de la IA
El análisis de Amodei sugiere que, aunque DeepSeek ha logrado un hito impresionante, no ha alterado fundamentalmente la economía del desarrollo de IA avanzada. La capacidad de producir modelos competitivos por costes más bajos representa una fase transitoria, no un cambio permanente en el panorama de la IA.
Las empresas que deseen mantenerse competitivas en el desarrollo de IA seguirán necesitando inversiones sustanciales en infraestructura y recursos computacionales. La diferencia entre el coste de entrenamiento de un modelo individual y la inversión total necesaria para mantener un programa de IA competitivo sigue siendo significativa.
Conclusión
El análisis de Amodei proporciona una perspectiva más matizada y realista sobre los costes reales del desarrollo de IA avanzada. Mientras que la narrativa inicial sugería una revolución en la economía del desarrollo de IA, la realidad muestra que la inversión sustancial en infraestructura y recursos sigue siendo crucial para mantenerse competitivo en este campo.