La organización sin ánimo de lucro Ai2, con sede en Seattle, ha anunciado el lanzamiento de un nuevo modelo de inteligencia artificial que, según afirman, supera en rendimiento a uno de los sistemas más avanzados de la empresa china DeepSeek, marcando un importante hito en la competencia tecnológica entre Estados Unidos y China.
El nuevo modelo, denominado Tulu 3 405B, no solo supera al DeepSeek V3, sino que también muestra un rendimiento superior al GPT-4o de OpenAI en determinadas pruebas de referencia, según informa TechCrunch.
Un modelo de código abierto que marca la diferencia
Una de las características más destacables de Tulu 3 405B es su naturaleza de código abierto, lo que significa que todos los componentes necesarios para replicarlo están disponibles gratuitamente y con licencias permisivas. Esta característica lo diferencia significativamente de sus competidores, incluyendo tanto el GPT-4o como el DeepSeek V3.
"Este hito es un momento clave para el futuro de la IA abierta, reforzando la posición de Estados Unidos como líder en modelos competitivos de código abierto", declaró un portavoz de Ai2 a TechCrunch.
Características técnicas y rendimiento
El Tulu 3 405B es un modelo de gran escala que cuenta con 405 mil millones de parámetros, una cifra que refleja su capacidad para resolver problemas complejos. Para su entrenamiento, fue necesario el uso simultáneo de 256 GPUs, lo que demuestra la magnitud de recursos computacionales requeridos para su desarrollo.
Innovación en el entrenamiento
La clave del éxito del modelo radica en una técnica denominada "reinforcement learning with verifiable rewards" (RLVR), que entrena los modelos en tareas con resultados verificables, como la resolución de problemas matemáticos y el seguimiento de instrucciones.
Resultados sobresalientes en pruebas de referencia
El modelo ha demostrado un rendimiento excepcional en varios benchmarks importantes:
- PopQA: superó a DeepSeek V3, GPT-4o y al modelo Llama 3.1 405B de Meta en esta prueba que incluye 14.000 preguntas especializadas extraídas de Wikipedia
- GSM8K: obtuvo el mejor rendimiento de su categoría en esta prueba de problemas matemáticos de nivel escolar
Disponibilidad y acceso
Ai2 ha puesto el modelo a disposición del público para su prueba a través de su aplicación web de chatbot. Además, el código para entrenar el modelo está disponible en GitHub y en la plataforma de desarrollo de IA Hugging Face.
Implicaciones para la competencia global en IA
Este desarrollo representa un importante avance en la competencia tecnológica entre Estados Unidos y China en el campo de la inteligencia artificial. El portavoz de Ai2 enfatizó que este logro "subraya el potencial de Estados Unidos para liderar el desarrollo global de modelos de IA de primera clase".
La presentación de Tulu 3 405B demuestra que las organizaciones sin ánimo de lucro pueden competir efectivamente en el desarrollo de IA avanzada, tradicionalmente dominado por grandes empresas tecnológicas y startups bien financiadas.