Ai2 presenta un nuevo modelo de IA que supera al líder chino DeepSeek

La organización sin ánimo de lucro Ai2, con sede en Seattle, ha anunciado el lanzamiento de un nuevo modelo de inteligencia artificial que, según afirman, supera en rendimiento a uno de los sistemas más avanzados de la empresa china DeepSeek, marcando un importante hito en la competencia tecnológica entre Estados Unidos y China.

El nuevo modelo, denominado Tulu 3 405B, no solo supera al DeepSeek V3, sino que también muestra un rendimiento superior al GPT-4o de OpenAI en determinadas pruebas de referencia, según informa TechCrunch.

Un modelo de código abierto que marca la diferencia

Una de las características más destacables de Tulu 3 405B es su naturaleza de código abierto, lo que significa que todos los componentes necesarios para replicarlo están disponibles gratuitamente y con licencias permisivas. Esta característica lo diferencia significativamente de sus competidores, incluyendo tanto el GPT-4o como el DeepSeek V3.

"Este hito es un momento clave para el futuro de la IA abierta, reforzando la posición de Estados Unidos como líder en modelos competitivos de código abierto", declaró un portavoz de Ai2 a TechCrunch.

Características técnicas y rendimiento

El Tulu 3 405B es un modelo de gran escala que cuenta con 405 mil millones de parámetros, una cifra que refleja su capacidad para resolver problemas complejos. Para su entrenamiento, fue necesario el uso simultáneo de 256 GPUs, lo que demuestra la magnitud de recursos computacionales requeridos para su desarrollo.

Innovación en el entrenamiento

La clave del éxito del modelo radica en una técnica denominada "reinforcement learning with verifiable rewards" (RLVR), que entrena los modelos en tareas con resultados verificables, como la resolución de problemas matemáticos y el seguimiento de instrucciones.

Resultados sobresalientes en pruebas de referencia

El modelo ha demostrado un rendimiento excepcional en varios benchmarks importantes:

PopQA: superó a DeepSeek V3, GPT-4o y al modelo Llama 3.1 405B de Meta en esta prueba que incluye 14.000 preguntas especializadas extraídas de Wikipedia
GSM8K: obtuvo el mejor rendimiento de su categoría en esta prueba de problemas matemáticos de nivel escolar

Disponibilidad y acceso

Ai2 ha puesto el modelo a disposición del público para su prueba a través de su aplicación web de chatbot. Además, el código para entrenar el modelo está disponible en GitHub y en la plataforma de desarrollo de IA Hugging Face.

Implicaciones para la competencia global en IA

Este desarrollo representa un importante avance en la competencia tecnológica entre Estados Unidos y China en el campo de la inteligencia artificial. El portavoz de Ai2 enfatizó que este logro "subraya el potencial de Estados Unidos para liderar el desarrollo global de modelos de IA de primera clase".

La presentación de Tulu 3 405B demuestra que las organizaciones sin ánimo de lucro pueden competir efectivamente en el desarrollo de IA avanzada, tradicionalmente dominado por grandes empresas tecnológicas y startups bien financiadas.

Un modelo de código abierto que marca la diferencia

Características técnicas y rendimiento

Innovación en el entrenamiento

Resultados sobresalientes en pruebas de referencia

Disponibilidad y acceso

Implicaciones para la competencia global en IA

Deja un comentario Cancelar la respuesta

Noticias

Nvidia confirma un problema de fabricación en sus tarjetas gráficas RTX 5090 y 5070 Ti

Noticias

OpenAI expande su agente de IA Operator a múltiples países

Noticias

Anne Wojcicki presenta nueva oferta de 69 millones de euros para privatizar 23andMe

Noticias

Empleados de Meta discutieron «durante años» usar contenido con copyright para entrenar IA

Noticias

OpenAI planea reducir su dependencia tecnológica de Microsoft y migrar a infraestructura respaldada por SoftBank

Noticias

Jensen Huang, CEO de Nvidia: «el mercado malinterpretó el impacto de DeepSeek»

Ai2 presenta un nuevo modelo de IA que supera al líder chino DeepSeek

Un modelo de código abierto que marca la diferencia

Características técnicas y rendimiento

Innovación en el entrenamiento

Resultados sobresalientes en pruebas de referencia

Disponibilidad y acceso

Implicaciones para la competencia global en IA

Deja un comentario Cancelar la respuesta

LO ÚLTIMO

Noticias

Nvidia confirma un problema de fabricación en sus tarjetas gráficas RTX 5090 y 5070 Ti

Noticias

OpenAI expande su agente de IA Operator a múltiples países

Noticias

Anne Wojcicki presenta nueva oferta de 69 millones de euros para privatizar 23andMe

Noticias

Empleados de Meta discutieron «durante años» usar contenido con copyright para entrenar IA

Noticias

OpenAI planea reducir su dependencia tecnológica de Microsoft y migrar a infraestructura respaldada por SoftBank

Noticias

Jensen Huang, CEO de Nvidia: «el mercado malinterpretó el impacto de DeepSeek»