Investigadores lanzan Sky-T1, una IA de razonamiento open source que cuesta menos de 415€ entrenar

Droids

Investigadores lanzan Sky-T1, una IA de razonamiento open source que cuesta menos de 415€ entrenar

Un equipo de investigadores de la Universidad de California en Berkeley ha dado un paso significativo hacia la democratización de la inteligencia artificial al presentar Sky-T1, un modelo de IA de razonamiento que puede entrenarse por menos de 450 dólares (aproximadamente 415€), una fracción del costo tradicional de estos sistemas.

Un avance revolucionario en costos

El equipo NovaSky, perteneciente al Sky Computing Lab de UC Berkeley, anunció el viernes el lanzamiento de Sky-T1-32B-Preview, marcando un hito en la accesibilidad de los modelos de IA de razonamiento. Este desarrollo es particularmente notable considerando que, hasta hace poco, el entrenamiento de modelos similares podía costar millones de dólares.

¿Qué hace especial a Sky-T1?

Los modelos de IA de razonamiento se distinguen por su capacidad de "autocomprobación", lo que les permite evitar errores comunes en otros sistemas de IA. Aunque requieren más tiempo para procesar información -desde segundos hasta minutos adicionales-, ofrecen mayor fiabilidad en áreas como física, ciencias y matemáticas.

El sistema utiliza 32 mil millones de parámetros y fue entrenado durante aproximadamente 19 horas utilizando ocho GPUs Nvidia H100. Para su desarrollo, el equipo empleó una combinación innovadora de recursos:

  • Datos de entrenamiento inicial generados por QwQ-32B-Preview de Alibaba
  • Refinamiento mediante GPT-4o-mini de OpenAI
  • Curación específica de los datos para optimizar el rendimiento

Rendimiento frente a la competencia

Sky-T1 ha demostrado resultados prometedores en diversas pruebas:

  • Supera a la versión preliminar de o1 de OpenAI en MATH500, una colección de problemas matemáticos de nivel competitivo
  • Mejores resultados en LiveCodeBench, una evaluación de programación
  • Sin embargo, muestra un rendimiento inferior en GPQA-Diamond, que evalúa conocimientos de nivel doctorado en física, biología y química

El futuro del proyecto

El equipo de NovaSky ha expresado su compromiso con el desarrollo continuo del modelo. "Nos centraremos en desarrollar modelos más eficientes que mantengan un fuerte rendimiento de razonamiento y en explorar técnicas avanzadas que mejoren aún más la eficiencia y precisión de los modelos en tiempo de prueba", señalaron en su blog.

Este desarrollo se produce en un momento de rápida evolución en el campo de la IA de razonamiento. OpenAI está preparando el lanzamiento de o3, una versión mejorada de su modelo actual, en las próximas semanas.

Importancia para el sector

La llegada de Sky-T1 representa un punto de inflexión en la democratización de la IA avanzada. Como referencia, modelos recientes como Palmyra X 004 de Writer, que utiliza datos sintéticos, costó aproximadamente 700,000 dólares (645,000€) en su desarrollo, lo que hace que el costo de Sky-T1 sea extraordinariamente bajo en comparación.

La naturaleza completamente open source del proyecto, incluyendo el código de entrenamiento y los conjuntos de datos utilizados, permite que otros investigadores y desarrolladores puedan replicar y mejorar el modelo, fomentando la innovación colaborativa en el campo de la IA de razonamiento.

Deja un comentario