Investigadores de las universidades de Stanford y Washington han logrado desarrollar un modelo de inteligencia artificial "razonador" por menos de 46€ en créditos de computación en la nube, demostrando que es posible crear alternativas competitivas a los costosos modelos comerciales a una fracción del precio.
Un nuevo competidor en el campo del razonamiento artificial
El modelo, denominado s1, ha demostrado un rendimiento similar a los modelos de razonamiento más avanzados del mercado, como el o1 de OpenAI y el R1 de DeepSeek, especialmente en pruebas que miden capacidades matemáticas y de programación. Lo más destacable es que tanto el modelo como el código y los datos utilizados para su entrenamiento están disponibles públicamente en GitHub.
Metodología innovadora y bajo costo
El equipo utilizó un enfoque innovador basado en la "destilación", un proceso que permite extraer las capacidades de razonamiento de otro modelo de IA mediante el entrenamiento con sus respuestas. En este caso, los investigadores aprovecharon el modelo Gemini 2.0 Flash Thinking Experimental de Google como base para el proceso.
Para el entrenamiento, los investigadores:
- Comenzaron con un modelo base de código abierto de Qwen (laboratorio chino propiedad de Alibaba)
- Crearon un conjunto de datos de 1.000 preguntas cuidadosamente seleccionadas
- Utilizaron las respuestas y procesos de pensamiento del modelo Gemini de Google
- Completaron el entrenamiento en menos de 30 minutos usando 16 GPUs Nvidia H100
Niklas Muennighoff, investigador de Stanford involucrado en el proyecto, señaló a TechCrunch que el costo actual de alquiler del poder computacional necesario sería de aproximadamente 19€.
Controversia en la industria
El desarrollo de s1 ha generado debate sobre la protección de la propiedad intelectual en el campo de la IA. OpenAI ha acusado recientemente a DeepSeek de recolectar datos de forma inadecuada de su API para realizar destilación de modelos, según informó el New York Times.
Implicaciones para el futuro de la IA
Este desarrollo plantea preguntas importantes sobre el futuro de la innovación en IA. Mientras que grandes empresas como Meta, Google y Microsoft planean invertir cientos de miles de millones de dólares en infraestructura de IA durante 2025, proyectos como s1 demuestran que es posible lograr avances significativos con recursos mucho más limitados.
Sin embargo, los expertos señalan que la destilación, aunque efectiva para replicar capacidades existentes, puede no ser suficiente para crear modelos que superen significativamente a los actuales. Esto sugiere que las grandes inversiones en investigación y desarrollo siguen siendo necesarias para impulsar avances fundamentales en el campo.
Innovaciones técnicas destacables
Un aspecto particularmente interesante del modelo s1 es su capacidad para "pensar" antes de responder. Los investigadores descubrieron que simplemente añadiendo la palabra "wait" (esperar) durante el proceso de razonamiento del modelo, este conseguía producir respuestas más precisas.
El desarrollo de s1 representa un hito importante en la democratización de la tecnología de IA, demostrando que es posible crear modelos competitivos con recursos limitados. Sin embargo, también plantea importantes debates sobre la propiedad intelectual y el futuro de la innovación en el campo de la inteligencia artificial.