Hugging Face ha anunciado el lanzamiento de Open-R1, un ambicioso proyecto que busca reproducir de manera completamente abierta el modelo de inteligencia artificial DeepSeek-R1, centrándose especialmente en sus capacidades de razonamiento matemático y lógico.
El origen: DeepSeek-R1
La semana pasada, DeepSeek sorprendió a la comunidad tecnológica con el lanzamiento de DeepSeek-R1, un modelo de lenguaje que demostró capacidades excepcionales en tareas de razonamiento. Lo que lo hace particularmente interesante es que viene acompañado de un informe técnico detallado que explica su funcionamiento, aunque sin revelar el código fuente ni los conjuntos de datos utilizados.
El modelo se basa en DeepSeek-V3, una arquitectura que costó aproximadamente 5.5 millones de dólares (unos 5.1 millones de euros) en entrenamiento y que compite en rendimiento con modelos como GPT-4o y Sonnet 3.5.
El proyecto Open-R1: reproducción completa y abierta
La iniciativa Open-R1 tiene como objetivo principal reconstruir sistemáticamente tanto los datos como el proceso de entrenamiento de DeepSeek-R1, validando sus afirmaciones y ampliando las fronteras de los modelos de razonamiento de código abierto.
Plan de implementación en tres fases
El proyecto se desarrollará en tres etapas principales:
-
Replicación de R1-Distill: Se creará un conjunto de datos de razonamiento de alta calidad destilado de DeepSeek-R1.
-
Reproducción del pipeline de RL: Se replicará el sistema de aprendizaje por refuerzo puro, incluyendo la creación de nuevos conjuntos de datos para matemáticas, razonamiento y código.
-
Entrenamiento multietapa: Se demostrará la progresión desde el modelo base hasta el entrenamiento por refuerzo.
Más allá de las matemáticas
Los responsables del proyecto destacan que su alcance no se limitará a las matemáticas. Se explorarán otras áreas como la programación y campos científicos como la medicina, donde los modelos de razonamiento podrían tener un impacto significativo.
Llamado a la colaboración
Hugging Face ha hecho un llamado a la comunidad para participar en el proyecto, ya sea contribuyendo con código o uniéndose a las discusiones en la plataforma de Hugging Face. El objetivo es crear un esfuerzo colaborativo que beneficie a toda la comunidad de investigación y desarrollo en inteligencia artificial.
La iniciativa representa un paso importante hacia la democratización de los modelos de IA avanzados, permitiendo que más investigadores y desarrolladores puedan acceder y mejorar estas tecnologías de razonamiento artificial.