Hugging Face lanza iniciativa para recrear el modelo de IA DeepSeek-R1 de forma completamente abierta

Hugging Face ha anunciado el lanzamiento de Open-R1, un ambicioso proyecto que busca reproducir de manera completamente abierta el modelo de inteligencia artificial DeepSeek-R1, centrándose especialmente en sus capacidades de razonamiento matemático y lógico.

El origen: DeepSeek-R1

La semana pasada, DeepSeek sorprendió a la comunidad tecnológica con el lanzamiento de DeepSeek-R1, un modelo de lenguaje que demostró capacidades excepcionales en tareas de razonamiento. Lo que lo hace particularmente interesante es que viene acompañado de un informe técnico detallado que explica su funcionamiento, aunque sin revelar el código fuente ni los conjuntos de datos utilizados.

El modelo se basa en DeepSeek-V3, una arquitectura que costó aproximadamente 5.5 millones de dólares (unos 5.1 millones de euros) en entrenamiento y que compite en rendimiento con modelos como GPT-4o y Sonnet 3.5.

El proyecto Open-R1: reproducción completa y abierta

La iniciativa Open-R1 tiene como objetivo principal reconstruir sistemáticamente tanto los datos como el proceso de entrenamiento de DeepSeek-R1, validando sus afirmaciones y ampliando las fronteras de los modelos de razonamiento de código abierto.

Plan de implementación en tres fases

El proyecto se desarrollará en tres etapas principales:

Replicación de R1-Distill: Se creará un conjunto de datos de razonamiento de alta calidad destilado de DeepSeek-R1.
Reproducción del pipeline de RL: Se replicará el sistema de aprendizaje por refuerzo puro, incluyendo la creación de nuevos conjuntos de datos para matemáticas, razonamiento y código.
Entrenamiento multietapa: Se demostrará la progresión desde el modelo base hasta el entrenamiento por refuerzo.

Más allá de las matemáticas

Los responsables del proyecto destacan que su alcance no se limitará a las matemáticas. Se explorarán otras áreas como la programación y campos científicos como la medicina, donde los modelos de razonamiento podrían tener un impacto significativo.

Llamado a la colaboración

Hugging Face ha hecho un llamado a la comunidad para participar en el proyecto, ya sea contribuyendo con código o uniéndose a las discusiones en la plataforma de Hugging Face. El objetivo es crear un esfuerzo colaborativo que beneficie a toda la comunidad de investigación y desarrollo en inteligencia artificial.

La iniciativa representa un paso importante hacia la democratización de los modelos de IA avanzados, permitiendo que más investigadores y desarrolladores puedan acceder y mejorar estas tecnologías de razonamiento artificial.

El origen: DeepSeek-R1

El proyecto Open-R1: reproducción completa y abierta

Plan de implementación en tres fases

Más allá de las matemáticas

Llamado a la colaboración

Noticias

OpenAI aclara que no busca una garantía del gobierno para su infraestructura

Noticias

Google presenta Ironwood, su nuevo chip de IA para competir con Nvidia

Noticias

La IA multiplica por 11 los pedidos en Shopify desde enero

Noticias

La justicia británica da la razón a Stability AI en su juicio contra Getty

Noticias

Anthropic proyecta 70.000 millones de ingresos en 2028 impulsada por las empresas

Noticias

Studio Ghibli y editoriales japonesas exigen a OpenAI no entrenar su IA con sus obras

Hugging Face lanza iniciativa para recrear el modelo de IA DeepSeek-R1 de forma completamente abierta

El origen: DeepSeek-R1

El proyecto Open-R1: reproducción completa y abierta

Plan de implementación en tres fases

Más allá de las matemáticas

Llamado a la colaboración

LO ÚLTIMO

Noticias

OpenAI aclara que no busca una garantía del gobierno para su infraestructura

Noticias

Google presenta Ironwood, su nuevo chip de IA para competir con Nvidia

Noticias

La IA multiplica por 11 los pedidos en Shopify desde enero

Noticias

La justicia británica da la razón a Stability AI en su juicio contra Getty

Noticias

Anthropic proyecta 70.000 millones de ingresos en 2028 impulsada por las empresas

Noticias

Studio Ghibli y editoriales japonesas exigen a OpenAI no entrenar su IA con sus obras