La compañía francesa Mistral AI ha anunciado el lanzamiento de Devstral, un nuevo modelo de lenguaje de inteligencia artificial (IA) de código abierto diseñado específicamente para tareas de ingeniería de software. Con 24.000 millones de parámetros, Devstral destaca por su capacidad para ejecutarse en ordenadores portátiles, su alto rendimiento y una licencia permisiva que fomenta su adopción y modificación por parte de la comunidad de desarrolladores y empresas.
Mistral AI, conocida por su rápido ascenso desde el lanzamiento de su potente modelo fundacional de código abierto en otoño de 2023, busca con Devstral reafirmar su compromiso con la comunidad de código abierto. Este movimiento llega después de que la empresa recibiera algunas críticas por parte de desarrolladores en la red social X tras la presentación de Medium 3, un modelo de lenguaje grande (LLM) propietario, que algunos consideraron una desviación de sus raíces y promesas iniciales.
Para este nuevo proyecto, Mistral AI se ha asociado con la startup de código abierto All Hands AI, creadores de Open Devin. Juntos, han lanzado Devstral, un modelo que, a diferencia de los LLM tradicionales diseñados para completar fragmentos de código o generar funciones aisladas, está optimizado para actuar como un agente completo de ingeniería de software. Esto implica la capacidad de comprender el contexto a través de múltiples archivos, navegar por grandes bases de código y resolver problemas del mundo real.
"Queríamos lanzar algo abierto para la comunidad de desarrolladores y entusiastas, algo que puedan ejecutar localmente, de forma privada, y modificar como deseen", afirmó Baptiste Rozière, científico de investigación en Mistral AI, en declaraciones recogidas por VentureBeat. "Se publica bajo Apache 2.0, por lo que la gente puede hacer básicamente lo que quiera con él". El modelo está disponible gratuitamente bajo la permisiva licencia Apache 2.0, permitiendo su despliegue, modificación y comercialización sin restricciones.
Evolución desde Codestral
Devstral representa el siguiente paso en la creciente cartera de modelos de Mistral enfocados en el código, tras el éxito inicial con la serie Codestral. El primer Codestral, lanzado en mayo de 2024, fue la incursión inicial de Mistral en los LLM especializados en codificación. Con 22.000 millones de parámetros, fue entrenado para manejar más de 80 lenguajes de programación y se ganó una buena reputación por su rendimiento en tareas de generación y completado de código.
La popularidad y las fortalezas técnicas de Codestral llevaron a iteraciones rápidas, incluyendo Codestral-Mamba y, más recientemente, Codestral 25.01. Este impulso consolidó a Mistral como un actor clave en el ecosistema de modelos de codificación y sentó las bases para Devstral, extendiendo las capacidades desde completados rápidos hasta la ejecución de tareas completas por un agente.
Rendimiento Superior y Validación en Benchmarks
Una de las características más destacadas de Devstral es su rendimiento. Según la información proporcionada, el modelo alcanza una puntuación del 46,8% en el benchmark SWE-Bench Verified, un conjunto de datos de 500 problemas reales de GitHub validados manualmente para verificar su corrección. Este resultado lo sitúa por delante de todos los modelos de código abierto lanzados anteriormente y de varios modelos cerrados, incluyendo GPT-4.1-mini, al que supera en más de 20 puntos porcentuales.
"Actualmente, es, con bastante diferencia, el mejor modelo abierto para SWE-bench verified y para agentes de código", señaló Rozière. "Y también es un modelo muy pequeño, solo 24.000 millones de parámetros, que puedes ejecutar localmente, incluso en un MacBook".
Sophia Yang, Ph.D. y Jefa de Relaciones con Desarrolladores en Mistral AI, escribió en la red social X: "Comparamos Devstral con modelos cerrados y abiertos evaluados bajo cualquier andamiaje; encontramos que Devstral logra un rendimiento sustancialmente mejor que varias alternativas de código cerrado. Por ejemplo, Devstral supera al reciente GPT-4.1-mini en más de un 20%".
El modelo ha sido afinado a partir de Mistral Small 3.1 utilizando técnicas de aprendizaje por refuerzo y alineación de seguridad. "Partimos de un modelo base muy bueno con el control de árbol pequeño de Mistral, que ya funciona bien", explicó Rozière. "Luego lo especializamos usando técnicas de seguridad y aprendizaje por refuerzo para mejorar su rendimiento en SWE-bench".
Construido para la Era Agéntica
Devstral no es solo un modelo de generación de código; está optimizado para su integración en marcos agénticos como OpenHands, SWE-Agent y, notablemente, OpenDevin. Estos "andamios" (scaffolds) permiten a Devstral interactuar con casos de prueba, navegar por archivos fuente y ejecutar tareas de múltiples pasos en proyectos complejos.
"Lo estamos lanzando con OpenDevin, que es un andamiaje para agentes de código", comentó Rozière. "Nosotros construimos el modelo, y ellos construyen el andamiaje: un conjunto de prompts y herramientas que el modelo puede usar, como un backend para el modelo de desarrollador".
Para asegurar su robustez, el modelo fue probado en diversos repositorios y flujos de trabajo internos. "Fuimos muy cuidadosos para no sobreajustar a SWE-bench", detalló Rozière. "Entrenamos solo con datos de repositorios que no son clones del conjunto SWE-bench y validamos el modelo en diferentes marcos". Añadió que Mistral utilizó Devstral internamente ("dogfooding") para asegurar que generaliza bien a tareas nuevas y no vistas previamente.
Despliegue Eficiente y Licencia Permisiva para Uso Comercial
La arquitectura compacta de 24.000 millones de parámetros de Devstral lo hace práctico para que los desarrolladores lo ejecuten localmente, ya sea en una única GPU RTX 4090 o en un Mac con 32GB de RAM. Esto lo convierte en una opción atractiva para casos de uso sensibles a la privacidad y para despliegues en el borde (edge computing).
"Este modelo está dirigido a entusiastas y personas que se preocupan por ejecutar algo localmente y de forma privada, algo que puedan usar incluso en un avión sin internet", dijo Rozière.
Más allá del rendimiento y la portabilidad, su licencia Apache 2.0 ofrece una propuesta convincente para aplicaciones comerciales. La licencia permite el uso, adaptación y distribución sin restricciones, incluso para productos propietarios, haciendo de Devstral una opción de baja fricción para la adopción empresarial.
Las especificaciones detalladas y las instrucciones de uso están disponibles en la ficha del modelo Devstral-Small-2505 en Hugging Face. El modelo cuenta con una ventana de contexto de 128.000 tokens y utiliza el tokenizador Tekken con un vocabulario de 131.000. Es compatible con las principales plataformas de código abierto, incluyendo Hugging Face, Ollama, Kaggle, LM Studio y Unsloth, y funciona bien con bibliotecas como vLLM, Transformers y Mistral Inference.
Disponible Vía API o Localmente
Devstral es accesible a través de la API Le Platforme de Mistral bajo el nombre de modelo devstral-small-2505. El precio se ha fijado en 0,10 dólares (aproximadamente 0,092 €) por millón de tokens de entrada y 0,30 dólares (aproximadamente 0,276 €) por millón de tokens de salida.
Para aquellos que opten por el despliegue local, el soporte para marcos como OpenHands permite la integración con bases de código y flujos de trabajo agénticos de forma nativa. Rozière compartió cómo incorpora Devstral en su propio flujo de desarrollo: "Lo uso yo mismo. Puedes pedirle que haga pequeñas tareas, como actualizar la versión de un paquete o modificar un script de tokenización. Encuentra el lugar correcto en tu código y realiza los cambios. Es realmente agradable de usar".
Más por Venir
Aunque Devstral se lanza actualmente como una vista previa de investigación, Mistral AI y All Hands AI ya están trabajando en un modelo de seguimiento más grande con capacidades ampliadas. "Siempre habrá una brecha entre los modelos más pequeños y los más grandes", señaló Rozière, "pero hemos avanzado mucho en cerrarla. Estos modelos ya rinden muy bien, incluso en comparación con algunos competidores más grandes".
Con sus impresionantes benchmarks de rendimiento, su licencia permisiva y su diseño agéntico, Devstral se posiciona no solo como una herramienta de generación de código, sino como un modelo fundacional para la construcción de sistemas autónomos de ingeniería de software.






