Mistral AI lanza Small 3.1, un modelo de IA de alto rendimiento bajo licencia abierta

Droids

Mistral AI lanza Small 3.1, un modelo de IA de alto rendimiento bajo licencia abierta

Mistral AI ha anunciado hoy el lanzamiento de Mistral Small 3.1, un nuevo modelo de inteligencia artificial que, según la empresa, se posiciona como "el mejor modelo en su categoría de peso". Esta nueva versión mejora el rendimiento de texto, la comprensión multimodal y amplía la ventana de contexto hasta 128.000 tokens, superando a competidores comparables como Gemma 3 y GPT-4o Mini, mientras ofrece velocidades de inferencia de 150 tokens por segundo.

Lo que distingue particularmente a este modelo es su disponibilidad bajo licencia Apache 2.0, lo que lo convierte en una alternativa de código abierto a modelos propietarios de características similares.

Un nuevo referente en modelos de IA

De acuerdo con la información proporcionada por Mistral AI, Small 3.1 es el primer modelo de código abierto que no solo iguala sino que supera el rendimiento de los principales modelos pequeños propietarios en múltiples dimensiones. Las aplicaciones modernas de IA exigen una combinación de capacidades: procesamiento de texto, comprensión de entradas multimodales, soporte para varios idiomas y gestión de contextos extensos, todo ello con baja latencia y eficiencia de costes.

"Estamos impresionados con cómo la comunidad construye sobre los modelos abiertos de Mistral", señala la compañía en su anuncio, destacando ejemplos recientes como el modelo de razonamiento DeepHermes 24B desarrollado por Nous Research sobre la base de Mistral Small 3.

Capacidades técnicas mejoradas

Mistral Small 3.1 representa una evolución de su predecesor, Mistral Small 3, con mejoras significativas en tres áreas clave:

  1. Rendimiento de texto mejorado: El modelo muestra un rendimiento superior en benchmarks de instrucciones de texto como GPQA, MMLU y evaluaciones de razonamiento matemático.

  2. Comprensión multimodal: Incorpora capacidades avanzadas para entender y procesar imágenes junto con texto, con buen desempeño en pruebas como MM-MT-Bench y ChartQA.

  3. Contexto expandido: La ventana de contexto se ha ampliado hasta 128.000 tokens, lo que permite al modelo manejar documentos y conversaciones mucho más extensos.

La empresa ha publicado comparativas de rendimiento detalladas en diversas pruebas, mostrando cómo su modelo se compara favorablemente con otros modelos líderes tanto propietarios como de código abierto.

Versatilidad y casos de uso

Mistral Small 3.1 ha sido diseñado para manejar una amplia gama de tareas de IA generativa, que incluyen:

  • Seguimiento de instrucciones
  • Asistencia conversacional
  • Comprensión de imágenes
  • Llamadas a funciones

Esta versatilidad lo convierte en una base sólida tanto para aplicaciones empresariales como para servicios orientados al consumidor.

Características principales

Ligero y eficiente

Una de las ventajas más destacables del modelo es su eficiencia. Según Mistral AI, el modelo puede ejecutarse en una sola tarjeta gráfica RTX 4090 o en un Mac con 32GB de RAM, lo que lo hace ideal para casos de uso en dispositivos locales sin necesidad de infraestructura compleja en la nube.

Respuesta conversacional rápida

El modelo está optimizado para proporcionar respuestas rápidas y precisas, lo que lo hace ideal para asistentes virtuales y otras aplicaciones donde la inmediatez es esencial.

Llamadas a funciones de baja latencia

Mistral Small 3.1 es capaz de ejecutar funciones rápidamente dentro de flujos de trabajo automatizados o basados en agentes, una característica crucial para aplicaciones profesionales.

Ajuste fino para dominios especializados

El modelo puede ajustarse para especializarse en dominios específicos, creando expertos en materias concretas. Esto resulta particularmente útil en campos como el asesoramiento legal, los diagnósticos médicos y el soporte técnico.

Aplicaciones prácticas

Mistral AI destaca que su modelo puede utilizarse en diversos escenarios empresariales y de consumo que requieren comprensión multimodal, como:

  • Verificación de documentos
  • Diagnósticos
  • Procesamiento de imágenes en dispositivos
  • Inspección visual para controles de calidad
  • Detección de objetos en sistemas de seguridad
  • Soporte al cliente basado en imágenes
  • Asistencia de propósito general

Disponibilidad y acceso

Mistral Small 3.1 está disponible para descargar en la plataforma Hugging Face en dos versiones: Mistral Small 3.1 Base y Mistral Small 3.1 Instruct. Para implementaciones empresariales con infraestructura de inferencia privada y optimizada, la empresa recomienda contactar directamente con ellos.

Además, el modelo puede probarse a través de la API en el playground para desarrolladores de Mistral AI, La Plateforme, disponible desde hoy mismo. También está disponible en Google Cloud Vertex AI y estará disponible en NVIDIA NIM en las próximas semanas.

Este lanzamiento refuerza la posición de Mistral AI como un actor relevante en el campo de la inteligencia artificial generativa, ofreciendo modelos de alto rendimiento que combinan la accesibilidad del código abierto con capacidades avanzadas previamente disponibles solo en soluciones propietarias.

Deja un comentario