Microsoft ha presentado tres nuevos modelos de inteligencia artificial "abiertos" que, a pesar de su tamaño relativamente pequeño, logran un rendimiento comparable al de sistemas mucho más grandes. El más avanzado de estos modelos es capaz de competir con el o3-mini de OpenAI en al menos una prueba de referencia, según anunció la compañía el miércoles.
Los nuevos modelos de razonamiento Phi 4
Los tres nuevos modelos lanzados por Microsoft —Phi 4 mini reasoning, Phi 4 reasoning y Phi 4 reasoning plus— están diseñados específicamente como "modelos de razonamiento", lo que significa que pueden dedicar más tiempo a verificar soluciones para problemas complejos.
Estos modelos amplían la familia de "pequeños modelos" Phi que la empresa lanzó hace un año con el objetivo de ofrecer una base para desarrolladores de IA que construyen aplicaciones para dispositivos con recursos limitados.
Características y capacidades de cada modelo
Phi 4 mini reasoning
Este es el modelo más pequeño de la nueva serie, con aproximadamente 3.800 millones de parámetros. Fue entrenado utilizando alrededor de un millón de problemas matemáticos sintéticos generados por el modelo de razonamiento R1 de la startup china DeepSeek.
Microsoft indica que este modelo está diseñado principalmente para aplicaciones educativas, como "tutoría integrada" en dispositivos ligeros.
Phi 4 reasoning
Con 14.000 millones de parámetros, este modelo de tamaño medio fue entrenado utilizando datos web de "alta calidad", así como "demostraciones curadas" del modelo o3-mini de OpenAI. Según Microsoft, es especialmente adecuado para aplicaciones de matemáticas, ciencias y programación.
Phi 4 reasoning plus
Este es el modelo más avanzado de la serie, una adaptación del Phi 4 anterior de Microsoft convertido en un modelo de razonamiento para lograr mayor precisión en tareas específicas. La compañía afirma que Phi 4 reasoning plus se acerca a los niveles de rendimiento del DeepSeek R1, que tiene significativamente más parámetros (671.000 millones).
Los benchmarks internos de Microsoft también sugieren que Phi 4 reasoning plus iguala al o3-mini de OpenAI en OmniMath, una prueba de habilidades matemáticas.
La importancia de los parámetros en la IA
Para entender la relevancia de estos nuevos modelos, es importante comprender qué son los parámetros en un modelo de IA. Los parámetros corresponden aproximadamente a las habilidades de resolución de problemas de un modelo, y generalmente, aquellos con más parámetros ofrecen mejor rendimiento que los que tienen menos.
El logro de Microsoft con estos nuevos modelos radica en conseguir un alto rendimiento con un número relativamente bajo de parámetros, lo que permite su uso en dispositivos con recursos limitados.
Disponibilidad y licencia
Todos los modelos —Phi 4 mini reasoning, Phi 4 reasoning, Phi 4 reasoning plus— junto con sus informes técnicos detallados, están disponibles en Hugging Face, la plataforma de desarrollo de IA. Microsoft ha decidido lanzarlos bajo licencias permisivas, lo que facilita su uso por parte de desarrolladores e investigadores.
La estrategia de Microsoft con los pequeños modelos
"Utilizando destilación, aprendizaje por refuerzo y datos de alta calidad, estos modelos equilibran tamaño y rendimiento", escribió Microsoft en una entrada de blog. "Son lo suficientemente pequeños para entornos de baja latencia, pero mantienen fuertes capacidades de razonamiento que rivalizan con modelos mucho más grandes. Esta combinación permite que incluso dispositivos con recursos limitados realicen tareas de razonamiento complejas de manera eficiente".
Esta estrategia de desarrollo de modelos pequeños pero potentes representa una dirección importante en el campo de la IA, donde tradicionalmente se ha asociado mayor capacidad con modelos más grandes que requieren infraestructuras computacionales más robustas.
El contexto del mercado de la IA
El lanzamiento de estos modelos se produce en un momento en que varias empresas tecnológicas compiten por desarrollar modelos de IA cada vez más eficientes. La particularidad del enfoque de Microsoft con los modelos Phi es priorizar la eficiencia y el rendimiento en dispositivos con limitaciones de recursos, en lugar de simplemente aumentar el tamaño de los modelos.
Esto podría tener importantes implicaciones para la implementación de IA en dispositivos móviles, electrónica de consumo y otras aplicaciones donde los recursos computacionales son limitados pero se requiere un procesamiento inteligente.
Impacto potencial
Los nuevos modelos Phi 4 podrían democratizar el acceso a capacidades avanzadas de IA al permitir su funcionamiento en hardware más modesto. Aplicaciones como la tutoría educativa, asistentes de programación, o sistemas de análisis científico podrían implementarse en dispositivos que anteriormente no tenían la capacidad de ejecutar modelos de IA sofisticados.
Para los desarrolladores, estos modelos ofrecen la oportunidad de crear aplicaciones más inteligentes sin necesidad de depender de conexiones a servidores remotos o infraestructuras cloud costosas, lo que podría resultar en experiencias más rápidas, privadas y accesibles para los usuarios finales.
La capacidad de los modelos pequeños para competir con sistemas mucho más grandes representa un avance significativo en el campo de la IA y subraya el progreso continuo en la optimización de estos sistemas. Microsoft continúa así expandiendo su oferta en el espacio de la IA, con un enfoque particular en modelos que equilibran el tamaño, el rendimiento y la accesibilidad.






