OpenAI lanza o3 y o4-mini, sus nuevos modelos de razonamiento con capacidades avanzadas

Droids

Updated on:

OpenAI lanza o3 y o4-mini, sus nuevos modelos de razonamiento con capacidades avanzadas

OpenAI ha anunciado este miércoles el lanzamiento de o3 y o4-mini, dos nuevos modelos de inteligencia artificial diseñados específicamente para realizar pausas y trabajar a través de preguntas antes de ofrecer una respuesta. Según la compañía, o3 es su modelo de razonamiento más avanzado hasta la fecha, superando a versiones anteriores en pruebas que miden capacidades matemáticas, de codificación, razonamiento, ciencia y comprensión visual.

Junto con estos dos modelos principales, la empresa también ha presentado una variante llamada "o4-mini-high", que dedica más tiempo a elaborar respuestas para mejorar su fiabilidad. Todos estos modelos ya están disponibles para los suscriptores de los planes Pro, Plus y Team de OpenAI.

Características y capacidades avanzadas

El modelo o3 ha conseguido un rendimiento de vanguardia en la prueba SWE-bench verified (sin estructuración personalizada), una evaluación que mide habilidades de codificación, alcanzando una puntuación del 69,1%. No muy por detrás, el modelo o4-mini logra un rendimiento similar con un 68,1% en la misma prueba. Para poner estas cifras en contexto, el anterior modelo de OpenAI, o3-mini, obtuvo un 49,3%, mientras que Claude 3.7 Sonnet de Anthropic alcanzó un 62,3%.

Según OpenAI, estos nuevos modelos representan un salto significativo en sus capacidades de razonamiento, siendo parte del esfuerzo de la compañía por mantenerse a la vanguardia frente a competidores como Google, Meta, xAI, Anthropic y DeepSeek en la disputada carrera global por el desarrollo de la IA.

Es interesante destacar que o3 estuvo a punto de no ser lanzado en ChatGPT. Sam Altman, CEO de OpenAI, había indicado en febrero que la compañía planeaba dedicar más recursos a una alternativa sofisticada que incorporaría la tecnología de o3. Sin embargo, la presión competitiva parece haber impulsado a OpenAI a cambiar de rumbo.

Integración con herramientas y nuevas funcionalidades

A diferencia de los modelos de razonamiento anteriores, tanto o3 como o4-mini pueden generar respuestas utilizando herramientas disponibles en ChatGPT, como navegación web, ejecución de código Python, procesamiento de imágenes y generación de imágenes.

OpenAI afirma que estos son sus primeros modelos capaces de "pensar con imágenes". En la práctica, esto significa que los usuarios pueden cargar imágenes en ChatGPT, como esbozos de pizarra o diagramas de PDF, y los modelos analizarán estas imágenes durante su fase de "cadena de pensamiento" antes de responder. Gracias a esta nueva capacidad, o3 y o4-mini pueden comprender imágenes borrosas y de baja calidad, y realizar tareas como ampliar o rotar imágenes mientras razonan.

Además, ambos modelos pueden ejecutar y ejecutar código Python directamente en el navegador a través de la función Canvas de ChatGPT, así como buscar en la web cuando se les pregunta sobre eventos actuales.

Disponibilidad y precios

Los tres modelos —o3, o4-mini y o4-mini-high— están disponibles tanto a través de ChatGPT como mediante las API de desarrollador de OpenAI: Chat Completions API y Responses API. Esto permite a los ingenieros construir aplicaciones con los modelos de la compañía a tarifas basadas en el uso.

OpenAI ha establecido un precio relativamente bajo para o3, considerando su rendimiento mejorado: 10 dólares (aproximadamente 9,20 euros) por millón de tokens de entrada (equivalente a unas 750.000 palabras, más largo que la serie "El Señor de los Anillos") y 40 dólares (unos 36,80 euros) por millón de tokens de salida.

Para o4-mini, la compañía cobra lo mismo que para o3-mini: 1,10 dólares (aproximadamente 1,01 euros) por millón de tokens de entrada y 4,40 dólares (unos 4,05 euros) por millón de tokens de salida.

El futuro de los modelos de razonamiento de OpenAI

En las próximas semanas, OpenAI planea lanzar o3-pro, una versión de o3 que utiliza más recursos computacionales para producir sus respuestas, exclusivamente para suscriptores de ChatGPT Pro.

Sam Altman, CEO de OpenAI, ha indicado que o3 y o4-mini podrían ser los últimos modelos de razonamiento independientes en ChatGPT antes del lanzamiento de GPT-5, un modelo que según la compañía unificará los modelos tradicionales como GPT-4.1 con sus modelos de razonamiento.

Este lanzamiento se produce en un momento en que los modelos de razonamiento han comenzado a dominar el campo, ya que los laboratorios de IA buscan obtener más rendimiento de sus sistemas. Aunque OpenAI fue la primera en lanzar un modelo de razonamiento (o1), los competidores rápidamente siguieron con sus propias versiones que igualan o superan el rendimiento de la línea de productos de OpenAI.

Implicaciones para el sector de la IA

El lanzamiento de estos nuevos modelos de razonamiento representa un paso significativo en la evolución de los sistemas de inteligencia artificial conversacional. La capacidad de "pensar con imágenes" y utilizar herramientas externas abre nuevas posibilidades para aplicaciones prácticas en campos como la programación, la educación y la investigación científica.

La estrategia de precios de OpenAI para estos modelos también sugiere un enfoque en democratizar el acceso a capacidades avanzadas de IA, permitiendo que más desarrolladores puedan integrar estas tecnologías en sus aplicaciones a un coste razonable.

Con el futuro lanzamiento de GPT-5 en el horizonte, que supuestamente unificará modelos tradicionales y de razonamiento, estos lanzamientos pueden verse como pasos intermedios pero cruciales en la hoja de ruta de OpenAI hacia sistemas de IA cada vez más capaces y versátiles.

Deja un comentario