Alibaba lanza un modelo de IA de razonamiento que desafía al o1 de OpenAI

Droids

Updated on:

Alibaba lanza un modelo de IA de razonamiento que desafía al o1 de OpenAI

Alibaba ha dado un paso significativo en el campo de la inteligencia artificial con el lanzamiento de QwQ-32B-Preview, un nuevo modelo de «razonamiento» que se presenta como competidor directo del o1 de OpenAI, con la particularidad de ser el primero disponible bajo una licencia permisiva.

Un nuevo competidor en el campo del razonamiento artificial

El modelo, desarrollado por el equipo Qwen de Alibaba, cuenta con 32.5 mil millones de parámetros y tiene la capacidad de procesar textos de hasta aproximadamente 32,000 palabras. Según TechCrunch, esta nueva IA supera a los modelos o1-preview y o1-mini de OpenAI en ciertos puntos de referencia importantes, específicamente en las pruebas AIME y MATH.

Características técnicas y capacidades

QwQ-32B-Preview se distingue por su capacidad de «razonamiento», que le permite:

  • Resolver puzzles lógicos
  • Abordar problemas matemáticos complejos
  • Realizar autoverificación de datos
  • Planificar y ejecutar series de acciones para encontrar soluciones

Sin embargo, el modelo también presenta algunas limitaciones. Alibaba reconoce que puede cambiar de idioma inesperadamente, quedarse atascado en bucles y mostrar un rendimiento inferior en tareas que requieren «razonamiento de sentido común».

Un modelo «abierto» con matices

Aunque el modelo se promociona como «abierto» y está disponible bajo una licencia Apache 2.0, que permite su uso comercial, es importante señalar que solo se han liberado ciertos componentes. Esta restricción hace imposible replicar completamente el modelo o estudiar en profundidad su funcionamiento interno.

El contexto político y sus implicaciones

Como empresa china, Alibaba está sujeta a regulaciones específicas que afectan al comportamiento de su IA. El modelo muestra restricciones claras en temas políticamente sensibles, siguiendo las directrices del regulador de internet chino que requiere que las respuestas de la IA «incorporen valores socialistas fundamentales».

El futuro de la IA de razonamiento

Este lanzamiento se produce en un momento crucial para la industria de la IA, cuando las grandes empresas están buscando nuevos enfoques debido a los rendimientos decrecientes de los métodos tradicionales. Google, por ejemplo, ha expandido significativamente su equipo dedicado a modelos de razonamiento, llegando a aproximadamente 200 personas.

Implicaciones para el sector

El lanzamiento de QwQ-32B-Preview representa un avance significativo en el campo de la IA de razonamiento y sugiere un cambio en la dirección de la investigación en IA. La tecnología de «compute test-time» que utiliza, que proporciona tiempo adicional de procesamiento para completar tareas, podría marcar una nueva tendencia en el desarrollo de modelos de IA más sofisticados.

Este desarrollo se produce en un momento en que la industria de la IA está buscando alternativas a las estrategias tradicionales de escalado, ya que los modelos de grandes empresas como OpenAI, Google y Anthropic muestran signos de alcanzar límites en sus mejoras de rendimiento mediante los métodos convencionales.

Deja un comentario