Zhipu AI, lanza GLM-4.5, un potente modelo de IA de código abierto capaz de crear PowerPoints

Droids

Updated on:

La startup china Zhipu AI, a menudo descrita como la respuesta de Pekín a OpenAI, ha sacudido el panorama de la inteligencia artificial con el lanzamiento de su nueva familia de modelos de código abierto, GLM-4.5. Este nuevo sistema no solo presume de un rendimiento que compite directamente con el aclamado GPT-4, sino que también introduce una innovadora funcionalidad que promete ahorrar horas de trabajo en oficinas de todo el mundo: la capacidad de crear presentaciones de PowerPoint completas a partir de una única instrucción.

Este movimiento estratégico posiciona a Zhipu AI (también conocida como Z.ai) como un actor clave en la carrera global de la IA, desafiando el dominio de los modelos cerrados y propietarios que han caracterizado a muchas de las grandes empresas tecnológicas de Occidente.

Un nuevo contendiente en la carrera de la IA global

En un sector cada vez más competitivo, el lanzamiento de la familia GLM-4.5 marca un hito significativo. A diferencia de modelos como GPT-4 de OpenAI o Claude 3 de Anthropic, que operan como sistemas cerrados, Zhipu AI ha optado por una estrategia de código abierto. Esto significa que el código y los pesos del modelo están disponibles públicamente, permitiendo a desarrolladores, investigadores y empresas de todo el mundo utilizar, modificar y construir sobre su tecnología libremente.

Los modelos ya están disponibles para la comunidad global a través de la popular plataforma Hugging Face, así como en la plataforma propia de la compañía, bigmodel.cn. Esta decisión democratiza el acceso a una IA de última generación, fomentando una mayor innovación y colaboración a nivel mundial.

La funcionalidad estrella: creación automática de presentaciones

Quizás la característica más llamativa y práctica del nuevo GLM-4.5 es su capacidad para generar un archivo de presentación de PowerPoint (formato .pptx) a partir de una simple instrucción de texto, conocida como prompt. Un usuario podría, por ejemplo, solicitar «crea una presentación de 10 diapositivas sobre el impacto del cambio climático en los arrecifes de coral» y el modelo produciría un archivo .pptx estructurado, con títulos, puntos clave y un diseño coherente.

Esta funcionalidad va más allá de la simple generación de texto. Demuestra una comprensión profunda de la estructura, el contenido y la finalidad de una presentación, convirtiendo una tarea que a menudo consume mucho tiempo en un proceso de segundos. Según el analista Dr. Li Wei, del AI Research Institute de Pekín, «la función de PowerPoint, aunque pueda parecer un nicho, es una demostración inteligente de aplicaciones prácticas y reales que pueden impulsar la adopción masiva del modelo», según afirmó en una entrevista con TechCrunch.

Rendimiento y capacidades técnicas a la altura de los mejores

Más allá de sus novedosas aplicaciones, la familia GLM-4.5 destaca por su potencia bruta. Según las pruebas de rendimiento publicadas por Zhipu AI, su modelo insignia, GLM-4.5-Chat-1M, supera a GPT-4-Turbo-0125, una de las versiones más avanzadas de OpenAI, en varias pruebas de referencia estándar de la industria como MMLU (comprensión masiva del lenguaje multitarea), GSM8K (razonamiento matemático), MATH (problemas matemáticos complejos) y HumanEval (generación de código).

El modelo cuenta con una ventana de contexto de 128.000 tokens, idéntica a la de GPT-4 Turbo. Este término técnico se refiere a la cantidad de información (texto, código, etc.) que el modelo puede procesar y «recordar» en una sola interacción, lo que le permite abordar tareas complejas y mantener conversaciones largas y coherentes.

Técnicamente, los modelos GLM-4.5 se basan en una arquitectura de Mezcla de Expertos (MoE). En lugar de utilizar una única y gigantesca red neuronal para todas las tareas, esta técnica emplea un sistema de múltiples redes más pequeñas y especializadas («expertos»). Un «enrutador» inteligente dirige cada parte de una consulta al experto más adecuado, lo que hace que el modelo sea significativamente más eficiente de entrenar y ejecutar sin sacrificar su rendimiento.

Un ecosistema completo de modelos especializados

Zhipu AI no se ha limitado a lanzar un único modelo. La familia GLM-4.5 es un ecosistema completo diseñado para diversas tareas:

  • GLM-4V-9B: Un modelo de visión multimodal, capaz de comprender y analizar el contenido de las imágenes.
  • CodeGeeX-4-ALL-9B: Especializado en la generación y comprensión de código de programación en múltiples lenguajes.
  • CogView-4: Un modelo de generación de imágenes, capaz de crear arte visual a partir de descripciones textuales.

Esta especialización permite a los usuarios elegir la herramienta más adecuada para cada necesidad específica, desde el análisis de datos visuales hasta el desarrollo de software.

El músculo financiero y tecnológico detrás de Zhipu AI

Zhipu AI no es un recién llegado. La empresa se ha consolidado como una de las startups de IA más importantes de China, con un fuerte respaldo de gigantes tecnológicos como Alibaba y Tencent. Recientemente, la compañía cerró una ronda de financiación de 400 millones de dólares (aproximadamente 370 millones de euros), elevando su valoración a más de 3.000 millones de dólares (unos 2.780 millones de euros).

Este respaldo financiero y tecnológico le ha permitido atraer talento de primer nivel y acometer proyectos de investigación y desarrollo a gran escala, compitiendo directamente con los laboratorios de IA más avanzados del mundo.

Una visión de apertura y el análisis de los expertos

El CEO de Zhipu AI, Zhang Peng, enmarcó este lanzamiento dentro de una visión más amplia de colaboración global. «Nuestro objetivo no es solo igualar el estado del arte, sino ampliar los límites de lo que es posible con los modelos abiertos», declaró en un comunicado de prensa oficial. «Hacer que estos modelos sean accesibles permite a la comunidad global construir sobre nuestro trabajo, fomentando la innovación para todos».

Esta estrategia de apertura es vista por los analistas como un movimiento audaz. El Dr. Li Wei señaló que «al hacer de código abierto un modelo de este calibre, están desafiando el dominio de los modelos cerrados de las empresas occidentales».

Con el lanzamiento de GLM-4.5, Zhipu AI no solo presenta una herramienta poderosa, sino que también lanza un guante en la arena de la inteligencia artificial. Es una declaración de intenciones que subraya el rápido avance tecnológico de China y refuerza la creciente importancia del software de código abierto como motor de la innovación futura.