Manus usa Claude y otros modelos, y no está a la altura de las expectativas generadas

Droids

Updated on:

Manus: El asistente de IA chino que no está a la altura de las expectativas generadas

El fenómeno de la inteligencia artificial agéntica (sistemas de IA que pueden actuar de forma autónoma para realizar tareas complejas) tiene un nuevo protagonista: Manus. Esta plataforma china, lanzada en versión preliminar la semana pasada, ha generado una expectación comparable a un concierto de Taylor Swift, pero las pruebas iniciales sugieren que estamos ante un caso donde el entusiasmo se ha adelantado a la realidad tecnológica.

El origen de la expectación

El revuelo comenzó cuando figuras importantes del sector tecnológico empezaron a alabar las capacidades de Manus. El responsable de producto en Hugging Face calificó a Manus como «la herramienta de IA más impresionante que he probado». Por su parte, el investigador de políticas de IA Dean Ball describió la plataforma como «el ordenador más sofisticado que utiliza IA».

Este bombo publicitario tuvo un efecto inmediato: el servidor oficial de Discord para Manus creció hasta superar los 138.000 miembros en solo unos días, y los códigos de invitación se venden supuestamente por miles de euros en Xianyu, una aplicación china de reventa.

La empresa desarrolladora, The Butterfly Effect, presenta en su sitio web ejemplos sorprendentes de lo que Manus puede supuestamente lograr, desde comprar bienes inmuebles hasta programar videojuegos. Yichao «Peak» Ji, líder de investigación de Manus, sugirió en un vídeo viral que la plataforma era superior a herramientas de IA agéntica como Deep Research y Operator de OpenAI.

La realidad tras las pruebas

Sin embargo, muchos usuarios iniciales informan que Manus no cumple con estas promesas. Alexander Doria, cofundador de la startup de IA Pleias, compartió en X que encontró mensajes de error y bucles infinitos mientras probaba la plataforma. Otros usuarios señalaron que Manus comete errores en preguntas factuales y no cita consistentemente sus fuentes, además de perder información fácilmente encontrable en internet.

No sólo eso, sino que otro usuario de X dice haber descargado el prompt de sistema de Manus, y haber encontrado que usa el modelo de Anthropic Claude, y la heramienta de código abierto Browser Use.

Kyle Wiggers, autor del artículo original en TechCrunch, probó Manus con varias tareas que consideraba bastante sencillas, con resultados decepcionantes:

  • Al pedirle que ordenara un sándwich de pollo frito de un restaurante de comida rápida de su zona, Manus se bloqueó tras unos diez minutos. En un segundo intento, encontró un menú que cumplía los requisitos, pero no pudo completar el proceso de pedido ni proporcionar un enlace de pago.
  • Cuando intentó reservar un vuelo de Nueva York a Japón, lo mejor que Manus pudo ofrecer fueron enlaces a tarifas en varios sitios web de aerolíneas y motores de búsqueda como Kayak, algunos de los cuales estaban rotos.
  • Al solicitar una reserva en un restaurante a poca distancia, la plataforma falló después de unos minutos.
  • Finalmente, al pedirle que construyera un juego de lucha inspirado en Naruto, el sistema dio error tras media hora.

No es el «segundo momento DeepSeek»

Parte de la expectación generada proviene de las comparaciones con DeepSeek, otra empresa china de IA que ha logrado avances significativos recientemente. Sin embargo, existen diferencias fundamentales:

  1. A diferencia de DeepSeek, The Butterfly Effect (la empresa detrás de Manus) no ha desarrollado modelos propios desde cero. Según informes en redes sociales, Manus utiliza una combinación de modelos existentes y ajustados, incluyendo Claude de Anthropic y Qwen de Alibaba.
  2. Mientras DeepSeek ha hecho disponibles públicamente muchas de sus tecnologías, Manus todavía no lo ha hecho.

Los medios chinos no tardaron en promocionar Manus como un logro nacional; la publicación QQ News lo calificó como «el orgullo de los productos nacionales». Al mismo tiempo, influencers de IA en redes sociales difundieron información errónea sobre las capacidades de Manus. Un vídeo muy compartido mostraba un programa de escritorio, supuestamente Manus, realizando acciones en múltiples aplicaciones de smartphone. Sin embargo, Ji confirmó que dicho vídeo no era, en realidad, una demostración de Manus.

La respuesta de la empresa

Un portavoz de Manus envió a TechCrunch la siguiente declaración a través de mensaje directo:

«Como equipo pequeño, nuestro enfoque es seguir mejorando Manus y crear agentes de IA que realmente ayuden a los usuarios a resolver problemas […] El objetivo principal de la actual beta cerrada es probar bajo estrés varias partes del sistema e identificar problemas. Agradecemos profundamente las valiosas opiniones compartidas por todos.»

Factores que explican el fenómeno

¿Por qué se produjo tal explosión mediática alrededor de Manus? Varios factores contribuyeron, como la exclusividad creada por la escasez de invitaciones.

Otras cuentas influyentes de IA en X intentaron establecer comparaciones entre Manus y DeepSeek, comparaciones que no están necesariamente fundamentadas en hechos. The Butterfly Effect no desarrolló modelos internos, a diferencia de DeepSeek. Y mientras DeepSeek hizo muchas de sus tecnologías disponibles abiertamente, Manus aún no lo ha hecho, al menos no todavía.

Conclusión

Aunque es justo reconocer que Manus se encuentra en una fase muy temprana de acceso, y la empresa afirma estar trabajando para ampliar su capacidad de computación y solucionar los problemas reportados, la plataforma en su estado actual parece ser un caso donde la expectación ha superado a la innovación tecnológica real.

Este fenómeno nos recuerda la importancia de mantener una perspectiva crítica ante los anuncios de avances en inteligencia artificial, especialmente cuando las promesas son extremadamente ambiciosas. A medida que la carrera por desarrollar sistemas de IA más capaces se intensifica, tanto en China como en Occidente, los consumidores y profesionales del sector debemos distinguir entre las posibilidades futuras y las capacidades reales actuales.

Manus podría convertirse en el futuro en una herramienta revolucionaria, pero por ahora, no parece ser el «segundo momento DeepSeek» que algunos esperaban.

Deja un comentario