La nueva tendencia de imágenes estilo Studio Ghibli colapsa la función GPT-4o de OpenAI

Droids

Updated on:

La nueva tendencia de imágenes estilo Studio Ghibli colapsa la función GPT-4o de OpenAI

Una nueva moda de transformación de imágenes está arrasando en Internet: fotos históricas, políticos, celebridades y memes reconvertidos al estilo visual del famoso estudio de animación japonés Studio Ghibli. Esta tendencia viral ha sido posible gracias a la nueva función de generación de imágenes del modelo GPT-4o de OpenAI, que se ha vuelto tan popular que la empresa ha tenido que retrasar su lanzamiento para usuarios gratuitos.

La fiebre de las imágenes estilo Ghibli inunda las redes sociales

Si has navegado por la red social X (anteriormente Twitter) en los últimos días, probablemente hayas visto tu timeline inundado de coloridas imágenes al estilo anime que recrean fotografías famosas con la estética característica de los largometrajes de Studio Ghibli, el estudio responsable de clásicos como «La princesa Mononoke», «El chico y la grulla» o «Mi vecino Totoro».

Esta tendencia ha convertido instantáneamente todo tipo de contenido en versiones animadas de estilo suave y colorido: desde el actual presidente Trump, la icónica imagen del «Hombre del Tanque» durante las protestas pro-democracia de la Plaza de Tiananmén en 1989, Osama Bin Laden o Jeffrey Epstein, hasta momentos de la cultura pop como el famoso cameo de Sam Rockwell en «The White Lotus» y numerosos memes populares.

Muchos usuarios se quejan de que sus feeds están prácticamente monopolizados por este tipo de imágenes, lo que demuestra la magnitud del fenómeno.

Qué es GPT-4o y cómo funciona la generación nativa de imágenes

La explosión de esta tendencia se debe a la reciente actualización del modelo GPT-4o de OpenAI, disponible para los suscriptores de ChatGPT Plus, Pro y Team. La principal novedad es la incorporación de «generación nativa de imágenes».

Hasta ahora, ChatGPT permitía a los usuarios crear imágenes a partir de descripciones textuales, pero lo hacía redirigiendo las solicitudes a otro modelo de OpenAI llamado DALL-E 3. La diferencia fundamental con GPT-4o (donde la «o» significa «omni») es que ha sido entrenado no solo con texto y código, sino también con imágenes y, presumiblemente, vídeo y audio.

Esta formación integral permite al modelo comprender las similitudes y diferencias entre diversos formatos de medios, conceptualizar ideas que los atraviesan (por ejemplo, entender que una «manzana» no es solo una palabra, sino algo que puede representarse como una fruta roja, amarilla o verde) y producir con precisión dichos contenidos a partir de instrucciones textuales sin necesidad de conectarse a modelos externos.

Similar a la reciente actualización de Google AI Studio que incluye un modelo experimental de creación de imágenes Gemini 2.0 Flash, el nuevo GPT-4o de OpenAI también acepta la carga de imágenes preexistentes desde la galería del usuario o capturas de pantalla guardadas de la web.

Cómo crear imágenes al estilo Studio Ghibli con ChatGPT

Para aquellos interesados en probar esta función, el proceso es relativamente sencillo:

  1. Visita Chat.com o ChatGPT.com y asegúrate de iniciar sesión con una cuenta ChatGPT Plus, Pro o Team.
  2. Verifica que el selector de modelo de IA (ubicado en la esquina izquierda de la ventana de sesión) muestre «GPT-4o» como el modelo elegido. Puedes hacer clic en él para desplegar y seleccionar el modelo adecuado entre las opciones disponibles.
  3. Carga una imagen a ChatGPT utilizando el botón «+» en la esquina inferior izquierda del cuadro de entrada de texto.
  4. Pide al modelo que transforme tu imagen al estilo deseado, por ejemplo: «convierte esta imagen al estilo de una animación de Studio Ghibli».

Después de unos segundos, GPT-4o generará una versión transformada de la imagen con resultados sorprendentemente convincentes. El sistema incluso admite la carga de múltiples imágenes para combinarlas en una sola composición.

OpenAI retrasa el acceso gratuito debido a la alta demanda

Inicialmente, OpenAI había anunciado que esta función también estaría disponible para usuarios gratuitos de ChatGPT. Sin embargo, el cofundador y CEO de la empresa, Sam Altman, anunció en X que el lanzamiento se retrasará debido a la abrumadora demanda por parte de los suscriptores actuales.

«Las imágenes en ChatGPT son muuuucho más populares de lo que esperábamos (y ya teníamos expectativas bastante altas). El lanzamiento para nuestro nivel gratuito desafortunadamente se retrasará por un tiempo», escribió Altman.

Mientras tanto, quienes tienen acceso seguirán produciendo ediciones de imágenes en este y otros estilos reconocibles o novedosos, alimentando la tendencia viral.

¿Qué pasa con el copyright y la propiedad intelectual de Studio Ghibli?

No todos son entusiastas del trabajo de OpenAI en este campo. De hecho, el propio creador de Studio Ghibli, Hayao Miyazaki, apareció en un documental en 2016 donde expresó un profundo disgusto y repulsión ante un ejemplo temprano de animación impulsada por IA desarrollada, precisamente, por OpenAI.

Como ocurre con muchos productos y servicios de IA generativa, los datos de entrenamiento utilizados por OpenAI para esta nueva capacidad de generación de imágenes permanecen en secreto, aunque se especula ampliamente que contienen material protegido por derechos de autor. Si bien imitar un estilo generalmente no se considera una infracción de derechos de autor en Estados Unidos, esta práctica está provocando rechazo entre algunos fans de la animación original.

Implicaciones para empresas y usuarios

Para las marcas y empresas interesadas en experimentar con este estilo, los expertos recomiendan cautela y una seria consideración previa, dado el posible rechazo negativo entre algunos usuarios. Sin embargo, para aquellos con una actitud abiertamente favorable hacia las herramientas de IA o con bases de fans más indulgentes y divertidas, está claro que OpenAI tiene otro éxito en sus manos.

Este fenómeno ilustra perfectamente cómo las nuevas capacidades de la IA generativa pueden volverse virales rápidamente y generar tanto entusiasmo como controversia. También demuestra el poder de la nostalgia y la cultura pop como vehículos para la adopción tecnológica, así como los desafíos que enfrentan las empresas para equilibrar la innovación con las consideraciones éticas y las expectativas de los creadores originales.

Mientras tanto, la tendencia de las imágenes estilo Studio Ghibli sigue propagándose por internet, transformando nuestra realidad en versiones animadas que, irónicamente, probablemente no contarían con la aprobación del maestro que inspiró el estilo que ahora la IA intenta replicar.

Deja un comentario