OpenAI ha comenzado a probar un sistema de marcas de agua para las imágenes creadas con su modelo de generación de imágenes ChatGPT-4o, según reporta BleepingComputer. Esta nueva característica parece estar dirigida principalmente a los usuarios que utilizan la versión gratuita del servicio, mientras que los suscriptores de pago podrían mantener la capacidad de guardar imágenes sin marcas de agua.
La medida llega en un momento en que el modelo de generación de imágenes, que forma parte de ChatGPT-4o, ha ganado popularidad por su capacidad para crear arte visualmente impresionante, especialmente imitando estilos como el del estudio japonés de animación Studio Ghibli.
Un sistema de marca de agua para diferenciar servicios
Según el investigador de inteligencia artificial Tibor Blaho, quien detectó estas pruebas, OpenAI parece estar implementando un sistema de marca de agua llamado «ImageGen» específicamente para los usuarios de la versión gratuita de ChatGPT. Esta información ha sido corroborada por fuentes cercanas a BleepingComputer, que confirman que la empresa ha comenzado recientemente a probar esta característica.
La estrategia parece clara: los usuarios que paguen por la suscripción ChatGPT Plus (con un coste de 20 dólares mensuales, aproximadamente 18 euros) podrán descargar imágenes limpias, sin ningún tipo de marca de agua. Este enfoque reforzaría el valor añadido del servicio de pago frente al gratuito.
Sin embargo, el artículo también señala que estos planes podrían no ser definitivos, ya que «los planes en OpenAI siempre están sujetos a cambios», según menciona el periodista Mayank Parmar en el artículo original.
La democratización del modelo de generación de imágenes
Un punto importante a destacar es que el modelo de generación de imágenes de ChatGPT, anteriormente disponible solo para usuarios de pago (suscriptores de ChatGPT Plus), ha sido recientemente extendido a todos los usuarios, incluidos aquellos con cuentas gratuitas. Esta ampliación del acceso podría explicar por qué OpenAI está considerando implementar marcas de agua para distinguir entre los diferentes niveles de servicio.
La herramienta ha ganado notoriedad principalmente por su capacidad para generar arte de alta calidad, con una habilidad particular para reproducir estilos específicos como el de Studio Ghibli, reconocido estudio de animación japonés. Este tipo de uso artístico parece ser uno de los motivos del creciente interés en la tecnología.
Ejemplo de arte generado con ChatGPT en estilo Studio Ghibli. Fuente: BleepingComputer
Un modelo entrenado para la consistencia visual
OpenAI ha explicado anteriormente, en una publicación en su blog, que su modelo de generación de imágenes fue entrenado utilizando un amplio conjunto de imágenes y textos. Este entrenamiento permite no solo relacionar imágenes con lenguaje, sino también entender cómo las imágenes se relacionan entre sí.
«Entrenamos nuestros modelos en la distribución conjunta de imágenes y textos en línea, aprendiendo no solo cómo las imágenes se relacionan con el lenguaje, sino cómo se relacionan entre sí», explicó OpenAI en su comunicado. «Combinado con un agresivo post-entrenamiento, el modelo resultante tiene una sorprendente fluidez visual, capaz de generar imágenes que son útiles, consistentes y conscientes del contexto».
Esta capacidad para generar imágenes coherentes y contextuales es lo que ha hecho que el modelo sea tan valorado y utilizado, especialmente para proyectos creativos y artísticos.
Futuro desarrollo: API para desarrolladores
Además de las pruebas de marca de agua, OpenAI también ha confirmado que está trabajando en una API (Interfaz de Programación de Aplicaciones) para ImageGen. Esta API permitirá a los desarrolladores incorporar la tecnología de generación de imágenes en sus propias aplicaciones y servicios.
La creación de esta API podría representar un paso importante para la compañía, ya que abriría nuevas posibilidades para el uso de su tecnología en diferentes ámbitos y permitiría a terceros construir productos basados en ella. Sin embargo, el artículo no proporciona detalles sobre cuándo estará disponible esta API ni qué características específicas incluirá.
Un modelo multimodal de vanguardia
ChatGPT-4o, del cual forma parte el generador de imágenes, es descrito como «el modelo multimodal más avanzado enviado hasta la fecha». Su capacidad no se limita a generar imágenes con textos, sino que también puede crear visuales realistas con un alto nivel de detalle y fidelidad estilística.
La combinación de texto e imagen en un mismo modelo (lo que se conoce como modelo multimodal) representa una de las direcciones más prometedoras en el desarrollo de la inteligencia artificial actual, permitiendo interacciones más naturales y versátiles.
Implicaciones de la marca de agua
La implementación de marcas de agua en las imágenes generadas por IA no es un concepto nuevo y tiene varias implicaciones importantes. Por un lado, ayuda a identificar el contenido generado por inteligencia artificial, lo cual es cada vez más relevante en un mundo donde distinguir entre contenido humano y artificial se vuelve más difícil.
Por otro lado, desde la perspectiva comercial, permite a OpenAI diferenciar sus niveles de servicio, ofreciendo imágenes sin marca de agua como un beneficio exclusivo para usuarios de pago, incentivando así las suscripciones a ChatGPT Plus.
OpenAI sigue una tendencia similar a la de otras empresas en el sector, que buscan equilibrar el acceso gratuito a tecnologías avanzadas con modelos de negocio sostenibles basados en suscripciones premium.
Aunque las pruebas de marcas de agua están en curso, aún no está claro si OpenAI seguirá adelante con esta implementación o si modificará sus planes. Como es habitual en el dinámico campo de la inteligencia artificial, las estrategias y características pueden evolucionar rápidamente en respuesta a consideraciones técnicas, comerciales y de experiencia de usuario.
Lo que sí parece evidente es el creciente interés en las capacidades de generación de imágenes de ChatGPT y el continuo esfuerzo de OpenAI por desarrollar y monetizar esta tecnología de manera efectiva.