Freepik y Fal.ai lanzan F Lite: un modelo de IA generativa entrenado exclusivamente con datos legales

Droids

Updated on:

Freepik y Fal.ai lanzan F Lite: un modelo de IA generativa entrenado exclusivamente con datos legales

La colaboración entre las empresas marca un hito en el desarrollo de modelos de texto a imagen basados únicamente en contenido con licencia, desafiando las prácticas habituales del sector.

F Lite - Imagen generada por el modelo

La inteligencia artificial generativa avanza a un ritmo vertiginoso, impulsada por la colaboración en código abierto. Sin embargo, desarrollar modelos de alta calidad entrenados exclusivamente con datos con licencia sigue siendo un reto significativo. En este contexto, Freepik y Fal.ai han presentado F Lite, un potente modelo de texto a imagen que representa un importante avance en el campo de la IA responsable y abierta.

Un hito en la IA responsable y abierta

Los equipos de investigación de ambas compañías unieron fuerzas para construir F Lite desde cero. A diferencia de la mayoría de modelos actuales, este ha sido entrenado exclusivamente con imágenes de alta calidad, legalmente conformes y seguras en términos de derechos de autor, procedentes de la biblioteca de stock de Freepik.

Lo más destacable es que F Lite utiliza un conjunto de datos considerablemente menor: solo 80 millones de imágenes, en contraste con los más de mil millones que suelen emplearse en otros modelos de referencia. Esto lo convierte potencialmente en «el mayor modelo de texto a imagen disponible públicamente entrenado enteramente con contenido legalmente seguro», según señalan desde ambas compañías.

Características técnicas y capacidades de F Lite

F Lite - Ejemplo de generación

F Lite aprovecha una arquitectura de 10 mil millones de parámetros basada en DiT (Diffusion Transformer), incorporando numerosas mejoras. Aunque se ha entrenado con menos recursos computacionales —64 GPUs H100 durante dos meses— y menos datos en comparación con los modelos insignia típicos, sigue siendo altamente capaz y está listo para su evolución por parte de la comunidad.

El modelo destaca en la generación de imágenes diversas y de alta fidelidad, siendo especialmente efectivo en estilos ilustrativos y vectoriales, un reflejo directo de los datos con los que fue entrenado. Esta característica lo convierte en una herramienta potencialmente valiosa para diseñadores gráficos y creativos que trabajan con estos formatos.

Limitaciones y áreas de mejora

F Lite - Ejemplo de paisaje

Como primera versión, F Lite presenta algunas limitaciones conocidas:

  • Detalles precisos: Las imágenes fotorrealistas ocasionalmente carecen de texturas ultrafinas.
  • Escenas complejas: Las composiciones intrincadas o la anatomía pueden producir defectos.
  • Sensibilidad a los prompts: Los resultados óptimos requieren indicaciones descriptivas; los prompts cortos con menos detalle pueden rendir por debajo de lo esperado.
  • Renderizado de texto: La generación precisa de texto en imágenes sigue siendo un desafío conocido.

Tras rigurosas pruebas, los desarrolladores afirman que la arquitectura básica y la metodología de entrenamiento de F Lite son sólidas. Estas limitaciones reflejan principalmente los límites de la potencia de cálculo y los datos utilizados, no problemas fundamentales del diseño.

Dos variantes para diferentes necesidades

F Lite se lanza en dos variantes para adaptarse a diferentes casos de uso:

  • F Lite Regular: Ideal para uso general.
  • F Lite Textured: Ofrece una calidad estética mejorada y texturas más ricas, más adecuado para prompts detallados (menos efectivo con vectores y prompts cortos).

«Este lanzamiento demuestra que incluso sin recursos ilimitados, la innovación centrada y la colaboración dentro de la comunidad de código abierto pueden producir modelos fundacionales notables», señalan desde el equipo del proyecto.

Disponibilidad y acceso al modelo

F Lite - Ejemplo de loro

Ambos modelos están licenciados abiertamente, con los pesos de las versiones regular y texturizada disponibles en Hugging Face. El código del modelo también es de código abierto, lo que permite utilizar F Lite en ComfyUI, integrarlo en flujos de trabajo de Python mediante diffusers, o ajustarlo y crear LoRAs personalizados.

Para entusiastas de la IA e investigadores, se ha publicado un detallado Informe Técnico de F Lite que explica los métodos innovadores utilizados durante el entrenamiento, incluyendo µ-Parameterization, WSD scheduling, Register Tokens, Residual Value Connections, Sequence Dropout, MaPO y GRPO, entre otros.

El futuro de F Lite y la colaboración en IA

Los equipos de Freepik y Fal.ai han anunciado que están trabajando en una versión «micro» más ligera y compatible con GPUs menos potentes, con el objetivo de llevar la potencia de F Lite a un mayor número de creadores.

Asimismo, invitan a la comunidad a explorar diferentes aplicaciones del modelo, ya sea ajustándolo para estilos artísticos específicos, creando IP-Adapters o ControlNets, u optimizando versiones cuantizadas.

Este lanzamiento representa un paso importante hacia modelos de IA generativa más responsables y transparentes. Al demostrar que es posible crear modelos potentes utilizando exclusivamente datos con licencia, Freepik y Fal.ai establecen un precedente valioso para la industria, equilibrando la innovación tecnológica con el respeto a la propiedad intelectual.

En un momento en que la IA generativa enfrenta numerosos desafíos legales y éticos relacionados con los derechos de autor, iniciativas como F Lite abren caminos alternativos para el desarrollo sostenible y responsable de estas tecnologías.

Deja un comentario