DeepSeek lanza nueva familia de modelos de IA que desafía a los líderes del mercado

Droids

DeepSeek lanza nueva familia de modelos de IA que desafía a los líderes del mercado

La empresa china DeepSeek ha presentado Janus-Pro, una nueva familia de modelos de inteligencia artificial que, según afirma la compañía, supera en rendimiento al DALL-E 3 de OpenAI en la generación y análisis de imágenes.

Un nuevo competidor en el mercado de la IA generativa

DeepSeek, que recientemente ha ganado notoriedad tras el éxito viral de su aplicación de chatbot, ha puesto a disposición del público su nueva familia de modelos a través de la plataforma de desarrollo Hugging Face. Los modelos Janus-Pro se presentan en diferentes versiones, con capacidades que van desde 1.000 millones hasta 7.000 millones de parámetros, siendo estos últimos los que ofrecen el mejor rendimiento.

Características técnicas y capacidades

La nueva familia de modelos se caracteriza por ser un "marco autorregresivo novedoso", según describe la propia empresa en su publicación en Hugging Face. Los modelos tienen la capacidad dual de analizar y crear nuevas imágenes, aunque la mayoría de las versiones están limitadas a trabajar con imágenes de resolución de hasta 384 x 384 píxeles.

Rendimiento superior en pruebas comparativas

Según DeepSeek, su modelo más avanzado, el Janus-Pro-7B, ha demostrado un rendimiento superior en dos importantes pruebas de evaluación de IA: GenEval y DPG-Bench. En estas pruebas, el modelo superó no solo a DALL-E 3 de OpenAI, sino también a otros competidores destacados como:

  • PixArt-alpha
  • Emu3-Gen
  • Stable Diffusion XL de Stability AI

Accesibilidad y licenciamiento

Un aspecto destacable del lanzamiento es que los modelos Janus-Pro se distribuyen bajo licencia MIT, lo que permite su uso comercial sin restricciones. Esta decisión podría tener un impacto significativo en la adopción de la tecnología por parte de desarrolladores y empresas.

Contexto empresarial

DeepSeek, respaldada principalmente por la firma de trading cuantitativo High-Flyer Capital Management, ha logrado captar la atención del sector tecnológico en las últimas semanas. La empresa alcanzó el primer puesto en la App Store de Apple con su aplicación de chatbot, superando incluso a ChatGPT.

Impacto en el mercado

El éxito de DeepSeek y sus eficientes técnicas de entrenamiento de modelos ha llevado a muchos analistas de Wall Street y expertos en tecnología a cuestionar si Estados Unidos podrá mantener su liderazgo en la carrera de la IA. También ha generado debates sobre la sostenibilidad de la demanda de chips específicos para IA.

La empresa afirma que "la simplicidad, alta flexibilidad y efectividad de Janus-Pro lo convierten en un fuerte candidato para la próxima generación de modelos multimodales unificados", según declara en su documentación oficial.

Este lanzamiento representa un nuevo capítulo en la competencia global por el desarrollo de tecnologías de IA, donde empresas chinas como DeepSeek están demostrando su capacidad para competir con los líderes establecidos del mercado occidental.

Deja un comentario