Una empresa china ha dado un importante paso adelante en la carrera de la inteligencia artificial con el lanzamiento de DeepSeek V3, un modelo que está demostrando ser uno de los más potentes entre los sistemas de IA de código abierto disponibles actualmente.
Un nuevo competidor en la arena de la IA
DeepSeek, una empresa respaldada por el fondo de inversión High-Flyer Capital Management, ha presentado su último modelo bajo una licencia permisiva que permite a los desarrolladores descargarlo y modificarlo para la mayoría de las aplicaciones, incluyendo usos comerciales.
Capacidades técnicas sobresalientes
El nuevo modelo destaca por sus impresionantes especificaciones técnicas:
- 685 mil millones de parámetros
- Entrenamiento con 14.8 billones de tokens de datos
- Capacidad para realizar tareas como programación, traducción y redacción
DeepSeek V3 ha demostrado un rendimiento superior en pruebas específicas, superando a competidores establecidos como el Llama 3.1 405B de Meta y el GPT-4o de OpenAI en competiciones de programación en la plataforma Codeforces.
Un desarrollo eficiente y económico
Uno de los aspectos más sorprendentes del proyecto es su eficiencia en términos de tiempo y costos. La empresa logró entrenar el modelo en aproximadamente dos meses, utilizando un centro de datos equipado con GPUs Nvidia H800, con un costo total de solo 5.02 millones de euros ($5.5M).
Respaldo empresarial sólido
DeepSeek cuenta con el respaldo de High-Flyer Capital Management, un fondo de inversión cuantitativo chino que utiliza IA para sus decisiones de trading. La empresa ha realizado inversiones significativas en infraestructura, incluyendo un cluster de servidores valorado en aproximadamente 126 millones de euros ($138M).
Limitaciones y consideraciones políticas
Como empresa china, DeepSeek debe adherirse a ciertas regulaciones gubernamentales. El modelo presenta restricciones en temas políticamente sensibles y, según se ha observado, evita responder a preguntas sobre ciertos acontecimientos históricos o temas políticos controvertidos.
Impacto en el mercado
El lanzamiento de DeepSeek V3 ya está teniendo un efecto significativo en el mercado. Competidores como ByteDance, Baidu y Alibaba se han visto obligados a reducir los precios de uso de sus modelos, y algunos incluso los han hecho completamente gratuitos.
La visión de código abierto
Liang Wenfeng, fundador de High-Flyer, ha expresado su compromiso con el código abierto, describiéndolo como un "acto cultural". En una entrevista citada por TechCrunch, Liang argumentó que incluso el enfoque de código cerrado de OpenAI no ha impedido que otros les alcancen.
Este lanzamiento marca un hito importante en el desarrollo de modelos de IA de código abierto y demuestra la creciente competitividad del sector tecnológico chino en el campo de la inteligencia artificial, a pesar de las restricciones comerciales internacionales.