Meta ha anunciado el lanzamiento de Llama 3.3 70B, la última incorporación a su familia de modelos de inteligencia artificial generativa. Este nuevo modelo promete ofrecer un rendimiento equivalente al de su predecesor más grande, pero con mayor eficiencia y menor coste computacional.
Un modelo más eficiente y competitivo
Según anunció en X Ahmad Al-Dahle, vicepresidente de IA generativa en Meta, el nuevo modelo Llama 3.3 70B logra igualar el rendimiento del Llama 3.1 405B, su modelo más grande hasta la fecha, pero requiriendo significativamente menos recursos. "Aprovechando los últimos avances en técnicas post-entrenamiento, este modelo mejora el rendimiento básico a un coste significativamente menor", explicó Al-Dahle.
Los resultados compartidos por Meta muestran que el nuevo modelo supera a competidores destacados como Gemini 1.5 Pro de Google, GPT-4o de OpenAI y Nova Pro de Amazon en varias pruebas de referencia, incluyendo MMLU, que evalúa la capacidad de comprensión del lenguaje.
Disponibilidad y alcance
El modelo está disponible para su descarga a través de la plataforma Hugging Face y otros canales, incluyendo el sitio web oficial de Llama. Meta mantiene ciertas restricciones en sus términos de uso: las plataformas con más de 700 millones de usuarios mensuales deben solicitar una licencia especial.
A pesar de estas limitaciones, la estrategia de "código abierto" de Meta ha sido exitosa. La compañía reporta más de 650 millones de descargas de sus modelos Llama hasta la fecha.
Inversiones masivas en infraestructura
Para sostener el desarrollo de futuras generaciones de Llama, Meta está realizando inversiones significativas en infraestructura. La empresa anunció la construcción de un centro de datos de IA en Louisiana, con una inversión de 10.000 millones de dólares (aproximadamente 9.300 millones de euros), que será el más grande jamás construido por Meta.
Mark Zuckerberg, CEO de Meta, indicó que para entrenar la próxima generación de modelos Llama 4, la empresa necesitará 10 veces más capacidad de cómputo que la utilizada para Llama 3. Para ello, Meta ha adquirido un cluster de más de 100.000 GPUs de Nvidia.
Desafíos regulatorios y preocupaciones
La naturaleza abierta de Llama ha presentado tanto oportunidades como desafíos. En noviembre, surgieron informes sobre investigadores militares chinos utilizando un modelo Llama para desarrollar un chatbot de defensa, lo que llevó a Meta a hacer sus modelos disponibles para contratistas de defensa estadounidenses.
En el frente europeo, Meta ha expresado preocupaciones sobre su capacidad para cumplir con la Ley de IA de la UE, calificando su implementación como "demasiado impredecible" para su estrategia de lanzamiento abierto. También enfrenta desafíos relacionados con el GDPR respecto al entrenamiento de IA con datos de usuarios europeos.
Impacto financiero
El desarrollo de modelos de IA generativa representa una inversión sustancial para Meta. Los gastos de capital de la empresa aumentaron casi un 33% hasta los 8.500 millones de dólares (aproximadamente 7.900 millones de euros) en el segundo trimestre de 2024, en comparación con los 6.400 millones de dólares (aproximadamente 5.950 millones de euros) del año anterior, impulsados por inversiones en servidores, centros de datos e infraestructura de red.
A pesar de estos costos, la estrategia parece dar frutos: Meta AI, el asistente de IA de la compañía impulsado por modelos Llama, ya cuenta con casi 600 millones de usuarios activos mensuales, posicionándose para convertirse en el asistente de IA más utilizado en el mundo, según afirma Zuckerberg.