Nvidia lanza Cosmos, su nueva familia de modelos de IA para simular el mundo físico

Droids

Nvidia lanza Cosmos, su nueva familia de modelos de IA para simular el mundo físico

Nvidia, el gigante tecnológico especializado en chips gráficos, ha presentado en el CES 2025 de Las Vegas su nueva familia de modelos de inteligencia artificial denominada Cosmos World Foundation Models (Cosmos WFM), diseñada para predecir y generar videos con consciencia física.

Una nueva era en la simulación del mundo real

Los nuevos modelos de Nvidia se inspiran en la forma en que los humanos desarrollan modelos mentales del mundo que les rodea. Estos "modelos de mundo" (world models) representan un avance significativo en la capacidad de la IA para comprender y simular el comportamiento físico de objetos y entornos.

La compañía ha dividido su oferta en tres categorías principales:

  • Nano: Orientada a aplicaciones en tiempo real y baja latencia
  • Super: Modelos base de alto rendimiento
  • Ultra: Enfocada en máxima calidad y fidelidad

Características técnicas y capacidades

Los modelos Cosmos varían en tamaño desde 4.000 millones hasta 14.000 millones de parámetros. En el mundo de la IA, los parámetros son elementos que determinan la capacidad del modelo para resolver problemas, siendo generalmente más capaces aquellos con mayor número de parámetros.

Para su desarrollo, Nvidia ha utilizado un conjunto de datos masivo que incluye:

  • 9.000 billones de tokens
  • 20 millones de horas de interacciones humanas
  • Datos de entornos industriales
  • Información sobre robótica
  • Datos de conducción autónoma

Aplicaciones prácticas y colaboraciones

Varias empresas importantes ya han confirmado su interés en utilizar Cosmos WFM:

  • Waabi y Wayve: desarrollo de vehículos autónomos
  • Fortellix: búsqueda y clasificación de videos
  • Uber: soluciones de movilidad autónoma

"La IA generativa impulsará el futuro de la movilidad, requiriendo tanto datos ricos como una capacidad de cómputo muy potente", declaró Dara Khosrowshahi, CEO de Uber, según TechCrunch.

Controversia sobre derechos de autor

A pesar del entusiasmo por el lanzamiento, han surgido preocupaciones sobre el origen de los datos utilizados para entrenar estos modelos. Algunos informes y una demanda legal sugieren que Nvidia podría haber utilizado videos de YouTube sin permiso para el entrenamiento.

La compañía defiende su posición argumentando que Cosmos "aprende como las personas aprenden" y que los hechos sobre cómo funciona el mundo no están sujetos a derechos de autor. Sin embargo, los expertos legales cuestionan si este argumento será suficiente ante los tribunales.

Disponibilidad y licencia

Los modelos están disponibles a través de:

  • API de Nvidia
  • Catálogos NGC
  • GitHub
  • Plataforma Hugging Face

Es importante señalar que, aunque Nvidia describe estos modelos como "abiertos", no son estrictamente de código abierto, ya que la empresa no ha publicado todos los detalles sobre su entrenamiento ni las herramientas necesarias para recrearlos desde cero.

Perspectivas futuras

"Esperamos que [Cosmos] haga por el mundo de la robótica y la IA industrial lo que Llama ha hecho por la empresa", afirmó Jensen Huang, CEO de Nvidia, durante el evento de presentación.

Este lanzamiento representa un paso significativo en la evolución de la IA aplicada a la simulación del mundo físico, aunque su éxito dependerá en gran medida de cómo se resuelvan las cuestiones legales pendientes y de la adopción por parte de la industria.

Deja un comentario