Inception revoluciona la IA con un nuevo modelo de lenguaje basado en tecnología de difusión

Droids

Inception revoluciona la IA con un nuevo modelo de lenguaje basado en tecnología de difusión

Una nueva startup de Palo Alto está sacudiendo el mundo de la inteligencia artificial con una tecnología innovadora que promete ser hasta diez veces más rápida y económica que los modelos actuales. Inception, fundada por el profesor de Stanford Stefano Ermon, ha salido de su fase de desarrollo en secreto para presentar un nuevo tipo de modelo de IA que combina las mejores características de dos tecnologías existentes.

Una nueva aproximación a la IA generativa

El nuevo modelo, denominado DLM (modelo de lenguaje basado en difusión), representa un cambio significativo en la forma en que se procesa el lenguaje natural. Hasta ahora, el panorama de la IA generativa estaba dominado por dos tipos principales de modelos: los grandes modelos de lenguaje (LLM) para texto y los modelos de difusión para imágenes y vídeo, como los utilizados por Midjourney y Sora de OpenAI.

Ventajas tecnológicas revolucionarias

La principal innovación de Inception radica en su capacidad para procesar texto de manera paralela, a diferencia de los modelos tradicionales que funcionan de forma secuencial. Como explicó Ermon a TechCrunch: "Con los LLM tradicionales, no puedes generar la segunda palabra hasta que hayas generado la primera, ni la tercera hasta que generes las dos primeras".

El nuevo enfoque permite:

  • Procesamiento de texto más rápido y eficiente
  • Reducción significativa en costos de computación
  • Mayor aprovechamiento de las GPU
  • Velocidades de hasta 1.000 tokens por segundo

Un equipo con sólidas credenciales académicas

La empresa está liderada por un equipo de destacados académicos:

  • Stefano Ermon – Profesor de Stanford y fundador principal
  • Aditya Grover – Profesor de UCLA y cofundador
  • Volodymyr Kuleshov – Profesor de Cornell y cofundador

El proyecto surgió de años de investigación en el laboratorio de Stanford de Ermon, culminando en un importante paper científico publicado el año pasado que sentó las bases teóricas de esta tecnología.

Rendimiento y aplicaciones prácticas

Según un portavoz de la empresa, su modelo "pequeño" para programación iguala el rendimiento de GPT-4o mini de OpenAI pero funciona más de diez veces más rápido. Además, su modelo "mini" supera a modelos de código abierto como Llama 3.1 8B de Meta.

La empresa ya ofrece:

  • API para desarrolladores
  • Opciones de implementación local
  • Soporte para ajuste fino de modelos
  • Suite de DLMs preconfigurados para diversos casos de uso

Perspectivas futuras

Aunque Inception no ha revelado detalles sobre su financiación, fuentes cercanas a TechCrunch confirman que cuenta con el respaldo del prestigioso fondo Mayfield Fund. La empresa ya ha conseguido varios clientes entre las empresas Fortune 100, que buscan reducir la latencia y aumentar la velocidad en sus aplicaciones de IA.

"Creemos que esto va a cambiar la forma en que la gente construye modelos de lenguaje", afirmó Ermon a TechCrunch, señalando el potencial transformador de esta tecnología para la industria de la IA.

Deja un comentario