La startup de inteligencia artificial Deep Cogito, con sede en San Francisco y fundada por ex-ingenieros de Google, ha irrumpido en el panorama tecnológico con el lanzamiento de cuatro nuevos modelos de lenguaje de código abierto (LLM). Estos modelos, pertenecientes a la familia Cogito v2, introducen una capacidad innovadora: aprenden a razonar de forma más eficaz con el tiempo, mejorando su propia «intuición» sin necesidad de supervisión constante.
Este avance propone un nuevo paradigma en el desarrollo de la IA, centrado no solo en procesar más datos, sino en aprender a «pensar» de una manera más eficiente y precisa. Los modelos ya están disponibles para desarrolladores y empresas, prometiendo un rendimiento de vanguardia con un coste computacional reducido.
Presentando la familia Cogito v2: potencia y flexibilidad
La nueva familia de modelos de Deep Cogito está diseñada para cubrir un amplio espectro de necesidades, desde aplicaciones de baja latencia hasta investigación de frontera. La serie incluye cuatro variantes:
- Cogito v2-70B (Denso)
- Cogito v2-109B (Mezcla de Expertos – MoE)
- Cogito v2-405B (Denso)
- Cogito v2-671B (Mezcla de Expertos – MoE)
Para entender su potencial, es crucial distinguir entre las dos arquitecturas utilizadas. Los modelos Densos, como las versiones de 70.000 y 405.000 millones de parámetros, activan todos sus parámetros en cada consulta. Esto los hace más predecibles y fáciles de implementar en una gran variedad de hardware, siendo ideales para entornos con capacidad de GPU limitada o para el ajuste fino (fine-tuning) en tareas específicas.
Por otro lado, los modelos MoE (Mixture-of-Experts), como los de 109.000 y 671.000 millones de parámetros, utilizan un enfoque más eficiente. En lugar de activar todo el modelo, un mecanismo de enrutamiento inteligente selecciona y activa solo unas pocas subredes «expertas» especializadas para cada tarea. Esto permite crear modelos mucho más grandes y potentes sin que los costes computacionales se disparen, lo que los hace perfectos para tareas de razonamiento complejo y para ofrecer una precisión de primer nivel con un menor gasto en tiempo de ejecución.
Según informa VentureBeat, la fuente principal de esta noticia, los modelos ya están disponibles para su descarga en Hugging Face, para uso local a través de Unsloth y mediante APIs de servicios como Together AI, Baseten y RunPod.
El secreto de la «intuición» artificial: ¿cómo aprenden a pensar mejor?
La verdadera innovación de Cogito v2 reside en su sistema de razonamiento híbrido. Todos los modelos pueden responder a una consulta de forma inmediata o, si la complejidad lo requiere, realizar un proceso de «reflexión interna» antes de dar una respuesta. Lo más revolucionario es que esta reflexión no es solo un comportamiento en tiempo de ejecución, sino que está integrada en el propio proceso de entrenamiento.
El método, que la compañía denomina «destilación y amplificación iterada» (IDA, por sus siglas en inglés), consiste en entrenar al modelo para que internalice sus propias cadenas de razonamiento. En lugar de depender de ejemplos estáticos, el modelo aprende de sus propios «pensamientos». Los caminos mentales que toma para llegar a una respuesta correcta se «destilan» y se reincorporan a sus pesos neuronales. Con el tiempo, aprende a identificar qué líneas de pensamiento son productivas y cuáles son callejones sin salida.
El resultado, según Deep Cogito, es un razonamiento más rápido y eficiente. Se desincentiva al modelo a «divagar más de la cuenta para llegar a la respuesta», fomentando en su lugar «el desarrollo de una intuición más fuerte para la trayectoria de búsqueda correcta».
Drishan Arora, CEO y cofundador de Deep Cogito, lo explica como la diferencia entre buscar un camino y ya saber aproximadamente dónde está el destino. «Dado que los modelos Cogito desarrollan una mejor intuición de la trayectoria a seguir durante la búsqueda en tiempo de inferencia, tienen cadenas de razonamiento un 60% más cortas que Deepseek R1», escribió en una publicación en X.
Rendimiento en el mundo real: más allá de los benchmarks
Esta mejora en la eficiencia del razonamiento se traduce en resultados concretos. Según los benchmarks internos, el modelo insignia Cogito v2-671B MoE iguala o supera al potente modelo DeepSeek R1 en tareas de razonamiento, logrando la misma o mejor precisión con un proceso de pensamiento significativamente más corto. Su rendimiento general es comparable al de otros modelos abiertos de primer nivel como Qwen1.5-72B y se acerca a la categoría de modelos cerrados como Claude 4 Opus.
Más allá de las cifras, los ejemplos prácticos ilustran su capacidad:
- Razonamiento matemático: Ante la pregunta de si un tren que viaja a 80 mph puede recorrer 240 millas en menos de 2,5 horas, el modelo determina internamente que el viaje dura 3 horas (240 / 80 = 3) y concluye correctamente que no es posible, utilizando menos de la mitad de los «tokens» (unidades de texto) que otros modelos para llegar a la misma respuesta.
- Razonamiento legal: Al analizar un caso hipotético de registro e incautación a la luz de un precedente del Tribunal Supremo de EE.UU., el modelo estructura su lógica en dos pasos claros, ofreciendo una respuesta matizada y bien justificada, una tarea en la que muchos LLMs todavía flaquean.
- Manejo de la ambigüedad: En la clásica pregunta «Si Alicia es la madre de Bob, y Bob es el padre de Carlos, ¿qué es Alicia para Carlos?», los modelos Cogito v2 identifican correctamente que Alicia es la abuela de Carlos, incluso en variantes de la pregunta donde otros modelos se confunden.
Eficiencia y estrategia: la historia de Deep Cogito
Aunque la compañía acaba de acaparar la atención de la comunidad de IA, Deep Cogito lleva más de un año construyendo su tecnología en silencio. Salió de su fase de desarrollo oculto («stealth mode») en abril de 2025 y, según los registros de Crunchbase, cerró una ronda de financiación inicial de 13 millones de dólares (aproximadamente 12,1 millones de euros) en noviembre de 2024, liderada por la firma de capital riesgo Benchmark.
Lo más sorprendente es la eficiencia de su inversión. Deep Cogito afirma haber entrenado sus ocho modelos (incluyendo la primera versión) por un coste total de menos de 3,5 millones de dólares (unos 3,25 millones de euros). Esta cifra contrasta drásticamente con los más de 100 millones de dólares (más de 93 millones de euros) que, según informes, costó entrenar algunos de los modelos más avanzados de OpenAI.
Arora atribuye esta frugalidad a la tesis central de la empresa: los modelos más inteligentes necesitan mejores fundamentos («priors»), no simplemente más tokens de datos. Al enseñar al modelo a evitar rutas de razonamiento redundantes, consiguen un mayor rendimiento sin inflar los costes de inferencia.
Un futuro de código abierto y mejora continua
El lanzamiento de Cogito v2 no es un punto final, sino un paso más en un proceso iterativo que el CEO describe como «escalada» («hill climbing»). La estrategia consiste en ejecutar los modelos, aprender de sus trazas de razonamiento, destilar ese aprendizaje en la siguiente versión y repetir el ciclo. Cada modelo se convierte en el trampolín para el siguiente.
La compañía ha reafirmado su compromiso de mantener todos sus modelos como código abierto, una decisión que ha atraído el apoyo de importantes socios de la industria como Hugging Face, Together AI, Meta y Unsloth. Con este lanzamiento, Deep Cogito no solo ofrece una nueva herramienta a la comunidad, sino que propone una forma diferente de construir inteligencia: no pensando más duro, sino aprendiendo a pensar mejor.






