DeepL estrena un superordenador con chips Nvidia capaz de traducir todo internet en 18 días

Droids

Updated on:

La compañía alemana de inteligencia artificial DeepL, conocida por su popular servicio de traducción, ha anunciado la puesta en marcha de un nuevo superordenador de última generación. Equipado con los potentes chips Blackwell de Nvidia, esta nueva infraestructura dota a la empresa de una capacidad de procesamiento masiva, que le permitiría teóricamente traducir la totalidad de internet en tan solo 18 días. Este movimiento estratégico no solo busca perfeccionar su tecnología de traducción, sino que también consolida a DeepL como un actor clave en la competitiva carrera global de la IA.

Un salto cuántico en capacidad de procesamiento

En el corazón de este avance se encuentra un nuevo y avanzado clúster de supercomputación, un sistema que conecta miles de procesadores para que trabajen como un único y gigantesco cerebro. La potencia de este sistema proviene de su arquitectura, basada en las GPU (Unidades de Procesamiento Gráfico) Nvidia B200, pertenecientes a la recién anunciada plataforma Blackwell. Estas GPU están diseñadas específicamente para las cargas de trabajo más exigentes de la inteligencia artificial, como el entrenamiento de los complejos modelos que impulsan los servicios de DeepL.

Los modelos de lenguaje grandes (LLM, por sus siglas en inglés), que son la tecnología base de herramientas como ChatGPT y el traductor de DeepL, requieren una cantidad ingente de datos y poder de cómputo para aprender los patrones, matices y complejidades del lenguaje humano. Con esta nueva adquisición, DeepL acelera drásticamente su capacidad para entrenar y refinar sus modelos.

«Este es un momento decisivo para DeepL», afirmó Jaroslaw Kutylowski, CEO y fundador de la compañía. «Esta inversión en infraestructura de primer nivel nos permite no solo mejorar la precisión y la naturalidad de nuestras traducciones actuales, sino también acelerar nuestra investigación y desarrollo para ofrecer nuevos productos y soluciones de comunicación basados en IA», explicó en el comunicado de prensa oficial publicado por la empresa.

El hito de los 18 días: ¿Qué significa realmente?

La afirmación de que el nuevo sistema puede «traducir todo internet en 18 días» es la métrica más llamativa del anuncio. Sin embargo, es importante entenderla en su contexto. No se trata de un proyecto que DeepL vaya a acometer, sino de un parámetro de referencia para ilustrar la magnitud de su nueva capacidad de cómputo.

La «totalidad de internet» se refiere a una estimación del vasto corpus de texto disponible en la web pública, similar a los gigantescos conjuntos de datos como Common Crawl, que se utilizan para entrenar a los modelos de IA y que contienen billones de palabras. La capacidad de procesar tal volumen de información en poco más de dos semanas demuestra un aumento exponencial en la eficiencia de la compañía.

Para el usuario final, los beneficios de este poder de cálculo se traducirán en:

  • Traducciones más rápidas y precisas: Los modelos podrán ser más grandes y complejos, captando mejor los matices, el contexto cultural y las expresiones idiomáticas.
  • Ampliación de idiomas: La capacidad de entrenar modelos más rápidamente facilitará la incorporación de nuevos idiomas y dialectos, especialmente aquellos con menos recursos digitales disponibles.
  • Nuevas funcionalidades: Esta potencia abre la puerta a nuevas herramientas, como la adaptación del tono del texto, resúmenes avanzados o análisis de sentimientos en múltiples idiomas.

La alianza con Nvidia para liderar la IA

La elección de los chips de Nvidia no es casual. La compañía estadounidense se ha convertido en el principal proveedor de la infraestructura que sustenta la revolución de la inteligencia artificial. Sus GPU son el estándar de facto en la industria para el entrenamiento de modelos de lenguaje.

Jensen Huang, fundador y CEO de Nvidia, celebró la colaboración destacando el potencial de la nueva tecnología. «Estamos entusiasmados de ver cómo pioneros como DeepL utilizan nuestra plataforma Blackwell para derribar las barreras del lenguaje», escribió Huang en la red social X. «La IA generativa está redefiniendo la comunicación global, y DeepL está a la vanguardia de esta transformación».

La arquitectura Blackwell, sucesora de la exitosa plataforma Hopper (H100), promete un rendimiento varias veces superior, lo que permite a empresas como DeepL abordar problemas de una escala que antes era inalcanzable, consolidando su ventaja competitiva.

Una inversión millonaria en un mercado ferozmente competitivo

Este despliegue tecnológico está respaldado por una inversión sustancial. Según fuentes cercanas a la compañía citadas por la agencia de noticias Reuters, el coste total del nuevo clúster de supercomputación asciende a unos 300 millones de dólares (aproximadamente 275 millones de euros).

Esta cifra se enmarca en la estrategia de crecimiento de DeepL, que recientemente alcanzó una valoración de 2.000 millones de dólares tras su última ronda de financiación. La inversión subraya la intención de la empresa de competir cara a cara con los gigantes tecnológicos como Google, Microsoft y Amazon, que también invierten miles de millones en sus propias infraestructuras de IA.

Mientras que las grandes corporaciones estadounidenses dominan gran parte del panorama de la IA, DeepL se ha erigido como el principal campeón europeo en el campo de la tecnología del lenguaje. Con este nuevo superordenador, la compañía no solo refuerza su producto estrella, sino que se dota de los recursos necesarios para innovar y expandirse hacia nuevas fronteras de la inteligencia artificial, asegurando que Europa siga siendo un polo de relevancia en la era digital.

Deja un comentario