DeepSeek anuncia actualización a V3.1, optimizada para chips chinos de IA de próxima generación

DeepSeek anunció el jueves una actualización de uno de sus modelos de lenguaje grande, el V3.1, y señaló que está adaptado para los chips de inteligencia artificial de próxima generación fabricados en China que se lanzarán próximamente.

La empresa china indicó en su cuenta oficial de WeChat que el formato de precisión «UE8M0 FP8» de su modelo V3.1 está diseñado para los chips domésticos de próxima generación. El FP8 (punto flotante de 8 bits) es un formato de procesamiento de datos que puede aumentar la eficiencia computacional para el entrenamiento e inferencia de modelos de aprendizaje profundo.

DeepSeek afirmó que su modelo V3.1 incluye «cambios importantes», como tiempos de respuesta más rápidos y una arquitectura de razonamiento híbrida que permite al modelo operar tanto en modos de razonamiento como de no razonamiento. Los modelos de razonamiento pueden ejecutar tareas más complicadas mediante un proceso de pensamiento lógico paso a paso.

La empresa no reveló qué chips utilizó para entrenar el V3.1 ni con qué chips locales podría ser compatible el UE8M0 FP8.

Esta referencia a los chips chinos de próxima generación podría indicar planes de trabajar más estrechamente con el emergente ecosistema de chips de IA de China, en el contexto de las restricciones de exportación de semiconductores avanzados de Washington y el impulso de Beijing por la autosuficiencia en chips.

Hace aproximadamente dos semanas, Beijing habría instado a los desarrolladores chinos de IA a utilizar alternativas domésticas a las unidades de procesamiento gráfico (GPU) de Nvidia utilizadas en el entrenamiento de IA.

A principios de este año, DeepSeek lanzó su modelo de razonamiento R1, que demostró capacidades comparables a competidores occidentales como OpenAI, a pesar de las restricciones de exportación estadounidenses que impedían a DeepSeek usar los chips de entrenamiento de IA más avanzados de Nvidia. En diciembre, DeepSeek había lanzado su modelo V3, indicando que había sido entrenado con aproximadamente 2.000 chips menos avanzados de Nvidia.

Tras los avances de DeepSeek, Estados Unidos endureció aún más las restricciones de exportación en abril, prohibiendo efectivamente los chips H20 de Nvidia, diseñados específicamente para cumplir con las restricciones de exportación previas a China. El mes pasado, funcionarios de la administración Trump declararon que planeaban permitir que Nvidia reanudara el envío de chips H20 a China. Sin embargo, estos chips enfrentan actualmente escrutinio en China, con reguladores exigiendo a las empresas no comprarlos hasta completar una revisión de seguridad nacional.

Los analistas señalan que los fabricantes domésticos de chips de IA de China están rezagados respecto a Nvidia en avance tecnológico y escala, aunque empresas como Huawei han estado progresando. Los analistas de chips consultados por CNBC indicaron que empresas como Huawei, que buscan construir un ecosistema alternativo de chips de IA en China, podrían beneficiarse de la ausencia de los H20 de Nvidia en el mercado.

DeepSeek ajustará los precios para usar la API de su modelo a partir del 6 de septiembre.

Noticias

OpenAI aclara que no busca una garantía del gobierno para su infraestructura

Noticias

Google presenta Ironwood, su nuevo chip de IA para competir con Nvidia

Noticias

La IA multiplica por 11 los pedidos en Shopify desde enero

Noticias

La justicia británica da la razón a Stability AI en su juicio contra Getty

Noticias

Anthropic proyecta 70.000 millones de ingresos en 2028 impulsada por las empresas

Noticias

Studio Ghibli y editoriales japonesas exigen a OpenAI no entrenar su IA con sus obras

DeepSeek anuncia actualización a V3.1, optimizada para chips chinos de IA de próxima generación

LO ÚLTIMO

Noticias

OpenAI aclara que no busca una garantía del gobierno para su infraestructura

Noticias

Google presenta Ironwood, su nuevo chip de IA para competir con Nvidia

Noticias

La IA multiplica por 11 los pedidos en Shopify desde enero

Noticias

La justicia británica da la razón a Stability AI en su juicio contra Getty

Noticias

Anthropic proyecta 70.000 millones de ingresos en 2028 impulsada por las empresas

Noticias

Studio Ghibli y editoriales japonesas exigen a OpenAI no entrenar su IA con sus obras