DeepSeek ha lanzado su nuevo modelo DeepSeek-V3.1, una versión optimizada para chips chinos que podría representar un serio desafío para el dominio de NVIDIA y otras empresas estadounidenses de chips en el mercado de la inteligencia artificial.
Un Modelo Híbrido para el Mercado Chino
DeepSeek-V3.1 utiliza un sistema de inferencia híbrida, similar a GPT-5, con dos modos: "Think" (razonamiento profundo) y "Non-Think" (respuesta rápida). La compañía asegura que el modo "Think" ofrece respuestas más rápidas que su predecesor. Este enfoque marca una evolución significativa en la forma en que se aborda la inferencia en modelos de IA.
FP8: Optimizado para Chips Chinos
La clave del nuevo modelo reside en su uso del formato de datos FP8, específicamente el UE8M0 FP8. DeepSeek ha anunciado que este formato ha sido "pensado para la próxima generación de chips nacionales", lo que sugiere una optimización específica para los procesadores chinos, potencialmente los chips Ascend de Huawei. Este enfoque de optimización para hardware específico podría darle a DeepSeek una ventaja significativa en el mercado chino.
El formato FP8, con la mitad del peso de FP16/BF16, ofrece un mayor rendimiento por ciclo y una menor necesidad de memoria, si el escalado se realiza correctamente. La integración de FP8 en DeepSeek-V3.1 no se limita al empaquetado de pesos, sino que abarca todo el proceso, desde el entrenamiento hasta la ejecución.
El Impacto en NVIDIA
La apuesta de DeepSeek podría afectar significativamente a NVIDIA, que obtuvo aproximadamente el 13% de sus ingresos de China en su último ejercicio fiscal. Si DeepSeek logra demostrar una eficiencia superior en chips chinos con su formato FP8, la demanda de las soluciones de NVIDIA podría disminuir, especialmente en el mercado chino. Este escenario pone de manifiesto la importancia del control del hardware en el desarrollo y la implementación de la IA.
Contexto Político y Tecnológico
El lanzamiento de DeepSeek-V3.1 se produce en un contexto de tensiones geopolíticas y controles de exportación de EEUU. Las restricciones a la exportación de chips punteros hacia China han impulsado el desarrollo de la industria local, fomentando la autosuficiencia. La estrategia de DeepSeek refleja la creciente competencia y la búsqueda de independencia tecnológica en el sector de la IA.
DeepSeek-V3.1 no es solo una simple mejora; representa un avance estratégico en la integración de hardware y software de IA en China. A pesar de desafíos previos en el entrenamiento con chips chinos, esta iteración demuestra la determinación de DeepSeek en ofrecer una solución competitiva y adaptable al ecosistema local.
En resumen, DeepSeek-V3.1 es un modelo de IA potente y optimizado para chips chinos. Su éxito podría marcar un cambio significativo en el panorama tecnológico, generando una competencia más equilibrada y redefiniendo el dominio de las empresas de chips de Estados Unidos.
Fuente: Xataka