Después de 484 días de silencio, la compañía china DeepSeek vuelve al centro de la escena con el lanzamiento de DeepSeek V4, un modelo de pesos abiertos que promete sacudir los cimientos del ecosistema de IA dominado por actores como OpenAI y Google. El anuncio no solo marca un salto tecnológico, sino también un cambio estratégico en la competencia global.
El nuevo modelo llega en dos variantes: V4 Pro, con 1,6 billones de parámetros, y V4 Flash, con 248.000 millones. Ambos utilizan arquitectura Mixture-of-Experts (MoE), lo que permite activar solo una fracción de los parámetros durante cada tarea, reduciendo significativamente el costo computacional. Además, incorporan una impresionante ventana de contexto de hasta un millón de tokens, multiplicando por casi ocho la capacidad de su versión anterior.
En términos de eficiencia, DeepSeek asegura que V4 requiere solo el 27% de las operaciones por token y el 10% de la caché KV en comparación con su predecesor. Esta optimización se traduce en una mejora clave en rendimiento y escalabilidad, especialmente para aplicaciones complejas de coding y razonamiento avanzado.
Los primeros benchmarks son contundentes. En LiveCodeBench, DeepSeek V4 Pro-Max alcanza un 93,5%, superando al modelo Opus 4.6 de Anthropic (88,8%) y a Gemini 3.1 Pro de Google (91,7%). Aunque estos resultados aún no han sido verificados de forma independiente, posicionan al modelo como uno de los más competitivos del mercado.
Pero el verdadero diferencial está en el precio. DeepSeek V4 Pro cuesta 1,74 dólares por millón de tokens de entrada y 3,48 dólares de salida, lo que representa hasta siete veces menos que sus rivales directos. La versión Flash reduce aún más el costo, con tarifas de apenas 0,14/0,28 dólares, generando una fuerte presión sobre modelos como los de OpenAI y Anthropic.
Otro punto clave es el hardware. Aunque DeepSeek no confirmó los detalles del entrenamiento, sí se sabe que el modelo es compatible tanto con GPUs de NVIDIA como con chips Ascend de Huawei. Esta compatibilidad es estratégica, ya que reduce la dependencia de tecnología estadounidense y refuerza la autonomía del ecosistema chino.
El impacto geopolítico no pasó desapercibido. Según Jensen Huang, el soporte de Huawei representa una noticia “horrible” para Estados Unidos, ya que podría debilitar el dominio de NVIDIA en el entrenamiento de modelos de IA. Este movimiento marca un nuevo capítulo en la carrera tecnológica global.
Sin embargo, el lanzamiento llega en un momento de transición interna para DeepSeek. La empresa ha perdido talento clave —como Guo Daya y Luo Fuli— y busca levantar 300 millones de dólares en su primera ronda de financiación externa, con una valoración estimada en 20.000 millones. Aun así, el enfoque parece claro: consolidar un modelo de alto rendimiento a bajo costo como su principal ventaja competitiva.
En perspectiva, DeepSeek V4 representa la evolución del llamado “momento DeepSeek” iniciado en 2025. Si el rendimiento real confirma lo que prometen los benchmarks, el modelo no solo consolidará esa tendencia, sino que podría redefinir las reglas del mercado de la IA, especialmente en un contexto donde empresas como Anthropic enfrentan críticas por el aumento de costos y el fenómeno de la “reduflación” de tokens.
Preguntas frecuentes
¿Qué hace diferente a DeepSeek V4 Pro frente a otros modelos de IA?
Su combinación de alto rendimiento, arquitectura eficiente MoE y un costo significativamente menor lo posiciona como una alternativa disruptiva frente a modelos propietarios.
¿Por qué es importante el soporte de chips de Huawei?
Porque reduce la dependencia de hardware estadounidense como NVIDIA, fortaleciendo la soberanía tecnológica y cambiando el equilibrio global en IA.
¿Se puede confiar en los benchmarks de DeepSeek?
Son prometedores, pero aún no han sido verificados de forma independiente, por lo que será clave evaluar su rendimiento en aplicaciones reales.