Inteligencia Artificial

DeepSeek afina su modelo insignia con R1‑0528 y refuerza su apuesta por la IA abierta

Mejora la profundidad de razonamiento, reduce errores factuales y amplía la ventana de contexto hasta 128K tokens. Además, optimiza la generación de código y facilita la integración con funciones externas, consolidando a DeepSeek como referente en IA abierta.

DeepSeek, la startup china que en enero de 2025 sacudió al mundo de la inteligencia artificial con su modelo R1, acaba de lanzar una nueva versión, R1‑0528, fortaleciendo todavía más su posición en la carrera global por la IA.

¿Qué es DeepSeek R1 y por qué fue revolucionario?

Presentado en enero de 2025, R1 sorprendió por entregar un razonamiento computacional comparable —e incluso superior en ciertos benchmarks— a modelos occidentales como los de OpenAI o Google, con una estructura de costos significativamente menor. El lanzamiento causó una fuerte reacción financiera: las acciones de compañías como NVIDIA, Microsoft y ASML cayeron entre un 6 % y 8 %.

Además, el CEO de OpenAI, Sam Altman, lo calificó como “impresionante”, resaltando su capacidad para igualar el rendimiento de o1, pero a 20 a 50 veces menor costo. El éxito de DeepSeek residió en su enfoque abierto y económico: lanzó R1 bajo licencia MIT, permitiendo su uso comercial y modificable.

La actualización del modelo R1 permite generar cadenas de pensamiento más extensas y coherentes.
La actualización del modelo R1 permite generar cadenas de pensamiento más extensas y coherentes.

R1‑0528: una actualización discreta, pero poderosa

A finales de mayo (28 de mayo de 2025), DeepSeek publicó discretamente en Hugging Face la versión R1‑0528, una «actualización menor de prueba» que trae mejoras significativas. A continuación, sus principales avances:

  • Mayor profundidad de razonamiento: en el examen matemático AIME 2025, su tasa de aciertos pasó del 70 % al 87,5 %, con cadenas de pensamiento de hasta 23 000 tokens por pregunta, frente a los 12 000 anteriores.
  • Reducción de alucinaciones: disminuye aproximadamente un 50 % los errores factuales en resúmenes, reescrituras y comprensión lectora.
  • Soporte para indicaciones de sistema y funciones: ahora basta con un prompt inicial («system prompt») para activar contextos avanzados; se elimina la necesidad de trucos como «<think>\n».
  • Contexto ampliado: puede gestionar hasta 128 000 tokens, ideal para largos documentos, conversaciones prolongadas o proyectos de software complejos.
  • Mejor generación de código (“vibe coding”): produce código más limpio, comentado y estructurado, reduciendo errores sintácticos.
R1‑0528: el modelo ahora puede procesar hasta 128.000 tokens de contexto, ideal para análisis extensos y proyectos de código.
El modelo ahora puede procesar hasta 128.000 tokens de contexto, ideal para análisis extensos y proyectos de código.

Un análisis de LiveCodeBench —desarrollado por UC Berkeley, MIT y Cornell— ubica a R1‑0528 justo debajo de los modelos o4‑mini y o3 de OpenAI en generación de código, superando a sistemas como Grok 3 Mini y Qwen 3.

Impacto global y reacciones de la industria

El relanzamiento de R1 con mejoras potentes sin despliegue formal refuerza el modelo de desarrollo estratégico: enfoque incremental y comunitario. La naturaleza open‑source acelera su adopción en gigantes como Tencent, Baidu y ByteDance, que ya integran sus modelos en sus servicios en la nube.

Analistas internacionales destacan que R1‑0528 afianza la presión sobre OpenAI y Google para que lancen modelos más eficientes y accesibles. En respuesta, EE. UU. está acelerando la liberación de modelos como Gemini 2.5 Pro y optimizando precios.

La IA de DeepSeek apunta a competir directamente con gigantes como OpenAI y Google, con costos mucho menores.
La IA china apunta a competir directamente con gigantes como OpenAI y Google, con costos mucho menores.

¿Rumbo a R2?

Aunque muchos esperaban el debut de R2 en mayo, DeepSeek reorientó su estrategia hacia la consolidación del R1 con mejoras progresivas. Esto indica que R1‑0528 actúa como una base sólida antes de avanzar hacia un salto cualitativo mayor.

Panorama estratégico

  • Competencia creciente: los modelos occidentales cuentan con más recursos, pero el enfoque open‑source y costo‑eficiente desafía ese paradigma.
  • Equilibrio de poder: el lanzamiento de R1‑0528 señala que no solo China innova a gran escala, sino que también lo hace con rapidez y sin dependencia de hardware ultramoderno.
  • Impulso a la colaboración: la comunidad global de research y developers participará activamente en R1‑0528, al haber respaldo comunitario, licencias permisivas y una actualización optimizada.

Leer más

Autor

[mdx-adserve-bstreet region="MED"]

Publicaciones relacionadas

Botón volver arriba