El lanzamiento del modelo R1 de DeepSeek, el pasado 20 de enero, ha revolucionado el mercado de la inteligencia artificial generativa. Este modelo, desarrollado en China, destaca por su bajo costo de entrenamiento, su enfoque de “cadena de pensamiento” y su disponibilidad como código abierto.
DeepSeek entrenó su modelo en tan solo 55 días, con un presupuesto de 5.57 millones de dólares, utilizando procesadores H800 de Nvidia. Este costo representa menos de una décima parte del gasto de GPT-4 de OpenAI, marcando un punto de inflexión en la idea de que los avances en IA requieren inversiones gigantescas en recursos de cómputo. Según el experto en informática Robert Clarisó, de la UOC, “esto ha dejado en estado de shock al mundo de la IA”.
El modelo R1 ofrece rendimiento competitivo en tareas como resolución de problemas matemáticos, programación e inferencia del lenguaje natural, comparándose favorablemente con modelos como Claude de Anthropic o o1 de OpenAI. Además, su licencia de código abierto (MIT) permite que cualquier persona lo examine, modifique y adapte, lo que ha contribuido a su rápida adopción, especialmente fuera de China, donde usuarios buscan evitar la censura.
Para seguir leyendo: Microsoft y Oracle entre los interesados en comprar TikTok
Sin embargo, su éxito no ha estado exento de desafíos. En las últimas horas, DeepSeek ha enfrentado ciberataques masivos, lo que ha limitado el registro de nuevos usuarios. Según Kaspersky, estos podrían ser ataques de denegación de servicio (DDoS) o intentos de explotación de vulnerabilidades.
El momento del lanzamiento, coincidiendo con el regreso de Donald Trump y el anuncio del proyecto estadounidense ‘Stargate’ con 500 millones de dólares para IA, también ha influido en el impacto global de DeepSeek. Su aparición desafía la hegemonía tecnológica de Estados Unidos y redefine las reglas del sector, posicionándose como un competidor inesperado en el mercado de la inteligencia artificial.