Así es DeepSeek, la nueva IA de la que todo el mundo habla y que podría destronar a Nvidia y OpenAI

Después de que el terremoto Trump desembarcase en Estados Unidos y lo pusiese todo patas arriba en el terreno de la inteligencia artificial, aboliendo leyes y dando millonadas a un nuevo proyecto de IA, DeepSeek, una startup china fundada en 2023 y con sede en Hangzhou, está revolucionando el sector con tan solo haber aparecido.

Su reciente modelo, DeepSeek-V3, no solo ha superado a ChatGPT como la aplicación gratuita más descargada en la App Store de Apple en Estados Unidos, sino que también está desatando una hecatombe en el mercado tecnológico global.

DeepSeek-V3 ha ganado popularidad porque, a diferencia de los modelos de IA occidentales que requieren infraestructuras costosas y chips de alta gama, DeepSeek utiliza hardware menos avanzado, como los chips Nvidia H800, y consigue resultados competitivos a un coste considerablemente inferior. Según la empresa, entrenar su modelo costó menos de 6 millones de dólares, un dato que contrasta con las elevadas inversiones necesarias para modelos similares desarrollados en Estados Unidos.

El modelo no solo reduce los costes de producción, sino que también optimiza el uso de datos, lo que ha permitido a DeepSeek ofrecer su asistente de manera gratuita, atrayendo a millones de usuarios en todo el mundo. Esta accesibilidad ha generado un gran interés, especialmente en Estados Unidos, donde los usuarios han descargado la aplicación en masa desde su lanzamiento el pasado 10 de enero.

¿Qué puede hacer DeepSeek?

DeepSeek es un asistente de inteligencia artificial generativa impulsado por el modelo DeepSeek V3, el cual ha sido entrenado con 671.000 millones de parámetros. Está disponible de modo gratuito en App Store.

Además de responder preguntas en un formato conversacional, puede navegar por la web para ofrecer respuestas actualizadas, resumir documentos de texto de manera rápida y utilizar el razonamiento para resolver problemas complejos.

Según afirman, el modelo “supera a otros modelos de código abierto y logra un rendimiento comparable al de los principales modelos de código cerrado”. Así, tal y como informan desde Europa Press, en la evaluación de la comprensión del lenguaje (MMLU Pro) en una variedad de tareas, DeepSeek V3 alcanza una puntuación de 75.9 frente al 78.0 de Claude 3.5 Sonnet (de Anthropic), el 72.6 de GPT 4o (de OpenAI) y el 73.3 de Llama 3.1 405B (de Meta).

En la evaluación de la capacidad para responder preguntas complejas de nivel posgrado (GPAQ Diamond), DeepSeek V3 ha obtenido una puntuación de 59.1, por debajo de Claude 3.5 Sonnet (65.0), pero por encima de GPT 4o (49.9), Qwen 2.5 de 72B (49.0) y Llama 3.1 405B (51.1).

También queda en segunda posición en el análisis de la capacidad para resolver problemas de software del mundo real (SWE), en el que alcanza una puntuación de 42.0, frente a los 50.8 de Claude 3.5 Sonnet, seguidos de GPT 4o (38.8), Llama 3.1 405B (24.5) y Qwen 2.5 de 72B (23.8).

En cambio, sobre sale en las pruebas de resolución de desafíos (MATH 500), donde obtiene 90.2, mientras que Claude 3.5 Sonnet alcanza 78.9; Qwen 2.5 de 72B, 80.0; GPT 4o, 74.6, y Llama 3.1 405B, 73.8 puntos. También lo hace en la resolución de problemas matemáticos con AIME 2024, con una puntuación de 39.2, seguido de Qwen 2.5 de 72B y Llama 3.1 405B (ambos 23.3), Claude 3.5 Sonnet (16.0) y GPT 4o (9.3).

En programación, en la prueba Codeforces, DeepSeek V3 alcanza 51.6 puntos, Qwen 2.5 de 72B , 24.8; Llama 3.1 405B, 25.3 puntos; GPT 4o23.6; y Claude 3.5 Sonnet, una puntuación de 20.3.

Impacto en el mercado tecnológico

El éxito de DeepSeek también ha tenido repercusiones significativas en los mercados financieros. Empresas como Nvidia, Microsoft, Meta Platforms y Alphabet han visto caídas sustanciales en sus acciones tras el lanzamiento del modelo chino. La razón principal es la incertidumbre sobre la demanda futura de chips avanzados, un segmento clave para estas empresas.

Hasta ahora, la narrativa predominante apuntaba a que la IA impulsaría una demanda masiva de hardware de alta gama. Sin embargo, DeepSeek ha puesto en duda esta idea al demostrar que es posible obtener resultados de alto nivel sin necesidad de infraestructuras costosas.

Analistas financieros destacan que, aunque el enfoque de DeepSeek podría ser positivo para los consumidores y la productividad global, representa un reto para los fabricantes de hardware avanzado.

El auge de DeepSeek también ha reavivado el debate sobre la supremacía tecnológica entre Estados Unidos y China. A pesar de las restricciones impuestas por la administración Biden desde 2021 para limitar la exportación de chips avanzados a China, la startup ha logrado entrenar un modelo competitivo. Esto ha llevado a cuestionar la eficacia de dichas políticas y a subrayar la capacidad de innovación de las empresas chinas, incluso en un entorno restrictivo.

La semana pasada, la compañía china presentó una nueva familia de modelos de razonamiento, DeepSeek-R1-Zero y DeepSeek-R1.

Apúntate a nuestra newsletter y recibe en tu correo las últimas noticias sobre tecnología.

Zircon - This is a contributing Drupal Theme
Design by WeebPal.