Heraldo USA > tendencias

¿Qué es DeepSeek; la herramienta de IA que puso a temblar a Google, Open AI y Meta?

En un sector dominado por gigantes como OpenAI, Google y Meta, una nueva inteligencia artificial de origen chino ha irrumpido con fuerza, amenazando con cambiar las reglas del juego.

¿Qué es DeepSeek; la herramienta de IA que puso a temblar a Google, Open AI y Meta?
AFP

Compartir este artículo

Facebook
Twitter
WhatsApp
Email

La industria de la inteligencia artificial (IA) ha sido dominada durante mucho tiempo por empresas como OpenAI, Google y Meta. Sin embargo, en los últimos meses, una nueva estrella ha emergido desde China y ha sacudido el sector: DeepSeek. Este laboratorio de IA ha desarrollado modelos que desafían a los gigantes establecidos, logrando un rendimiento impresionante con una fracción de los recursos computacionales utilizados por sus competidores.

Publicidad

DeepSeek tiene su sede en Hangzhou, China, y fue fundada en julio de 2023 por Liang Wenfeng, un ingeniero informático y electrónico de la Universidad de Zhejiang. La empresa opera de manera independiente, sin la presión de inversores externos, lo que le permite centrarse en la investigación y el desarrollo a largo plazo. Su equipo está compuesto por jóvenes talentos de las mejores universidades chinas y apuesta por la innovación en el desarrollo de modelos de IA.

Desde su lanzamiento, DeepSeek ha ido ganando terreno en el mundo de la IA. En noviembre de 2023 presentó DeepSeek Coder, un modelo de código abierto para tareas de programación. Luego lanzó DeepSeek LLM, su primer gran modelo lingüístico (LLM). En mayo de 2024, DeepSeek-V2 se destacó por su alto rendimiento y bajo coste, obligando a otras grandes empresas tecnológicas chinas como ByteDance, Tencent y Baidu a reducir los precios de sus propios modelos de IA.

Capacidades y modelos de DeepSeek

Los modelos de DeepSeek han evolucionado rápidamente. DeepSeek-V2 fue sucedido por DeepSeek-Coder-V2, un modelo de 236.000 millones de parámetros con una ventana de contexto de hasta 128.000 tokens. Esto permite a la IA manejar textos largos con mayor eficiencia, lo que la hace ideal para el análisis de documentos extensos y tareas de código complejas.

Publicidad

En 2025, la empresa lanzó DeepSeek-V3 y DeepSeek-R1. DeepSeek-V3, con 671.000 millones de parámetros, logra resultados excepcionales con menos recursos que sus competidores. Por otro lado, DeepSeek-R1 se especializa en tareas avanzadas como matemáticas, programación y razonamiento complejo, compitiendo directamente con los modelos más recientes de OpenAI.

Publicidad

Accesibilidad y seguridad de DeepSeek

Uno de los factores que han hecho de DeepSeek un fenómeno es su gratuidad para los usuarios finales. Mientras que modelos como OpenAI o1 y Claude Sonnet requieren suscripciones pagas, DeepSeek ofrece su servicio sin restricciones. Aunque Google Gemini también es gratuito, sus versiones más avanzadas están limitadas.

Los usuarios pueden acceder a la plataforma a través de chat.deepseek, donde pueden interactuar con la IA mediante comandos. Además, cuenta con la función “Deep Think”, que ofrece respuestas más detalladas al buscar información en la web. No obstante, los usuarios deben verificar la información obtenida, ya que el modelo puede acceder a fuentes poco confiables.

En cuanto a la seguridad, DeepSeek recopila datos de los usuarios y los almacena en servidores en China, lo que ha generado dudas sobre la privacidad. Sin embargo, al ser de código abierto, investigadores independientes pueden analizar el modelo para evaluar su seguridad.

Innovaciones de DeepSeek

A pesar de las restricciones impuestas por Estados Unidos a la exportación de chips hacia China, DeepSeek ha encontrado formas innovadoras de entrenar sus modelos con menos recursos. La empresa utilizó GPU AMD Instinct y software ROCM para entrenar DeepSeek-V3. Además, según Forbes, Liang había adquirido grandes cantidades de chips Nvidia A100 antes de las sanciones, lo que le permitió desarrollar sus modelos con eficiencia.

Una de las claves del éxito de DeepSeek es su uso de arquitecturas innovadoras como:

  • Aprendizaje por refuerzo (RL): En lugar del ajuste fino supervisado, DeepSeek emplea RL puro, donde la IA aprende a través de un sistema de recompensas y castigos.
  • Arquitectura MoE (Mixture of Experts): Distribuye las tareas entre distintos “expertos” especializados, optimizando el rendimiento y reduciendo el costo computacional.
  • Atención latente multicabezal: Permite a la IA analizar información desde distintas perspectivas, mejorando su comprensión.
  • Destilación de modelos: Transfiere el conocimiento de modelos grandes a versiones más pequeñas y eficientes.

Gracias a estos avances, DeepSeek ha logrado entrenar modelos con costos significativamente menores que Meta y otros gigantes del sector.

El Futuro de DeepSeek

DeepSeek ha demostrado que la IA de alta calidad no tiene por qué requerir enormes cantidades de recursos. Su modelo de investigación independiente y su enfoque en la eficiencia han posicionado a la empresa como una amenaza real para OpenAI, Google y Meta.

Aunque DeepSeek se centra actualmente en la investigación y no tiene planes inmediatos de monetización, su impacto ya ha sido reconocido por líderes de la industria. Alexandr Wang, CEO de ScaleAI, describió a DeepSeek como “un modelo revolucionario” durante el Foro Económico Mundial en Davos. Con su enfoque innovador y su capacidad de desafiar a los gigantes tecnológicos con menos recursos, DeepSeek podría cambiar para siempre el panorama de la inteligencia artificial.

Sigue a Heraldo USA en Google News, dale CLIC AQUÍ.

Temas relacionados

author

Diana Rivero

Publicidad

Publicidad

Publicidad