¿Qué es DeepSeek; la herramienta de IA que puso a temblar a Google, Open AI y Meta?
En un sector dominado por gigantes como OpenAI, Google y Meta, una nueva inteligencia artificial de origen chino ha irrumpido con fuerza, amenazando con cambiar las reglas del juego.
La industria de la inteligencia artificial (IA) ha sido dominada durante mucho tiempo por empresas como OpenAI, Google y Meta. Sin embargo, en los últimos meses, una nueva estrella ha emergido desde China y ha sacudido el sector: DeepSeek. Este laboratorio de IA ha desarrollado modelos que desafían a los gigantes establecidos, logrando un rendimiento impresionante con una fracción de los recursos computacionales utilizados por sus competidores.
Publicidad
DeepSeek tiene su sede en Hangzhou, China, y fue fundada en julio de 2023 por Liang Wenfeng, un ingeniero informático y electrónico de la Universidad de Zhejiang. La empresa opera de manera independiente, sin la presión de inversores externos, lo que le permite centrarse en la investigación y el desarrollo a largo plazo. Su equipo está compuesto por jóvenes talentos de las mejores universidades chinas y apuesta por la innovación en el desarrollo de modelos de IA.
Desde su lanzamiento, DeepSeek ha ido ganando terreno en el mundo de la IA. En noviembre de 2023 presentó DeepSeek Coder, un modelo de código abierto para tareas de programación. Luego lanzó DeepSeek LLM, su primer gran modelo lingüístico (LLM). En mayo de 2024, DeepSeek-V2 se destacó por su alto rendimiento y bajo coste, obligando a otras grandes empresas tecnológicas chinas como ByteDance, Tencent y Baidu a reducir los precios de sus propios modelos de IA.
Capacidades y modelos de DeepSeek
Los modelos de DeepSeek han evolucionado rápidamente. DeepSeek-V2 fue sucedido por DeepSeek-Coder-V2, un modelo de 236.000 millones de parámetros con una ventana de contexto de hasta 128.000 tokens. Esto permite a la IA manejar textos largos con mayor eficiencia, lo que la hace ideal para el análisis de documentos extensos y tareas de código complejas.
Publicidad
En 2025, la empresa lanzó DeepSeek-V3 y DeepSeek-R1. DeepSeek-V3, con 671.000 millones de parámetros, logra resultados excepcionales con menos recursos que sus competidores. Por otro lado, DeepSeek-R1 se especializa en tareas avanzadas como matemáticas, programación y razonamiento complejo, compitiendo directamente con los modelos más recientes de OpenAI.
Publicidad
Accesibilidad y seguridad de DeepSeek
Uno de los factores que han hecho de DeepSeek un fenómeno es su gratuidad para los usuarios finales. Mientras que modelos como OpenAI o1 y Claude Sonnet requieren suscripciones pagas, DeepSeek ofrece su servicio sin restricciones. Aunque Google Gemini también es gratuito, sus versiones más avanzadas están limitadas.
Los usuarios pueden acceder a la plataforma a través de chat.deepseek, donde pueden interactuar con la IA mediante comandos. Además, cuenta con la función “Deep Think”, que ofrece respuestas más detalladas al buscar información en la web. No obstante, los usuarios deben verificar la información obtenida, ya que el modelo puede acceder a fuentes poco confiables.
En cuanto a la seguridad, DeepSeek recopila datos de los usuarios y los almacena en servidores en China, lo que ha generado dudas sobre la privacidad. Sin embargo, al ser de código abierto, investigadores independientes pueden analizar el modelo para evaluar su seguridad.
Innovaciones de DeepSeek
A pesar de las restricciones impuestas por Estados Unidos a la exportación de chips hacia China, DeepSeek ha encontrado formas innovadoras de entrenar sus modelos con menos recursos. La empresa utilizó GPU AMD Instinct y software ROCM para entrenar DeepSeek-V3. Además, según Forbes, Liang había adquirido grandes cantidades de chips Nvidia A100 antes de las sanciones, lo que le permitió desarrollar sus modelos con eficiencia.
Una de las claves del éxito de DeepSeek es su uso de arquitecturas innovadoras como:
- Aprendizaje por refuerzo (RL): En lugar del ajuste fino supervisado, DeepSeek emplea RL puro, donde la IA aprende a través de un sistema de recompensas y castigos.
- Arquitectura MoE (Mixture of Experts): Distribuye las tareas entre distintos “expertos” especializados, optimizando el rendimiento y reduciendo el costo computacional.
- Atención latente multicabezal: Permite a la IA analizar información desde distintas perspectivas, mejorando su comprensión.
- Destilación de modelos: Transfiere el conocimiento de modelos grandes a versiones más pequeñas y eficientes.
Gracias a estos avances, DeepSeek ha logrado entrenar modelos con costos significativamente menores que Meta y otros gigantes del sector.
El Futuro de DeepSeek
DeepSeek ha demostrado que la IA de alta calidad no tiene por qué requerir enormes cantidades de recursos. Su modelo de investigación independiente y su enfoque en la eficiencia han posicionado a la empresa como una amenaza real para OpenAI, Google y Meta.
Aunque DeepSeek se centra actualmente en la investigación y no tiene planes inmediatos de monetización, su impacto ya ha sido reconocido por líderes de la industria. Alexandr Wang, CEO de ScaleAI, describió a DeepSeek como “un modelo revolucionario” durante el Foro Económico Mundial en Davos. Con su enfoque innovador y su capacidad de desafiar a los gigantes tecnológicos con menos recursos, DeepSeek podría cambiar para siempre el panorama de la inteligencia artificial.
Sigue a Heraldo USA en Google News, dale CLIC AQUÍ.
Publicidad
Últimas Noticias
Publicidad
Más Leídas | Heraldo USA
Una cucharada de este ingrediente de cocina resucitará a tus plantas con hojas amarillas y secas
Por Heraldo USA
Donald Trump lanza moneda Meme $TRUMP e ingresa al mercado de las criptomonedas
Por Heraldo USA
¿Cómo Bashar Al-Assad? Así es como Trump planea el derrocamiento de Maduro en Venezuela
Por Heraldo USA
Blue Monday: ¿Por qué es el día “más triste del año” y en qué FECHA cae en 2025?
Por Heraldo USA
Publicidad
Más noticias de Meta
Más noticias de Tendencias
Últimas Noticias
Donald Trump reafirma los aranceles a México y Canadá a partir del 1 de febrero
Por Jonathan Almazán
Tras conflicto entre Trump y Petro, EEUU reanuda otorgamiento de VISAS americanas a colombianos
Por Agencias
Nicolás Maduro llama a inmigrantes venezolanos a volver a su país tras redadas masivas en EEUU
Comunidad científica no descarta NUEVA pandemia; ahora por gripe aviar
Por Jonathan Almazán
Estrategia de Emergencia Nacional: El plan de Honduras para enfrentar deportaciones masivas de EEUU
Por Jonathan Almazán
Gastrolab MX
¿Por qué no germinan las semillas? Errores que podrías estar cometiendo
Por Gastrolab México
¡No te compliques en la cocina! Así puedes preparar una rica pasta de coditos con atún al chipotle
Por Gastrolab México
¿Cuáles son los alimentos ultraprocesados y qué daños causan en el cuerpo? Aquí una lista sobre ellos
Por Gastrolab México
Haz este rico atole de masa sabor chocolate para ponerle el toque mexicano a tu desayuno
Por Gastrolab México
Recetas fáciles y económicas para preparar: Cocina unos ejotes con pollo para la hora de la comida
Por Gastrolab México
Heraldo MX
Adiós a la Inteligencia Artificial: cómo se vería la hermosa Misa Amane de ‘Death Note’ estilo cosplay
Por El Heraldo de México
Adiós a la Inteligencia Artificial: cómo se vería la hermosa Mitsuri Kanroji de ‘Demon Slayer’ estilo cosplay
Por El Heraldo de México
Niño de 4 años acaba en el hospital tras ser abusado por una mujer: la agresora era la novia de su mamá
Por El Heraldo de México
Cuándo abrirá la estación observatorio del Tren El Insurgente; esto es lo que sabemos
Por El Heraldo de México
BIMBO ofrece chamba DESDE CASA, abre VACANTES con sueldo competitivo y descuentos exclusivos en productos
Por El Heraldo de México