Resumen para recién llegados:
La Paradoja del Tomate: Cómo DeepSeek, el Open Source y Stargate redefinirán la guerra de la IA
Imagina que tienes una plantación de 100 metros cuadrados con plantas de tomates y un sistema de producción que te da 50 tomates. Tu vecino con los ojos medio cerrados, resulta que en su balcón ha conseguido con unos 6 metros cuadrados de tierra conseguir 40 tomates. Para ello ha usado un sistema de alimentación de la planta más eficiente, sin inventar «demasiado» ya que ese sistema lo han copiado de un vecino que se lo había prestado. Como la condición del que se lo ha prestado, era que si los resultados eran buenos, tendrían que permitir a todos usar su «sistema de alimentación».
Más o menos eso serian datos extrapolados del resultado estadísticos. OpenAI invierte 100 millones de euros en el entrenamiento de su modelo, mientras DeepSeek invierte unos 6 millones.
DeepSeek se apoya en una arquitectura open source, basada en modelos predecesores como LLaMA (Meta) y BLOOM (BigSciencew) . Esto implica que este nuevo modelo, ahora se libera bajo open source y cualquiera puede descargárselo a su ordenador y ver como lo han hecho. Open Source , si no estás familiarizado con el término, es que enseñas al mundo de forma gratis como lo has hecho, y les dejas que lo usen, lo copien y lo mejoren de forma gratuita.
Y como resumen que nadie se engañe, es importante que el modelo sea efectivo, pero tener la plantación mayor a largo plazo es lo más importante. La plantación es la granja de GPUs y energía que formará parte del proyecto StarGate. Eso y solo eso es lo que marcará la diferencia.
Explayándonos un poco mas técnicamente.
DeepSeek y el Paradigma del Open Source
DeepSeek no es solo otro modelo de IA; es una apuesta por el código abierto en un momento donde grandes corporaciones buscan restringir el acceso al desarrollo de modelos avanzados. Se basa en arquitecturas open source previas como Llama de Meta, Mistral y Falcon, lo que significa que su código y arquitectura pueden ser utilizados y modificados libremente.
Al basarse en el modelo open source, cualquier mejora o modificación que se haga sobre DeepSeek deberá mantenerse en el mismo ecosistema, asegurando que la innovación permanezca accesible para todos y no quede en manos de unos pocos gigantes tecnológicos. Esto es una diferencia crucial frente a modelos cerrados como los de OpenAI o Anthropic, cuyos avances están restringidos por intereses comerciales.
Sin embargo, esta apertura también conlleva limitaciones. DeepSeek, como muchos otros modelos, está afectado por sesgos ideológicos y restricciones que pueden condicionar su aplicabilidad en diversos contextos. Mientras en el código abierto la transparencia es clave, los sesgos y las barreras en los datos de entrenamiento pueden convertirse en una trampa para su verdadero potencial.
La Caída de NVIDIA y el Verdadero Futuro de la IA
Recientemente, NVIDIA ha sufrido caídas en bolsa, y una de las razones detrás de este fenómeno es la impaciencia y falta de visión estratégica de sus actuales gestores. En el corto plazo, modelos más eficientes como DeepSeek podrían parecer una amenaza para el dominio de las GPUs en la IA, pero a largo plazo, la realidad es innegable:
- El futuro de la IA dependerá de dos cosas fundamentales: procesamiento y energía.
- Ningún avance en eficiencia eliminará la necesidad de hardware y potencia energética masiva.
El único país con una visión clara en este sentido es Estados Unidos, que ha diseñado su proyecto Stargate, destinado a mantener su dominio en el procesamiento de IA en las próximas décadas. Por más que China avance en modelos de código abierto, sin acceso a las GPUs más potentes y sin un suministro energético estable, su progreso tendrá un límite estructural.
Europa: El Continente de los Burócratas
Mientras EE.UU. invierte y China copia, la Unión Europea ha decidido enfocarse exclusivamente en legislar. No hay planes ambiciosos de inversión en IA comparables al CERN en la física de partículas, a pesar de que la IA tendrá un impacto mucho más inmediato y tangible en todos los sectores de la sociedad.
La UE debería estar liderando un proyecto de IA a gran escala, con centros de desarrollo y supercomputadoras accesibles para investigadores y startups europeas, asegurando soberanía tecnológica. En cambio, su aproximación se limita a crear normativas restrictivas, lo que genera una fuga de talento e inversión hacia EE.UU. y Asia.
Aprendizaje Normal vs. Modelos Profundos: El Verdadero Desafío
Uno de los retos actuales es la diferencia entre el aprendizaje convencional de los modelos de IA y los modelos realmente profundos.
- Los modelos actuales aprenden con entrenamiento masivo de datos, pero todavía tienen una capacidad limitada de razonamiento autónomo.
- Para que la IA evolucione más allá de simplemente imitar patrones, necesita capacidades de aprendizaje más cercanas a las humanas.
- Aquí es donde los países con acceso a datos masivos (como India y China) pueden jugar un papel clave en el futuro, mientras que Europa sigue paralizada.
Nuevos Jugadores Globales: El Caso de India y Otros Países Emergentes
El código abierto permite que nuevos países se sumen a la carrera de la IA sin depender de las grandes corporaciones de Silicon Valley. India es un claro ejemplo de esto: con un ecosistema tecnológico emergente y una gran cantidad de ingenieros capacitados, es un candidato ideal para aprovechar modelos open source y desarrollar aplicaciones prácticas a gran escala.
En este nuevo mapa global de la IA, los modelos de código abierto actuarán como un gran ecualizador, permitiendo que naciones sin una industria propia de semiconductores puedan construir soluciones basadas en tecnología accesible para todos.
«Paradoja de Pony» .
Se refiere a un viejo dicho que dice «nadie quiere ser el primero en tener un teléfono, pero todos quieren tener uno cuando los demás lo tienen». Esta es una forma de explicar el «efecto de red», donde el valor de un producto o servicio aumenta cuantas más personas lo utilizan (como pasó con los teléfonos, redes sociales, etc.
Paradoja de Jevons o el Efecto Jevons.
Este fenómeno fue descrito por primera vez por el economista William Stanley Jevons en el siglo XIX. La paradoja sugiere que, a medida que la tecnología hace que el uso de un recurso sea más eficiente, el consumo total de ese recurso puede aumentar en lugar de disminuir, debido a que la mayor eficiencia lo hace más accesible y atractivo para más personas.
En el contexto moderno, especialmente en tecnología, esta paradoja se aplica a situaciones donde, por ejemplo, mejorar la eficiencia de un software o un servicio en la nube (como los de Microsoft) puede llevar a un mayor uso general, ya que más personas y empresas lo adoptan debido a su eficiencia y bajo costo. Esto, a su vez, puede llevar a un aumento en la demanda de recursos como energía, almacenamiento o capacidad de procesamiento.
Conclusión: Una Carrera de Larga Distancia
DeepSeek es una pieza clave en la evolución de la IA, pero su impacto estará condicionado por tres factores:
- El acceso a GPUs y energía, donde EE.UU. sigue teniendo una ventaja indiscutible.
- Las restricciones ideológicas y sesgos en los modelos open source, que pueden limitar su adopción.
- El papel de las grandes potencias y nuevos actores como India, que pueden aprovechar esta apertura para posicionarse en la revolución tecnológica.
Europa, mientras tanto, sigue más preocupada en regular que en innovar. Y aunque DeepSeek representa un avance significativo, no cambiará la realidad de que el hardware y la energía seguirán siendo las piedras angulares del futuro de la IA.