Después de que según el color e interés del medio de comunicación al que nos hayamos visto expuesto hayan zarandeado el árbol de “DeepSeek” vs “OpenAI” de izquierda a derecha hasta dejarlo sin hojas me he decidido a hacer un pequeño artículo de un tema que me apasiona, tal como se puede percibir por mi nick. Va a ser cortito y al pie, como diría Luis Aragonés o “quick & dirty” como le gustaba a @Jvas en sus años mozos, porque hacerlo exhaustivo haría que no naciera y estoy intentando cambiar esa limitación.
De Egipto a Pérgamo
Como soy un pirata, me he apropiado del título de un estupendo libro que habla precisamente sobre la historia de los libros. En uno de sus capítulos se relata la historia de que tras la invención del papiro ( Papiro - Wikipedia, la enciclopedia libre ) en Egipto como soporte para la escritura y su tremendo éxito, se impusieron vetos de uso en otros lugares para preservar la hegemonía cultural, esto unido a que su producción de papiro era cara y laboriosa , impulsó una necesidad de innovación local en Europa que acabó culminando con la invención del pergamino o la vitela, más duraderos y económicos. Más allá de la precisión histórica de la anécdota ( que ya sabemos que siempre tiene muchos matices ) , nos sirve de introducción para presentar lo que ha ocurrido con EEUU al intentar vetar sus nuevas tarjetas H100 en países como China y que, derivase como si de una obra dramática se tratase en que precisamente al mismo tiempo que se anunció el proyecto Stargate, que ha sido comparado con el proyecto Manhattan por su importancia para la humanidad, se anunciase también DeepSeek R1, un modelo de IA procedente de una startup china, un proyecto liberado bajo términos opensource ( pesos libres aunque sin datos de entrenamiento libres, que implica que puede usarse por cualquiera en sus máquinas ) que igualaba en capacidad y mejoraba tremendamente en costes y necesidad de computación al mejor modelo público del momento, el o1 de OpenAI y que para su desarrollo teóricamente ( no sabemos si es cierto ) habían usado un hardware inferior sin veto, como las tarjetas H800.
De OpenAI a DeepSeek
Sam Altman y otros grandes personajes dentro del mundo de la IA llevan años comentando que lo importante en el futuro no será tanto el modelo, si no la capacidad de computación, por lo tanto quien tenga la capacidad de computación podrá seguir iterando los nuevos modelos y sirviendo a los usuarios que hagan uso de dichos modelos. Hay otras derivadas de esta necesidad, como es la necesidad de energía barata, centros de datos eficientes etc.
Los que seguimos este mundo sabemos que los modelos de IA tienen un valor muy limitado en el tiempo, cada mes tenemos iteraciones nuevas de modelos anteriores que evolucionan y no parece existir una “secret sauce” que haga que nadie tenga una ventaja determinante en este aspecto. De hecho, más allá de las iteraciones, técnicas que parecen el futuro de la IA, como el “test time computing” escalan precisamente con mayor capacidad de cómputo ( Scaling test-time compute - a Hugging Face Space by HuggingFaceH4 ) .
Ganadores y Perdedores
Pues básicamente todo el mundo gana. Lo describía muy bien el CEO de Microsoft en X explicando la paradoja de Jevon, explicando que a medida que se “commoditiza” una tecnología la usamos cada vez más.
Empresas que desarrollan modelos cerrados como OpenAI pueden verse perjudicadas a corto plazo, sin embargo, también se benefician de la innovación y el uso masivo a medio-largo plazo, por eso Altman se ha querido asegurar capacidad de cómputo como el proyecto Stargate.
Facebook se ve perjudicada a corto por que intenta liderar el desarrollo de modelos OpenSource, la verdad es que ha dejado a sus modelo Llama en entredicho, como sabe que no es un líder en la categoría ni quiere intentar serlo, parece que su estrategia desde el inicio ha sido la de intentar causar deflación en este tipo de tecnología e intentar ser un referente para beneficiarse de la comunidad, que suele ser más innovadora y ágil. En mi opinión la IA es la pieza que les faltaba para su metaverso/realidad aumentada, donde lo más difícil es la generación de contenido que ahora se podrá automatizar en gran medida tarde o temprano.
Y así cada big tech parece tener sus propios planes, empresas como NVIDIA hasta que otras empresas como AMD no comiencen a hacer la competencia real deberían incluso reforzarse si creemos en las tesis iniciales. Apple parece agazapada sin gastar en computación, Google lanzará en breve su proyecto Astra, etc.
Finalmente, lo que está claro es que los usuarios/clientes nos beneficiamos tremendamente en esta guerra tecnológica y geopolítica, de esta carrera constante por la innovación y la liberación de modelos, que estirando la metáfora, parecen esconder el infinito en el silicio.
P.D disculpen cualquier errata/error ortográfico porque el texto salió del tirón y sin repasar, c’est la vie.