Una joven prodigio china ha sacudido los cimientos de la inteligencia artificial (IA) global. Luo Fuli, con tan solo 29 años, ha logrado desarrollar un modelo de IA que no solo es más eficiente que las mejores creaciones de gigantes como OpenAI, sino que además lo ha hecho con una fracción de los recursos utilizados habitualmente. Su nombre: DeepSeek.
Esta hazaña ha provocado el mayor colapso bursátil en la historia para una empresa en solo 24 horas. El afectado ha sido Nvidia, el principal fabricante de chips avanzados para IA, cuya dependencia tecnológica ha quedado expuesta frente a la innovación de esta visionaria, pero la crisis ha alcanzado al resto de gigantes tecnológicos estadounidenses.
Pero la historia de Luo Fuli no se limita a la brillantez de su talento. En el trasfondo, se encuentra una guerra geopolítica entre Estados Unidos y China, donde las restricciones arancelarias han obligado a ingenieros como ella a buscar soluciones que desafían las normas establecidas. En respuesta a los vetos tecnológicos, Luo Fuli no solo superó estas barreras, sino que convirtió las limitaciones en catalizadores para un avance histórico en la eficiencia de los modelos de IA.
VIRTUDES Y FLAQUEZAS DE DEEPSEEK
DeepSeek es una empresa fundada en 2023 en Hangzhou por Liang Wenfeng, un destacado emprendedor en el campo de la IA. Una de las principales innovaciones de DeepSeek es su modelo DeepSeek-R1, que ha demostrado capacidades avanzadas en razonamiento, especialmente en áreas como matemáticas y programación. Este modelo ha sido comparado favorablemente con los desarrollos de OpenAI.
Thank you for watching
Lo que distingue a DeepSeek es su enfoque en la eficiencia de recursos. Mientras que otras empresas requieren de supercomputadoras con miles de chips avanzados para entrenar sus modelos, DeepSeek ha logrado resultados comparables utilizando aproximadamente 2.000 chips Nvidia H800, una fracción de los más de 16.000 que OpenAI habría utilizado para ChatGPT-4.
Este enfoque no solo reduce los costes, sino que también democratiza el acceso a tecnologías avanzadas de IA, pues reduce las tarifas que los usuarios deben pagar por su uso. Por supuesto, esto también impacta positivamente en la sostenibilidad de los procesos a nivel medioambiental, que sabemos que son extremadamente costosos.
Además, DeepSeek ha adoptado una filosofía de código abierto, poniendo a disposición de la comunidad sus modelos y códigos. Esta transparencia permite a desarrolladores e investigadores explorar, modificar y desplegar la tecnología según sus necesidades, fomentando la innovación y la colaboración en el campo de la inteligencia artificial.
Su punto más negativo, sin embargo, estriba en su regulación. DeepSeek evita responder preguntas sobre eventos como la masacre de Tiananmén de 1989, sugiriendo al usuario que hable de otros temas. Cuando se le pregunta sobre la soberanía de Taiwán, DeepSeek afirma que “Taiwán ha sido una parte integral de China desde la antigüedad» y que «nos oponemos firmemente a cualquier forma de actividades separatistas de ‘independencia de Taiwán’”. Estas respuestas reflejan las posturas oficiales del gobierno chino y evidencian la censura aplicada en la plataforma.