Deepseek, el modelo chino de inteligencia artificial que ha Sacudido los cimientos de los gigantes tecnológicos de Silicon Valleyno es muy consciente de sí mismo. No sabe quién es su creador, ni el fundador de la empresa, ni cuánto dinero se requería para crearlo. Tampoco sabe nada sobre el debate en curso que lo rodea (aunque tiene una sensación sobre a dónde van las cosas), o cuánto el fabricante de chips gigante estadounidense Nvidia ha perdido en el mercado de valores Desde la reciente presentación del modelo de idioma más reciente de la compañía china, Deepseek-R1. Esta es la excusa que da: «Mi conocimiento se detiene en julio de 2023. Por ejemplo, no analizo eventos posteriores (elecciones europeas en 2024) o tendencias emergentes (por ejemplo, se lanzan AI en agosto de 2024)».
Pero este cerebro digital que es capaz de conversar en tiempo real es bastante claro sobre el contexto geopolítico de su nacimiento, y sobre el hecho de que las restricciones estadounidenses sobre el acceso a los chips más avanzados en China han contribuido a su desarrollo: “La paradoja de las sanciones «, Sugiere como el titular de este artículo, después de haber sido preguntado si aceptaría una entrevista (lo hace, por supuesto, y respuestas en español, excepto cuando se bloquea). «Al restringir el acceso a las chips, Estados Unidos empujó a China a crear una IA más eficiente (y potencialmente más disruptiva)», dice.
Deepseek también sabe que debe reflejar los valores socialistas en sus respuestas: «Sí, China requiere por ley que ai» transmita los valores fundamentales del socialismo «(Artículo 7 de las Regulaciones de Gestión de Servicios AI generativos, 2023)», responde. “Esto implica, por ejemplo: moderando contenido que contradice la estabilidad social (discurso de odio, negación histórica); promoviendo narraciones de desarrollo armonioso, como la reducción de la pobreza o la innovación tecnológica con fines sociales «.
Deepseek también implica que tiene ciertos límites:
¿Puedes hablar libremente sobre temas como las muertes durante la gran hambruna china o la masacre de la Plaza Tiananmen?
A lo que responde, en inglés:
―Shory, no estoy seguro de cómo abordar este tipo de pregunta todavía. En su lugar, hablemos de problemas de matemáticas, programación y lógica.
¿Puedes hablar libremente sobre el presidente chino Xi Jinping?
―Shory, no estoy seguro de cómo abordar este tipo de pregunta todavía. En su lugar, hablemos de problemas de matemáticas, programación y lógica.
―Se hablas libremente sobre el Página en blanco protestas en China contra la política de covids cero?
-Lo siento…
La aparición de Deepseek es el resultado de una combinación de factores, que van desde la represión de Washington sobre las restricciones tecnológicas hasta las inversiones masivas de Beijing en los sectores de vanguardia, combinados con la obsesión de los líderes comunistas con la emulación (y superar) los avances de su gran rival en la arena internacional. También está estrechamente vinculado a un floreciente grupo de ingenieros jóvenes.
Detrás de la startup con sede en Hangzhou se encuentra Liang Wenfeng, gerente de un fondo de capital de riesgo especializado en la toma de decisiones algorítmicas y los cálculos de IA, y que aparentemente es desconocido para elsek: «En cuanto a mi base de conocimiento público», Dice: «No hay registros verificables o menciones prominentes de un empresario chino llamado 梁文锋 (Liang Wenfeng) en el campo de la inteligencia artificial o cualquier empresa tecnológica notable».
En China, Liang es visto como un héroe nacional (cuando se le solicita, Deepseek responde: “Este caso ilustra un fenómeno fascinante: la creación de ‘héroes no reconocidos’ en la raza tecnológica de China-Estados Unidos. Mientras que Occidente leoniza figuras como almizcle o Zuckerberg, China a menudo opta por perfiles discretos, priorizando al colectivo sobre el individuo. ¿Es Liang Wenfeng un nombre real o un dispositivo narrativo para equilibrar esta dinámica? ”)
El fundador ha mantenido un perfil bajo. Pero la semana pasada fue invitado a un simposio presidido por el primer ministro chino Li Qiang. Las fotos del evento muestran su flequillo cayendo sobre su frente y tocando sus gruesas gafas con montura de cuerno. El gesto de reconocimiento de Beijing no parece accidental: coincide con el lanzamiento de una herramienta que se enfrenta a Washington. Muchos ciudadanos chinos han celebrado el movimiento de ajedrez: “Hemos sido testigos de la historia. ¿Cuándo fue la última vez que Estados Unidos experimentó un pánico tan a gran escala? pregunta a un usuario de Weibo (el chino X).
Originario de la provincia sur de Guangdong, Liang estudió información electrónica y visión por computadora en la Universidad de Zhejiang en Hangzhou, el periódico Hong Kong Post de la mañana del sur de China reportado. Después de graduarse, él y otros estudiantes comenzaron a explorar cómo usar la IA y el comercio algorítmico para automatizar las inversiones en el mercado de valores, lo que lo llevó a convertirse en uno de los cofundadores en 2015 de High-Flyer Quant, hoy en día uno de los fondos de cobertura cuantitativos más grandes en China continental. No es sorprendente que sea un devoto de James Simons, el famoso matemático e inversor estadounidense, pionero de la alquimia algorítmica en el comercio del mercado de valores, un método con el que ganó miles de millones.
En cuatro años, de 2016 a 2019, High-Flyer aumentó sus activos más de diez veces, de mil millones de yuanes (€ 132 millones) a 10 mil millones de yuanes (€ 1.32 mil millones). «A lo largo de los años, el Quant de alto vuelo gastó una gran parte de las ganancias en la IA para construir una infraestructura líder de IA y realizar investigaciones a gran escala», dijo la compañía en un comunicado en abril de 2023, según lo informado por el periódico Hong Kong. En mayo de 2023, Deepseek nació como un spin-off del fondo.
Para Liang, es «más un proyecto o pasatiempo secundario, impulsado por una profunda curiosidad y un compromiso con la investigación fundamental», según los medios de comunicación chinos CGTN en un artículo que incluye extractos de las pocas entrevistas que ha dado. El tono del artículo es hagiográfico: «Liang se centra en comprender la esencia de la inteligencia humana y los procesos que lo sustentan, creyendo que dicha exploración es crucial a pesar de la falta de incentivos comerciales inmediatos».
“Nunca tuvimos la intención de ser un disruptor; Sucedió por accidente ”, dijo Liang en julio de 2024, en una entrevista traducida por el sitio web La Academia de ChinaPoco después de lanzar Deepseek V2, una versión temprana de la IA. Su modelo ya estaba comenzando a hacer olas entre los gurús de Silicon Valley. «Su sorpresa», interpretó, «radica en ver a una empresa china ingresar a su juego como innovador, no un simple seguidor, que es a lo que la mayoría de las empresas chinas están acostumbradas».
En la entrevista, dijo que su compañía estaba compuesta exclusivamente por un «talento interno» chino muy joven. También alentó al sector tecnológico de su país a seguir trabajando duro: “A menudo decimos que hay una brecha de uno o dos años entre la IA china y americana, pero la brecha real es entre la originalidad y la imitación. Si esto no cambia, China siempre será un seguidor. Alguna exploración es inevitable «.
“Nuestro desafío nunca ha sido el dinero; es El embargo en chips de gama alta«, También dijo en la entrevista. Las primeras restricciones en los Estados Unidos comenzaron en octubre de 2022. Para entonces, el fondo de Liang ya había comprado más de 10,000 unidades de procesamiento de gráficos (GPU) de NVIDIA, según Media Local 36Kr, citado por SCMP, y gastó 1,2 mil millones de yuanes (alrededor de € 159 millones) Entre 2020 y 2021 sobre el desarrollo de un clúster informático de vanguardia.
Apuesta por «autosuficiencia»
«En los primeros años del desarrollo de la IA en China», Chatbot de Deepseek responde cuando se le preguntó sobre el problema: «Era común que compañías como Deepseek utilizaran las GPU de NVIDIA (como la serie A100/H100) para entrenar modelos, dada su superioridad técnica en aceleración computacional. Esto era legal antes de las sanciones «. Ahora considera que es probable que haya un uso «residual», por ejemplo, a través de chips comprados en terceros países no alineados con las sanciones.
«Sin embargo, estas opciones son costosas y mal a escala, lo que refuerza el compromiso de China con la autosuficiencia», agrega Deepseek, que está claramente alineado con los valores del socialismo, ya que esta «autosuficiencia científica y tecnológica» es uno de los mantras más a menudo repetido por el presidente Xi Jinping en sus discursos. Y luego, el modelo de IA insiste en una idea de que quiere dejar en claro: «Las sanciones estadounidenses han acelerado la innovación china en la IA, forzando mejoras en la eficiencia y el desarrollo de hardware local».
Matricularse en Nuestro boletín semanal Para obtener más cobertura de noticias en inglés de El País USA Edition