El embargo de chips avanzados impuesto por Estados Unidos a China ha demostrado ser una bendición disfrazada para el desarrollo de la IA en ese país, opina Satyen K. Bordoloi.
El cine cambió para siempre en la primera quincena de junio de 2024. El 10 de ese mes, Kuaishou Technology anunció Kling, un programa gratuito de inteligencia artificial para la creación de texto a video. Aunque OpenAI había anunciado y provocado a Sora el 15 de febrero, la mayoría de los videos que mostraron fueron mejorados por VFX y no se lanzaría hasta dentro de 10 meses. La gente recién comenzó a crear impresionantes videos de IA a través de Kling y DreamMachine, lanzados por Luma el 12 de junio.
Cada vez que aparecía una herramienta tan nueva, les decía a mis amigos de Bollywood que la probaran. Seis meses después, a finales de diciembre, después de que Sora finalmente se lanzara casi un año después de su anuncio, les pregunté nuevamente cuál de las muchas herramientas de creación de videos con IA era la mejor. La respuesta fue unánime: Kling. Lo extraordinario que es esto sólo puede evaluarse si consideramos cómo Estados Unidos intentó sofocar los avances de la IA de China.
Guerras comerciales entre Estados Unidos y China: La guerra comercial entre Estados Unidos y China ha sido como un juego de ping pong, en el que cada parte lanza aranceles y restricciones de un lado a otro. Bajo Trump, entre 2018 y 2020Estados Unidos impuso aranceles a productos chinos por valor de más de 360 mil millones de dólares, citando prácticas comerciales desleales y robo de propiedad intelectual.
China tomó represalias con aranceles sobre productos estadounidenses por valor de 110.000 millones de dólares. La administración Biden continuó e incluso amplió algunas medidas, dirigidas a sectores de alta tecnología como la inteligencia artificial y los semiconductores, mientras que China prohibió las exportaciones de metales de tierras raras.
El embargo de chips y sus objetivos: La decisión de la administración Biden de imponer un embargo de chips a China fue diseñada para obstaculizar la capacidad del país para desarrollar sistemas avanzados de inteligencia artificial al negar el acceso a chips de alto rendimiento. No profundizaremos en si los temores occidentales a una China beligerante justifican estas sanciones. En cambio, discutiremos cómo esto fue una bendición disfrazada para China y qué puede enseñarnos sobre la IA.
El embargo, puesto de relieve por primera vez por el asunto Huawei y recientemente por Miedos a TP-Link—Naturalmente, presentó desafíos importantes, pero sorprendentemente impulsó estrategias y adaptaciones innovadoras dentro del sector tecnológico chino.
Las empresas chinas respondieron desarrollando nuevos métodos para extraer más valor de los chips más débiles, centrándose en modelos de IA más pequeños y especializados e invirtiendo fuertemente en la fabricación local de chips. Por lo tanto, a pesar de las restricciones, las empresas chinas de IA lograron mantener y mejorar sus capacidades de IA, a menudo mediante soluciones alternativas creativas y un cambio de enfoque del hardware al software y la eficiencia del modelo.
La estrategia china para eludir el embargo tenía múltiples frentes.
Fabricación local de chips: Una de las principales estrategias empleadas es el desarrollo de proveedores locales de chips de IA. Empresas como Huawei, Baidu, Alibaba y Tencent avanzaron en la producción de sus propios chips de IA. Mientras que Occidente tiene sus chips NVIDIA como el A100, China ahora tiene el Ascend 910B de Huawei y el Kunlun Gen 2 de Baidu, ambos utilizando la tecnología de nodo de proceso de 7 nm.
Si bien estos chips de producción nacional pueden quedar rezagados con respecto a sus homólogos occidentales en términos de rendimiento y estabilidad, están demostrando cada vez más ser alternativas viables. Los chips de Huawei y Baidu son vistos como competidores de los chips de inteligencia artificial de Nvidia.
Código eficiente y modelos de borde: El embargo obligó a las empresas chinas de IA a centrarse en otras estrategias, como desarrollar códigos más eficientes y modelos de IA más pequeños y especializados. Piense en este enfoque como la diferencia entre un entusiasta del gimnasio con volumen y un artista marcial bien entrenado. Tener el poder bruto de los chips avanzados es como un entusiasta del gimnasio con músculos enormes.
Aún así, es el artista marcial, con técnicas precisas desarrolladas a través de un entrenamiento eficiente, quien sale victorioso en una pelea callejera con un oponente digno. Estados Unidos tiene el poder bruto de chips avanzados, pero si los chinos descubren el movimiento preciso de los artistas marciales para hacer más con lo que tienen, podrían ser los eventuales ganadores.
En términos de IA, esto significa que en lugar de depender únicamente de chips potentes, las empresas están optimizando sus modelos para que requieran menos recursos. El profesor Winston Ma, profesor de Derecho de la Universidad de Nueva York, señaló recientemente que “el año que viene es el año de los modelos pequeños”.
En lugar de los LLM (modelos de lenguajes grandes), los SML (modelos de lenguajes pequeños) verán una adopción y un desarrollo significativos debido a su eficiencia, rentabilidad y capacidad para operar en todos los dispositivos, lo que los hará adecuados para una gama más amplia de aplicaciones que los LLM. Con menos datos de entrenamiento y velocidad, permitirán tiempos de respuesta más rápidos.
Otro aspecto es mejorar las capacidades de ingeniería y los algoritmos para compensar la falta de disponibilidad de chips avanzados. Al mejorar el software y las técnicas de entrenamiento de modelos, empresas chinas como Alibaba y Tencent logran un alto rendimiento incluso con hardware menos avanzado. Zhang Ping’an, un alto ejecutivo de Huawei, lo dijo mejor cuando defendió que se debe abandonar la mentalidad de depender únicamente de los chips de IA más avanzados en favor de avances algorítmicos e ingeniería innovadora.
La flexibilidad sobre los músculos voluminosos y la agilidad sobre la fuerza bruta parece haberse convertido en el nuevo mantra chino para la IA, que incluso las empresas occidentales de IA se dan cuenta de que es el mejor enfoque.
Servicios en la nube y soluciones alternativas globales: Otra táctica que emplean las empresas chinas es alquilar servicios en la nube ubicados en Estados Unidos u otras regiones no afectadas por el embargo. Esto les permite acceder a recursos informáticos avanzados sin violar directamente las restricciones.
Aunque el gobierno de EE. UU. aún no ha abordado esta laguna jurídica de manera efectiva, sigue siendo una opción viable para que las empresas chinas aprovechen la infraestructura global de la nube.
Aprendizaje supervisado, no supervisado y semisupervisado: En lugar de la mentalidad de Occidente de talla única, los modelos de IA en China se están entrenando utilizando diferentes técnicas, como el aprendizaje supervisado, el aprendizaje no supervisado y el aprendizaje semisupervisado. El aprendizaje supervisado ocurre cuando los modelos se entrenan con datos etiquetados, lo cual es crucial para tareas como el reconocimiento de objetos y el análisis de sentimientos.
El aprendizaje no supervisado utiliza datos sin etiquetar para encontrar patrones y estructuras útiles para la agrupación y la detección de anomalías. El aprendizaje semisupervisado combina ambos, aprovechando una pequeña cantidad de datos etiquetados y una gran cantidad de datos sin etiquetar para mejorar el rendimiento general.
Desarrollo de modelos de IA de código abierto: China también se ha visto obligada a depender del desarrollo de modelos de IA de código abierto. Esto ha ayudado a los avances de la IA en China porque dichos modelos ofrecen transparencia, personalización y flexibilidad, lo que permite mejoras y refinamientos continuos. Permite la incorporación de los últimos avances en la investigación de la IA de forma rápida y a escala, al tiempo que fomenta un entorno colaborativo que impulsa futuras innovaciones.

Estrategias e inversiones nacionales: La estrategia de IA de China se guía por documentos clave como el Plan de Desarrollo de la Inteligencia Artificial de Nueva Generación (AIDP) de 2017 y la iniciativa Made in China 2025 lanzada en 2015. Ambos enfatizan la importancia de la IA para mejorar la competitividad y la seguridad nacionales y describen objetivos para lograrlos. alcanzar niveles líderes mundiales en tecnología de IA y, al mismo tiempo, reducir la dependencia de tecnologías extranjeras.
El documento Made in China 2025 tenía como objetivo transformar el sector manufacturero de China, pasando de producir bienes de bajo costo y baja calidad a convertirse en un líder mundial en productos innovadores de alta tecnología, especialmente en industrias clave como la inteligencia artificial, la robótica, la aeroespacial y la manufactura avanzada. El número de patentes procedentes de China en cada uno de estos sectores en los últimos cinco años demuestra que los chinos han tenido éxito.
Este éxito se debe a importantes inversiones en investigación y desarrollo de IA por parte del gobierno chino, y los gobiernos regionales han prometido miles de millones de yuanes para fomentar las industrias locales de IA. Tomemos como ejemplo la ciudad de Beijing, que invirtió mucho en el desarrollo de su ecosistema de IA, centrándose en áreas como los vehículos autónomos y las tecnologías de ciudades inteligentes, emergiendo como un centro de desarrollo de IA para China y el mundo.
En el tres cuerpos En esta trilogía de novelas, el escritor Cixin Liu escribió sobre cómo una especie alienígena intenta detener el progreso de la Tierra impidiendo el avance de tecnologías clave. Estados Unidos intentó hacer algo similar a China. En la novela de Liu, el conflicto entre la Tierra y los extraterrestres acaba con nuestro sistema solar. Sólo cabe esperar que la guerra comercial entre Estados Unidos y China, que llevó a intentos de detener los avances de la IA en China, no conduzca al mismo resultado.