Desde avances económicos para modelos alucinantes, los desvalidos de IA de China están redefiniendo que el juego encuentra a Satyen K. Bordoloi
En la serie de problemas de tres cuerpos de Liu Cixin, Aliens sabotea el progreso tecnológico de la Tierra para mantener a la humanidad bajo control. Estados Unidos, en un movimiento algo menos extraterrestre pero igualmente dramático, trató de hacer lo mismo con China: abofetear las prohibiciones de exportación en chips avanzados y compañías de lista negra. Y seamos honestos, si hay algo en lo que tanto Biden como Trump están de acuerdo, es su amor compartido por odiar a China.
Pero aquí está el giro: en lugar de sofocar el crecimiento de la IA de China, estas restricciones solo han alimentado su aumento. Como escribí En una pieza de Sify anteriorLa industria de la IA de China no se está poniendo al día con los Estados Unidos; Está corriendo hacia adelante y hacerlo con un estilo que es impresionante y, me atrevo a decir, descarado.
Tomando la discusión por delante de ese artículo, aquí hay algunos modelos de IA chinos que se arremangaron y juraron: «Te mostraremos cómo se hace».
https://www.youtube.com/watch?v=jylyuzr24he
El surgimiento de Deepseek-V3: haciendo más con menos
Deepseek es un modelo de lenguaje grande (LLM), muy parecido a ChatGPT. Excepto que es de código abierto, al igual que Meta’s Llama. Sus modelos anteriores ya estaban haciendo olas. Pero luego vino Deepseek-V3, pavoneándose en la escena como si fuera el dueño del lugar. Este LLM no solo funcionó bien en los puntos de referencia globales, sino que lo hizo con lo que Andrej Karpathy, un miembro fundador de Operai, llamó una «broma de un presupuesto».
Deepseek es el mejor superprodoméstico experto en presupuesto. Con poco más de 2,000 GPU de NVIDIA H800, que costó entre $ 40 y $ 50 millones, y solo $ 5 millones gastados en capacitación, este desvalido desaliñado se enfrenta cara a cara con la última iteración de Chatgpt, que según los informes quemó miles de millones de dólares. Y aquí está el pateador: Deepseek no es solo mantenerse al día; A menudo son todos los Estados Unidos en la mayoría de los puntos de referencia. Deje que eso se hunda. Si $ 55 millones pueden hacer lo que miles de millones solían, la industria de la IA está a punto de voltear más rápido que una tortilla en una junta de desayuno en la carretera.
https://www.youtube.com/watch?v=ZB3tffMBPre
No es de extrañar que el gerente de investigación senior de Nvidia, Jim Fan, comentara sobre Deepseek en una publicación sobre X el 27 de diciembre, resumió perfectamente: «Las limitaciones de recursos son algo hermoso». Y chico, ¿tiene razón? Deepseek-v3 es una prueba de que la necesidad no es solo la madre de la invención; Es la madre de una invención eficiente. Al centrarse en los métodos de capacitación rentables y aprovechar los vastos recursos de datos de China, Deepseek ha creado un modelo que rivaliza con GPT-4 sin romper el banco.
Los modelos de Deepseek están diseñados para funcionar en múltiples idiomas, lo que los convierte en un contendiente global.
Kling: donde el texto se encuentra con el video magia
Si Deepseek es el cerebro del grupo, Kling de Kuaishou Technology es el artista. Esta compañía china ha estado haciendo olas en el espacio de texto a video (TTV) durante medio año, convirtiendo las descripciones escritas en contenido de video de alta calidad. Imagine escribir «un dragón besando a un unicornio arcoiris al atardecer» y obtener una obra maestra cinematográfica en segundos. Eso es Kling para ti.
Mientras que Openai anunció su modelo TTV Sora en febrero de 2024, lo lanzó solo seis meses después de Kling en diciembre. A pesar del retraso, los usuarios señalaron rápidamente que Kling está muy por delante de Sora en términos de calidad de video y distorsiones. Y lo mejor de todo, la suscripción de Kling es más barata que la mayoría de los TTV.
https://www.youtube.com/watch?v=-_eqwjnlu
Kling es una bendición para los creadores de contenido, anunciantes y educadores. Los cineastas y los YouTubers ahora pueden visualizar guiones y conceptos a la velocidad de escribir. Los especialistas en marketing pueden generar anuncios dinámicos de video narrativos adaptados a campañas específicas en un Jiffy. Los educadores también pueden usar fácilmente TTV para convertir las lecciones en contenido visual atractivo.
La salsa secreta de Kling radica en integrar el procesamiento del lenguaje natural (PNL), la visión por computadora y las redes adversas generativas (GANS). Es como tener un equipo de producción de Hollywood en su computadora portátil, listo para dar vida a sus ideas más salvajes.
Vidu 2.0: El futuro de la generación de videos
Si Deepseek es el genio presupuestario de la IA china, entonces Vidu 2.0 de Shengshu Technology es el demonio de la velocidad de la generación de videos. Lanzada como la última iteración de su plataforma de creación de video, Vidu 2.0 hace que la producción de video de alta calidad sea más rápida, más barata y más fácil que nunca. ¿Cómo? Al combinar un modelo de transformador de visión universal (U-VIT) con un acelerador de interferencia patentado, Shengshu ha reducido los costos en más de la mitad en comparación con los promedios de la industria.
Pero no se trata solo de velocidad y ahorros. Vidu 2.0 está lleno de características que hacen que la creación de video sea muy fácil. Olvídate de escribir indicaciones tediosas; Sus plantillas permiten a los usuarios agregar acciones detalladas, accesorios o configuraciones con solo unos pocos clics. La característica de «referencia a video» garantiza la consistencia en los sujetos y los estilos, abordando el problema fundamental con la generación de videos de IA: inconsistencia. Y con planes de expandir su biblioteca de plantillas, Vidu 2.0 solo está mejorando.
Shengshu, sorprendentemente, lo hizo en menos de dos años. Fundada en 2023, ha pasado rápidamente de una investigación a revolucionar la industria creativa. Junto a Vidu, también han desarrollado Voxcraft, una plataforma de generación de activos 3D. Pero Vidu 2.0 es su joya de la corona, que nos acerca a un futuro donde la narración de historias impulsada por la IA se adapta a la visión de cada creador. No es solo una herramienta, es una revolución creativa en una caja.

El elenco de apoyo: Inspur, Zhipu AI, Bytedance y Minimax
Mientras que Deepseek, Kling y Vidu 2.0 están acaparando el centro de atención, no olvidemos que el elenco estelar de compañías como Inspur, Zhipu Ai, Bytedance y Minax, que son en silencio (o no tranquilamente), olas con sus propias innovaciones de IA.
Tome Zhipu Ai, por ejemplo. Esta nueva empresa recientemente se encontró en la lista de entidades del Departamento de Comercio de los Estados Unidos, un honor dudoso que le restringe comprar tecnología estadounidense sin aprobación especial. La administración de Biden citó «preocupaciones de seguridad nacional», pero seamos honestos: también es un cumplido revelador de la creciente destreza de Zhipu. Estar prohibido por los EE. UU. Es prácticamente un rito de iniciación para las empresas tecnológicas chinas en estos días.
Luego está Malax, cuyo Hailuo Ai (de la fama viral de besos de besos de IA), y el Dreamina de Bytedance, están dando a Kling y Vidu 2.0 una carrera por su dinero en el espacio de texto a video (TTV). Estas plataformas son innovadoras, y al ofrecer capacidades multilingües más allá de los chinos, incluido el inglés y otros idiomas, indican sus ambiciones globales. ¿Por qué dominar un solo mercado cuando puedes conquistar el mundo?

Por qué el auge de la IA de China no es casualidad
Juntos, estas y otras compañías demuestran que el ecosistema de IA de China no es una maravilla de un solo golpe, sino una nueva sinfonía tecnológica donde cada jugador trae notas únicas. Como escribí en el artículo anterior para SifyResultan de una orquestación cuidadosa. Con casi mil millones y media de personas, una huella digital del tamaño de un planeta pequeño y una regulación laxa para el raspado de datos, China no tiene escasez de datos para capacitar a sus modelos. Agregue un apoyo gubernamental significativo, desde la financiación hasta las políticas favorables, y usted tiene una receta para el éxito.
Las principales universidades y compañías tecnológicas están uniendo fuerzas para acelerar la innovación, mientras que las instalaciones computacionales de vanguardia y las supercomputadoras de IA proporcionan la columna vertebral de este ecosistema. Es una tormenta perfecta de recursos, talento y ambición, y está dando sus frutos en espadas. India, ¿estás escuchando?
Lo que esto significa para el mundo
Los avances de China en la inteligencia artificial son significativos no solo para la nación misma sino también para el mundo. Similar a la carrera espacial durante la Guerra Fría, la rivalidad entre Estados Unidos y China en IA está acelerando la innovación a un ritmo increíble, motivando a ambos países a superarse entre sí en esta competencia. Estas tecnologías están transformando industrias enteras y creando nuevos modelos de negocios y oportunidades para aquellos que están dispuestos a adoptarlas.
Sin embargo, con gran poder viene una gran responsabilidad. A medida que AI evoluciona, también lo hacen los desafíos éticos y regulatorios. Tomar, por ejemplo, que La columnista de Bloomberg, Catherine Thorbecke, encontró Cuando intentó crear un video clip del presidente chino Xi Jinping. Se negó la solicitud, destacando la adhesión de la plataforma a las regulaciones que impiden la manipulación de figuras políticas chinas a pesar de que se permitió contenido similar sobre Donald Trump. ¿Cómo se abordaría esto? Todavía no lo sabemos.
Sin embargo, no se puede negar que la industria de la inteligencia artificial de China está demostrando que las restricciones y embargos son poco más que golpes de velocidad en el camino hacia la innovación. Con compañías como Deepseek, Kling y Vidu 2.0 liderando la carga, China no solo se pone al día con los Estados Unidos, está preparado para dejarlo en el polvo.
Prepárate, amigos. En la carrera por el dominio de la IA, los modelos chinos están superando a los de los Estados Unidos. Ya sea que sea un entusiasta de la tecnología, un líder empresarial o simplemente un usuario cotidiano, una cosa está clara: la competencia para el futuro de la IA definitivamente será emocionante.