La startup china de inteligencia artificial DeepSeek retrasó el lanzamiento de su nuevo modelo tras no lograr entrenarlo utilizando chips de Huawei, lo que pone de relieve los límites del impulso de Beijing por reemplazar la tecnología estadounidense.
Según tres personas familiarizadas con el asunto, después de lanzar su modelo R1 en enero, DeepSeek fue alentada por las autoridades a adoptar el procesador Ascend de Huawei en lugar de utilizar los sistemas de Nvidia.
Pero la startup china enfrentó problemas técnicos persistentes durante el proceso de entrenamiento de su modelo R2 con los chips Ascend, lo que la llevó a usar chips de Nvidia para el entrenamiento y los de Huawei para la inferencia, dijeron las fuentes.
Los problemas fueron la razón principal por la que el lanzamiento del modelo se retrasó desde mayo, según una persona con conocimiento de la situación, lo que hizo que perdiera terreno frente a sus rivales.
El entrenamiento implica que el modelo aprenda a partir de un conjunto de datos extenso, mientras que la inferencia se refiere al paso de usar un modelo ya entrenado para hacer predicciones o generar una respuesta, como una consulta en un chatbot.
Las dificultades de DeepSeek muestran que los chips chinos aún están por detrás de sus rivales estadounidenses para tareas críticas, lo que resalta los desafíos que enfrenta China en su objetivo de ser autosuficiente tecnológicamente.
Esta semana, el Financial Times informó que Beijing ha exigido a las empresas tecnológicas chinas justificar sus pedidos de las GPU H20 de Nvidia, en un intento por alentarlas a promover alternativas fabricadas por Huawei y Cambricon.
Expertos del sector han señalado que los chips chinos sufren problemas de estabilidad, una conectividad entre chips más lenta y un software inferior en comparación con los productos de Nvidia.
Según dos personas, Huawei envió un equipo de ingenieros a las oficinas de DeepSeek para ayudar a la compañía a utilizar su chip de IA en el desarrollo del modelo R2. Sin embargo, a pesar de tener al equipo en el lugar, DeepSeek no pudo realizar una ejecución de entrenamiento exitosa en el chip Ascend, indicaron.
Las fuentes señalaron que DeepSeek todavía trabaja con Huawei para hacer que el modelo sea compatible con Ascend para la inferencia.
Según las mismas fuentes, el fundador Liang Wenfeng ha expresado internamente su insatisfacción con el progreso de R2 y ha presionado para dedicar más tiempo a construir un modelo avanzado que pueda mantener el liderazgo de la empresa en el campo de la IA.
Otra persona añadió que el lanzamiento de R2 también se retrasó debido a que el etiquetado de datos para su modelo actualizado tomó más tiempo de lo previsto. Informes de medios chinos han sugerido que el modelo podría lanzarse en las próximas semanas.
“Los modelos son productos que pueden intercambiarse fácilmente”, dijo Ritwik Gupta, investigador de IA en la Universidad de California, Berkeley. “Muchos desarrolladores están usando Qwen3 de Alibaba, que es potente y flexible”.
Gupta señaló que Qwen3 adoptó conceptos centrales de DeepSeek, como su algoritmo de entrenamiento que hace que el modelo sea capaz de razonar, pero los hizo más eficientes de usar.
Gupta, quien sigue de cerca el ecosistema de IA de Huawei, dijo que la compañía enfrenta “dolores de crecimiento” al usar Ascend para el entrenamiento, aunque espera que el campeón nacional chino eventualmente se adapte.
“El hecho de que hoy no veamos modelos líderes entrenados en Huawei no significa que no vaya a suceder en el futuro. Es cuestión de tiempo”, afirmó.
Nvidia, un fabricante de chips en el centro de la batalla geopolítica entre Beijing y Washington, aceptó recientemente dar al gobierno de EEUU una parte de sus ingresos en China con el fin de reanudar las ventas de sus chips H20 al país.
“Los desarrolladores desempeñarán un papel crucial en la construcción del ecosistema ganador de IA”, dijo Nvidia sobre las empresas chinas que usan sus chips. “Renunciar a mercados y desarrolladores enteros solo dañaría la economía y la seguridad nacional de Estados Unidos”.
DeepSeek y Huawei no respondieron a una solicitud de comentarios.